Professional Documents
Culture Documents
1) ANLISIS DE CORRELACIN
Dado dos variables, la correlacin permite hacer estimaciones del valor de una de ellas conociendo el
valor de la otra variable.
1.1) DIAGRAMA DE DISPERSIN
Los diagramas de dispersin son planos cartesianos en los que se marcan los puntos correspondientes a
los pares ordenados (X,Y) de los valores de las variables.
1.2) CLASIFICACIN DE LA CORRELACIN
1.2.1) Segn la relacin entre variables
- Correlacin lineal: Se representa mediante una lnea recta.
- Correlacin no lineal: Se representa con una lnea curva.
1.2.2) Segn el nmero de variables
- Correlacin simple: La variable dependiente acta sobre la variable independiente.
- Correlacin mltiple: Cuando la variable dependiente acta sobre varias variables independientes.
- Correlacin parcial: Cuando la relacin que existe entre una variable dependiente y una
independiente es de tal forma que los dems factores permanezcan constantes.
1.2.3) Segn el valor cuantitativo
- Correlacin perfecta: El valor del coeficiente de correlacin es 1
- Correlacin imperfecta: El coeficiente de correlacin es menor a 1 sea en sentido positivo o
negativo.
- Correlacin nula: El coeficiente de correlacin es 0. No existe correlacin entre las variables.
Ejemplo: Nmero de calzado de una persona y su cociente intelectual.
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
No hay correlacin
Correlacin Positiva
Correlacin Negativa
Valor
-1
-0,9 a -0,99
-0,7 a -0,89
-0,4 a -0,69
-0,2 a -0,39
-0,01 a -0,19
0
0,01 a 0,19
0,2 a 0,39
0,4 a 0,69
0,7 a 0,89
0,9 a 0,99
1
Significado
Correlacin negativa grande y perfecta
Correlacin negativa muy alta
Correlacin negativa alta
Correlacin negativa moderada
Correlacin negativa baja
Correlacin negativa muy baja
Correlacin nula
Correlacin positiva muy baja
Correlacin positiva baja
Correlacin positiva moderada
Correlacin positiva alta
Correlacin positiva muy alta
Correlacin positiva grande y perfecta
)(
Para X:
Para Y:
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
Y
13
15
14
13
9
10
8
13
12
13
10
8
= 138
x = X-
3
2
0
1
-1
-3
-6
0
1
-1
1
3
y = Y-
1,5
3,5
2,5
1,5
-2,5
-1,5
-3,5
1,5
0,5
1,5
-1,5
-3,5
x2
9
4
0
1
1
9
36
0
1
1
1
9
72
xy
4,5
7
0
1,5
2,5
4,5
21
0
0,5
-1,5
-1,5
-10,5
28
y2
2,25
12,25
6,25
2,25
6,25
2,25
12,25
2,25
0,25
2,25
2,25
12,25
63
Se aplica la frmula:
)(
)(
UMG sede Chiquimula, Estadistica Aplicada a la Investigacin de Mercados, Lic. Alex Martnez
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
TAREA DE INTERAPRENDIZAJE
1) Elabore un organizador grfico de los tipos de correlacin.
2) Con los datos de la siguiente tabla sobre las temperaturas del da X y del da Y en determinadas
horas en una ciudad
X 9 10 12 14 16 18 20 22 24 26 28 30
Y 12 14 15 16 17 20 22 23 26 28 31 32
2.1) Calcule el coeficiente de correlacin de Pearson empleando la frmula y mediante Excel.
0,99
2.2) Elabore el diagrama de dispersin de manera manual.
2.3) Elabore el diagrama de dispersin empleando Excel.
2.4) Elabore el diagrama de dispersin empleando el programa Graph.
3) Cree y resuelva un ejercicio similar al anterior.
4) Consulte y presente un ejemplo resuelto del coeficiente de correlacin de Pearson para datos
agrupados en intervalos en http://www.monografias.com/trabajos85/coeficiente-correlacion-karlpearson/coeficiente-correlacion-karl-pearson.shtml
1.3.2) COEFICIENTE DE CORRELACIN POR RANGOS DE SPEARMAN
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es
decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera
y peso de los atletas.
Se calcula aplicando la siguiente ecuacin:
(
)
rs = Coeficiente de correlacin por rangos de Spearman
d = Diferencia entre los rangos ( X menos Y)
n = Nmero de datos
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes ms elevados le asignamos
el rango 1 al siguiente el rango 2 y as sucesivamente. Si se repiten dos puntajes o ms se calculan las
medias aritmticas.
Ejemplo ilustrativo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin
(X) y el rango o puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la
asignatura de Estadstica. Realizar el diagrama de dispersin y calcular el coeficiente de correlacin por
rangos de Spearman.
Estudiante
Dyana
Elizabeth
Mario
Orlando
Mathas
Josu
Anita
Luca
X
1
2
3
4
5
6
7
8
Y
3
4
1
5
6
2
8
7
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
Solucin:
El diagrama de dispersin hecho en Excel se muestra en la siguiente figura:
Para calcular el coeficiente de correlacin por rangos de Spearman de se llena la siguiente tabla:
Estudiante
Dyana
Elizabeth
Mario
Orlando
Mathas
Josu
Anita
Luca
X
1
2
3
4
5
6
7
8
Y
3
4
1
5
6
2
8
7
d= X-Y
-2
-2
2
-1
-1
4
-1
1
d2=(X-Y)2
4
4
4
1
1
16
1
1
2
d = 32
Se aplica la frmula:
Por lo tanto existe una correlacin positiva moderada entre la primera y segunda evaluacin de los 8
estudiantes.
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
TAREA DE INTERAPRENDIZAJE
1) Consulte sobre la biografa de Spearman y realice un organizador grfico de la misma.
2) La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin (X) y el rango o
puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la asignatura de
Matemtica.
X
1
2
3
4
5
6
7
8
Y
4
5
6
8
3
2
1
7
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
)(
xX X
y Y Y
r = Coeficiente de correlacin de Pearson
Coeficiente de determinacin
)(
puede
( )( )
( ) ][
( ) ]
Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre las temperaturas, calcular el coeficiente de determinacin
empleando la ecuacin obtenida de la forma equivalente del coeficiente de Pearson.
X 18 17 15 16 14 12 9 15 16 14 16 18
Y 13 15 14 13 9 10 8 13 12 13 10 8
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
Solucin:
Se calcula el coeficiente de Pearson llenando la siguiente tabla:
X
18
17
15
16
14
12
9
15
16
14
16
18
X=180
Y
13
15
14
13
9
10
8
13
12
13
10
8
Y =138
XY
234
255
210
208
126
120
72
195
192
182
160
144
XY=2098
X2
Y2
324
169
289
225
225
196
256
169
196
81
144
100
81
64
225
169
256
144
196
169
256
100
324
64
2
2
X = 2772 X =1650
( )( )
( ) ][
( ) ]
][
][
) ][
) ]
Nota:
El r2 tiene significado slo para las relaciones lineales. Dos variables pueden tener r2 =0 y sin embargo
estar relacionadas en sentido curvilneo. El valor de r2 no se interpreta como si la variable Y fuera
causado por un cambio de la variable X, ya que la correlacin no significa causa.
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
10
TAREA DE INTERAPRENDIZAJE
1) La siguiente tabla muestra el dinero en miles de dlares gastado en publicidad por una empresa (X)
para vender sus productos, y el nmero en miles de clientes (Y) que compran los productos de la
empresa.
X 15 17 14 13 18 20 17 18 16 14 20 18
Y 30 34 28 26 32 40 34 36 32 25 40 36
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
11
2) ANLISIS DE REGRESIN
Los primeros y ms importantes estudios al respecto se deben a los cientficos Francis Galton (18221911) y Karl Pearson (1857-1936). Fue Galton quien utiliz por primera vez el trmino regresin para
indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos regresaba a la media
general.
La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con el objeto de
estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la
regresin es un mtodo que se emplea para predecir el valor de una variable en funcin de valores
dados a la otra variable. En estadstica la palabra predecir no se utiliza en el sentido empleado por los
astrlogos, futurlogos y mentalistas, sino mas bien en un sentido lgico como es el de utilizar el
conocimiento del comportamiento de una variable para obtener informacin sobre otra variable. Por
ejemplo, puede predecirse el resultado que obtendr un estudiante en su examen final, basados en el
conocimiento de las calificaciones promedio de sus exmenes parciales, o predecir la preferencia de los
estudiantes por profesiones cientficas, conociendo los promedios de sus calificaciones en los estudios
escolares.
En todos los casos de regresin existe una dependencia funcional entre las variables. En el caso de dos
variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de
regresin de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresin de la altura de los
rboles sobre su dimetro, lo cual significa que midiendo el dimetro (variable independiente) y
reemplazando su valor en una relacin definida segn la clase de rbol se obtiene la altura, y aun sin
necesidad de clculos aprecian la altura utilizando grficas de la funcin de dependencia, altura =
funcin del dimetro.
2.1) PRINCIPIO DE LOS MNIMOS CUADRADOS
2.1.1) LA RECTA DE LOS MNIMOS CUADRADOS
Se llama lnea de mejor ajuste y se define como la lnea que hace mnima la suma de los cuadrados de
las desviaciones respecto a ella de todos los puntos que corresponden a la informacin recogida.
UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.
12