You are on page 1of 36

Regresin y correlacin (F.

lvarez) - 1
REGRESIN Y CORRELACIN
Mtodos Estadsticos Aplicados a las Auditoras Sociolaborales

Francisco lvarez Gonzlez
francisco.alvarez@uca.es


DISTRIBUCIONES BIVARIANTES

El estudio de la relacin existente entre dos variables X e Y conduce a la consideracin simultnea de ambas variables
estadsticas. Tal distribucin de las dos variables se denomina bivariante.
La presentacin de los datos experimentalmente observados puede hacerse :

a) Mediante los pares (X
i
, Y
i
) : (X
1
, Y
1
) , (X
2
, Y
2
) , (X
3
, Y
3
) , ...

b) Tabla simple de frecuencias : c) Tabla de frecuencias de doble entrada :

X Y n Y
X
1
Y
1
n
1
Y
1
Y
2
.... Y
m

X
2
Y
2
n
2
X
1
n
11
n
12
.... n
1m

.... .... .... X X
2
n
21
n
22
.... n
2m

X
n
Y
n
n
n
.... .... .... .... ....
X
n
n
n1
n
n2
.... n
nm


Distribuciones marginales :
Son las obtenidas de la distribucin bivariante, al considerar de forma independiente cada una de las dos
variables.
De ellas obtendremos los parmetros de centralizacin y dispersin caractersticos : media y desviacin tpica.
X s s Y s s
X X Y Y
, , , , ,
2 2


Covarianza :
Este ndice de variacin conjunta de X e Y se define como :
( )( )
Y X
N
Y X n
N
Y Y X X n
s
i
i i i
i
i i i
XY
.
. . . .
=

=

para tablas simples de frecuencias
( )( )
Y X
N
Y X n
N
Y Y X X n
s
i j
j i ij
i j
j i ij
XY
.
. . . .
=

=

para tablas de frecuencias de doble
entrada.

Si s
XY
=0 expresar que las variables X e Y son independientes.

RECTAS DE REGRESIN


Representando los pares de observaciones (X,Y) como
puntos en un plano cartesiano, obtenemos el denominado
diagrama de dispersin o nube de puntos.

Por recta de regresin o de ajuste entendemos la recta que
ms se aproxima a los puntos representativos de las
observaciones (X,Y).

El mtodo de los mnimos cuadrados proporciona un sistema
de obtencin de tales rectas, estableciendo que sea mnima
la suma de los cuadrados de las separaciones existentes
entre cada punto y la recta.

Segn se consideren estas separaciones en vertical (lo representado en la figura) o en horizontal, se obtienen,
respectivamente, las rectas de regresin de Y sobre X y de X sobre Y.

2 - Regresin y correlacin (F. lvarez)
RECTA DE REGRESIN DE Y SOBRE X
Y' = a + b.X
a = ordenada en el origen
b = coeficiente de regresin de Y sobre X =pendiente de la recta de regresin =tangente del
ngulo que forma con el eje horizontal.
Y' = predicciones de Y para el valor X observado.

Los coeficientes a y b de la recta de regresin de Y sobre X se obtienen resolviendo el sistema :

= +
= +


Y X n X n b X f a
Y n X n b N a
. . . . . .
. . . .
2


el cul tiene como solucin : b
s
s
a Y b X
XY
X
= =
2
.

RECTA DE REGRESIN DE X SOBRE Y
X' = a' + b'.Y
a' = ordenada en el origen
b' = coeficiente de regresin de X sobre Y =pendiente de la recta de regresin.
X' = predicciones de X para el valor Y observado.

Los coeficientes a' y b' de la recta de regresin de X sobre Y se obtienen igualmente al resolver :

= +
= +


Y X n Y n b Y f a
X n Y n b N a
. . . '. . '.
. . '. '.
2

o directamente : b
s
s
a X b Y
XY
Y
' ' ' . = =
2


Otro procedimiento de clculo simplificado permite obtener los coeficientes de regresin del siguiente modo :
( )( )
( )
2
2
.
. . .

=
X X N
Y X Y X N
b
( )( )
( )
2
2
.
. . .
'

=
Y Y N
Y X Y X N
b

Si utilizamos puntuaciones diferenciales : x X X = y Y Y = ,
las rectas de regresin pierden el trmino independiente (ordenadas en el origen a y a' ) al ser las medias nulas, siendo
su expresin : y' = b.x x' = b'.y

COEFICIENTE DE CORRELACIN DE PEARSON

La recta de regresin es la que pasa ms cerca de las observaciones, pero no nos indica si pasa muy cerca o no de
ellas.
Hemos de definir una medida del grado de asociacin o relacin entre ambas variables, lo cul, en trminos de recta de
ajuste, indicar la bondad de la misma.
Tal coeficiente se denomina coeficiente de correlacin, definido por Pearson del siguiente modo :
r b b
s
s s
XY
X Y
= = . '
.
ya que : r b b
s
s
s
s
s
s s
s
s s
XY
X
XY
Y
XY
X Y
XY
X Y
= = = = . ' .
. .
2 2
2
2 2

Segn las expresiones finales obtenidas para b y b', podemos tambin calcularlo como :
( )( )
( ) [ ] ( ) [ ]
2
2
2
2
. . .
. . .




=
Y Y N X X N
Y X Y X N
r
La expresin conduce a las siguientes relaciones (sin ms que multiplicar y dividir por s
X
o por s
Y
) :
r b
s
s
r b
s
s
X
Y
Y
X
= = . ' .

De aqu resulta que, si se trabaja con puntuaciones tipificadas (las desviaciones tpicas son iguales a 1) :

r = b = b' y las rectas de regresin son : z'
Y
= r.z'
X
; z'
X
= r.z'
Y


El coeficiente de correlacin toma siempre valores comprendidos entre -1 y 1 : -1 r 1

Regresin y correlacin (F. lvarez) - 3
Interpretacin :
r Asociacin de las variables Bondad del ajuste
prximo a 0 Variables independientes o no relacionadas
linealmente
Mala recta de ajuste. No pasa cerca de las
observaciones.
prximo a 1 Variables relacionadas directamente (cuando una
aumenta la otra tambin)
Buena recta de ajuste. Creciente (pendientes b
y b' positivas)
prximo a -1 Variables relacionadas inversamente (cuando una
aumenta la otra disminuye)
Buena recta de ajuste. Decreciente (pendientes
b y b' negativas)

CURVA DE REGRESIN DE LA MEDIA


Este mtodo es aplicable cuando una de las dos variables (o las dos) contiene un bajo
nmero de valores distintos.

Curva de regresin de la media de Y condicionada a X :
El procedimiento consiste en sustituir todos los pares de observaciones que tienen el
mismo valor de X por un nico par que tiene por componentes dicho valor de X y la
media de los valores de Y.

De igual modo puede establecerse la curva de regresin de la media de X condicionada a
Y.

As, por ejemplo, la figura muestra los pares siguientes:
X=1 : (1,1) , (1,3) sustituidos por el par (1,2) , al ser 2 la media de 1 y 3.
X=2 : (2,1) , (2,4) , (2,5) sustituidos por el par (2,3'33) , al ser 3'33 la media de 1, 4 y 5.
... etc ...
Con los pares (1,2) , (2,3'33), ... obtenemos la recta de regresin por el procedimiento ya
descrito.

Razn de correlacin :

=
2
2
2
.
.
1
1
Y
y i
s
s n
N
i


Toma valores comprendidos entre 0 y 1 y siempre verifica que
2
r
2
(r=coef. de
correlacin lineal). La relacin entre las variables X , Y ser de tipo lineal, cuanto ms
prximo sea
2
a r
2
.

OTROS PROCEDIMIENTOS DE CLCULO DEL COEFICIENTE DE CORRELACIN r

Coeficiente de correlacin (phi) :
El siguiente procedimiento se puede utilizar cuando las dos variables X e Y son dicotmicas.
Y
1 0 Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento
X 1 a b representado en la tabla de la izquierda.
0 c d El coeficiente de correlacin toma el valor :
( )( )( )( ) d b c a d c b a
bc ad
+ + + +

=
. . .


Coeficiente de correlacin biserial puntual r
bp
:

El siguiente procedimiento se puede utilizar cuando una variable es continua y la otra dicotmica. Supuesta X
continua :
r
X X
s
pq
bp
X
=

1 0
. .
Siendo :
X
1
la media de los valores de X que se corresponden con un 1 en Y.
X
0
la media de los valores de X que se corresponden con un 0 en Y.
s
X
la desviacin tpica de X (considerados sus valores globalmente).
p la proporcin de unos en Y.
q=1-p la proporcin de ceros en Y.
Coeficiente de correlacin por rangos de Spearman :
El siguiente procedimiento se puede utilizar cuando las dos variables son ordinales (reordenaciones de una serie de
elementos).
( ) 1 .
. 6
1
2
2

=

N N
d



Siendo d las diferencias entre los valores de X e Y.

4 - Regresin y correlacin (F. lvarez)
Los coeficientes de correlacin anteriores no son ms que una adaptacin del coeficiente de correlacin de Pearson
para tipos especiales de variables. En consecuencia, su valor coincide con el que habramos obtenido siguiendo el
procedimiento de Pearson (r); por ello, su interpretacin es la establecida para r .

OTROS COEFICIENTES DE CORRELACIN NO BASADOS EN EL PEARSON
Coeficiente de correlacin tetracrica:
Puede utilizarse cuando ambas variables son continuas , pero ambas pueden dicotomizarse artificialmente.
Y
1 0 Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento que se
X 1 a b representa en la tabla de la izquierda.
0 c d

A) Mtodo abreviado (aproximado) :

1 Calculamos los productos : a.d y b.c.
2 Si a.d > b.c , calculamos el cociente : C = a.d / b.c (el coeficiente de correlacin ser
positivo)
3 Si a.d < b.c , calculamos el cociente : C = b.c / a.d (el coeficiente de correlacin ser
negativo)
4 Consultando la tabla de clculo del coeficiente de correlacin tetracrico, localizamos el cociente C en el
intervalo que lo contiene (con extremos A y B). A su derecha encontramos el coeficiente de correlacin
tetracrico (r
t
), como un valor numrico (n) ms R. De aqu :
( )
r n R con R
C A
B A
t
= + =

:
. 100


B) Mtodo exacto :

El coeficiente de correlacin tetracrico r
t
ser el resultado de resolver la siguiente ecuacin :

( ) ( ) ( ) ( ) r z z
r
z z
r
z z z z
r ad bc
n f z f z
t
t t t
+ + + + =

. '.
!
. ' .
!
. ' ' .
!
...
. .
. ( ). ( ')
2
2 2
3
3 3
4
2
2
1 1
3
3 3
4


Como es lgico, la mayor exactitud en el clculo r
t
, se obtiene al considerar un mayor nmero de sumandos
del desarrollo en serie anterior. Esta dificultad aconseja seguir el mtodo abreviado descrito anteriormente.

En la ecuacin que permite calcular r
t
:
z valor de la curva normal tipificada N(0,1), que deja a su derecha un rea m, igual a la menor de las
cantidades (a+c)/n o (b+d)/n.
z' valor de la curva normal tipificada N(0,1), que deja a su derecha un rea m, igual a la menor de las
cantidades (a+b)/n o (c+d)/n.
f(z) y f(z') ordenadas de la curva normal, correspondientes a los valores z y z' anteriores. Tabuladas
para cada m.

Coeficiente de correlacin biserial r
b
:

Puede utilizarse cuando ambas variables son continuas , pero una de ellas puede dicotomizarse artificialmente.

Supuesta X continua y Y dicotomizada (valores 1 y 0) , el coeficiente de correlacin biserial se calcula del modo
siguiente :

r
X X
s
pq
f z
b
X
=

1 0
.
.
( )

Siendo :
X
1
la media de los valores de X que se corresponden con un 1 en Y.
X
0
la media de los valores de X que se corresponden con un 0 en Y.

La ordenada f(z) :



s
X
la desviacin tpica de X (considerados sus valores globalmente).
p la proporcin de unos en Y.
q=1-p la proporcin de ceros en Y.
z el valor normal tipificado (N(0,1)) que deja a su derecha (o a su izquierda) el
rea p.
f(z) la ordenada correspondiente a z en la curva normal.

NOTA :
Los clculos de z y f(z) no es preciso realizarlos ya que, para cada
valor de la probabilidad p (o q indistintamente), se encuentran
tabulados los valores de p.q/f(z).

Regresin y correlacin (F. lvarez) - 5
Coeficiente de correlacin (tau) de Kendall :

Como el de rangos de Spearman, este coeficiente es aplicable cuando las dos variables son ordinales
(reordenaciones de una serie de elementos).

Procedimiento de clculo :

a) Reordenamos los pares de observaciones de modo que la variable X (primer elemento del par) quede en orden
ascendente.
b) Comparamos cada valor de Y con los Y
i
siguientes, contando una permanencia si Y <Y
i
y una inversin si Y >Y
i
.

=

N N
n n
p i
.( ) 1
2

Siendo :
n el nmero de pares de valores (X , Y)
N
p
el nmero total de "permanencias"
N
i
el nmero total de "inversiones"

Utilizacin e interpretacin de los coeficientes estudiados en este epgrafe:

Los coeficientes tetracrico y biserial parten de variables continuas que pueden dicotomizarse (ambas o slo
una).
Para su aplicacin rigurosa es necesario que :
1. la distribucin de la variable o variables consideradas continuas debe ser "normal".
2. la relacin que suponemos existe entre ambas variables es de tipo "lineal".

Sus valores no tienen porqu coincidir con el del coeficiente de correlacin de Pearson, si bien verifican las
mismas propiedades que ste. Es decir :
Los coeficientes tetracrico y toman valores comprendidos entre -1 y 1 : -1 coeficiente 1.
El coeficiente biserial puede ser mayor que 1 y menor que -1. En valor absoluto, ser mayor que el biserial
puntual.
Valores prximos a cero implican falta de relacin entre las variables (independencia).

FUENTES DE VARIANZA EN LA CORRELACIN

Expresemos la desviacin de Y respecto de su media como :
( ) ( ) ( ) Y Y Y Y Y Y + = ' '
( ) ' Y Y es el error cometido en la prediccin. Representa la porcin de informacin no asociada a X.
( ) Y Y ' representa, en consecuencia, la informacin asociada a X.

En trminos de varianzas : ( ) ( ) ( )

+ =
2
2
2
' ' Y Y Y Y Y Y
( )


2
Y Y

=
( )


2
' Y Y

+
( )


2
' Y Y
Varianza total

Varianza no explicada por X
(varianza de los errores o residual)

Varianza explicada por X

Dividiendo los sumandos anteriores por la varianza de Y obtendremos la proporcin de varianza de Y no explicada y
explicada por la variable X. La manipulacin de esta operacin conduce a las expresiones y definiciones siguientes :
( )
( )
( )
( )
( )
( )
( )
( )
2
2
2
2
2
2
2
2
2
' ' '
1 r
Y Y
Y Y
Y Y
Y Y
Y Y
Y Y
Y Y
Y Y
+

= =



Varianza de las predicciones Y' =
( )
N
Y Y
s
Y


=
2
2
'
'

Proporcin de varianza de las predicciones Y' =
s
s
r
Y
Y
'
2
2
2
=

Proporcin de varianza explicada por X = r
2
= Coeficiente de determinacin ( R
2
)


Proporcin de varianza no explicada por X = 1 - r
2

Varianza de los errores o residual =
( ) ( ) ( )
( )
( )
2 2
2
2
2
2
2
.
2
1 .
'
.
'
r s
Y Y
Y Y
N
Y Y
N
Y Y
s s
Y X Y e
=

= =



La raz cuadrada de la varianza residual se denomina error tpico de la prediccin : s s r
Y X Y .
. = 1
2


IMPORTANTE : Observe los diferentes significados e interpretaciones de r
2
.
6 - Regresin y correlacin (F. lvarez)

FORMULARIO - RESUMEN DEL TEMA

N
x n
x

=
.

2
2
2
.
x
N
x n
s
x
=


N
y n
y

=
.
2
2
2
.
y
N
y n
s
y
=

y x
N
y x n
s
xy
.
. .
=



Recta de regresin de y
sobre x
(puntuaciones directas)
y a bx ' . = +
Predicciones : y y '=

= +
= +


y x n x n b x n a
y n x n b N a
. . . . . .
. . . .
2

b
s
s
a y bx
xy
x
=
=
2
.

Recta de regresin de x
sobre y
(puntuaciones directas)
x a b y ' ' '. = +
Predicciones : x x '=

= +
= +


y x n y n b y n a
x n y n b N a
. . . '. . '.
. . '. '.
2

b
s
s
a x b y
xy
y
'
' '.
=
=
2


Coeficiente de correlacin (de Pearson y equivalentes) :

Pearson Ph Biserial puntual Rangos de Spearman
r bb
s
s s
xy
x y
= = . '
.

r b
s
s
b
s
s
x
y
y
x
= = . '.

=

+ + + +
ad bc
a b c d a c b d ( ).( ).( ).( )


r
x x
s
pq
bp
x
=

1 0
. .

=

1
6
1
2
2
.
( )
d
N. N


Coeficiente de correlacin no basados en el de Pearson :

Tetracrico Biserial Tau de Kendall
(Tabulado)
( )
r n R con R
C A
B A
t
= + =

:
. 100


r
X X
s
pq
f z
b
X
=

1 0
.
.
( )

=

N N
n n
p i
.( ) 1
2


Puntuaciones
directas

(x,y)
Puntuaciones diferenciales

(d x x d y y
x y
= = , )
Puntuaciones tipificadas
z
x x
s
z
y y
s
x
x
y
y
=

=

,


y a bx ' . = +

d d s s s s s s
x y dx x dy y dxdy xy
= = = = = 0 0 , , , ,

(a = 0 ; b se mantiene)
z z
s s s
s
s s
r
x y
zx zy zxzy
xy
x y
= =
= = = =
0 0
1 1
,
, ,
.

(a = 0 ; b = r)
r
s
s s
xy
x y
=
.


d bd
y x
' . =

z r z
y x
' . =

Relacin fundamental :
Varianza de y =
=Varianza residual (de errores) +Varianza de las
predicciones.

s s s
y e y
2 2 2
= +
'

Varianza de las predicciones :
( )
s
y y
N
y'
'
2
2
=


Proporcin de varianza explicada o asociada a la
regresin,
o proporcin de varianza de las predicciones,
o coeficiente de determinacin :
s
s
r
y
y
'
2
2
2
=
Regresin y correlacin (F. lvarez) - 7
Varianza de los errores (o residual) :
( )
( ) s s
y y
N
s r
e yx y
2 2
2
2 2
1 = =

=

.
'
.

Error tpico de la prediccin (raz de la varianza de los
errores):
s
y.x
= s r
y
. 1
2

Proporcin de varianza no explicada o no asociada a la
regresin,
o proporcin de varianza de los errores :
s
s
r
e
y
2
2
2
1 =

Signo de b = signo de b = signo de r = signo de la
covarianza

r = 0 absoluta independencia
-1 r 1
r = 1 o r = -1 absoluta dependencia (directa o
inversa)
0 r
2
1

8 - Regresin y correlacin (F. lvarez)
EJERCICIOS RESUELTOS

1
La tabla siguiente contiene los resultados de las calificaciones en Matemticas (X) y Lengua (Y) de un
grupo de 40 alumnos de Secundaria.

X Y n
3 4 3 a) Obtenga la recta de regresin de Y sobre X.
3 5 5 b) Obtenga la recta de regresin de X sobre Y.
5 5 12 c) Calcule e interprete el coeficiente de correlacin lineal.
6 6 4 d) Obtenga el error tpico de la prediccin.
6 7 5 e) Qu proporcin de varianza de Y no queda explicada por X ?.
6 8 3
7 7 6
8 8 2

Tabla de clculos :

X Y n n.X n.Y n.X
2
n.Y
2
n.X.Y
3 4 3 9 12 27 48 36
3 5 5 15 25 45 125 75
5 5 12 60 60 300 300 300
6 6 4 24 24 144 144 144
6 7 5 30 35 180 245 210
6 8 3 18 24 108 192 144
7 7 6 42 42 294 294 294
8 8 2 16 16 128 128 128
40 214 238 1226 1476 1331

a) Recta de regresin de Y sobre X.
X Y = = = =
214
40
5 35
238
40
5 95 ' '
( )( )
( )
71 ' 0
3244
2308
214 1226 . 40
238 . 214 1331 . 40
.
. . .
2 2
2
= =

=


X X N
Y X Y X N
b


a Y b X = = = . ' ' . ' ' 5 95 0 7115 5 35 2 1436


Recta de regresin de Y sobre X :

Y' = 2'1436 + 0'7115.X

b) Recta de regresin de X sobre Y.
( )( )
( )
96 ' 0
2396
2308
238 1476 . 40
238 . 214 1331 . 40
.
. . .
'
2 2
2
= =

=


Y Y N
Y X Y X N
b


a X b Y ' ' . ' ' . ' ' = = = 5 35 0 9633 5 95 0 3815


Recta de regresin de X sobre Y :

X' = -0'3815 + 0'9633.Y

c) Coeficiente de correlacin de Pearson.
Conocidos los coeficientes de regresin puede calcularse como :
r b b = = = . ' ' . ' ' 0 7115 0 9633 0 8279
Existe una elevada relacin entre las calificaciones en Matemticas y Lengua. Dicha relacin es positiva
(directa); es decir, alumnos con altas calificaciones en Matemticas se corresponden con altas calificaciones en
Lengua, y a la inversa.

Podemos afirmar que las rectas de regresin obtenidas son buenas rectas de ajuste. Es decir, expresan con
una elevada aproximacin la relacin matemtica (lineal) existente entre las calificaciones en Matemticas y
Lengua.

d) Error tpico de la prediccin.
Calculada la varianza de Y : 4975 ' 1 95 ' 5
40
1476
.
2 2
2
2
= = =

Y
N
Y n
s
i
i i
Y

s s r
Y X Y .
. ' . ' ' = = = 1 1 4975 1 0 8279 0 6864
2 2


Regresin y correlacin (F. lvarez) - 9
e) Proporcin de varianza no explicada por X.
La proporciona : 1 - r
2
= 1 - 0'8279
2
= 0'3146. Es decir el 31'46%.


2
De la distribucin bivariante siguiente :

Y
0 1 2
X 2 0 1 5
4 0 9 0
6 8 0 0

a) Obtenga la recta de regresin de Y sobre X.
b) Obtenga la recta de regresin de X sobre Y.
c) Calcule e interprete el coeficiente de correlacin lineal.
d) Calcule su varianza residual.
e) Calcule e interprete el coeficiente de determinacin.

Obtenemos las distribuciones marginales de X y de Y totalizando las frecuencias en filas y columnas :

Y
0 1 2
X 2 0 1 5 6
4 0 9 0 9
6 8 0 0 8
8 10 5 23

X n n.X n.X
2
Y n n.Y n.Y
2

2 6 12 24 0 8 0 0
4 9 36 144 1 10 10 10
6 8 48 288 2 5 10 20
23 96 456 23 20 30

La suma de los productos de X por Y hemos de obtenerla directamente de la tabla proporcionada :
= =

i j
j i ij
Y X n Y X . . . 0.2.0 +1.2.1 +5.2.2 +0.4.0 +9.4.1 +0.4.2 +8.6.0 +0.6.1 +0.6.2 =58
Como puede observarse, slo realizamos los productos correspondientes a frecuencias y valores de variables no nulos.
X Y .

= 1.2.1 +5.2.2 +9.4.1 =58


Utilicemos las medias y varianzas de X e Y, as como la covarianza, en los clculos solicitados.
X Y s s
X Y
= = = = = = = =
96
23
4 1739
20
23
0 8696
456
23
4 1739 2 4045
30
23
0 8696 0 5482
2 2 2 2
' ' ' ' ' '
Covarianza = 1078 ' 1 8696 ' 0 . 1739 ' 4
23
58
.
.
.
. .
= = = =

Y X
N
Y X
Y X
N
Y X n
s
i j
j i ij
XY


a) Recta de regresin de Y sobre X :
b
s
s
a Y b X
XY
X
= =

= = = =
2
1 1078
2 4045
0 4607 0 8696 0 4607 4 1739 2 7925
'
'
' . ' ( ' ). ' '
Y' = 2'7925 - 0'4607 . X

b) Recta de regresin de X sobre Y :
b
s
s
a X b Y
XY
Y
'
'
'
' ' ' . ' ( ' ). ' ' = =

= = = =
2
1 1078
0 5482
2 0207 4 1739 2 0207 0 8696 5 9310
X' = 5'9310 - 2'0207 . Y

c) Coeficiente de correlacin :
Utilizando la expresin ( )( ) 9648 ' 0 0207 ' 2 . 4607 ' 0 ' . = = = b b r podemos tener duda en cuanto
al signo del coeficiente de correlacin. Este signo es el de b y b', ya que es el que proporciona la covarianza.
Calculado como r
s
s s
XY
X Y
= =

=
.
'
' . '
'
1 1078
2 4045 0 5486
0 9648 no se plantear tal dificultad.

10 - Regresin y correlacin (F. lvarez)
d) Varianza residual :
( ) ( ) ( ) 0379 ' 0 9648 ' 0 1 . 5482 ' 0 1 .
2 2 2 2
.
2
= = = = r s s s
Y X Y e


e) Coeficiente de determinacin :
Es el cuadrado del coeficiente de correlacin, representando la proporcin de varianza explicada por la variable
X (en el ajuste de Y sobre X).
( ) 9309 ' 0 9648 ' 0
2 2 2
= = = r R
La variable X explica el 93'09% de la varianza de Y. Slo el 6'91% no es atribuible a X.


3
De la siguiente distribucin bivariante :

Y
[0,1) [1,2) [2,3]
X 2 1 2 1
3 3 6 3
4 1 2 1

a) Calcule e interprete el valor de la covarianza.
b) Obtenga la recta de regresin de Y sobre X.
c) Obtenga la recta de regresin de X sobre Y.
d) Calcule el coeficiente de correlacin lineal y el de determinacin.
e) De la varianza total de Y , determine la proporcin atribuible a la variable X.

Totalizando filas y columnas obtendremos las distribuciones marginales de X e Y :

Y
0'5 1'5 2'5
X 2 1 2 1 4
3 3 6 3 12
4 1 2 1 4
5 10 5 20

X n n.X n.X
2
Y n n.Y n.Y
2

2 4 8 16 0'5 5 2'5 1'25
3 12 36 108 1'5 10 15 22'5
4 4 16 64 2'5 5 12'5 31'25
20 60 188 20 30 55

= =

i j
j i ij
Y X n Y X . . . 1.2.0'5 +2.2.1'5 +1.2.2'5 +3.3.0'5 +6.3.1'5 +3.3.2'5 +1.4.0'5 +2.4.1'5 +1.4.2'5 =90

a) Covarianza :
X Y = = = =
60
20
3
30
20
1 5 '
Covarianza = 0 5 ' 4 5 ' 4 5 ' 1 . 3
20
90
.
.
.
. .
= = = = =

Y X
N
Y X
Y X
N
Y X n
s
i j
j i ij
XY


Interpretacin :
Las variables son independientes.
Siendo nula la covarianza, tambin los sern los coeficientes de regresin, el coeficiente de correlacin
y el de determinacin, dado que en sus clculos interviene la covarianza en el numerador.

Al ser nulos los coeficientes de regresin, a coincidir con la media de Y y a' con la de X.

b) Recta de regresin de Y sobre X :
b
s
s s
a Y b X
XY
X X
= = = = = =
2 2
0
0 1 5 0 3 1 5 . ' . ' Y' = 1'5
c) Recta de regresin de X sobre Y :
b
s
s s
a X b Y
XY
Y Y
' ' ' . . ' = = = = = =
2 2
0
0 3 0 1 5 3 X' = 3
Regresin y correlacin (F. lvarez) - 11
d) Coeficiente de correlacin y de determinacin :
Como se indic en el apartado a), al ser nula la covarianza, ambos coeficientes tambin lo son :
r b b = = = . ' . 0 0 0 r
s
s s s s
XY
X Y X Y
= = =
. .
0
0 R r
2 2
0 = =
e) Proporcin de varianza explicada por X :
Proporcin de varianza explicada por X = r
2
= Coeficiente de determinacin =0


4
Se desea estudiar la relacin entre las calificaciones obtenidas en un test (puntuado de 0 a 5) y el sexo
del alumno que lo realiza. Los resultados observados fueron :

Test Sexo N de alumnos
1 Varn 3
1 Hembra 1
2 Varn 2
2 Hembra 4
3 Varn 3
4 Hembra 5
4 Varn 1
5 Hembra 1
5 Varn 2

a) Mida el grado de asociacin existente entre las dos variables mediante el coeficiente ms
adecuado.
b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el calculado en el
apartado anterior.

a) Siendo dicotmica la segunda variable, calcularemos el coeficiente de correlacin biserial puntual :

Denominando Y a la variable sexo (asignamos : 1=Hombre ; 0=Mujer) y X a la variable puntuacin en el test,
procederemos a los clculos necesarios para su obtencin. Ello nos conduce a calcular las medias de los
valores de X que se corresponden con un 1 y con un 0 en Y (X
1
y X
0
) de forma separada, as como la
desviacin tpica de X.
Las siguientes tablas facilitan nuestras operaciones :

X Y n n.X n.X
2
X
1
n n.X
1
X
0
n n.X
0

1 1 3 3 3 1 3 3 1 1 1
1 0 1 1 1 2 2 4 2 4 8
2 1 2 4 8 3 3 9 4 5 20
2 0 4 8 16 4 1 4 5 1 5
3 1 3 9 27 5 2 10 11 34
4 0 5 20 80 11 30 q
4 1 1 4 16 p
5 0 1 5 25
5 1 2 10 50
N= 22 64 226

X
1
30
11
2 7273 = = ' X
0
34
11
3 0909 = = ' p = =
11
22
0 5 ' q p = = =
11
22
0 5 1 '
X = =
64
22
2 9091 ' s s
X X
2 2
226
22
2 9091 1 8099 1 8099 1 3453 = = = = ' ' ' '
Con esto : r
X X
s
p q
bp
X
=

=

=
1 0
2 7273 3 0909
1 3453
0 5 0 5 0 1351 . .
' '
'
. ' . ' '

b) Coeficiente de correlacin de Pearson :

El propsito de este apartado no es otro que comprobar que efectivamente coinciden los coeficientes de
correlacin de Pearson y biserial puntual. Calculemos la media y desviacin tpica de Y, as como la covarianza:

12 - Regresin y correlacin (F. lvarez)

X Y n f.Y n.Y
2
n.X.Y
1 1 3 3 3 3
1 0 1 0 0 0
2 1 2 2 2 4
2 0 4 0 0 0
3 1 3 3 3 9
4 0 5 0 0 0
4 1 1 1 1 4
5 0 1 0 0 0
5 1 2 2 2 10
22 11 11 30
Y = =
11
22
0 5 ' s s
Y Y
2 2
11
22
0 5 0 25 0 25 0 5 = = = = ' ' ' '
s r
XY
= = =

=
30
22
2 9091 0 5 0 0909
0 0909
1 3453 0 5
0 1351 ' . ' '
'
' . '
'


5
La siguiente tabla nos muestra la distribucin por sexo de un grupo de 167 personas, indicando si
fuman o no.

Fuma No fuma
Hombre 85 12
Mujer 10 60

a) Calcule el coeficiente de ms adecuado para medir el grado de asociacin existente entre el sexo y
el ser o no fumador.
b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el calculado en el apartado
anterior.

a) Las dos variables son dicotmicas. El coeficiente especfico para esta situacin es el coeficiente de
correlacin (phi) . Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos :

Y
1 (Fuma) 0 (No fuma)
X 1 (Hombre) a =85 b =12 97
0 (Mujer) c =10 d =60 70
95 72
( )( )( )( )
7307 ' 0
72 . 95 . 70 . 97
10 . 12 60 . 85
. . .
=

=
+ + + +

=
d b c a d c b a
bc ad


b) Coeficiente de correlacin de Pearson :
X Y n n.X n.Y n.X
2
n.Y
2
n.X.Y
1 1 85 85 85 85 85 85
1 0 12 12 0 12 0 0
0 1 10 0 10 0 10 0
0 0 60 0 0 0 0 0
167 97 95 97 95 85
X = =
97
167
0 5808 ' s s
X X
2 2
97
167
0 5808 0 2435 0 2435 0 4934 = = = = ' ' ' '
Y = =
95
167
0 5689 ' s s
Y Y
2 2
95
167
0 5689 0 2453 0 2453 0 4952 = = = = ' ' ' '
s r
XY
= = = =
85
167
0 5808 0 5689 0 1786
0 1786
0 4934 0 4952
0 7307 ' . ' '
'
' . '
'

Coincidente con el calculado en el apartado anterior, como era de esperar.

Regresin y correlacin (F. lvarez) - 13
6
Doce atletas (A, B, C, ..., L) participan en una carrera de 100 metros y en otra de lanzamiento de peso.
Las clasificaciones en dichas pruebas fueron :
100 metros : A , B , C , D , E , F , G , H , I , J , K , L
Peso : K , I , J , L , G , H , F , D , E , B , C , A
a) Determine la relacin existente entre las dos clasificaciones en las pruebas descritas, mediante
el coeficiente ms adecuado.
b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el calculado en el
apartado anterior.

Nos encontramos ante dos reordenaciones distintas de los 12 individuos. Calcularemos pues el coeficiente de
correlacin por el mtodo de los rangos de Spearman.

a) Coeficiente de correlacin :
( ) ( )
9301 ' 0
1 12 . 12
552 . 6
1
1 .
. 6
1
2 2
2
=

=

N N
d
(Ver tabla siguiente)

A continuacin se ofrecen las tablas auxiliares de clculos de y r , calculados para comprobar que coinciden.
Para el clculo de Para el clculo de r
X Y d d
2
X Y X
2
Y
2
X.Y
1 11 -10 100 1 11 1 121 11
2 9 -7 49 2 9 4 81 18
3 10 -7 49 3 10 9 100 30
4 12 -8 64 4 12 16 144 48
5 7 -2 4 5 7 25 49 35
6 8 -2 4 6 8 36 64 48
7 6 1 1 7 6 49 36 42
8 4 4 16 8 4 64 16 32
9 5 4 16 9 5 81 25 45
10 2 8 64 10 2 100 4 20
11 3 8 64 11 3 121 9 33
12 1 11 121 12 1 144 1 12
78 78 0 552 78 78 650 650 374

b) Coeficiente de correlacin de Pearson :
X = =
78
12
6 5 ' s s
X X
2 2
650
12
6 5 11 9167 11 9167 3 4521 = = = = ' ' ' '
Y = =
78
12
6 5 ' s s
Y Y
2 2
650
12
6 5 11 9167 11 9167 3 4521 = = = = ' ' ' '
s r
XY
= = =

=
374
12
6 5 6 5 11 0833
11 0833
3 4521 3 4521
0 9301 ' . ' '
'
' . '
'

En efecto coinciden los coeficientes de correlacin obtenidos por los dos mtodos.

Su alto valor negativo (prximo a -1) nos indica que existe una fuerte relacin entre las dos clasificaciones en
las pruebas atlticas, quedando mejor clasificados en una los peor clasificados en la otra.


7
De los archivos de la Direccin provincial de Trfico se han seleccionado los expedientes de 64
conductores, realizando el siguiente recuento en funcin del sexo (M = mujer ; H = hombre) y el nmero
de multas impuestas durante el ltimo ao.

Sexo
M H
N de multas 1 9 0
en el ltimo ao 2 7 0
3 6 2
4 1 9
5 1 11
6 0 18

Qu conclusin puede deducirse acerca de la relacin existente entre sexo y nmero de denuncias ?.
Utilice para ello el ndice de asociacin ms apropiado.

Al ser dicotmica la variable sexo, obtendremos el coeficiente de correlacin biserial puntual :
14 - Regresin y correlacin (F. lvarez)

Y Y=1 Y=0
M =1 H =0 n n.X n.X
2
n.X
1
n.X
0

X 1 9 0 9 9 9 9 0
2 7 0 7 14 28 14 0
3 6 2 8 24 72 18 6
4 1 9 10 40 160 4 36
5 1 11 12 60 300 5 55
6 0 18 18 108 648 0 108
24 40 N=64 255 1217 50 205

X
1
50
24
2 0833 = = ' X
0
205
40
5 125 = = ' p = =
24
64
0 375 ' q p = = =
40
64
0 625 1 '
X = =
255
64
3 9844 ' s s
X X
2 2
1217
64
3 9844 3 1404 3 1404 1 7721 = = = = ' ' ' '
Con esto : r
X X
s
p q
bp
X
=

=

=
1 0
2 0833 5 125
1 7721
0 375 0 625 0 831 . .
' '
'
. ' . ' '

Es decir existe una fuerte relacin, de sentido inverso, entre ambas variables. Algo que poda advertirse al
analizar el recuento de las observaciones.


8
Para analizar si existe o no relacin entre las calificaciones en materias cientficas y las del rea
literaria, seleccionamos ocho alumnos a los que sometemos a dos pruebas (una de cada rea).
Clasificados por orden de puntuacin result :

Alumno 1 2 3 4 5 6 7 8
P. Cientfica 3 6 7 1 2 8 5 4
P. Literaria 3 5 7 4 1 8 2 6

Utilizando el ndice adecuado establezca el grado de relacin que existe entre las calificaciones de
dichas reas de conocimiento.

Calcularemos el coeficiente de correlacin (rangos de Spearman) al presentarse dos variables ordinales (dos
reordenaciones de los 8 alumnos).
Denominamos X e Y a las variables que proporcionan, respectivamente, las clasificaciones en la prueba cientfica y en la
literaria . Ordenadas las primeras, calculemos sus diferencias :

X Y d d
2

1 4 -3 9
2 1 1 1
3 3 0 0
4 6 -2 4
5 2 3 9
6 5 1 1
7 7 0 0
8 8 0 0
24

Con ello :
( ) ( )
7143 ' 0
1 8 . 8
24 . 6
1
1 .
. 6
1
2 2
2
=

=

N N
d

Es decir, existe una alta relacin entre las calificaciones. Generalmente un alumno con altas calificaciones en el
rea cientfica tendr altas calificaciones en el rea de conocimientos literarios.

Regresin y correlacin (F. lvarez) - 15
9
Un grupo de COU integran 17 alumnos de Ciencias y 14 de Letras. De ellos repiten curso 16 de Ciencias
y slo 2 de Letras. Calcule el coeficiente de correlacin ms adecuado para medir el grado de
asociacin existente entre las variables descritas.

Se trata de analizar la relacin que puede existir entre la especialidad (Ciencias o Letras) y el ser repetidor o no serlo.
Siendo las dos variables dicotmicas, calculamos el coeficiente de correlacin (phi) .

Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos :

Y
1 (Repite) 0 (No repite)
X 1 (Ciencias) a =16 b =1 17
0 (Letras) c =2 d =12 14
18 13
( )( )( )( )
=

=
+ + + +

= 8051 ' 0
13 . 18 . 14 . 17
2 . 1 12 . 16
. . . d b c a d c b a
bc ad
alta relacin entre las variables.


10
Se somete a 10 alumnos a dos test diferentes encaminados a medir su percepcin visual. Los
resultados fueron los siguientes :

Test A 3 4 5 5 6 7 8 9 10 12
Test B 4 5 5 6 7 8 8 10 11 14

a) Obtenga las ecuaciones de las rectas de regresin del test A sobre el B, en puntuaciones directas,
diferenciales y tpicas.
b) Determine la proporcin de varianza residual que se presenta en dicho ajuste.

Denominando Y a las puntuaciones en el test A (variable dependiente en el ajuste) y X a las correspondientes al text B,
procedemos a realizar los clculos necesarios :

X Y X
2
Y
2
X.Y
3 4 9 16 12
4 5 16 25 20
5 5 25 25 25
5 6 25 36 30
6 7 36 49 42
7 8 49 64 56
8 8 64 64 64
9 10 81 100 90
10 11 100 121 110
12 14 144 196 168
69 78 549 696 617

( )( )
( )
0809 ' 1
69 549 . 10
78 . 69 617 . 10
.
. . .
2 2
2
=

=


X X N
Y X Y X N
b
a Y b X
Y
N
b
X
N
= = = =

. . ' . '
78
10
1 0809
69
10
0 3416
( )( )
( ) [ ] ( ) [ ]
( )( )
9861 ' 0
78 696 . 10 . 69 549 . 10
78 . 69 617 . 10
. . .
. . .
2 2 2
2
2
2
=


=


=


Y Y N X X N
Y X Y X N
r

a) Rectas de regresin :
1.- En puntuaciones directas : Y' =a +b . X Y' = 0'3416 + 1'0809 . X

2.- En puntuaciones diferenciales : y' =b . x y' = 1'0809 . x

3.- En puntuaciones tipificadas: z
y'
=r .z
x
z
y'
= 0'9861 .z
x


b) Proporcin de varianza residual :
Cuando se habla de proporcin siempre se refiere al cociente entre la varianza total de Y; es decir, a la
proporcin de varianza de Y que representa la varianza solicitada.

16 - Regresin y correlacin (F. lvarez)
Siendo la varianza de los errores (residual) : ( )
2 2 2
.
2
1 . r s s s
Y X Y e
= =
( )
0277 ' 0 9861 ' 0 1 1
1 .
2 2
2
2 2
2
2
.
= = =

= r
s
r s
s
s
Y
Y
Y
X Y

Slo representa un 2'77% de la varianza del test A (Y), siendo la proporcin de varianza no explicada por el test
B (X).



11
A partir de los seis pares de valores, correspondientes a una variable bidimensional (X,Y) ,

(1 , 4) , (2 , 5) , (3 , 5) , (4 , 6) , (5 , 7)

a) Calcule la ecuacin de la recta de regresin de Y sobre X.
b) Represente grficamente el diagrama de dispersin y la recta de regresin.
c) Calcule e interprete el coeficiente de correlacin.

Clculos necesarios (realizados en este ejemplo a partir de las medias y varianzas de X e Y y de la covarianza) :

X Y X
2
Y
2
X.Y
1 4 1 16 4
2 5 4 25 10
3 5 9 25 15
4 6 16 36 24
5 7 25 49 35
15 27 55 151 88

X s Y s s
X Y XY
= = = = = = = = = =
15
5
3
55
5
3 2
27
5
5 4
151
5
5 4 1 04
88
5
3 5 4 1 4
2 2 2 2
' ' ' . ' '

a) b a = = = =
1 4
2
0 7 5 4 0 7 3 3 3
'
' ' ' . ' Y = 3'3 + 0'7 . X
b)
Para X =0 Y =3'3 (0 , 3'3)
Para X =5 Y =6'8 (5 , 6'8)

Enlazando los dos puntos anteriores obtenemos la grfica de la recta.





Observe que el punto que tiene por coordenadas las medias
de X e Y (3 , 5'4) , es un punto contenido en la recta de
regresin.

Apreciamos la proximidad de los puntos a la recta de ajuste,
as como que dicha recta es creciente (r >0).

c) r = =
1 4
2 1 04
0 9707
'
. '
'

Elevada relacin entre las variables y de signo positivo.
La recta de regresin es una buena funcin de ajuste, siendo creciente (r >0).

Para representar grficamente la recta de regresin, localizamos dos puntos cualesquiera de ella :
Y =3'3 +0'7 . X

Regresin y correlacin (F. lvarez) - 17
12
La recta de regresin de Y sobre X, calculada en el estudio de la relacin existente entre dos variables,
tiene por ecuacin Y' = 5'4 - 0'9 . X , siendo la varianza de la variable dependiente Y igual a 1'84.
Si la distribucin de las predicciones de Y tiene como media 3'6 y varianza 1'619936,
a) calcule la media y varianza de X
b) determine la ecuacin de la recta de regresin de X sobre Y
c) obtenga el valor del coeficiente de correlacin.

Iniciamos aqu una serie de ejemplos que requieren para su resolucin el empleo de las diferentes relaciones
funcionales (frmulas para entendernos) tratadas en el tema.

Resulta de utilidad escribir las expresiones en las que intervienen los datos suministrados, sustituyendo sus valores
conocidos. Tal vez as podamos obtener los que nos pida el problema.
1.- ( )

= = + = = = 9 ' 0 . 9 ' 0 4 ' 5 . . 9 ' 0 4 ' 5 '


2
X
XY
s
s
b X Y X b Y a X Y
2.- s s
Y Y
2
1 84 1 84 1 3565 = = = ' ' '
3.- Y' = Y = 3' 6 s = 1' 619936
Y'
2


Siendo 3'6 la media de Y, la expresin de a nos permite obtener la media de X :
5 4 0 9 5 4 3 6 0 9
5 4 3 6
0 9
2 ' ' . ' ' ' .
' '
'
= + = + =

= Y X X X
La varianza de X no puede obtenerse de momento (para extraerla del valor del coeficiente de regresin b necesitamos
conocer antes la covarianza o el coeficiente de correlacin).

Partiendo, por ejemplo, de la proporcin de varianza explicada (hace referencia a la varianza de las predicciones) :
r
s
s
r
Y
Y
2
2
2
1 619936
1 84
0 8804 0 8804 0 9383 = = = = =
'
'
'
' ' '
El coeficiente de correlacin ser negativo, ya que lo es el coeficiente de regresin b (b =-0'9), luego : r = 0'9383 .
La expresin r b
s
s
X
Y
= . nos permitir calcular la desviacin tpica de X :
r b
s
s
s
s s
X
Y
X
X X
= = =

= = = . ' ' .
'
' . '
'
' ' 0 9383 0 9
1 3565
0 9383 1 3565
0 9
1 4142 1 4142 2
2 2


Finalmente, calculemos la recta de ajuste de X sobre Y :
b
s
s
r
s
s
a X b Y
XY
Y
X
Y
' . ' .
'
'
' ' ' . ( ' ). ' ' = = = = = = =
2
0 9383
1 4142
1 3565
0 9783 2 0 9783 3 6 5 5217
Su ecuacin es :
X' = 5'5217 - 0'9783 . Y


13
La recta de regresin de Y sobre X corta a los ejes coordenados en los puntos (0'5,0) y (0,-0'4), siendo la
proporcin de varianza no explicada por X del 25'58%.
a) Calcule los coeficientes de correlacin y de determinacin.
b) Siendo X= 5, qu pronstico diferencial corresponde a una puntuacin directa X = 4 ?.

a) Los coeficientes de correlacin y de determinacin se obtienen directamente de la proporcin de varianza no
explicada :
1 - r
2
=0'2558 r
2
=1 - 0'2558 =0'7442

Luego :
Coeficiente de determinacin : R
2
=r
2
= 0'7442
Coeficiente de correlacin : r = = 0 7442 0 8627 ' '

Para determinar si el coeficiente de correlacin es positivo o negativo se pueden seguir distintos
procedimientos. Uno podra consistir en dibujar la recta de regresin (enlazando los dos puntos
conocidos) observando si es creciente (b >0 y r >0) o decreciente (b <0 y r <0). As resulta que
es creciente y, por tanto, r = 0'8627.

b) Determinemos la recta de regresin en puntuaciones directas y diferenciales :

Si la recta de regresin Y' =a +b.X pasa por (0'5,0) y (0,-0'4) , significa que :
- para X =0'5 Y' =0 : 0 =a +b.0'5
- para X =0 Y' =-0'4 : -0'4 =a +b.0 -0'4 = a 0 =-0'4 +b.0'5 b =0'4 / 0'5 = 0'8

18 - Regresin y correlacin (F. lvarez)
La recta de regresin es :
en puntuaciones directas : Y' = -0'4 + 0'8 . X
en puntuaciones diferenciales : y' = 0'8 . x

A la puntuacin directa X =4 , le corresponde una puntuacin diferencial : x X X = = = 4 5 1
luego el pronstico diferencial correspondiente es :
y' =0'8 . x =0'8 . (-1) y' = -0'8
NOTA :
Calculado b =0'8 >0, concluiremos que el coeficiente de correlacin es tambin positivo (r = 0'8627), tal como
se dedujo en el apartado a).


14
A las puntuaciones directas 2 y 6 de la variable X le corresponden predicciones 3'2 y 7'2
respectivamente.
Si la proporcin de varianza asociada a X es del 70'42% y los valores de la variable dependiente Y son:
1 , 3 , 5 , 6 y 11
a) obtenga las ecuaciones de las dos rectas de regresin
b) calcule el coeficiente de correlacin
c) un pronstico tipificado 1'1868 , a qu puntuacin directa de X corresponde ?.

a)
En la recta de regresin de Y sobre X : Y' =a +b.X
- Para X =2 , Y' =3'2 : 3'2 =a +2.b
- Para X =6 , Y' =7'2 : 7'2 =a +6.b
Resolviendo el sistema obtenemos : a = 1'2 b = 1 Y' = 1'2 + X

Para el clculo de la recta de regresin de X sobre Y no disponemos de elementos suficientes de momento.

b)
Con los valores conocidos de Y calculamos su media, varianza y desviacin tpica :
Y s s
Y Y
=
+ + + +
= =
+ + + +
= = =
1 3 5 6 11
5
5 2
1 3 5 6 11
5
5 2 11 36 11 36 3 3705
2
2 2 2 2 2
2
' ' ' ' '
Si la proporcin de varianza asociada es del 70'42%, deducimos que : r
2
= 0'7042 y, siendo b =1 >0 , el
coeficiente de correlacin r tambin ser positivo. Es decir :
r = + = 0 7042 0 8392 ' '

De la recta de regresin de Y sobre X deducimos (para las medias) :
Y Y X X Y ' ' ' ' ' = = + = = = 1 2 1 2 5 2 1 2 4
La desviacin tpica de X la podemos obtener ahora de la relacin :
r b
s
s
s
r s
b
s
X
Y
X
Y
X
= = = = = = .
. ' . '
' '
0 8392 3 3705
1
2 8284 2 8284 8
2 2

a bis)
Estamos en condiciones de calcular la recta de regresin de X sobre Y :
r b
s
s
b
r s
s
a X Y
Y
X
X
Y
= = = = = = = ' . '
. ' . '
'
' ' . ' . ' '
0 8392 2 8284
3 3705
0 7042 0 7042 4 0 7042 5 2 0 3380
La recta de regresin de X sobre Y tiene por ecuacin :
X' = 0'3380 + 0'7042 . Y

c)
La recta de regresin de Y sobre X en puntuaciones tpicas es : z r z z z
Y X Y X ' '
. ' . = = 0 8392
Para el pronstico tipificado 1'1868 deduciremos el valor tipificado de X. Teniendo en cuenta el proceso de
tipificacin, deduciremos la puntuacin directa de X
z z
X X
s
X
X
Y X
X
'
'
'
'
'
'
' . ' = = = =

=

= + = 1 1868
1 1868
0 8392
1 4142
4
2 8284
1 4142 2 8284 4 8


15
En un grupo de 10 sujetos se han aplicado dos pruebas (X,Y). Las puntuaciones obtenidas en X fueron
dicotomizadas por la Mediana formndose dos categoras: altos (A) y bajos (B). Los resultados son los
siguientes :

Sujeto 1 2 3 4 5 6 7 8 9 10
X B A B A A B B A A B
Y 5 3 3 0 1 3 2 0 1 2

Elija y calcule el ndice de correlacin adecuado para medir la relacin existente entre X e Y.
Regresin y correlacin (F. lvarez) - 19

X n
A
n
A
.X n
B
n
B
.X X n n.X n.X
2

0 2 0 0 0 0 2 0 0
1 2 2 0 0 1 2 2 2
2 0 0 2 4 2 2 4 8
3 1 3 2 6 3 3 9 27
4 0 0 0 0 4 0 0 0
5 0 0 1 5 5 1 5 25
5 5 5 15 10 20 62

X X X S
A B X
= = = = = = = =
5
5
1
15
5
3
20
10
2
62
10
2 1483
2
; ; ; '

r
X X
S
pq
bp
A B
X
=

=

= . .
'
. . '
1 3
1483
5
10
5
10
0674


Cierta relacin entre las variables, de signo inverso. A mayor puntuacin en la prueba Y menor nivel en X.


16
La puntuacin estimada de la variable Y para un valor 0 de la variable X es 05454, siendo la varianza de
esta variable 165. Sabiendo que el porcentaje de varianza de la variable Y no asociada a la variacin de
X es 4545% y que la varianza del error es 0318297, hallar :
a) la correlacin de Pearson entre X e Y.
b) la ecuacin de regresin para pronosticar Y a partir de X.
c) la varianza de las puntuaciones pronosticadas.

Datos :

Y a b X a b a S
S
S
r S
X
e
y
e
' . ' . ' ; ' ; ' ; ' = + = + = = = = = 05454 0 05454 165 1 004545 0318297
2
2
2
2 2

a) 1 - r
2
=004545 r
2
=1 - 004545 =095455 r =0977

b) a =05454


0318297
004545 7003 2646
2
2
'
' ' '
S
S S
Y
Y Y
= = =


r b
S
S
b
r S
S
Y X
X
Y
Y
X
= = = = = + .
. ' . '
'
' ' ' ' .
09772646
165
06364 05454 06364


c) S S S S S S
Y e Y Y Y e
2 2 2 2 2 2
7003 0318297 6684703 = + = = =
' '
' ' '


17
Las puntuaciones estimadas de la variable Y para los valores 3 y 5 de la variable X son 24545 y 37272
respectivamente. El coeficiente de correlacin entre X e Y es 0977, y la varianza de la variable X es 165.
Con estos datos calcular :
a) la ecuacin de la recta de regresin.
b) la varianza de las puntuaciones pronosticadas.
c) la proporcin de varianza de la variable Y no asociada a la variacin de X.

Datos :
Y a bX
a b
a b
r S
X
' .
' .
' .
' ' = +
= +
= +

= =
24545 3
37272 5
0977 165
2

a) Resolviendo el sistema anterior : a =054545 b =063635 Y =054545 +063635.X

b)
r
s
s
s r s
y
y
y y
2
2
2
2 2 2
= =
'
'
.

r b
S
S S
S S
X
Y Y
Y Y
= = = = = = . ' ' .
'
' ' ' . ' '
'
0977 063635
165
06364 2656594 0977 2656594 67366
2 2 2


c) 1 - r
2
=1 - 0977
2
=0045471 (45471%)

20 - Regresin y correlacin (F. lvarez)
18
Las puntuaciones directas obtenidas por 5 sujetos en la escala LKS (Escala de Lucas) y las obtenidas
por esos mismos sujetos en el factor C (Control Social) del PSI son las que figura en la tabla final.
a) Encuentre la puntuacin pronosticada en LKS de un sujeto cuya puntuacin directa en C es
15.
b) Encuentre la parte de la varianza de LKS asociada a la variacin de C.
c) Interprete el resultado obtenido al calcular el estadstico que expresa la relacin entre LKS y
C.

Sujetos A B C D E
LKS 49 40 43 31 37
C 8 16 14 20 12

Y =LKS X =C
X Y X
2
Y
2
X.Y
8 49 64 2401 392
16 40 256 1600 640
14 43 196 1849 602
20 31 400 961 620
12 37 144 1369 444
70 200 1060 8180 2698

X Y S S
S S S
X X
Y Y XY
= = = = = = =
= = = = =
70
5
14
200
5
40
1060
5
14 16 4
8180
5
40 36 6
2698
5
1440 204
2 2
2 2
; ; ;
; ; . '


b =-204 / 16 =-1275 a =40 - (.1275).14 =5785
a)
Y = 5785 - 1275.X = 5785 - 1275 . 15 = 38725

b) r =-204 / 4 . 6 =-085 r
2
=07225 (7225%)

c) Alta relacin entre las dos pruebas (r=-085) y de signo inverso. Es decir, un sujeto con alta puntuacin en LKS
tendr baja puntuacin en C

19
La empresa de publicidad VENDEBIEN quiere saber si la aceptacin o rechazo dependen del sexo.
Para ello se encuesta a 200 personas de las cules el 50% son mujeres; 40 hombres rechazan el
producto mientras que 30 mujeres lo aceptan.
Elija y calcule el ndice de correlacin adecuado para interpretar estos datos.





=

+ + + +
=

=
ad bc
a b c d a c b d ( ).( ).( ).( )
. .
. . .
'
6070 3040
90110100100
03015


Escasa relacin entre la aceptacin y el sexo. De aceptarla, el mayor rechazo se produce en mujeres.


20
La ecuacin de la recta de regresin que permite pronosticar las calificaciones en Psicologa
Matemtica II (Y) a partir de las calificaciones en Psicologa Matemtica I (X) es la siguiente : Y = 08.X
- 025
Sabiendo que S
x
= (4/5).S
y
; S
y
= 3 y que X Y = 174 ' , calcule :
a) r X Y
xy
, , .
b) la varianza de las puntuaciones pronosticadas.
c) la proporcin de varianza error cometida al pronosticar, utilizando la recta de regresin
anterior.


H M
Aceptan a=60 b=30
Rechazan c=40 d=70
Regresin y correlacin (F. lvarez) - 21
Datos :

Y X S S S X Y
X Y Y
' ' . ' ; . ; ; ' = = = = 08 025
4
5
3 174


a)
b
S
r b
S
S
a Y b X Y X
X Y
X
Y
X
X
Y
=
= =

= = =
= =
=


=
=

08
4
5
3 24
08
24
3
064
025 08
174
745
571
'
. '
. ' .
'
'
. ' ' .
'
'
'


b)
r
s
s
s r s
y
y
y y
2
2
2
2 2 2 2 2
064 3 36864 = = = =
'
'
. ' . '


c) 1 - r
2
=1 - 0'64
2
=0'5904 (59'04%)


21
La recta de regresin de Y sobre X, que permite el pronstico en el rendimiento en un trabajo manual a
partir de las puntuaciones en un test de destreza manual, corta al eje de ordenadas en Y = 8 y al de
abscisas en X = -4, en puntuaciones directas.
a) Calcule la ecuacin de la recta de regresin anterior en puntuaciones directas.
b) Represente grficamente la recta de regresin anterior.
c) Calcule el coeficiente de correlacin entre X e Y sabiendo que la varianza de los errores es la
cuarta parte de la varianza de Y.

a)
Para X =0 , Y =8 y, para X =-4, Y =0

Y a b X
a
a b
a
b
Y X ' .
.
' . = +
=
=

=
=
= +

8
0 4
8
2
8 2

b)

c)
( ) S S S S r r
S
S
S
S
r
e Y e Y
e
Y
Y
Y
2 2 2 2 2 2
2
2
2
2
1
4
1 1 1
1
4
3
4
0866 = = = = = = . .
.
'


22
Estudiando la relacin entre las variables X e Y se obtuvieron los siguientes datos :
X Y S S r n
x Y xy
= = = = = = 119 130 10 055 070 10 , ' , , ' , ' ,
a) Elena C. obtuvo una puntuacin de 130 en X. Estime su puntuacin en Y.
b) Se estim la puntuacin 128 en la variable Y para Gonzalo S.. Cul fue su puntuacin en la
variable X ?.
c) Determinar el valor de S
y.x
y la desviacin tpica de las puntuaciones pronosticadas (S
y
).

a)
b r
s
s
a x Y X
Y
y
x
= = = = = = +
= + =
. ' .
'
' ; ' ' ' ' ' ' .
' ' ' . '
07
055
10
00385 130 00385 119 32815 32815 00385
32815 00385130 17235


b) 128 =-32815+00385.X X =11848

c)
S S r
S S S S
Y X Y
Y Y Y X Y
.
' . '
. ' . ' '
' ' ' '
= = =
= = = =
1 055 1 07 03928
03025 01543 01482 0385
2 2
2 2 2



22 - Regresin y correlacin (F. lvarez)
23
La siguiente grfica muestra las calificaciones obtenidas
por dos grupos de alumnos que han estudiado con dos
mtodos de enseanza distintos (A y B). Elija, calcule e
interprete el coeficiente de correlacin ms adecuado para
estudiar la relacin entre el mtodo de enseanza y las
calificaciones.

X
A
X
B

2 2
4 4
6 5
8 6
9
10
20 36

X
2 4 6 8 2 4 5 6 9 10 56
X
2

4 16 36 64 4 16 25 36 81 100 382

Biserial puntual (r
bp
). Una cuantitativa (calificacin) y la otra dicotmica (mtodo).

X X X S
A B X
= = = = = = = =
20
4
5
36
6
6
56
10
56
382
10
56 261
2
; ; ' ; ' '

r
X X
S
pq
bp
A B
X
=

=

= . .
'
. . '
5 6
261
4
10
6
10
0187


r
2
=0035 (35%)

Existe una relacin muy baja (del 35%) entre el mtodo seguido y las calificaciones. De aceptarse la relacin
diramos que los alumnos que siguen el mtodo B obtienen mejores resultados (signo negativo de r).


24
Sabemos que las puntuaciones diferenciales pronosticadas (y) son cinco veces las puntuaciones
diferenciales de la variable X, y que la proporcin de varianza asociada entre X e Y es igual a 025.
Calcular :
a) La pendiente de la recta de regresin de Y sobre X en puntuaciones directas y diferenciales.
b) La pendiente de la recta de regresin de Y sobre X en puntuaciones tpicas.
c) La pendiente de la recta de regresin de X sobre Y en puntuaciones directas.

Datos : y =5x r
s
s
y
y
2
2
2
025 = =
'
'
a) b =5

b) r
2
=025 r =05

c) b.b =r
2
5.b =025 b =025 / 5 =005


25
Para un grupo de 100 sujetos y en dos variables X e Y, disponemos de los siguientes datos :
xy=480 ; x
2
=400 ; y
2
=Y=900.
Sabiendo adems que X e Y son dos variables cuantitativas que mantienen una relacin lineal y que,
lgicamente,
x = y = 0
a) Cunto valdr el coeficiente de correlacin de Pearson entre X e Y ?.
b) Cunto valdr la desviacin tpica de los errores cometidos al pronosticar Y a partir de X ?.
c) Qu puntuacin directa pronosticaremos en Y a un sujeto que ha obtenido una puntuacin x=-2 ?.

Se sigue en el enunciado la notacin usual de representacin de puntuaciones directas (mayscula) y diferenciales
(minscula).

Recordemos que :

Regresin y correlacin (F. lvarez) - 23
En puntuaciones directas En puntuaciones diferenciales
( )( )
Y X
N
Y X n
N
Y Y X X n
S
i
i i i
i
i i i
XY
.
. . . .
=

=


N
y x n
S
i
i i i
XY

=
. .

( )
2
2
2
2
. .
X
N
X n
N
X X n
S
i
i i
i
i i
X
=

=


N
x n
S
i
i i
X

=
2
2
.


a) Para puntuaciones diferenciales :

s
xy
n
s
x
n
s
y
n
xy x y
= = = = = = = = =
480
100
48
400
100
2
900
100
3
2 2
'

r =48 / 2'3 =08

b) s s s r
e y y
= = = =
.x
. . ' ' 1 3 1 08 18
2 2


c) En puntuaciones diferenciales : y =b.x , con
b r
s
s
y
x
= = = . ' . ' 08
3
2
12

Para x =-2 : y =12 . (-2) =-24
Como : y Y Y Y y Y y
Y
N
' ' ' ' ' ' ' ' = = + = + = + = + =

24
900
100
24 9 66


26

La empresa de publicidad VENDEBIEN quiere
saber si existe relacin entre la duracin de un
anuncio en T.V. y la aceptacin o rechazo del
mismo. Los resultados de la encuesta se
incluyen en la siguiente tabla.
Elija y calcule el ndice de correlacin
adecuado para interpretar estos datos.
Duracin Aceptacin Rechazo
5 - 9 3 0
10 - 14 4 1
15 - 19 4 2
20 - 24 1 3
25 - 29 0 2

X n
A
n
A
.X n
R
n
R
.X X n n.X n.X
2

5-9 7 3 21 0 0 7 3 21 147
10-14 12 4 48 1 12 12 5 60 720
15-19 17 4 68 2 34 17 6 102 1734
20-24 22 1 22 3 66 22 4 88 1936
25-29 27 0 0 2 54 27 2 54 1458
12 159 8 166 20 325 5995

X X X S
A R X
= = = = = = = =
159
12
1325
166
8
2075
325
20
1625
5995
20
1625 5974
2
' ; ' ; ' ; ' '
r
X X
S
pq
bp
A R
X
=

=

= . .
' '
'
. . '
1325 2075
5974
12
20
8
20
0615

Cierta relacin entre las variables, de signo inverso. A mayor duracin mayor rechazo.


27
El gabinete de estudios sobre Malestar Social desea conocer si existe relacin entre la consumicin
de drogas y la comisin de delitos sobre la propiedad. Para ello se selecciona una muestra y se
comprueba que 50 individuos han consumido algn tipo de droga y a la vez han estado implicados en
delitos contra la propiedad. Teniendo en cuenta que un 20% de la muestra ha cometido delitos contra la
propiedad, que 250 no consumen drogas ni han estado implicados en delitos contra la propiedad y que
la muestra constaba de 500 individuos, qu conclusin obtendr el gabinete de estudios ?. (Elija,
calcule e interprete el coeficiente de correlacin adecuado).
24 - Regresin y correlacin (F. lvarez)





=

+ + + +
=

=
ad bc
a b c d a c b d ( ).( ).( ).( )
. .
. . .
'
50250 50150
100400200300
0144


Escasa relacin entre consumo de drogas y comisin de delitos. De aceptarla, la mayor comisin de delitos se
produce en consumidores de drogas.


28

Un grupo de hombres y mujeres responde a una
prueba (X). Los datos obtenidos aparecen en la
siguiente tabla.
Elija razonadamente, calcule e interprete el
coeficiente de correlacin adecuado, para estudiar
la relacin entre las puntuaciones de la prueba y la
variable sexo.
X Mujeres Hombres
11 - 13 8 3
8 - 10 6 5
5 - 7 5 6
2 - 4 1 6

X n
M
n
M
.X n
H
n
H
.X X n n.X n.X
2

2-4 3 1 3 6 18 3 7 21 63
5-7 6 5 30 6 36 6 11 66 396
8-10 9 6 54 5 45 9 11 99 891
11-13 12 8 96 3 36 12 11 132 1584
20 183 20 135 40 318 2934

X X X S
M H X
= = = = = = = =
183
20
915
135
20
675
318
40
795
2934
40
795 3186
2
' ; ' ; ' ; ' '

r
X X
S
pq
bp
M H
X
=

=

= . .
' '
'
. . '
915 675
3186
20
40
20
40
0377


Muy dbil relacin entre las variables, de signo directo. De aceptarse, la mayor calificacin se produce en
mujeres.

29

Elija el coeficiente de correlacin ms apropiado
entre las variables puntuaciones en un test de
inteligencia (X), y prejuicio antiprotestante (Y),
teniendo en cuenta el cuadro adjunto.
En este cuadro, fA significa frecuencia con alto
prejuicio y fB frecuencia con bajo. Calcule el
coeficiente de correlacin elegido y comente
brevemente el resultado obtenido.

Y
f
A
f
B

9 - 11 40 0
X 6 - 8 40 0
3 - 5 0 10
0 - 2 0 10

X n
A
n
A
.X n
B
n
B
.X X n n.X n.X
2

0-2 1 0 0 10 10 1 10 10 10
3-5 4 0 0 10 40 4 10 40 160
6-8 7 40 280 0 0 7 40 280 1960
9-11 10 40 400 0 0 10 40 400 4000
80 680 20 50 100 730 6130

X X X S
A B X
= = = = = = = =
680
80
85
50
20
25
730
100
73
6130
100
73 283
2
' ; ' ; ' ; ' '

r
X X
S
pq
bp
A B
X
=

=

= . .
' '
'
. . '
85 25
283
80
100
20
100
0848


Elevada relacin entre las variables, de signo directo. A mayor puntuacin en el test mayor prejuicio
antiprotestante.


Droga SI Droga NO
Delito SI a=50 b=50
Delito NO c=150 d=250
Regresin y correlacin (F. lvarez) - 25

30
Estudiando la relacin entre las variables X e Y se obtuvieron los siguientes datos :
X Y S S r n
x Y xy
= = = = = = 50 6 6 2 08 5 , , , , ' ,
a) Qu puntuacin directa en Y pronosticaremos a un sujeto que obtuvo una puntuacin directa en X
de 52 ?.)
b) Cunto valen S
y'
2
y S
yx .
?.

a)
b r
s
s
a x
Y X Y x
y
x
= = = = =
= + = + =
. ' . ' ; ' '
' ' ' . ' ' ' '
08
2
6
0267 6 0267 50 735
735 0267 735 0267 52 6534


b) S S r S S S
Y Y Y Y Y .X ' .X
. . ' ' ' ' = = = = = = 1 2 1 08 12 4 144 256
2 2 2 2 2



31
Estudiando una muestra de 50 alumnos de BUP se observ que una proporcin de 010 estaba
compuesta por alumnos hijos nicos. De los 50 alumnos, una proporcin de 06 coman en el Colegio.
Si sabemos que una proporcin de 004, con respecto al total, son hijos nicos que no comen en el
Colegio. Existe una relacin entre ser hijo nico o no y comer o no en el Colegio ?. Halle el coeficiente
de correlacin que corresponda e interprete el resultado.





=

+ + + +
=

=
ad bc
a b c d a c b d ( ).( ).( ).( )
. .
. . .
318 272
3020545
0


Las variables son independientes. No existe ningn tipo de relacin entre ser hijo nico y comer en el colegio.


32
La desviacin tpica de un determinado grupo de personas en la variable ansiedad (X) es igual a 2.
Tambin conocemos para esta variable la media de los varones (10) y la de las mujeres (5). Sabiendo
que el ndice de asociacin entre las variables ansiedad y sexo es igual a +1, y que el nmero de
varones es superior al de mujeres :
a) Qu coeficiente de correlacin habr sido utilizado ?.
b) Interprete el valor del coeficiente de correlacin.
c) Calcule la proporcin de varones que componen nuestra muestra.

a) Biserial puntual (r
bp
). Una cuantitativa y la otra dicotmica.

b) Relacin perfecta. Los varones presentan altas puntuaciones en ansiedad y las mujeres bajas.

c)
r
x x
s
pq pq pq pq
p p p p p p p
p
p
bp
v m
x
=

= =

= = =
= = + = =

=

=
=
=

. . . . . ' . '
.( ) ' ' '
' '
'
'
1
10 5
2
2
5
04 016
1 016 016 016 0
1 1 064
2
1 06
2
08
02
2 2

La solucin es 08 al indicar que hay ms varones que mujeres.

33
Y Con la presente distribucin bivariante obtenga :
[0,10) [10,20) [20,30) [30,40] a) recta de regresin de la media de Y condicionada a X
0 0 1 0 16 b) coeficiente de correlacin de la media de Y condicionada a X
X 1 0 5 20 3 c) recta de regresin de Y sobre X
2 5 18 6 0 d) coeficiente de correlacin lineal (de Y sobre X)
3 3 2 1 0 e) razn de correlacin.

Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). Interprete el
significado de la razn de correlacin calculada.

nico SI nico NO
Comen SI a=3 b=27
Comen NO c=2 d=18
26 - Regresin y correlacin (F. lvarez)
a) b)
Para cada valor de la variable X, determinamos la media de los correspondientes valores de Y. Obtendremos
tambin las varianzas de cada valor Y para calcular posteriormente la razn de correlacin (apartado e).
[0,10) [10,20) [20,30) [30,40]
y 5 15 25 35
X = 0 f 0 1 0 16 = 17
f.y 0 15 0 560 = 575
f.y
2
0 225 0 1960 = 2185

[0,10) [10,20) [20,30) [30,40]
y 5 15 25 35
X = 1 f 0 5 20 3 = 28
f.y 0 75 500 105 = 680
f.y
2
0 1125 12500 3675 = 17300

[0,10) [10,20) [20,30) [30,40]
y 5 15 25 35
X = 2 f 5 18 6 0 = 29
f.y 25 270 150 0 = 445
f.y
2
125 4050 3750 0 = 7925

[0,10) [10,20) [20,30) [30,40]
y 5 15 25 35
X = 3 f 3 2 1 0 = 6
f.y 15 30 25 0 = 70
f.y
2
75 450 625 0 = 1150


Con las tablas de clculos anteriores obtenemos :
X Y
(
*
)
n
X =0 y
1
338 = '
s
y
1
2
221453 = '

0 33'8 17
X =1 y
2
243 = '
s
y
2
2
280612 = '

1 24'3 28
X =2 y
3
153 = '
s
y
3
2
378121 = '

2 15'3 29
X =3 y
4
117 = '
s
y
4
2
555556 = '

3 11'7 6
(
*
)
Medias de cada Y condicionado a X

Con esta distribucin procedemos a calcular la recta de regresin y el coeficiente de correlacin (omitimos la tabla de
clculos) :

n.X = 104 Media de X =1'3 Recta de regresin de la media de Y condicionada a X
n.X
2
= 198 Varianza de X =0'785 Y' = 32'8998 - 8'2989.X
n.Y = 1768'9 Media de Y =22'11 Coeficiente de correlacin de la media de Y condicionada a X
n.Y
2
= 43565'15 Varianza de Y =55'657 r = -0'9856 (r
2
= 0'9714)
n.X.Y = 1778'4 Covarianza =-6'5146

c) d)
X Y n n.X n.X n.Y n.Y n.X.Y
0 5 0 0 0 0 0 0
0 15 1 0 0 15 225 0
0 25 0 0 0 0 0 0
0 35 16 0 0 560 19600 0
1 5 0 0 0 0 0 0
1 15 5 5 5 75 1125 75
1 25 20 20 20 500 12500 500
1 35 3 3 3 105 3675 105
2 5 5 10 20 25 125 50
2 15 18 36 72 270 4050 540
2 25 6 12 24 150 3750 300
2 35 0 0 0 0 0 0
3 5 3 9 27 15 75 45
3 15 2 6 18 30 450 90
3 25 1 3 9 25 625 75
3 35 0 0 0 0 0 0
80 104 198 1770 46200 1780

Regresin y correlacin (F. lvarez) - 27
Media de X =1'3 Recta de regresin de Y sobre X
Varianza de X =0'785 Y' = 32'91 - 8'2962.X
Media de Y =22'125 Coeficiente de correlacin lineal
Varianza de Y =87'9844 r = -0'7836 (r
2
= 0'6141)
Covarianza =-6'5125

e)
Razn de correlacin :
6317 ' 0
9844 ' 87
5556 ' 55 . 6 8121 ' 37 . 29 0612 ' 28 . 28 1453 ' 22 . 17
.
80
1
1
.
.
1
1
2
2
2
=
+ + +
= =

Y
y i
s
s n
N
i



Conclusiones :

Comprobamos que
2
toma un valor comprendido entre 0 y 1 y verifica que
2
r
2
(0'6317 0'6141).
Al ser muy prximo
2
a r
2
, concluimos que la relacin entre las variables X , Y es de tipo lineal.

Esta ltima conclusin habramos deducido al comprobar que las rectas de ajuste de Y sobre X y la de la
media de Y condicionada a X prcticamente coinciden :
Y' = 32'91 - 8'2962.X Y' = 32'8998 - 8'2989.X

La sustitucin de las observaciones Y
i
por su promedio, ha permitido aumentar el valor del coeficiente de
correlacin :
r = -0'7836 r = -0'9856

incrementando as la proporcin de varianza explicada por el ajuste :
r
2
= 0'6141 (61'41%) r
2
= 0'9714 (97'14%)


34
De un grupo de COU, integrado `por 40 alumnos, conocemos sus calificaciones finales en Matemticas
y en Filosofa. El nmero de aprobados en ambas ascendi a 15, suspendiendo 12 las dos materias,
mientras que slo aprob Matemticas el 10% de los alumnos.
a) Calcule el coeficiente de correlacin ms adecuado para medir el grado de asociacin existente
entre las variables descritas.
b) Asumiendo que las calificaciones en Matemticas y en Filosofa se distribuyen normalmente,
determine otro coeficiente que estudie el nivel de asociacin y no est basado en el concepto de
correlacin de Pearson

Se trata de analizar la relacin que puede existir entre las calificaciones en las dos materias.
a)
Siendo las dos variables dicotmicas, calculamos el coeficiente de correlacin (phi) .

Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos :

Y - Filosofa
1 (Aprueban) 0 (Suspenden)
X 1 (Aprueban) a =15 b =4 19
Matemticas 0 (Suspenden) c =9 d =12 21
24 16
( )( )( )( )
=

=
+ + + +

= 3679 ' 0
16 . 24 . 21 . 19
9 . 4 12 . 15
. . . d b c a d c b a
bc ad
baja relacin entre las variables.

El aprobar o suspender una materia no condiciona el resultado final en la otra.
b)
Siendo las dos variables dicotmicas (normalmente distribuidas inicialmente), calculamos el coeficiente de
correlacin tetracrica (r
t
).

1 Calculamos los productos : a.d = 15 . 12 = 180 y b.c = 4 . 9 = 36.
2 Como a.d > b.c , calculamos el cociente : C = a.d / b.c = 180 / 36 = 5 (r
t
ser positivo)
3 Consultamos la tabla XXV, para el clculo del coeficiente de correlacin tetracrico, localizando el cociente
C=5 en el intervalo (A,B) = (4'8305 , 5'0075), al cul corresponde un coeficiente 0'56 + R.

De aqu :
( ) ( )
56958 ' 0 00958 ' 0 56 ' 0 56 ' 0 00958 ' 0
8305 ' 4 0075 ' 5 . 100
8305 ' 4 5
. 100
= + = + = =

= R r
A B
A C
R
t


NOTA :
Generalmente se verifica que el coeficiente de correlacin tetracrica y el coeficiente verifican la
relacin :
28 - Regresin y correlacin (F. lvarez)
r
t
1'5 .
(con mayor rigor para valores del coeficiente tetracrico, menores o iguales a 0'5).

En nuestro caso : 1'5 . = 1'5 . 0'3679 = 0'55185 r
t


Esto permite tener una referencia sobre el intervalo (-1 , 1), a la hora de interpretar el valor obtenido
con el coeficiente de correlacin tetracrica. Calculando el valor aproximado de , podremos medir el
grado de asociacin :
= =
r
t
15
056958
15
037972
'
'
'
'
baja relacin entre las variables


35
Con el fin de estudiar si existe o no relacin entre las calificaciones en Matemticas y en Filosofa de
COU, seleccionamos seis alumnos. Clasificados por orden de puntuacin final en cada materia result :

Alumno 1 2 3 4 5 6
Matemticas 3 6 4 1 2 5
Filosofa 3 5 6 4 1 2

a) Utilizando el ndice adecuado, basado en el concepto de correlacin de Pearson, establezca el grado
de relacin que existe entre las calificaciones de las dos asignaturas.
b) Resuelva lo solicitado en el apartado anterior mediante un ndice que no est basado en el concepto
de correlacin de Pearson

a)
Calcularemos el coeficiente de correlacin (rangos de Spearman) al presentarse dos variables ordinales
(dos reordenaciones de los 8 alumnos).

Denominamos X e Y a las variables que proporcionan, respectivamente, las clasificaciones en Matemticas y
en Filosofa.
Ordenando las primeras (X), calculamos sus diferencias con las segundas :

X Y d d
2

1 4 -3 9
2 1 1 1
3 3 0 0
4 6 -2 4
5 2 3 9
6 5 1 1
24

Con ello :
( ) ( )
=

1
6
1
1
6 24
6 6 1
03143
2
2 2
.
.
.
.
'
d
N N

Es decir, apenas existe relacin entre las calificaciones.

b)
Procede ahora el clculo del coeficiente de correlacin (tau) de Kendall :

Reordenamos los pares de observaciones de modo que la variable X (primer elemento del par) quede en orden
ascendente y comparamos cada valor de Y con los Y
i
siguientes, contando una permanencia (P) si Y <Y
i
y
una inversin (I) si Y >Y
i
. :

X Y
1 4
2 1 (4,1) I
3 3 (4,3) I (1,3) P
4 6 (4,6) P (1,6) P (3,6) P
5 2 (4,2) I (1,2) P (3,2) I
6 5 (4,5) P (1,5) P (3,5) P (2,5) P

En total hemos encontrado 8 permanencias (P) y 4 inversiones (I). Con ello :

=

= =
N N
n n
p i
.( ) .( )
'
1
2
8 4
6 6 1
2
4
15
02667

Es decir, como ocurri con el coeficiente , existe una escasa relacin entre las calificaciones en Matemticas y
Filosofa.

Regresin y correlacin (F. lvarez) - 29
36
Con el fin de estudiar si existe o no relacin entre las calificaciones en Matemticas y en Filosofa de
COU, seleccionamos 30 alumnos analizando la puntuacin final en cada materia . Teniendo en cuenta
que se nos proporcion en Filosofa solamente si el alumno aprob (A) o suspendi, establezca el
grado de relacin que existe entre las calificaciones en dichas materias.

Y
Filosofa
A S
2 2 1
X 3 5 0
Matemticas 4 10 2
5 4 0
6 3 1
8 1 1

a) utilizando el ndice adecuado, basado en el concepto de correlacin de Pearson.
b) mediante un ndice que no est basado en el concepto de correlacin de Pearson.

a)
Al ser dicotmica la 2 variable, obtendremos el coeficiente de correlacin biserial puntual :

Y Y=1 Y=0
A =1 S =0 n n.X n.X
2
n.X
1
n.X
0

X 2 2 1 3 6 12 4 2
3 5 0 5 15 45 15 0
4 10 2 12 48 192 40 8
5 4 0 4 20 100 20 0
6 3 1 4 24 144 18 6
8 1 1 2 16 128 8 8
25 5 N=30 129 621 105 24

X
1
105
25
42 = = ' X
0
24
5
48 = = ' p= =
25
30
0833 ' q= =
5
30
0167 '
X = =
129
30
43 ' s s
X X
2 2
621
30
43 221 221 1487 = = = = ' ' ' '

Con esto :
r
X X
s
pq
bp
X
=

=

=
1 0
42 48
1487
08330167 01505 . .
' '
'
. ' . ' '


Es decir apenas existe relacin entre ambas variables.

b)
Calculemos ahora el coeficiente de correlacin biserial r
b
:

Tomando el menor de los valores de p y q :
min (p,q) =min (0'833 , 0'167) =0'167
obtenemos el valor tabulado del cociente
pq
f z
.
( )
(Tabla XXIII), que resulta ser igual a 0'55609 .
Con esto :
r
X X
s
pq
f z
b
X
=

=

=
1 0
42 48
1487
055609 02244 .
.
( )
' '
'
. ' '


Aunque no coincide su valor con el coeficiente de correlacin biserial puntual, tambin podemos concluir que
apenas existe relacin entre ambas variables.

37
Hemos encontrado, utilizando el criterio de mnimos cuadrados, que las rectas de regresin de Y sobre
X en puntuaciones directas y tpicas son, respectivamente :
Y' = 1'2 . X + 4 z
y'
= 0'8 . z
x

Sabiendo que : X =5 , Y =10 , S =2 , S =3
X Y
, calcular :
a) La varianza de las puntuaciones pronosticadas en Y.
b) La recta de regresin de Y sobre X, en puntuaciones directas, si sumamos 5 a todos los valores de
X.
c) La recta de regresin de Y sobre X, en puntuaciones directas, si sumamos 3 a todos los valores de Y
y multiplicamos por 2 todos los valores de X.

30 - Regresin y correlacin (F. lvarez)
La recta de ajuste en puntuaciones tpicas nos proporciona el coeficiente de correlacin : r =0'8
En consecuencia, sobra del enunciado el conocer una de las dos desviaciones tpicas. Conocido r =0'8 ; b =
1'2 y una de las desviaciones tpicas (de X o de Y), la otra la habramos calculado a partir de la relacin :
r b
S
S
X
Y
= .
Su conocimiento permite obtener la covarianza (cuyo clculo tampoco resulta imprescindible) :
r
S
S S
S r S S
XY
X Y
XY X Y
= = = =
.
. . ' . . ' 0823 48


a) Varianza de los pronsticos : S
Y'
2

Obtenida de la relacin que proporciona la proporcin de varianza explicada por el
ajuste :
S
S
r S S r
Y
Y
Y Y
'
'
. . ' '
2
2
2 2 2 2 2 2
3 08 576 = = = =

b)
Si a los valores de X les sumamos 5, la nueva media se incrementa en 5, pero las medidas de
dispersin se mantienen inalterables.
Resulta as : X =5+5=10 , Y =10 , S =2 , S =3, S =4'8
X Y XY

Luego :
b
S
S
a Y b X Y X
XY
X
= = = = = = +
2
12 10 12 10 2 2 12 ' . ' . ' ' .

c)
Si a los valores de Y les sumamos 3, la nueva media se incrementa en 3, pero las medidas de
dispersin se mantienen inalterables.
Si los valores de X los multiplicamos por 2, la nueva media se multiplica por 2, y las medidas de
dispersin tambin (la varianza por el cuadrado).
Resulta as : X =5.2=10 , Y =10+3=13 , S =2. , S =3, S =4'8.
X Y XY
2 4 2 96 = = '
Luego :
b
S
S
S
S
b a Y b X Y X
XY
X
XY
X
= = = = = = = +
2 2 2
2
2
2
4
06 13 06 10 7 7 06
.
.
. ' . ' . ' ' .



38
Se desea estudiar si existe relacin entre `padecer diabetes y ceguera en la tercera edad. Para ello se
analiza una muestra de 1000 personas del INSERSO encontrndose que de todas ellas un 50%
presentan simultneamente diabetes y ceguera, el 40% no presentan ninguna de ambas deficiencias y
el resto presentan en la misma medida slo una u otra deficiencia. Con estos datos elija, calcule e
interprete el coeficiente de correlacin adecuado a dicho estudio.

Se trata de analizar la relacin que puede existir entre las dos enfermedades.

Siendo las dos variables dicotmicas, calculamos el coeficiente de correlacin (phi) .
Padecen ambas 50% de 1000 500
No padecen ninguna 40% de 1000 400
Padecen slo diabetes La mitad de los 100 restantes 50
Padecen slo ceguera La mitad de los 100 restantes 50

Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos :

Y - Ceguera
1 (Padece) 0 (No padece)
X 1 (Padece) a =500 b =50 550
Diabetes 0 (No padece) c =50 d =400 450
550 450

( ) ( ) ( ) ( )
=

+ + + +
=

=
ad bc
a b c d a c b d . . .
. .
. . .
'
500400 5050
550450550450
0798 alta relacin entre las variables.

El padecer o no una dolencia condiciona el padecer la otra.


Regresin y correlacin (F. lvarez) - 31
EJERCICIOS PROPUESTOS

1

X Y n
De la presente distribucin conjunta de las dos variables (X,Y) :
4 0 3
4 1 5 b) Obtener la recta de regresin de Y sobre X en puntuaciones diferenciales.
5 2 6 b) Obtener la recta de regresin de X sobre Y en puntuaciones tpicas..
6 2 2 c) Calcular e interpretar la proporcin de varianza residual.
6 3 8
6 4 1

2
Y De la presente distribucin conjunta de las variables (X,Y) :
2 4 6 8 a) Obtener la recta de regresin de Y sobre X.
0 3 1 0 0 b) Calcular e interpretar el coeficiente de determinacin.
X 1 0 6 4 0 c) Calcular su varianza residual.
2 0 2 4 5


3


De los 10 pares de valores que se representan en el
diagrama de dispersin de la izquierda,

a) Calcular la recta de regresin de Y sobre X.
b) Calcular e interpretar el coeficiente de correlacin
lineal
c) Determinar la proporcin de varianza asociada a X.
d) Calcular la media y varianza de las predicciones Y'.
.

4
Y De la presente distribucin conjunta de las variables (X,Y) :
0 1 2 3 a) Calcular la frecuencia que falta sabiendo que la me-
3 0 1 5 12 dia de X es igual a 4.
X 4 3 7 15 2 b) Obtener la recta de regresin de Y sobre X en
5 5 1 0 puntuaciones diferenciales.
c) Calcular la proporcin de varianza residual.

5
Edad Hermanos
n
De la distribucin de edades y nmero de hermanos de 40 jvenes :
[10,15) 0 3
[10,15) 1 5 a) Obtener las rectas de regresin en puntuaciones directas,
[10,15) 2 9 diferenciales y tipificadas.
[15,20) 1 5 c) Calcular e interpretar el coeficiente de correlacin lineal.
[15,20) 2 10
[20,25] 1 3
[20,25] 2 5

6
Las siguientes distribuciones bivariantes pretenden estudiar el grado de relacin existente entre las variables :
a) Puntuacin en un test de agresividad y sexo.
b) Clasificacin (de mayor a menor) segn la nota media obtenida en las asignaturas del curso y en una
prueba tendente a determinar su coeficiente intelectual.
c) Ser bebedor y ser fumador.

Determine y calcule en cada caso el ndice adecuado que permite medir el grado de relacin entre las variables
descritas.

32 - Regresin y correlacin (F. lvarez)

(I) Puntos Sexo (II)
test Hombre Mujer Alumno 1 2 3 4 5 6
[ 0,10) 0 2 Nota media 2 4 5 1 6 3
[10,20) 5 3 C.I. 3 4 6 1 5 2
[20,30) 11 9
[30,40) 20 22 (III) Fuman
[40,50) 14 9 S No
[50,60) 6 6 Beben S 4 31
No 41 14

7
La proporcin de varianza residual, en un ajuste de Y sobre X, es del 22'12%.
a) Determine dicha recta de ajuste sabiendo que a una puntuacin directa X=2 corresponde una
prediccin 2'1 y que dicha recta corta al eje de ordenadas en el punto (0,0'3).
b) Calcule el coeficiente de correlacin.
c) Qu pronstico diferencial corresponde a una puntuacin directa X=5, si X=0 ?.

8
En el estudio de la relacin lineal existente entre dos variables X e Y se observ que eran independientes.
Sabiendo que sus respectivas medias son iguales a 2 y 1, y que tienen por varianzas 0'1538 y 0'6154,
a) calcule las ecuaciones de las dos rectas de regresin
b) determine el error tpico de la prediccin.

9
De los clculos realizados para estudiar la relacin existente entre las variables X e Y, se conoce que :
- la recta de ajuste de Y sobre X pasa por el punto (2,2)
- las media de X es igual a 1 y la de Y vale 4
- la varianza de la variable dependiente es igual a 2'2857, y la de las predicciones es 1'9047.
A la vista de estos datos, calcule :
a) Ecuaciones de las dos rectas de regresin en puntuaciones directas, diferenciales y tpicas.
b) Proporcin de varianza no asociada a X.

10
Determinar las ecuaciones en puntuaciones diferenciales de las rectas de regresin correspondientes a la
distribucin bivariante (X,Y), sabiendo que las varianzas de ambas variables son 4 y 9 respectivamente y que
existe una relacin lineal perfecta y directa entre ellas.

11
En el estudio de la relacin lineal existente entre dos variables X e Y, sabemos que a las puntuaciones directas
0 y 2 de X le corresponden unos pronsticos respectivos 33243 y 77567. Sabiendo que la proporcin de
varianza asociada al ajuste es del 9465% y que la variable dependiente tiene por media 82 y varianza 1536,
calcular :
a) Ecuacin de la recta de ajuste.
b) Coeficiente de correlacin.
c) Media y varianza de la variable X.
d) Varianza residual y de las predicciones.

12
Analizamos las edades de 8 personas que acuden a un examen para la obtencin del carnet de conducir.
Sabiendo que aprueban 5 con edades : 28, 24, 32, 45 y 30 y que los que suspenden tienen 23, 21 y 27 aos,
determine el coeficiente ms adecuado para medir el grado de relacin de la edad con la superacin o no del
examen.

13
Para los siguientes pares de valores de las variables X e Y :
(12 , 4) , (10 , 7) , (12 , 5) , ( 11 , 65) , (14 , 2) , (11, 85) , (12, 3) , (14 , 15) , (10, 9) , ( 11, 7)
calcular la proporcin de varianza que explica el ajuste de Y sobre X.

14
Determine la varianza de los errores y de las
predicciones, correspondientes al ajuste de Y
sobre X en la distribucin anterior.




X 0 1 1 1 2 3 3 5
Y -6 -2 -1 1 3 8 9 12
f 3 6 11 16 3 1 4 2
Regresin y correlacin (F. lvarez) - 33
15
En un grupo de 10 alumnos se han obtenido las calificaciones en Anatoma, separando el ejercicio terico del
prctico. El profesor encargado orden tales calificaciones de mayor a menor puntuacin, encontrando los
resultados siguientes :

Alumno 1 2 3 4 5 6 7 8 9 10
Clasificacin teora 6 2 7 10 4 1 8 5 9 3
Clasificacin prctica 6 10 4 3 9 7 2 5 1 8

Elija y calcule el ndice de correlacin adecuado para medir si existe relacin o no entre las calificaciones en las
dos partes del examen.

16
Para los valores 0 y 2 de la variable X se obtuvieron unos pronsticos de la variable dependiente iguales a
68617 y 140531 respectivamente.
Sabiendo que la proporcin de varianza de la variable Y no asociada a la variacin de X es del 1732%, y la
varianza de la variable independiente es 29375, calcular :
a) la ecuacin de la recta de regresin de Y sobre X.
b) la varianza de las puntuaciones pronosticadas y la varianza residual.
c) el coeficiente de correlacin entre X e Y

17
Y Con la presente distribucin bivariante obtenga :
1 2 3 4 5 a) recta de regresin de la media de Y condicionada a X
0 6 8 3 0 1 b) coeficiente de correlacin de la media de Y condicionada a X
X 1 0 7 10 1 0 c) recta de regresin de Y sobre X
2 2 0 5 8 6 d) coeficiente de correlacin lineal (de Y sobre X)

e) razn de correlacin.
f) Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). Interprete el
significado de la razn de correlacin calculada.

18
Determine y calcule en cada uno de los siguioentes supuestos, el ndice adecuado (no basado en el concepto
de correlacin de Pearson) que permita medir el grado de asociacin entre las variables X e Y.

(I) Y (II) (ordinales)
X 0 1 X A B C D E F
-2 6 1 Y C F D E A B
-1 4 4
0 2 6
1 0 5 (III) Y
2 1 8 1 0
X 1 2 40
0 50 8


34 - Regresin y correlacin (F. lvarez)
SOLUCIONES DE LOS EJERCICIOS PROPUESTOS
1


X =5'12
s
X
2
= 0'7456

Y =1'96
s
Y
2
= 1'1584 s
XY
= 0'8448
a) b = 1'133 y' =1'133 . x
b) r = 0'909 z
y'
=0'909 . z
x

c) 1 - r
2
= 0'1737 La proporcin de varianza no explicada por X supone el 17'37% de la de Y.

2


X =1'28
s
X
2
= 0'5216

Y =5'2
s
Y
2
= 3'52 s
XY
= 1'024
a) a = 2'6871 b = 1'9632 Y' =2'6871 +1'9632 . X
b) R
2
= r
2
= 0'5711 Representa la proporcin de varianza de Y explicada por X (el 57'11%)
c)
s
Y X .
2
=1'5097


3


X =5'5
s
X
2
= 8'25

Y =4'05
s
Y
2
= 1'8225 s
XY
= 3'175
a) a = 1'9333 b = 0'3848 Y' =1'9333 +0'3848 . X
b) r = 0'8188 Elevada relacin entre las variables (de tipo directo)
c) R
2
= r
2
= 0'6704
d)

Y Y ' = = 405
s
Y'
2
=1'2218


4


X =4
s
X
2
= 0'5714

Y =1'6508
s
Y
2
= 0'9257 s
XY
= -0'5238
a) n = 12
b) b = -0'9167 y' =-0'9167 . x
c) 1 - r
2
= 0'4813

5


X =16'375
s
X
2
= 14'3594

Y =1'525
s
Y
2
= 0'3994 s
XY
= 0'4656
a = 0'994 b = 0'0324
a' = 14'597 b' = 1'1659 r = 0'1944
a) Y' =0'994 +0'0324 . X y' =0'0324 . x z
y'
=0'1944 . z
x

X' =14'597 +1'1659 . Y x' =1'1659 .y z
x'
=0'1944 . z
y

b) r = 0'1944 Las variables no estn relacionadas linealmente (son independientes)

6
(I) Coeficiente biserial puntual r
bp
= 0'0389
(II) Coeficiente de los rangos de Spearman = 0'8857
(III) Coeficiente = - 0'6154

7
a) Y =0'3 +0'9 . X b) r =0'8825 c) y' =4'5

8
a) Y' =1 X' =2 b) s
Y.X
=s
Y
=0'7845

9
a) Y' =6 - 2 . X y' =-2 . x z
y'
=-0'9129 . z
x

X' =2'6667 - 0'4167 . Y x' =-0'4167 .y z
x'
=-0'9129 . z
y

b) 1 - r
2
= 0'1667

10
y' =1'5 . x x' =0'6667 . y

Regresin y correlacin (F. lvarez) - 35
11
a) Y =33243 +22162.X
b) 09729
c) 22, 296
d) 08216, 145384

12
r
bp
=056

13
08331 (o bien el 8331%)

14
19543 ; 155069

15
=-08667

16
a) Y =68617 +35957 . X
b) 3998 y 796
c) 09093

17
a) Y
M
=1'9317 +0'9049 . X
b) r
M
=0'9924
c) Y =1'9268 +0'8862 . X
d) r =0'6067
e)
2
=03749 (prximo a r
2
=0'3681)

18
(I) Coeficiente biserial
r
b
=- 0'7250
(II) Coeficiente de Kendall
=- 0'3333
(III) Coeficiente tetracrico
r
t
=- 0'7744

36 - Regresin y correlacin (F. lvarez)




Clculo del coeficiente de correlacin biserial
La tabla proporciona, para el menor de los valores p y q, la cantidad :
p q
f z
.
( )


min(p,q) 0'000 0'001 0'002 0'003 0'004 0'005 0'006 0'007 0'008 0'009
0'00 0'29788 0'31576 0'32772 0'33699 0'34469 0'35133 0'35722 0'36253 0'36738
0'01 0'37186 0'37603 0'37994 0'38363 0'38712 0'39044 0'39360 0'39663 0'39954 0'40233
0'02 0'40502 0'40762 0'41014 0'41257 0'41493 0'41722 0'41945 0'42162 0'42373 0'42579
0'03 0'42781 0'42977 0'43169 0'43357 0'43540 0'43720 0'43897 0'44069 0'44239 0'44406
0'04 0'44569 0'44729 0'44887 0'45042 0'45195 0'45345 0'45492 0'45638 0'45781 0'45922
0'05 0'46061 0'46198 0'46333 0'46466 0'46597 0'46726 0'46854 0'46980 0'47105 0'47228
0'06 0'47349 0'47469 0'47587 0'47704 0'47820 0'47934 0'48047 0'48159 0'48270 0'48379
0'07 0'48487 0'48594 0'48700 0'48804 0'48908 0'49011 0'49112 0'49213 0'49312 0'49411
0'08 0'49508 0'49605 0'49701 0'49795 0'49889 0'49982 0'50074 0'50166 0'50256 0'50346
0'09 0'50435 0'50523 0'50611 0'50697 0'50783 0'50868 0'50953 0'51036 0'51120 0'51202
0'10 0'51284 0'51365 0'51445 0'51525 0'51604 0'51682 0'51760 0'51838 0'51914 0'51990
0'11 0'52066 0'52141 0'52215 0'52289 0'52362 0'52435 0'52507 0'52579 0'52650 0'52721
0'12 0'52791 0'52860 0'52929 0'52998 0'53066 0'53134 0'53201 0'53268 0'53334 0'53400
0'13 0'53465 0'53530 0'53595 0'53659 0'53723 0'53786 0'53849 0'53911 0'53973 0'54034
0'14 0'54096 0'54156 0'54217 0'54277 0'54336 0'54396 0'54454 0'54513 0'54571 0'54629
0'15 0'54686 0'54743 0'54800 0'54856 0'54912 0'54967 0'55023 0'55078 0'55132 0'55186
0'16 0'55240 0'55294 0'55347 0'55400 0'55453 0'55505 0'55557 0'55609 0'55660 0'55711
0'17 0'55762 0'55812 0'55862 0'55912 0'55962 0'56011 0'56060 0'56109 0'56157 0'56205
0'18 0'56253 0'56301 0'56348 0'56395 0'56442 0'56488 0'56534 0'56580 0'56626 0'56671
0'19 0'56716 0'56761 0'56806 0'56850 0'56895 0'56938 0'56982 0'57025 0'57069 0'57111
0'20 0'57154 0'57196 0'57239 0'57281 0'57322 0'57364 0'57405 0'57446 0'57487 0'57527
0'21 0'57568 0'57608 0'57647 0'57687 0'57726 0'57766 0'57805 0'57843 0'57882 0'57920
0'22 0'57958 0'57996 0'58034 0'58071 0'58109 0'58146 0'58182 0'58219 0'58256 0'58292
0'23 0'58328 0'58364 0'58399 0'58435 0'58470 0'58505 0'58540 0'58574 0'58609 0'58643
0'24 0'58677 0'58711 0'58745 0'58778 0'58811 0'58845 0'58878 0'58910 0'58943 0'58975
0'25 0'59007 0'59039 0'59071 0'59103 0'59134 0'59166 0'59197 0'59228 0'59258 0'59289
0'26 0'59319 0'59350 0'59380 0'59410 0'59439 0'59469 0'59498 0'59528 0'59557 0'59585
0'27 0'59614 0'59643 0'59671 0'59699 0'59727 0'59755 0'59783 0'59811 0'59838 0'59865
0'28 0'59892 0'59919 0'59946 0'59973 0'59999 0'60025 0'60051 0'60077 0'60103 0'60129
0'29 0'60154 0'60180 0'60205 0'60230 0'60255 0'60280 0'60304 0'60329 0'60353 0'60377
0'30 0'60401 0'60425 0'60449 0'60472 0'60496 0'60519 0'60542 0'60565 0'60588 0'60611
0'31 0'60633 0'60656 0'60678 0'60700 0'60722 0'60744 0'60765 0'60787 0'60808 0'60830
0'32 0'60851 0'60872 0'60893 0'60913 0'60934 0'60954 0'60975 0'60995 0'61015 0'61035
0'33 0'61055 0'61074 0'61094 0'61113 0'61132 0'61151 0'61170 0'61189 0'61208 0'61226
0'34 0'61245 0'61263 0'61281 0'61299 0'61317 0'61335 0'61353 0'61370 0'61388 0'61405
0'35 0'61422 0'61439 0'61456 0'61473 0'61489 0'61506 0'61522 0'61538 0'61554 0'61570
0'36 0'61586 0'61602 0'61618 0'61633 0'61649 0'61664 0'61679 0'61694 0'61709 0'61724
0'37 0'61738 0'61753 0'61767 0'61781 0'61796 0'61810 0'61824 0'61837 0'61851 0'61865
0'38 0'61878 0'61891 0'61904 0'61917 0'61930 0'61943 0'61956 0'61969 0'61981 0'61993
0'39 0'62006 0'62018 0'62030 0'62042 0'62053 0'62065 0'62077 0'62088 0'62099 0'62111
0'40 0'62122 0'62133 0'62143 0'62154 0'62165 0'62175 0'62186 0'62196 0'62206 0'62216
0'41 0'62226 0'62236 0'62245 0'62255 0'62264 0'62274 0'62283 0'62292 0'62301 0'62310
0'42 0'62319 0'62328 0'62336 0'62345 0'62353 0'62361 0'62369 0'62377 0'62385 0'62393
0'43 0'62401 0'62408 0'62416 0'62423 0'62430 0'62437 0'62444 0'62451 0'62458 0'62465
0'44 0'62471 0'62478 0'62484 0'62490 0'62496 0'62502 0'62508 0'62514 0'62520 0'62525
0'45 0'62531 0'62536 0'62541 0'62547 0'62552 0'62556 0'62561 0'62566 0'62571 0'62575
0'46 0'62579 0'62584 0'62588 0'62592 0'62596 0'62600 0'62603 0'62607 0'62611 0'62614
0'47 0'62617 0'62620 0'62623 0'62626 0'62629 0'62632 0'62635 0'62637 0'62640 0'62642
0'48 0'62644 0'62646 0'62648 0'62650 0'62652 0'62654 0'62655 0'62657 0'62658 0'62659
0'49 0'62660 0'62661 0'62662 0'62663 0'62664 0'62664 0'62665 0'62665 0'62665 0'62666
0'50 0'62666

You might also like