You are on page 1of 51

60 Distribuciones bidimensionales


s 
r
(xi x)(yj y)fij
j=1 i=1
xy = =
 N
1
= (3 5.6)(3 5.2)2 + (4 5.6)(3 5.2)5 + (4 5.6)(4 5.2)1 +
20
+(5 5.6)(5 5.2)3 + (6 5.6)(6 5.2)1 + (6 5.6)(7 5.2)1 +
+(7 5.6)(6 5.2)1 + (7 5.6)(8 5.2)1 + (8 5.6)(7 5.2)2 +

+(8 5.6)(8 5.2)2 + (9 5.6)(7 5.2)1 = 3.28

Como alternativa para facilitar los calculos podemos confeccionar las


tablas de las variables x e y por separado con sus frecuencias marginales
como sigue

xi fi yi fj
3 2 3 7
4 6 4 1
5 3 5 3
6 2 6 2
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

7 2 7 4
8 4 8 3
9 1

Y ahora podemos proceder como en el Captulo 1 para disponer los


calculos en tabla de forma adecuada para obtener x, y, x2 y y2 .

xi fi xi fi xi x (xi x)2 (xi x)2 fi


3 2 6 2.6 6.76 13.52
4 6 24 1.6 2.56 15.36
5 3 15 0.6 0.36 1.08
6 2 12 0.4 0.16 0.32
7 2 14 1.4 1.96 3.92
8 4 32 2.4 5.76 23.04
9 1 9 3.4 11.56 11.56

= 112 68.80

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Regresion y correlacion 61

yj fj yj fj yj y (yj y)2 (yj y)2 fj


3 7 21 2.2 4.84 33.88
4 1 4 1.2 1.44 1.44
5 3 15 0.2 0.04 0.12
6 2 12 0.8 0.64 1.28
7 4 28 1.8 3.24 12.96
8 3 24 2.8 7.84 23.52

= 104 73.20

A la vista de las tablas se tiene


112 68.80
x= = 5.6 x2 = = 3.44
20 20
104 73.20
y= = 5.2 y2 = = 3.66
20 20

2.2 Regresion y correlacion


2.2.1 Lneas de regresion
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Como ya hemos indicado anteriormente, observando la nube de puntos


de una distribucion bidimensional se puede intuir la existencia, o no existen-
cia, de relacion entre las dos variables. En caso armativo, puede intentarse
expresar dicha relacion mediante alguna funcion cuya graca se aproxime a
la forma de la nube de puntos, denominada lnea de regresion. As pues,
puede hablarse de regresion lineal, parabolica, etc., segun sea la lnea que
represente la distribucion.
No existe razon lingustica para el termino regresion. El motivo es
historico. En 1886, Galton, primo de Darwin, publico un trabajo en el que se
pona de maniesto la dependencia de la talla entre padres e hijos: de padres
altos (bajos) nacen hijos altos (bajos). No obstante, observo ademas que la
estatura media de los hijos tiende a regresar hacia la media de la raza.
Nosotros abordaremos fundamentalmente el problema de la regresion
lineal, es decir, aquellas distribuciones bidimensionales que pueden ser repre-
sentadas por una recta, y aportaremos algunas nociones acerca de la regresion,
mas general, de tipo polinomico y de otras regresiones de uso comun.

2.2.2 Rectas de regresion


Supongamos que la nube de puntos que representa una distribucion
bidimensional se puede aproximar por una recta. De entre todas las rectas
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
62 Distribuciones bidimensionales

posibles optaremos por elegir la que nos da el metodo de ajuste por mnimos
cuadrados. Este metodo consiste en elegir la recta y = ax + b de modo que
la suma de cuadrados de las desviaciones entre los N puntos representados
(xi , yi ), i = 1, 2, . . . , N , (puede que se repitan) y la recta, sea lo menor posible.
Formalmente, si escribimos di = yi (axi + b), deseamos encontrar los
valores de a y b que hagan que d21 + d22 + + d2N sea mnimo.
Se demuestra, con los metodos usuales del Analisis Matematico, que
los valores a y b son las soluciones del siguiente sistema que constituyen las
denominadas ecuaciones normales de la recta de regresion de y sobre x:

 

N b + a xi = yi
(2.4)

  
b xi + a x2i = xi yi

(Para N grande resulta interesante razonar con las frecuencias absolutas


fi de cada par (xi , yi ). En tal caso, las ecuaciones normales de la recta de
regresion de y sobre x (escrita en la forma y = b0 + b1 x) son las dos primeras
del sistema (2.7) de la seccion 2.3.1, tomando b2 = 0).
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Del mismo modo, si deseamos hallar la recta de regresion de x sobre


y, utilizando el metodo de los mnimos cuadrados, las desviaciones que habran
de ser mnimas son las distancias entre las abcisas xi y las correspondientes a
la recta buscada que escribiremos x = a y + b , y de manera analoga se llega
al sistema de ecuaciones

 
 

Nb + a yi = xi


  
b yi + a yi2 = xi yi

Para el calculo practico de las rectas de regresion, ampliaremos la tabla


de frecuencias de la manera que muestra el siguiente ejemplo.

2.2.3 Ejemplo

Hallemos las rectas de regresion del Ejemplo 2.1.6.


Dispongamos los calculos como muestra la tabla adjunta.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Regresion y correlacion 63

xi yi x2i yi2 xi yi
3 3 9 9 9
4 4 16 16 16
6 4 36 16 24
8 7 64 49 56
8 8 64 64 64
6 7 36 49 42
4 3 16 9 12
5 5 25 25 25
4 3 16 9 12
 7 6 49 36 42
= 55 50 331 282 302
Atendiendo al estudio previo, para obtener la recta de regresion de y
sobre x hemos de resolver el sistema:

10b + 55a = 50

55b + 331a = 302
27 (50 55a)
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

cuya solucion es a = = 0.947, b = 0.211, por lo que la


28.5 10
ecuacion de la recta de regresion de y sobre x es y = 0.947 x 0.211
Para obtener la recta de regresion de x sobre y hemos de resolver el
sistema
10b + 50a = 55

50b + 282a = 302
27
cuya solucion es a = = 0.844, b 1.281, por lo que la ecuacion de la recta
32
de regresion de x sobre y es x = 0.844 y + 1.281, es decir y = 1.185 x 1.518.

2.2.4 Calculo abreviado de las rectas de regresion


Continuando con nuestro estudio, supongamos que la recta de regresion
de y sobre x aproxima la nube de puntos (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ) que
dene la variable bidimensional (X, Y ).
Si dividimos por n la primera ecuacion del sistema normal (2.4) que
dene la recta de regresion de y sobre x se tiene:
 
xi yi
b+a =
N N
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
64 Distribuciones bidimensionales

o sea, b+ax = y, lo cual expresa que el centro de gravedad (x, y) del diagrama
de puntos pertenece a la recta de regresion de y sobre x. Con un razonamiento
similar se prueba que (x, y) tambien pertenece a la recta de regresion de x
sobre y.
Puesto que la situacion relativa de la recta de regresion respecto de
la nube de puntos es independiente del sistema de coordenadas elegido, si
trasladamos los ejes cartesianos al punto (x, y), con el cambio de coordenadas
X = x x, Y = y y, entonces la recta de regresion Y = AX + B, de Y
sobre X tendra la misma pendiente respecto al nuevo sistema de coordenadas
que la recta de regresion de y sobre x, pero en este caso pasara por el origen,
i.e., A = a, B = 0, con lo que el sistema de ecuaciones normales de Y sobre
X
 

N B + A Xi = Yi

  
B Yi + a Xi2 = Xi Yi
quedara de la forma
 

a Xi = Yi
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.


 
a Xi2 = Xi Yi
donde la primera de las ecuaciones es una identidad, como es facil comprobar,
y de la segunda de estas ecuaciones se deduce

Xi Yi
a=  2
Xi
que expresado en las coordenadas iniciales es

(xi x)(yi y) xy
a=  2
= 2
(xi x) x
Teniendo en cuenta la ecuacion del haz de rectas que pasa por el punto
(x, y) (yy = a (x x)), podemos escribir la ecuacion de la recta de regresion
de y sobre x de la forma que habitualmente usaremos
xy
y y = 2 (x x) (2.5)
x
xy
y si recordamos la denicion del coeciente de correlacion r = , entonces
x y
la podemos escribir de la siguiente manera:
(y y) (x x)
=r
y x
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Regresion y correlacion 65

Con un tratamiento analogo se demuestra que la ecuacion de la recta


de regresion de x sobre y es

xy
xx= (y y) (2.6)
y2
que tambien se puede escribir de la forma

(y y) (x x)
r =
y x

Observese que en este caso la pendiente de la recta de regresion de x


1
sobre y es  , siendo
a  2
1 Yi y2
=  =
a Xi Yi xy
Si todos los puntos de la nube estuvieran sobre una recta, es obvio, por
simple interpretacion geometrica, que ambas rectas de regresion coincidiran
con dicha recta.

2.2.5 Ejemplo
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Volviendo al Ejemplo 2.1.6, donde se tiene x = 5.5, y = 5, x2 = 2.85,


y2= 3.2, xy = 2.7, la ecuacion de la recta de regresion de y sobre x segun
(2.5) viene dada por
2.7
y5= (x 5.5)
2.85
de lo que se deduce que
y = 0.947 x 0.211

La ecuacion de la recta de regresion de x sobre y segun (2.6) viene dada


por
2.7
x 5.5 = (y 5)
3.2
de lo que se deduce
y = 1.185 x 1.518

2.2.6 El coeciente de correlacion lineal


Continuando con la terminologa del punto anterior, anadamos que la
separacion entre las dos rectas de regresion, de y sobre x, y de x sobre y,
medida por el angulo que forman, da una idea del grado de correlacion entre
las variables x e y.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
66 Distribuciones bidimensionales

A tal efecto, Galton propuso el siguiente coeciente de correlacion:


   
Xi Yi Xi Yi Xi Yi xy xy xy
r =   =  2
 2 = a a =
2 2
=
X2 Y 2 Xi Yi x y x y
i i

que ya denimos en el apartado 6.1.3. Tratemos ahora de darle una inter-


pretacion, analizando el comportamiento de r.
Supongamos que r = 1. Entonces si escribimos r de la forma

a
r=
(1/a )
a
se tiene que r2 = 1 = , lo cual indica que las pendientes de las dos
1/a
rectas de regresion a y (1/a ) son la misma y puesto que ambas pasan por el
centro de gravedad (x, y), las dos rectas coinciden con lo que la correlacion es
perfecta. En este caso se puede demostrar que todos los puntos del diagrama
de dispersion se encuentran sobre la recta de regresion. En el caso de que
r = 1 la recta tiene pendiente positiva por lo que se dice que hay correlacion
directa maxima, y si r = 1, la recta es de pendiente negativa y se dice que
hay correlacion inversa maxima.

Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Si r = 0, entonces ha de ser Xi Yi = 0, de lo que se deduce que



a = a = 0, lo cual indica que la recta de regresion de y sobre x es paralela
al eje de abcisas mientras que la de x sobre y es perpendicular a dicho eje, lo
cual expresa que hay independencia absoluta entre las dos rectas de regresion,
o dicho de otra forma, la correlacion entre las variables x e y es nula.
Por lo tanto cuanto mas proximo sea r a 1 o -1, tanto mayor es la
correlacion entre las variables x e y. Anadamos que se puede demostrar que
r solo puede tomar valores en el intervalo [1, 1].
Si la correlacion entre dos variables es alta, i.e. |r| se acerca a 1, ello
permite conjeturar con bastante abilidad cuanto valdra una de las dos va-
riables en funcion de la otra utilizando una de las rectas de regresion cuando
el dato es cercano al rango de la variable correspondiente. Si r [0.5, 0.5]
puede considerarse que la correlacion es debil y la conjetura tiene tanta menos
abilidad conforme |r| se va haciendo mas pequeno.

2.2.7 Ejemplo
Continuando con el ejemplo 2.1.6 donde x2 = 2.85, y2 = 3.2, xy = 2.7,
se tiene que
xy 2.7 2.7
r= = = = 0.894
x y 2.85 3.2 3.019933
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Regresion polinomica 67

lo que nos indica que hay una fuerte correlacion directa entre las notas de
Matematicas y las de Fsica.
Si un alumno obtiene una calicacion de 6.5 en Matematicas pode-
mos recurrir a la recta de regresion de y sobre x para conjeturar que cal-
icacion sacara en Fsica. Entonces, sustituyendo x = 6.5 en la ecuacion
y = 0.947x 0.211 se obtiene que y 5.9. El lector comprobara que usando
la recta de regresion de x sobre y se obtiene que la calicacion y de Fsica
es aproximadamente 6.1. Ambos resultados son bastante ables porque el
coeciente de correlacion r se acerca a 1.
En el caso del parrafo anterior si el alumno hubiera obtenido un 0 en
Matematicas no procede conjeturar nada acerca de la nota de Fsica pues 0
es un valor alejado del mnimo 3, teniendo en cuenta que el rango en que se
mueven las notas x de Matematicas es 5 (8-3).

2.3 Regresion polinomica


Cuando la nube de puntos no se ajusta de manera satisfactoria a una
recta, sino que parece condensarse a lo largo de otro tipo de curva, en vez de
regresion lineal, se habla de regresion no lineal . Como caso particular de la
regresion no lineal empezaremos estudiando la regresion parabolica.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

2.3.1 Regresion parabolica


Resolver este tipo de regresion consiste en determinar la parabola
y = b0 + b1 x + b2 x2 , (b2 = 0)
con la condicion, analoga al caso de la regresion lineal, de que la suma de los
cuadrados de las desviaciones

d21 + d22 + + d2N

sea mnima, donde


di = yi (b0 + b1 xi + b2 x2i )
Modicando ligeramente la terminologa hasta ahora utilizada, supon-
dremos que tenemos un total de N puntos que toman los siguientes m valores
distintos

(x1 , y1 ), (x2 , y2 ), (x3 , y3 ), . . . , (xm , ym ),


con las frecuencias f1 , f2 , . . . , fm , respectivamente. El sistema de ecuaciones
normales que se obtiene en este caso es
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
68 Distribuciones bidimensionales

m

 m m m

f y = b f + b f x + b fi x2i


i i 0 i 1 i i 2


i=1
m
i=1
m
i=1
m
i=1
m
fi xi yi = b0 fi xi + b1 fi x2i + b2 fi x3i (2.7)


i=1
i=1 i=1 i=1

m m m m

2 2 3
fi x4i

fi x i y i = b 0 fi xi + b 1 f i xi + b2
i=1 i=1 i=1 i=1

2.3.2 Ejemplo
Los siguientes datos se han obtenido en una experiencia para estudiar
la relacion entre la cantidad de horas X dedicadas a la produccion de ciertos
componentes electronicos de precision, y el numero de componentes produci-
dos Y .

X 40 50 60 70 80 90
Y 69 175 272 335 390 415
El lector puede hacer un sencillo diagrama cartesiano y representar los
puntos (xi , yi ) para observar que una rama de parabola se ajusta bastante a
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

la nube de puntos. As pues, ajustaremos una parabola y = b0 + b1 x + b2 x2 a


los datos anteriores.
Observese que en este caso los 6 pares de valores (xi , yi ) son distintos,
por lo que m = N = 6, y fi = 1, i = 1, . . . , 6. Dispongamos los calculos en la
siguiente tabla.

xi yi x2i x3i x4i xi yi x2i yi


40 69 1600 64000 2560000 2760 110400
50 175 2500 125000 6250000 8750 437500
60 272 3600 216000 12960000 16320 979200
70 335 4900 343000 24010000 23450 1641500
80 390 6400 512000 40960000 31200 2496000
90 415 8100 729000 65610000 37350 3361500

= 390 1656 27100 1989000 152350000 119830 9026100

El sistema de ecuaciones normales es



1656 = 6b0 + 390b1 + 27100b2
119830 = 390b0 + 27100b1 + 1989000b2

9026100 = 27100b0 + 1989000b1 + 152350000b2
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Regresion polinomica 69

Resolviendo el sistema anterior se obtiene

b0 = 579.236.51 b1 = 20.2675 b2 = 0.1023

y la ecuacion de la parabola sera

y = 579.236 + 20.2675x 0.1023x2

2.3.3 Regresion polinomica general


Como hemos comentado al introducir la regresion parabolica, frecuentemente la nube
de puntos no se ajusta bien a una recta, sino que parece condensarse a lo largo de una curva
distinta. Si la regresion parabolica (polinomica de grado 2) tampoco es satisfactoria, es
logico plantear (y es a lo que se recurre en muchos casos) el ajuste de la nube a una funcion
polinomica de grado mayor

y(x) = b0 + b1 x + b2 x2 + . . . + bk xk , k>2

El problema esta en determinar las constantes b0 , b1 . . . . , bk con la condicion, analoga


al caso de la regresion lineal, de que la suma de los cuadrados de las desviaciones sea mnima.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Si tenemos los N puntos del epgrafe anterior

(x1 , y1 ), (x2 , y2 ), (x3 , y3 ), . . . , (xm , ym ),

con las frecuencias f1 , f2 , . . . , fm , respectivamente, entonces la suma de los cuadrados de las


desviaciones es

X
m X
m
E(b0 , b1 , . . . , bk ) = fi (yi y(xi ))2 = fi (yi b0 b1 xi b2 x2i . . . bk xki )2
i=1 i=1

Para obtener los valores de las constantes (b0 , b1 , . . .,bk ) que hacen mnima esta suma,
se resuelve el sistema de ecuaciones normales
8 m
>
> X X
m
>
>
> fi yi = fi (b0 + b1 xi + + bk xki )
>
>
>
> i=1 i=1
>
> Xm X
m
>
< fi xi yi = fi xi (b0 + b1 xi + + bk xki )
i=1 i=1
>
> .. ..
>
>
>
> . .
>
> X m X m
>
>
>
> fi xki yi = fi xki (b0 + b1 xi + + bk xki )
:
i=1 i=1

Estas k + 1 ecuaciones pueden expresarse en la forma


Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
70 Distribuciones bidimensionales

8 m
>
> X X
m X
m X
m
>
>
> fi yi = b0 fi + b1 fi xi + . . . bk fi xki
>
>
>
> i=1 i=1 i=1 i=1
>
> Xm X
m Xm X
m
>
< fi xi yi = b0 fi xi + b1 fi x2i + . . . bk fi xk+1
i
i=1 i=1 i=1 i=1
>
> .. ..
>
>
>
> . .
>
> X m X
m X
m X
m
>
>
>
> fi xki yi = b0 fi xki + b1 fi xk+1 + . . . bk fi x2k
: i i
i=1 i=1 i=1 i=1

Mediante la resolucion de este sistema de k + 1 ecuaciones con k + 1 incognitas se


obtienen los coecientes del polinomio de grado k, de aproximacion optima segun el criterio
de los mnimos cuadrados.
Observese que el anterior resultado es una generalizacion de los casos de la regresion
lineal y parabolica.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 71

2.4 Ejercicios resueltos

R2.1 Se ha tomado el peso x en intervalos de 6 Kg. y la altura en intervalos


de 10 cm. de 50 alumnos de una clase. Los resultados se ofrecen en la
siguiente tabla de doble entrada.

Y \X [50, 56[ [56, 62[ [62, 68[ 68, 74[


[1.55, 1.65[ 3 4 2 1
[1.65, 1.75[ 2 1 12 5
[1.75, 1.85[ 0 0 6 14

A traves de las marcas de clase construyase la correspondiente tabla de


correlacion con las frecuencias marginales. Hallense x, y y x2 .
Solucion: La tabla de correlacion pedida es

Y \X x1 = 53 x2 = 59 x3 = 65 x4 = 71 fj
y1 = 1.60 3 4 2 1 10
y2 = 1.70 2 1 12 5 20
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

y3 = 1.80 0 0 6 14 20
fi 5 5 20 20 N=50

Se tiene que


3
yj fj
j=1 1.6 10 + 1.7 20 + 1.8 20 86
y= = = = 1.72
N 50 50

Para facilitar los calculos de x y x2 procederemos a escribir la tabla de


frecuencias marginales de x y las columnas necesarias para el calculo de
x2 , en la forma que deseemos.

xi fi xi fi xi x (xi x)2 (xi x)2 fi


53 5 265 12.6 158.76 793.8
59 5 295 6.6 43.56 217.8
65 20 1300 0.6 0.36 7.2
 71 20 1420 5.4 29.16 583.2
= 50 3280 1602
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
72 Distribuciones bidimensionales

As pues,


4
xi fi
i=1 3280
x = = = 65.6
N 50

4
(xi x)2 fi
1602
x2 = i=1
= = 32.04
N 50

R2.2 Sea la siguiente tabla de correlacion de una variable bidimensional (X, Y )

Y \ X x1 = 1 x2 = 2 x3 = 3
y1 = 0 1 1 0
y2 = 2 0 1 3
y3 = 4 0 2 0
y4 = 6 1 0 1

(a) Completese la tabla con las frecuencias marginales.


(b) Hagase la tabla de frecuencias marginales de x e y por separado y
calculese y y y2 .
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Solucion:

(a) La tabla de correlacion con las frecuencias marginales resulta:

Y \ X x1 = 1 x2 = 2 x3 = 3 fi
y1 = 0 1 1 0 2
y2 = 2 0 1 3 4
y3 = 4 0 2 0 2
y4 = 6 1 0 1 2
fj 2 4 4 N = 10

(b) Las tablas de frecuencias marginales de x e y resultan

xi fi xi fi xi x (xi x)2 (xi x)2 fi


1 2 2 1.2 1.44 2.88
2 4 8 0.2 0.04 0.16
3 4 12 0.8 0.64 2.56

= 22 5.50
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 73

yj fj yj fj yj y (yj y)2 (yj y)2 fj


0 2 0 2.8 7.84 0
2 4 8 0.8 0.64 2.56
4 2 8 1.2 1.44 2.88
6 2 12 3.2 10.04 20.08

= 28 25.52

Con los datos de esta ultima tabla se obtiene facilmente:

28
y = = 2.8
10
25.52
y2 = = 2.552
10

R2.3 A lo largo de 25 anos, una empresa de microprocesadores ha ido incre-


mentando la supercie de su factora dedicada a produccion. A inter-
valos de 5 anos, la supercie dedicada a produccion (en miles de m2 ) y
la facturacion anual (en millones de euros) son los que se indican en la
siguiente tabla:
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

X (supercie) 20 34 46 54 80 110
Y (facturacion) 1.1 2.2 3.6 5.4 6 8

Se pide:

(a) Hallar las rectas de regresion y el coeciente de correlacion lineal.


(b) Sabiendo que dentro de 5 anos se piensa contar con una super-
cie de 130000 m2 dedicados a produccion, que facturacion cabe
esperar en ese momento? Es able la ultima respuesta?
(c) Si en unos anos se piensa facturar 20 millones de euros, que su-
percie cabe esperar que habra dedicada a produccion?

Solucion:

(a) Las ecuaciones de las rectas pedidas son:


xy xy
y y = 2 (x x); x x = 2 (y y)
x y
Por tanto debemos calcular x, y, x2 , y2 , xy . Para ello orga-
nizaremos los calculos como muesra la siguiente tabla, donde la

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
74 Distribuciones bidimensionales

ultima la (en negrita) indica las sumas por columnas, para poder
realizar los calculos mas facilmente:
xi yi xi x yi y (xi x)2 (yi y)2 (xi x)(yi y)
20 1.1 37.33 3.28 1393.78 10.78 122.58
34 2.2 23.33 2.18 544.44 4.77 50.94
46 3.6 11.33 0.78 128.44 0.61 8.88
54 5.4 3.33 1.02 11.11 1.03 3.39
80 6 22.67 1.62 513.78 2.61 36.64
110 8 52.67 3.62 2773.78 13.08 190.48
P
= 344 26.3 5365.33 32.89 406.13

Se obtienen los siguientes resultados:

344 26.3
x= 57.33 y= 4.38
6 6
5365.33 32.89
x2 = 894.22 y2 = 5.48
6 6
406.13
xy = 67.69
6
Sustituyendo estos valores en las ecuaciones anteriores obtenemos
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

las ecuaciones de las rectas de regresion:


y 4.38 = 0.0759(x 57.33) (Recta de regresion de y sobre x)

x 57.33 = 12.35(y 4.38) (Recta de regresion de x sobre y)

Finalmente, el valor del coeciente de correlacion lineal es


xy 67.69
r= = 0.967
x y 894.22 5.48

(b) Calculando el valor de y para x = 130 en la recta de regresion de


y sobre x obtenemos la facturacion esperada:
y = 4.38 + 0.0759(130 57.33) 9.89
En consecuencia se espera obtener una facturacion de 9.89 millones
de euros.
El resultado es bastante able, dada la fuerte correlacion entre las
variables, ya que r 1.
(c) El rango de la variable y es 6.9 (=8-1.1), y el dato es para y = 20
que esta lejos del maximo 8, con relacion al rango, por lo que no
tiene sentido conjeturar nada acerta de X.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 75

R2.4 La siguiente tabla muestra la relacion entre las medias de averas ob-
servadas en 10 circuitos entre dos componentes X e Y . Que media de
averas en Y cabe esperar si la media de averas en X, en cierto circuito,
es 1.95? Es able la ultima respuesta?

X 1.18 2.13 1.41 1.42 1.5 1.25 1.65 1.24 1.48 1.35
Y 2.39 3.11 2.15 1.96 2.02 1.76 2.10 2.12 2.28 1.86

Solucion:
Para calcular el valor pedido, previamente debemos obtener, por ejem-
plo, la recta de regresion de y sobre x y, para ello, calcularemos los
valores x, y, x2 , xy a partir de los datos organizados en la siguiente
tabla, donde la ultima la (en negrita) indica las sumas por columnas:

xi yi xi x yi y (xi x)2 (yi y)2 (xi x)(yi y)


1.18 2.39 0.28 0.22 0.08 0.05 0.67
2.13 3.11 0.67 0.94 0.45 0.87 2.08
1.41 2.15 0.05 0.02 0.00 0.00 0.11
1.42 1.96 0.04 0.22 0.00 0.05 0.08
1.50 2.02 0.04 0.16 0.00 0.02 0.08
1.25 1.76 0.21 0.42 0.04 0.17 0.37
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

1.65 2.10 0.19 0.07 0.04 0.01 0.40


1.24 2.12 0.22 0.05 0.05 0.00 0.47
1.48 2.28 0.02 0.11 0.00 0.01 0.04
1.35 1.86 0.11 0.32 0.01 0.10 0.21
P
= 14.61 21.75 0.67 1.28 0.69

14.61 21.75
x= 1.46 y= 2.18
10 10
0.67 0.69
x2 = 0.07 xy = 0.07
10 10
Por tanto la recta de regresion de y sobre x es y 2.18 = 0.07
0.07 (x 1.46),
de donde se deduce que y = 0.72 + x y, para x = 1.95, se obtiene el
valor y = 2.67
En consecuencia, para una muestra en que la media de averas en el
primer componente sea de 1.95, cabe esperar que la media de averas en
el segundo componente sea de 2.67.
Para saber si el resultado es able debemos calcular el coeciente de
correlacion r. Se tiene que
1.28
y2 = 0.13
10
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
76 Distribuciones bidimensionales

As pues
0.07
r= 0.53
0.07 0.13

por lo que el resultado se puede dar como aceptable, con reservas, ya


que no es muy able, dada la debil correlacion entre las variables, puesto
que r esta algo lejos de 1 y de -1.

R2.5 La siguiente tabla muestra el numero de strikes conseguidos por dos


jugadores X e Y , durante 9 partidos. Cuantos strikes es de esperar
que consiga Y en el proximo partido, si suponemos que X consigue 3?
Es able el resultado obtenido?

Partido 1o 2o 3o 4o 5o 6o 7o 8o 9o
Jugador X 2 2 2 1 2 0 0 3 4
Jugador Y 3 6 1 2 1 2 2 4 3

Solucion:
La variable bidimensional (X, Y ) toma los valores (xi , yi ) siguientes:
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

(2, 3), (2, 6), (2, 1), (1, 2), (2, 1), (0, 2), (0, 2), (3, 4), (4, 3)

(Notese que (0, 2) aparece dos veces).


Consideremos ahora la siguiente tabla que facilita el calculo de los
parametros necesarios cuando se desea calcular la varianza y covarianza
a traves de las expresiones (1.9) y (2.2), respectivamente.

xi yi x2i yi2 xi yi
2 3 4 9 6
2 6 4 36 12
2 1 4 1 2
1 2 1 4 2
2 1 4 1 2
0 2 0 4 0
0 2 0 4 0
3 4 9 16 12
4 3 16 9 12

= 16 24 42 84 48
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 77

16 24
x= = 1.78 y= = 2.67
9 9
  2
x2i 42 16
x2 = x2 = = 1.5
9 9 9
  2
yi2 84 24
y2 = y2 = = 2.2
9 9 9

xi yi 48 384
xy = xy = = 0.59
9 9 81
Atendiendo a la seccion 2.2.4, la recta de regresion de y sobre x es:
xy
yy = (x x)
x2

Sustituyendo cada valor antes calculado se obtiene la recta


 
24 0.59 16
y= + x
9 1.5 9
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Finalmente, puesto que pretendemos calcular el valor que toma la va-


riable y cuando la variable x vale 3, sustituimos x por 3, y se obtiene
y = 3.14, luego es de esperar que el jugador Y obtenga tambien 3
strikes.
Para decidir si este resultado es muy able o no, se considerara corre-
lacion muy debil cuando r, sin estar proximo a cero, se encuentre entre
-0.5 y 0.5. En nuestro caso se tiene
xy 0.59
r= = = 0.32
x y 1.5 2.2

As pues, interpretamos que el resultado obtenido es poco able, dado


que la correlacion es muy debil.

R2.6 El consumo Y de energas (en termias) de una factora depende de la


temperatura T (en o C). Con medidas de varios das se ha determinado
que la media y desviacion tpica de la temperatura son, respectivamente,
t = 15 y t = 6, y las del consumo de energa son y = 250 y y = 80.
Por otra parte, se sabe que ty = 360. Si se considera un consumo
elevado de energa a partir de 300 termias, utilcese la recta de regresion
de y sobre t para determinar la temperatura t a partir de la cual se
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
78 Distribuciones bidimensionales

producira un consumo elevado de energa y razonese si la respuesta es


able o no.
Solucion:
ty
La ecuacion de la recta de regresion de y sobre t es y y = (t t).
t2
360
Por tanto resulta y 250 = (t 15), es decir
62
y = 400 10t

En consecuencia para y = 300 termias se tiene 300 = 400 10t, de


donde se obtiene t = 10o C.
ty 360
El coeciente de correlacion r = = = 0.75 y como
t y 6 80
| 0.75| se aproxima a 1, la estimacion realizada anteriormente resulta
bastante able.

R2.7 En la tabla siguiente, la variable X muestra el numero de fotones lan-


zados a un objetivo, e Y muestra los fotones capturados. Utilcense las
rectas de regresion de y sobre x y de x sobre y para calcular el numero
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

de fotones que se espera capturar al lanzar 11 fotones sobre el objetivo.


Razonese si son ables los resultados.

xi yi
9 4
10 5
9 6
12 6
10 4

Solucion:
Dispondremos los datos necesarios en una tabla.

xi yi xi x (xi x)2 yi y (yi y)2 (xi x)(yi y)


9 4 1 1 1 1 1
10 5 0 0 0 0 0
9 6 1 1 1 1 1
12 6 2 4 1 1 2
10 4 0 0 1 1 0

= 50 25 6 4 2

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 79

De los datos de la tabla se tiene:


50 25
x= = 10 y= =5
5 5
6 4
x2 = y2 =

5 5
6 2
x = y =
5 5
2
xy =
5

En consecuencia la recta de regresion de y sobre x resulta


2
5
y5= 6 (x 10)
5

que en su forma explcita resulta


x 5
y= +
3 3

Por otra parte, la recta de regresion de x sobre y resulta


2
5
x 10 = (y 5)
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

4
5

que en su forma explcita resuta

y = 2x 15

Para calcular el numero de fotones que se espera capturar al lanzar 11,


se obtiene para la recta de regresion de y sobre x
11 5 16
y= + = 5.33
3 3 3
y para la recta de regresion de x sobre y

y = 2 11 15 = 7

El razonamiento de la abilidad de los resultados tendra en cuenta el


valor del coeciente de correlacion lineal r que vale
2 2
xy 1
r= = 5 = 5
= 0.41
x y 6 2 2 6 6
5 5 5

por lo que las estimaciones realizadas resultan poco ables.


Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
80 Distribuciones bidimensionales

R2.8 Sea (X, Y ) una variable bidimensional tal que x = 5, x = 2 y y = 5


y cuya recta de regresion de y sobre x viene dada por la expresion
y = 2x 3.

(a) Calculese la media y y la covarianza xy de la variable (X, Y ).


Hallese la recta de regresion de x sobre y.
(b) Calculese el coeciente de correlacion lineal r.

Solucion:

(a) Se sabe que la recta de regresion pasa por el punto (x, y). Por
tanto se tiene
y = 2x 3 = 2 5 3 = 7

Por otra parte se sabe que la pendiente de la recta de regresion de


xy
y sobre x es 2 y por tanto se tiene
x
xy
=2
4
de donde se obtiene xy = 8.
La ecuacion de la recta de regresion de x sobre y segun (2.6) es
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

8
x5= (y 7)
25

(b) El coeciente de correlacion lineal r se puede obtener a traves de


xy
la expresion r = . Por tanto se tiene
x y

8
r= = 0.8
25
R2.9 Los siguientes datos se han obtenido en una experiencia para estudiar la
relacion entre la cantidad de horas X dedicadas a la produccion de cier-
tos componentes electronicos de precision y el numero de componentes
producidos Y .

X 0 1 1 3 4 5
Y 2 3 4 7 12 22

Realcese un estudio de regresion parabolica.


Solucion:
Dispondremos los calculos en la siguiente tabla.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 81

xi yi x2i x3i x4i xi yi x2i yi


0 2 0 0 0 0 0
1 3 1 1 1 3 3
2 4 4 8 16 8 16
3 7 9 27 81 21 63
4 12 16 64 256 48 192
5 22 25 125 625 110 550

= 15 50 45 225 979 190 824

El sistema de ecuaciones normales es



50 = 6b0 + 15b1 + 45b2
190 = 15b0 + 45b1 + 225b2

824 = 45b0 + 225b1 + 979b2

Resolviendo el anterior sistema se obtiene

b0 1.75 b1 1.12 b2 0.5

y en consecuencia la ecuacion de la parabola sera


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

y = 1.75 + 1.12x 0.5x2

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
82 Distribuciones bidimensionales

2.5 Ejercicios propuestos

P2.1 Hallese y2 y xy en el Ejercicio R2.1.

P2.2 Hallese x, x2 y xy en el Ejercicio R2.2.

P2.3 Se ha ajustado una recta de regresion de la variable y sobre x con el


siguiente resultado: y = 0.6x 5. Teniendo en cuenta que la media
aritmetica de y es 25 y que las varianzas de x e y son 0.64 y 0.36, res-
pectivamente, razona la abilidad de dicha recta de regresion atendiendo
al coeciente de correlacion.

P2.4 En 1929 Hubble presento las primeras medidas sobre distancias y ve-
locidades de galaxias, demostrando que el Universo se esta expandiendo.
La siguiente tabla muestra parte de los datos originales de Hubble. Cal-
cula la recta de regresion de v sobre d y realiza una estimacion de la
velocidad de una galaxia cuya distancia sea de 1.2M pc. Razona si el
resultado es o no able.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

d (M pc) v (km/s)
0.5 290
0.5 270
0.8 300
0.9 650
0.9 150
1.0 920
1.1 450
1.1 500
1.4 500
1.7 960
2.0 800
2.0 1090

Nota. La notacion M pc es la abreviatura de Megaparsec donde un parsec


es la distancia a la que una unidad astronomica (equivalente a la distancia
Tierra-Sol) forma un segundo de arco.

P2.5 En la siguiente tabla, la variable X muestra las distintas temperaturas


(en o C) e Y muestra el consumo de energa (en cientos de termias)
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios propuestos 83

necesarios para la produccion de una factora.

xi yi
5 4
10 3
15 3
20 2
25 3

(a) Utilcese la recta de regresion de y sobre x para calcular la energa


que se espera consumir en dicha factora si la temperatura es de
18o C.
(b) Razonese si es able el resultado.

P2.6 En la siguiente tabla, la variable X muestra la masa (en gr.) de cinco


pesas colgadas del extremo de un resorte, e Y muestra el alargamiento
(en mm.) producido. Hallese la recta de regresion de y sobre x, el
coeciente de correlacion lineal y deduzcase que masa pende del muelle si
este se alarga 8mm. Contestese tambien utilizando la recta de regresion
de x sobre y. Razonese si son ables los resultados.

xi yi
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3 1
4 3
5 4
6 5
7 7

P2.7 Sean las variables X, Y y Z cuyos valores se muestran en la tabla. Utiliza


el signicado del coeciente de correlacion lineal para decidir si X esta
mejor correlacionada con Y o con Z.

X Y Z
1 0 3
2 5 1
5 10 8
8 10 5
9 20 3

P2.8 Los siguientes datos se han obtenido en una experiencia para estudiar la
relacion entre la cantidad de horas X dedicadas a la produccion de cier-
tos componentes electronicos de precision y el numero de componentes
producidos Y .
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
84 Distribuciones bidimensionales

X 10 12 14 16 18 20
Y 95 120 200 240 340 390

Compruebese que la nube de puntos se ajusta a una parabola y realcese


el correspondiente estudio de regresion parabolica.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Proyecto: Otras funciones de ajuste 85

2.6 Proyecto: Otras funciones de ajuste

En numerosas ocasiones, un ajuste polinomico tampoco representa satisfacto-


riamente la ley de un fenomeno observado. Entonces se recurre a estudiar el ajuste
mediante otros tipos de curvas. La eleccion se hace teniendo presente, por una parte,
la representacion cartesiana de las observaciones realizadas (los puntos representados
en una graca) y, por otra, los conocimientos que se tengan (por supuesto a priori) del
fenomeno a estudiar. En general, es bastante conveniente la representacion graca,
en escalas logartmica o semilogartmica, cuando hay una variabilidad alta o
se observa un crecimiento relativo aproximadamente constante en alguna de las va-
riables, para examinar si es realmente apropiado ajustar a estos puntos una recta o
curva conocida. Veamos algunos casos de interes. Supongamos que se tiene una serie
de datos bidimensionales (xi , yi ). Si tomamos escala logartmica para los valores yi y
ordinaria para xi , o lo que es lo mismo, representamos sobre ejes cartesianos usuales
los puntos (xi , ln(yi )), y la nube obtenida se agrupa siguiendo la tendencia de una
recta, es logico ajustar los datos (xi , ln(yi )) a la recta

ln(y) = Ax + C,

lo cual equivale a ajustar los datos iniciales observados, (xi , yi ), a la funcion de tipo
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

exponencial, y = ceAx , donde c = eC . Notemos que el ajuste obtenido es equivalente


a y = cax , donde a = eA .
Si se toman escalas logartmicas en los valores yi y en xi , es decir, repre-
sentamos en ejes cartesianos usuales los puntos (ln(xi ), ln(yi )), y la nube obtenida
se agrupa siguiendo la tendencia de una recta, es logico el ajuste de los puntos
(ln(xi ), ln(yi )) a la recta

ln(y) = A ln(x) + C,

lo cual equivale al ajuste de los valores observados (xi , yi ) a la curva y = cxA , donde
c = eC .
Ejemplo:
Consideremos la serie de valores bidimensionales dada en la siguiente tabla

xi 2.5 3.7 4.1 5.3 6.2


yi 15.9 44.5 65.6 206.5 498.7

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
86 Distribuciones bidimensionales

A continuacion se representan gracamente los puntos de la tabla

Observamos a continuacion los datos de la tabla considerando escala semilo-


gartmica para los valores yi , es decir los datos de la tabla

xi 2.5 3.7 4.1 5.3 6.2


yi = ln(yi ) 2.8 3.8 4.2 5.3 6.2
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

que podemos observar que aparecen aproximadamente alineados. Si calculamos la


recta de regresion de Y = ln(y) sobre x se obtiene la recta

Y = 0.9359 x + 0.3774

la cual nos lleva a la funcion de ajuste exponencial y = e0.3774 e0.9359x , es decir

y = 1. 4585 e0.9359x

que equivale a
y = 1. 4585 2. 5495x
puesto que e0.9359 2. 5495.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Captulo 3

Probabilidad

En algunos casos concretos de este captulo se ha relajado la notacion


(lo cual es difcilmente justicable en matematicas) para que la formalizacion
de los resultados no eclipse los metodos probabilsticos.

3.1 Espacios Probabilsticos


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3.1.1 Experimentos aleatorios

Un experimento (fenomeno) E se dice que es aleatorio si no se puede


predecir su resultado. Cada resultado posible simple del experimento se llama
suceso elemental .
Representaremos por E el conjunto de sucesos elementales asociados
al fenomeno aleatorio E, y lo denomiremos espacio muestral. Se dice que S
es un suceso (aleatorio) si S E . Cuando no haya posibilidad de confusion
haremos omision a cualquier referencia sobre E.
A los sucesos y se les llama suceso seguro y suceso imposible,
respectivamente. Al realizarse un experimento se dice que se verica el suceso
S si el resultado es alguno de los sucesos elementales que forman S. Las
operaciones usuales con conjuntos dan lugar a nuevos sucesos, algunos de los
cuales denominamos a continuacion.
El suceso S, denominado contrario de S, lo forman los sucesos elemen-
tales que no son de S. Si S1 y S2 son sucesos de , se dene el suceso union
S1 S2 como aquel que se verica al realizarse S1 o S2 . Analogamente se
dene el suceso interseccion S1 S2 como aquel que se verica al realizarse
S1 y S2 simultaneamente.
Si S1 S2 = se dice que S1 y S2 son incompatibles.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
88 Probabilidad

Es evidente que la familia P() de todos los sucesos verica las conoci-
das propiedades de la teora de conjuntos, relativas a la union, interseccion y
complementacion (calculo del suceso contrario) de conjuntos, por lo que P()
con estas leyes constituye un algebra de Boole.
Ejemplos de experimentos aleatorios a los que nos referiremos con fre-
cuencia son el lanzamiento de un dado o una moneda, extraccion de cartas de
una baraja o de bolas de una urna, . . .

3.1.2 Ejemplo
Consideremos el experimento lanzar un dado. El espacio muestral
de los sucesos elementales posibles es = {1, 2, 3, 4, 5, 6}
El suceso A = {obtener cifra par} es A = {2, 4, 6}
El suceso B = {obtener multiplo de 3} es B = {3, 6}.
Por tanto,

A B = {2, 3, 4, 6}, A B = {6}, A = {1, 3, 5}, B = {1, 2, 4, 5},

A A = , A A =
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3.1.3 Nota
Para entender el concepto intuitivo de suceso elemental simple imaginemos
que en el dado los numeros 2, 4 y 6 no aparecen y en su lugar estuviera la etiqueta
par . Entonces el conjunto de sucesos elementales sera {1, 3, 5, par}.

3.1.4 Algebra de sucesos


Sea A una familia no vaca de sucesos contenida en P(). Diremos que
A es un algebra de sucesos si verica:

1. Si A, B A entonces A B A

2. Si S A entonces S A

Como consecuencia, si A es un algebra de sucesos se verica que:

3. A

4. A

5. Si A, B A, entonces A B A
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Espacios Probabilsticos 89

3.1.5 Ejemplo

En el experimento lanzar un dado, se tiene que la familia se sucesos


A = {, , {1, 3, 5}, {2, 4, 6}} es un algebra de sucesos.

3.1.6 Probabilidad

Sea A un algebra de sucesos. Una aplicacion P : A [0, 1] se dice


que es una probabilidad (sobre A) si verica los axiomas:

(1) P () = 1

(2) Si A B = entonces P (A B) = P (A) + P (B)

Si S es un suceso se dice que P (S) es la probabilidad de S.


A la terna (, A, P ) se le llama espacio probabilstico.
Con una notacion mas literal, el axioma (2) se puede escribir

P (A o B) = P (A) + P (B)
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

si A y B son incompatibles.

3.1.7 Nota

Sea A el algebra de sucesos de un experimento que podemos repetir


en igualdad de condiciones N veces. Si sobre A denimos la aplicacion
n
(frecuencia relativa) fr : A [0, 1] dada por fr (S) = donde n es el
N
numero de veces que se ha realizado el suceso S, entonces fr es una funcion
probabilidad sobre A.
Tambien y desde un punto de vista ligeramente distinto, la tabla de
frecuencias relativas de una variable estadstica proporciona un ejemplo de
funcion de probabilidad como muestra el siguente ejemplo.

3.1.8 Ejemplo

La siguiente tabla recoge las calicaciones de 100 alumnos, y en ella ni


indica la frecuencia absoluta de la calicacion i (i = 1, 2, . . . , 10).

i 1 2 3 4 5 6 7 8 9 10
ni 2 4 10 24 26 12 10 6 3 1
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
90 Probabilidad

Si S es un suceso de = {1, 2, . . . , 10}, designemos nS su frecuencia


absoluta. Con esta terminologa la frecuencia relativa fr verica
100
fr () = =1
100
Si A y B son sucesos incompatibles de entonces evidentemente
nA + nB nA nB
fr (A B) = = + = fr (A) + fr (B)
100 100 100
Por tanto fr es una funcion de probabilidad (sobre el algebra de sucesos
de ).
Sean los sucesos A = {notas inferiores a 3}, B = {notas superiores a 5}
y C = {3}, es decir A = {1, 2}, B = {6, 7, 8, 9, 10} y C = {3, 6, 9}. Evidente-
mente A B = y B C = {6, 9}.
Se tiene que
6 32
fr (A) = fr (B) =
100 100
38
fr (A B) = fr ({1, 2, 6, 7, 8, 9, 10}) = = f( A) + fr (B)
100
Por otra parte
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

25 15
fr (C) = fr (B C) =
100 100
y en este caso se verica (ver c4) del punto siguiente) que
42
fr (B C) = fr ({3, 6, 7, 8, 9, 10}) = = fr (B) + fr (C) fr (B C)
100

3.1.9 Propiedades de una funcion probabilidad


(, A, P ) un espacio probabilstico. Como consecuencia de los axiomas
de probabilidad, es facil deducir las siguientes consecuencias. (Ver ejercicios
R3.1, R3.3, R3.4 y la nota que sigue al ejercicio R3.4).
c1) P () = 0
c2) P (S) + P (S) = 1
c3) Si A B entonces P (B A) = P (B) P (A)
y nalmente, como generalizacion del axioma (2) de 3.1.6 se tiene:
c4) P (A B) = P (A) + P (B) P (A B)
o de manera mas literal P (A o B) = P (A) + P (B) P (A B).
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Espacios Probabilsticos 91

3.1.10 Axiomatica de Kolmogorov

El concepto de espacio probabilstico denido anteriormente es suciente para la


mayora de los problemas practicos que se nos pueden plantear. No obstante para el caso en
donde no es nito adoptaremos la siguiente denicion mas general debida a Kolmogorov.
Se dice que la familia no vaca M de subconjuntos del espacio muestral es una
-algebra si verica:
a) Si A M entonces A M
b) Si Aj M j = 1, 2 . . . entonces Aj M
Si M es una -algebra diremos que la funcion P : M [0, 1] es una probabilidad
si verica:
1. P () = 1
2. Si Aj es una sucesion de sucesos disjuntos dos a dos entonces
X
P (Aj ) = P (Aj )

La terna (, M, P ) recibe el nombre de espacio probabilstico.

3.1.11 Probabilidad de Laplace


Si disponemos de un fenomeno aleatorio, digamos lanzar un dado, que
podemos repetir un numero de veces determinado, 600 por ejemplo, el mayor
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

inconveniente que presenta la frecuencia relativa de la Nota 3.1.7 para tomarla


como denicion de probabilidad de un suceso, es que vara con el numero de
lanzamientos. As, si en nuestro ejemplo ha salido 90 veces el numero 1, es
poco probable que al lanzar 1200 veces el dado vaya a salir 180 veces el 1.
No obstante, cuando la realizacion del experimento se repite un numero muy
grande de veces se verica la siguiente ley, que nosotros asumimos en cuanto
sigue, concocida como ley del azar:
Las frecuencias relativas de los sucesos aleatorios tienden a estabilizarse
alrededor de ciertos numeros (probabilidades).
En el caso del dado mencionado y si suponemos que esta bien cons-
truido, la frecuencia relativa del 1, al ir aumentando cada vez el numero de
1
experimentos, tiende a (lo mismo sucede con el 2, 3, 4, 5 y 6).
6
Hagamos enfasis en el hecho de que la frecuencia relativa del 1 podra
1
tender a un numero distinto de , sin que esto suponga ninguna contradiccion
6
con la ley del azar; sencillamente, nos esta mostrando que el dado no es
perfecto.
Supongamos ahora que el conjunto de sucesos elementales de un ex-
perimento aleatorio, es el conjunto nito e1 , e2 , . . . , en y que todos ellos son
igualmente esperados. En tal caso diremos que los sucesos elementales son
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
92 Probabilidad

equiprobables. Si adjudicamos a cada suceso elemental ei un mismo valor


P (ei ) = k, y deseamos que P sea una probabilidad, entonces, como los sucesos
elementales son disjuntos dos a dos, debera vericarse que
P () = 1 = P (e1 ) + P (e2 ) + + P (en ) = nk,
1
es decir, P (ei ) = .
n
En consecuencia si un suceso S esta formado por r sucesos elementales
se vericara que:
r veces
  
1 1 r
P (S) = + + =
n n n
de lo que se deriva la conocida expresion de la probabilidad de un suceso S:
casos favorables
P (S) =
casos posibles
conocida como regla de Laplace, o probabilidad de Laplace.
Es facil vericar que P , de esta forma denida, es en efecto una funcion
probabilidad sobre la familia A de sucesos de . Cuando no se especique lo
contrario, al hablar de probabilidad nos referiremos a la dada por la regla de
Laplace.
En cuanto sigue, salvo que se diga lo contrario, supondremos que las
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

monedas, dados,. . . de nuestros experimentos estan bien construdos.

3.1.12 Ejemplo
Sea S el suceso extraer dos reyes simultaneamente en una baraja espanola
de 40 cartas. Se tiene que
43
casos favorables C4,2 2 1
P (S) = = = 4039 =
casos posibles C40,2 2
130

3.1.13 Pruebas repetidas. Espacio producto


Por pruebas repetidas solemos designar la repeticion de un fenomeno
aleatorio en igualdad de condiciones. Corresponden, por ejemplo, a este tipo,
el lanzamiento de varias monedas (todas ellas iguales) al aire, que puede ser
considerado como el experimento de lanzar una sola repetidamente. Si es
el conjunto de los n sucesos elementales, (que suponemos nito) entonces la
repeticion 2, 3, . . . veces de este experimento nos lleva a considerar como suce-
sos elementales del experimento, los elementos de 2 , 3 , . . . como veremos
en el siguiente ejemplo. No obstante, en ocasiones, este aspecto formal es
eclipsado en la practica del calculo de probabilidades.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Espacios Probabilsticos 93

3.1.14 Ejemplo
Cual es la probabilidad de obtener 3 caras al lanzar 3 monedas al aire?
1
Como obviamente P (c) = P (+) = , entonces los ocho casos (igual-
2
mente) posibles que se pueden dar al lanzar las 3 monedas son los elementos
del producto cartesiano {c, +}3 que representaremos en la forma:

ccc, cc+, c+c, +cc, c++, +c+, ++c, +++

y por tanto, como hay un unico caso favorable (ccc), la probabilidad pedida
1
es .
8

3.1.15 Probabilidad suma


Si generalizamos el axioma 2 de 3.1.6 a n sucesos Ai disjuntos dos a dos
(ver ejercicio 2), se tiene el teorema de la probabilidad suma:
n

P Ai = P (A1 ) + P (An )
i=1
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3.1.16 Probabilidad compuesta


Se denomina probabilidad compuesta la probabilidad de un suceso
cuya realizacion exige que se realicen conjuntamente varios sucesos. En esta
seccion nos ocuparemos de sucesos que son independientes entre s. Para jar
ideas imaginemos que tenemos una urna U1 que contiene N1 bolas, de las
cuales n1 son blancas, y una segunda urna U2 con N2 bolas, de las cuales n2
son blancas. Deseamos conocer la probabilidad de obtener simultaneamente
una bola blanca en U1 y otra blanca en U2 .
Si denominamos Si al suceso obtener bola blanca en Ui (i = 1, 2), y S
al suceso salir blanca en ambas urnas, se tiene que
n1 n2 n1 n2
P (S) = = = P (S1 ) P (S2 )
N1 N2 N1 N2
y se observa en el calculo anterior, que la probabilidad de que se realicen
ambos sucesos S1 y S2 , P (S1 y S2 ), es el producto de las probabilidades de
cada uno de ellos. Si generalizamos esta situacion se tiene el teorema de la
probabilidad compuesta:
La probabilidad de un suceso compuesto es igual al producto de las pro-
babilidades de los sucesos componentes, supuestos estos independientes entre
s.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
94 Probabilidad

Observemos que la nocion de ser dos sucesos independientes entre s


es una nocion intuitiva (una denicion matematica de sucesos independientes
se vera en la siguiente seccion), y engloba como caso particular las pruebas
repetidas, pues el resultado de un experimento no depende del anterior.
Tambien los sucesos simultaneos puede considerarse independientes,
pero hagamos notar que el concepto de simultaneidad es relativo en la Fsica
Relativista, por lo que dichos sucesos pueden considerarse consecutivos. As
los sucesos consecutivos resultan ser, salvo mencion explcita, independientes.
En general, por ejemplo, podemos armar (y el lector encontrara ade-
cuados argumentos para ello) que el suceso que se realiza al lanzar un dado
o una moneda es independiente del que se de al extraer una carta en una
baraja. El reconocimiento, en su caso, de sucesos independientes simplica
enormemente el calculo de probabilidades (ver Ejercicio R3.11)

3.1.17 Nota
En la practica, la realizacion conjunta de dos sucesos A y B donde
A 1 y B 2 que da lugar al suceso compuesto S se denota, de manera
simplista
S =AB
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Observese que esta notacion, en principio, no tiene sentido salvo que se for-
malice el problema (lo que siempre es posible), de manera que A y B se
identiquen con sucesos de 1 2 . As, con la notacion simplista se tiene

P (A B) = P (A) P (B) (3.1)

si A y B son independientes.
De manera mas general P (A1 An ) = P (A1 ) P (An ) si los sucesos
Ai son independientes dos a dos.

3.1.18 Ejemplo
Se desea hallar la probabilidad de obtener rey en una baraja de cartas
espanola y un cinco en el lanzamiento de un dado.
4 1 1
Se tiene que P (obtener rey)= = y P (obtener 5)= . Ahora bien,
40 10 6
como los sucesos mencionados son independientes entre s, entonces, usando
la notacion simplista de la Nota 3.1.17 la probabilidad pedida es
1 1 1
P ({rey} {5}) = =
10 6 60
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Espacios Probabilsticos 95

(Si hubieramos prescindido de la notacion simplista, tendramos que


considerar el suceso S compuesto formado por los 4 sucesos elementales
{(rey oros, 5), (rey copas, 5), (rey espadas, 5), (rey bastos, 5)}
de entre los 240 sucesos elementales de 1 2 donde 1 son los 40 sucesos
elementales de una baraja y 2 son los 6 sucesos elementales de un dado.
4 1
Obviamente P (S) = = ).
240 60

3.1.19 Ejemplo

(a) (Extraccion con reemplazamiento) Hallar la probabilidad de obte-


ner en una primera extraccion un rey en una baraja espanola, reem-
plazarla a la baraja y extraer de nuevo, en una segunda extraccion, otro
rey.
(b) (Extraccion sin reemplazamiento) Contestemos al apartado ante-
rior pero sin reemplazar, en esta ocasion, la primera carta extrada de
la baraja.
1
En el caso (a) la probabilidad de extraer rey en cada extraccion es ,
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

10
y como ambos sucesos son independientes entre s, entonces la probabilidad
pedida es
1 1 1
=
10 10 100
En el caso (b) la baraja de la segunda extraccion se compone de 39
cartas, y si se supone que la primera carta extraida era rey, solo quedan 3
reyes, por lo que la probabilidad de obtener rey en la segunda extraccion
3 1
es = . As pues, dado que los sucesos son independientes entre s, la
39 13
1 1 1
probabilidad pedida es =
10 13 130
Observese que el problema de una segunda extraccion sin reemplaza-
miento equivale a extraer simultaneamente dos cartas de la baraja, y esa es
la razon por la que la solucion del apartado (b) coincide con la del Ejemplo
3.1.12

3.1.20 Diagramas de arbol


Un caso especialmente interesante de sucesos independientes entre s lo
constituyen los experimentos que se repiten en igualdad de condiciones (vease
la Seccion 3.1.13 y el Ejemplo 3.1.14).
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
96 Probabilidad

Supongamos pues, que un experimento aleatorio que da lugar a n suce-


sos elementales, llamemos originales, se repite m veces. Entonces el expe-
rimento tiene un numero nm de sucesos elementales, digamos nales, que
se pueden representar por medio de caminos de izquierda a derecha, en un
diagrama de arbol, de interpretacion obvia. La probabilidad de cada suceso
elemental nal (camino) es el producto de las probabilidades de los n sucesos
elementales originales (ramas) que constituyen el suceso elemental nal.
De manera mas general un arbol puede representar la realizacion de
sucesos distintos consecutivos de manera que en cada vertice aparecen ramas
que representan sucesos disjuntos y excluyentes por lo que la suma de sus
probabilidades es 1. La realizacion de un suceso S al nal de un camino
supone la realizacion de todos los sucesos independientes, en el sentido de
la seccion 3.1.16 y Nota 3.1.17, que quedan representados por las ramas del
camino, por lo que la probabilidad de S es el producto de las probabilidades
representadas en dichas ramas.
Un diagrama en arbol admite otra interesante interpretacion distinta
pero tan valida como la anterior. Cada suceso se realiza condicionado a que
se haya realizado el anterior que tiene a la izquierda, y este concepto suceso
condicionado sera el objeto de estudio de la seccion 3.2.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3.1.21 Ejemplo

Se lanza 3 veces al aire una moneda cargada, de manera que

2 1
P (c) = P (+) =
3 3

Hallaremos la probabilidad de que salgan solo dos caras.


Como se observa en el diagrama siguiente, hay tres caminos (sucesos
elementales nales) en los que se tienen dos caras y una cruz (cc+, c + c, +cc).
En cada camino, y atendiendo a las ramas que lo constituyen, la probabilidad
es
1 2 2 4
=
3 3 3 27

Como los tres caminos representan sucesos disjuntos, entonces la pro-


4 4
babilidad pedida es 3 = .
27 9
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Probabilidad condicionada. Teorema de Bayes 97

2
3 C
 *
2 C
HH
3  1j +
3
C
2
 @ C
2  1 @ 3*
R 
3  3 +
 HH
 1j +
 3

A 2
C
A 3*
A 
1 2 C
A HH
j
3 3 
A 1 +
AU 3
+
2
@ C
1 @ 3*
R 
3 +
HH
j
1 +
3
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3.2 Probabilidad condicionada. Teorema de Bayes


En esta seccion nos ocuparemos de estudiar la probabilidad de que se
realice un suceso cuando esta condicionado, al menos hipoteticamente, a la
realizacion de otro suceso.
En esta seccion (, A, P ) es un espacio probabilstico.

3.2.1 Probabilidad condicionada


Si A y B son sucesos de A y suponemos P (B) > 0, se dene la proba-
bilidad de A dado B (condicionada a B), y se denota P (A/B) como

P (A B)
P (A/B) = (3.2)
P (B)
El diagrama de Venn adjunto contextualiza la ecuacion (3.2) y muestra
que el espacio de sucesos elementales se reduce a B en vez de . As, P (A/B)
es la probabilidad de que suceda A suponiendo que B ha sucedido. Como se
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
98 Probabilidad

aprecia en el diagrama, P (A/B) mide, en cierto sentido, la probabilidad de A


con relacion a B. En el caso particular de que este formado por un numero
nito de sucesos elementales equiprobables, es facil probar que

no de elementos de (A B)
P (A/B) =
no de elementos de B

De la expresion (3.2) se obtiene que

P (A B) = P (A/B) P (B) (3.3)


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

y tambien, a partir de la denicion (analoga) de P (B/A), se tiene que

P (A B) = P (B/A) P (A) (3.4)

La expresion (3.3) (o la expresion (3.4)) es una alternativa a (3.1) para


hallar la probabilidad conjunta de A y B cuando A y B no son independientes.
Se dice que A y B son sucesos independientes si

P (A B) = P (A) P (B)

en cuyo caso de (3.2) se tiene que P (A/B) = P (A), o expresado en otras


palabras, dos sucesos son independientes si y solo si la probabilidad de que
uno suceda no depende del otro (i.e. la ocurrencia de uno no afecta a la
probabilidad del otro).
Es facil probar que, jado B la funcion P denida por P (A) = P (A/B) es una
funcion probabilidad sobre A, lo que justica su denominacion de probabilidad.

3.2.2 Ejemplo
Se lanzan dos dados, y resulta que la suma de puntos es 6. Hallar la
probabilidad de que alguno de los dos dados sea un dos.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Probabilidad condicionada. Teorema de Bayes 99

Sea B = {suma de puntos es 6} = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} y
sea A = {un dado al menos es 2} = {(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(1, 2), (3, 2), (4, 2), (5, 2), (6, 2)}. Entonces: AB = {(2, 4), (4, 2)}. Si tenemos
en cuenta que al lanzar dos dados tenemos 62 casos posibles, entonces
2
P (A B) 36 2
P (A/B) = = 5 =
P (B) 36
5

Observese que como todos los 36 sucesos elementales de B son equipro-


bables, podramos haber recurrido a escribir

no elementos de (A B) 2
o =
n de elementos de B 5

Finalmente observemos que A y B no son sucesos independientes pues


11
P (A) = = P (A/B).
36

3.2.3 Probabilidad total

Supongamos que la familia de sucesos A1 , A2 , . . . , An de A constituyen


n
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

una particion de , es decir, son disjuntos dos a dos y verican que Ai = .


i=1
Si B es un suceso de A podemos escribir

B = B = (A1 A2 An ) B = (A1 B) (A2 B) (An B)

Como cada conjunto de la ultima union es disjunto con los demas, pode-
mos escribir

P (B) = P (A1 B) + P (A2 B) + P (An B) (3.5)

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
100 Probabilidad

Aplicando ahora a cada sumando de (3.5) la expresion (3.4) del punto


anterior, se tiene el teorema de la probabilidad total (en version condi-
cional):

P (B) = P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + + P (B/An ) P (An ) (3.6)

3.2.4 Ejemplo
Tres maquinas A1 , A2 y A3 producen respectivamente el 50%, 30% y
20% del numero total de artculos de una fabrica. Los porcentajes de produc-
tos defectuosos de estas maquinas son 3%, 2% y 1%, respectivamente. Si se
selecciona un artculo al azar, cual es la probabilidad de que sea defectuoso?
Sea D = {seleccionar artculo defectuoso}. Observemos que A1 , A2 ,
A3 representa una particion de la produccion de artculos, y que del enunciado
se deduce que P (A1 ) = 0.5, P (A2 ) = 0.3 y P (A3 ) = 0.2.
Por otra parte, la probabilidad de que un artculo producido por A1
sea defectuoso es P (D/A1 ) = 0.03, y analogamente P (D/A2 ) = 0.02, y
P (D/A3 ) = 0.01. Por aplicacion de (3.6) se tiene que
P (D) = P (D/A1 ) P (A1 ) + P (D/A2 ) P (A2 ) + P (D/A3 ) P (A3 ) =
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

= 0.03 0.5 + 0.02 0.3 + 0.01 0.2 = 0.023

Podemos responder la cuestion mediante la interpretacion del siguiente


arbol en donde las probabilidades de cada suceso Ai de la particion aparecen
al principio y las probabilidades condicionadas P (D/Ai ) aparecen a la derecha
de Ai , de manera que (D/Ai ) y Ai se tratan como sucesos consecutivos y por
tanto, en este contexto, independientes.
Tres son las ramas distintas que conducen al artculo defectuoso D. En
cada una de ellas se han de dar dos sucesos independientes cuyas probabili-
dades se indican en el diagrama de arbol. As pues
P (D) = 0.5 0.03 + 0.3 0.02 + 0.2 0.01 = 0.023

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Probabilidad condicionada. Teorema de Bayes 101

3.2.5 Teorema de Bayes


Supongamos que estamos en las condiciones del apartado anterior y que
P (B) > 0. De una parte sabemos que

P (Ai B) P (B/Ai ) P (Ai )


P (Ai /B) = = (3.7)
P (B) P (B)
Sustituyendo en la expresion (3.7) P (B) por su valor de (3.6) se tiene
el teorema de Bayes:

P (B/Ai ) P (Ai )
P (Ai /B) =
P (B/A1 ) P (A1 ) + P (B/A2 ) P (A2 ) + + P (B/An ) P (An )

3.2.6 Ejemplo
Siguiendo con el ejemplo anterior, supongase que se selecciona un art-
culo al azar y resulta ser defectuoso. Hallar la probabilidad de que el artculo
fuera producido por la maquina A1
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Se tiene que
P (D/A1 ) P (A1 )
P (A1 /D) = =
P (D/A1 ) P (A1 ) + P (D/A2 ) P (A2 ) + P (D/A3 ) P (A3 )
0.03 0.5
= 0.65
0.023
La solucion se puede dar de nuevo por interpretacion del diagrama de
arbol anterior. En efecto, sabamos que P (D) = 0.023.
Ademas P (A1 D) = P (D/A1 ) P (A1 ) = 0.03 0.5 = 0.015 segun el
diagrama. As pues
P (A1 D) P (D/A1 ) P (A1 ) 0.5 0.03
P (A1 /D) = = = 0.65
P (D) P (D) 0.023

3.2.7 Nota
En una version mas simple el Teorema de Bayes expresa P (A/B) en
funcion de P (A), P (B) y P (B/A); en efecto, de (3.7) se tiene
P (A)
P (A/B) = P (B/A)
P (B)
suponiendo P (B) > 0.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
102 Probabilidad

3.2.8 Probabilidad geometrica


Imaginemos dos dominios S y T del plano con areas a(S) y a(T ), res-
pectivamente, siendo S T . Entonces la probabilidad de que un punto de T
se encuentre en S viene dada por

a(S)
a(T )

Al anterior tipo de probabilidad se le llama geometrica y se extiende


de manera natural a cualquier dominio de Rn (n = 1, 2, 3) en el que tenga
sentido hablar de longitud, area o volumen.

3.2.9 Ejemplo
Se divide el intervalo [0, 15] en 5 intervalos disjuntos consecutivos que
denotaremos Ii (i = 1, . . . , 5), nombrados de izquierda a derecha, de manera
que cada intervalo mide una unidad mas que el que tiene a su izquierda.
Veamos la probabilidad P (I3 ) de que seleccionado un punto al azar, este se
encuentre en el intervalo central I3 .
Si x es la longitud del intervalo I1 (y por tanto su extremo derecho) se
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

tiene que x + (x + 1) + (x + 2) + (x + 3) + (x + 4) = 15. As pues, x = 1 y en


consecuencia los 3 primeros intervalos son I1 = [0, 1[, I2 = [1, 3[ e I3 = [3, 6[.
As pues,
longitud de I3 3 1
P (I3 ) = = =
longitud de [0,15] 15 5
La eleccion de los intervalos semiabiertos por la derecha se ha realizado
por coherencia pero ello es intrascendente porque la probabilidad de que el
punto seleccionado sea exactamente un punto determinado, por ejemplo 3, es
nula.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 103

3.3 Ejercicios resueltos


Sea (, A, P ) un espacio probabilstico en los siguientes 4 ejercicios.

R3.1 Demuestrese que P () = 0 y que P (S) + P (S) = 1


Solucion:
P () = P ( ) = P () + P (), por ser conjuntos disjuntos.
En consecuencia, P () = 0.
Por otra parte, como S y S son disjuntos, se tiene que

P () = P (S S) = P (S) + P (S) = 1

R3.2 Demuestrese que si A1 , A2 , . . . , An son sucesos disjuntos dos a dos, en-


tonces

P (A1 A2 An ) = P (A1 ) + P (A2 ) + P (An )

Solucion:
Por el axioma (2) del apartado 3.1.6, la igualdad es cierta para n = 2.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Supongamos pues que la expresion del enunciado es cierta para n, y sean


A1 , A2 , . . . , An+1 sucesos disjuntos dos a dos. Se tiene entonces que

P (A1 A2 An+1 ) = P ((A1 A2 An ) An+1 ) =


= P (A1 A2 An ) + P (An+1 )
= P (A1 ) + + P (An ) + P (An+1 )

por aplicacion de la hipotesis de induccion, con lo que el enunciado


queda probado.

R3.3 Demuestrese que si A B entonces P (B A) = P (B) P (A)


Solucion:

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
104 Probabilidad

Como A B, entonces A y B A son disjuntos, por lo que se tiene

P (B) = P (A (B A)) = P (A) + P (B A)

de lo que se desprende el resultado.

R3.4 Demuestrese que para dos sucesos cualesquiera A y B se verica que

P (A B) = P (A) + P (B) P (A B)

Solucion:

El conjunto A B se puede escribir como union de conjuntos disjuntos


dos a dos en la forma
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

A B = (A (A B)) (B (A B)) (A B)

Entonces por el ejercicio R3.2 se tiene que

P (A B) = P (A (A B)) + P (B (A B)) + P (A B)

Finalmente por el ejercicio R3.3 se tiene:

P (A B) = P (A) P (A B) + P (B) P (A B) + P (A B) =
= P (A) + P (B) P (A B)
Nota 3.3.1. Dados los 3 conjuntos A1 , A2 , A3 , si designamos, para simplicar la
notacion, por Aij la interseccion Ai Aj para i, j = 1, 2, 3 con i = j, y A123 =
A1 A2 A3 , se puede demostrar que
P (A1 A2 A3 ) = P (A1 ) + P (A2 ) + P (A3 ) P (A12 ) P (A13 ) P (A23 ) + P (A123 )

La alternancia de signos a la derecha de la igualdad que acompana a los conjuntos,


de la anterior expresion, se perpetua para 4 o mas conjuntos, de manera que con
notacion similar, para cuatro conjuntos Ai se tendra
4
  
P (A1 A2 A3 A4 ) = P (Ai ) P (Aij ) + P (Aijk ) P (A1234 )
i=1 i=j i=j=k
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 105

y de manera general:
n
 n 
P Ai = P (Ai ) P (Aij ) + + (1)n+1 P (A1n )
i=1 i=1 i=j

R3.5 Hallar la probabilidad de obtener al menos una cara al lanzar 3 monedas.


Solucion:
Si designamos por S al suceso obtener al menos una cara, entonces
S es el suceso obtener tres cruces, y por la propiedad c2) de 3.1.9 se
tiene:

 3
1 1 7
P (al menos una cara) = 1 P (tres cruces) = 1 =1 =
2 8 8

R3.6 J y P participan junto a otros cuatro nadadores mas en una nal de


natacion donde se disputan las tres medallas. Cual es la probabilidad
de que

(a) J consiga la medalla de oro.


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

(b) J consiga la medalla de oro y P obtenga la de plata o la de bronce.


(c) J consiga una medalla.
(d) J y P consigan medalla.
(e) J no consiga una medalla.
(f) Ni J ni P consigan medalla.
(g) Al menos un de los dos (en referencia a J y P) consiga medalla.

Solucion:
Los apartados (a)-(d) se resolveran de dos formas distintas.

(a) (a1) Si J ocupa la posicion que indica el siguiente esquema

el numero de casos favorables es P5 = 5! y el de casos posibles es


5! 1
P6 = 6!. As, la probabilidad pedida resulta = .
6! 6
(a2) Puesto que J puede quedar en una de las 6 posiciones, la
1
probabilidad pedida es .
6
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
106 Probabilidad

(b) (b1) Las posiciones favorables para J y P vienen dadas en el si-


guiente esquema
JP
J P
Ahora los casos favorables son P4 + P4 = 2 4!. As, la probabilidad
2 4! 1
pedida resulta = .
6! 15
(b2) Por (a) la probabilidad de que J consiga la medalla de oro es
1
, y entonces P tiene dos opciones entre 5 de conseguir la segunda
6
2
o tercera posicion. Por tanto es probabilidad es , y as por el
5
Teorema de la probabilidad compuesta, la probabilidad pedidad
1 2 1
resulta = .
6 5 15
(c) (c1) Las posiciones favorables para J vienen dadas por el siguiente
esquema
J
J
J
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

As, los casos favorables son P5 + P5 + P5 = 3 5!, y la probabilidad


3 5! 1
pedida es = .
6! 2
(c2) Puesto que que J tiene las mismas opciones de obtener medalla
1
que de no obtenerla (3 en cada caso), la probabilidad pedida es .
2
(d) (d1) Las posiciones favorables para J y P vienen dadas por el si-
guiente esquema
JP
J P
JP
PJ
P J
P J

As, los casos favorables son 6 P4 = 6 4!, y en consecuencia la


6 4! 1
probabilidad pedida es = .
6! 5
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 107

(Nota: Para realizar razonamientos en otros casos similares notese


que 6 es la cantidad de formas en que 2 letras pueden ocupar 3
posiciones, que se corresponde con V32 = 3 2).
3
(d2) La probabilidad de que J consiga medalla es , y en este
6
caso, puesto que hay una medalla y una posicion ocupadas, la
2
probabilidad de que P consiga medalla es , y por el Teorema de
5
3 2
probabilidad compuesta, la probabilidad pedida es .
6 5
1
(e) Por el apartado (c), la probabilidad pedida es .
2
(f) Puesto que J y P tienen las mismas opiciones de conseguir medalla
que de no conseguirla, la probabilidad pedida (al igual que en el
1
apartado (d)) es . (Observese que este suceso no es el contrario
5
del apartado (d)).
(g) Este suceso es el contrario del apartado (f) y por tanto la proba-
1 4
bilidad pedida resulta 1 = .
5 5
R3.7 Una tienda de electronica tiene 15 chips en stock de los cuales 5 son
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

defectuosos. El dependiente saca 8 chips y un cliente se lleva 5 de esos


8. Que probabilidad hay de que al cliente le hayan vendido los 5 chips
en buen estado?
Solucion:
Con el proposito de facilitar la escenicacion del problema supongamos
que los 10 chips en buen estado se corresponden con 10 consonantes
distintas y los 5 en mal estado con las 5 vocales. En este supuesto el
problema admite la siguiente representacion.
El numero posible de elecciones del dependiente es
 
8 15
C15 = = 6435
8

El cliente se lleva 5 chips en buen estado si se da alguno de los 4


supuestos excluyentes siguientes:

(a) Los 8 sacados por el dependiente estan en buen estado, i.e. eran
consonantes. El numero de casos en este supuesto es
 
8 10
C10 = = 45
8
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
108 Probabilidad

(b) Solo 7 eran consonantes y el otro era vocal. Ahora el numero de


casos es  
7 10
5 C10 = 5 = 600
7
(c) Solo 6 eran consonantes y los otros dos vocales. Ahora el numero
de casos es    
2 6 5 10
C5 C10 = = 2100
2 6
(d) Solo 5 eran consonantes y los otros 3 vocales. Ahora el numero de
casos es    
3 5 5 10
C5 C10 = = 2520
3 5
As el numero de casos en que el cliente se lleva los 5 chips en buen
estado es 45 + 600 + 2100 + 2520 = 5265, y en consecuencia la
5265
probabilidad pedida es 0.82
6435
R3.8 En un programa informatico pueden detectarse hasta 12 tipos de errores
(con igual probabilidad) que nombramos a, b, c, . . . , l. En un momento
determinado el programa detecta 5 errores. Hallese la probabilidad de
que al menos dos sean del mismo tipo.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Solucion:
El suceso S contrario del solicitado lo constituye el hecho de que los
5 errores sean de 5 tipos distintos y su numero de casos favorables es
5 = 12 11 10 9 8.
V12
Por otra parte, el numero de casos posibles a considerar son todas la
quintuplas donde cada componente es una letra cualquiera de la a hasta
5 = 125 . Por tanto
la l, y este numero es RV12
12 11 10 9 8 55
P (S) = 5
=
12 144
En consecuencia la probabilidad pedida es
55
P (S) = 1 P (S) = 1 0.62
144
R3.9 El siguiente circuito trabaja (la bombilla se enciende) si y solo si, existe
una trayectoria de tres dispositivos en funcionamiento de izquierda a
derecha. En el dibujo se indica la probabilidad de que cada dispositivo
funcione. Supongase que la probabilidad de que un dispositivo funcione
no depende del funcionamiento de los demas dispositivos. Cual es la
probabilidad de que el circuito trabaje?
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
Ejercicios resueltos 109

Solucion:

Sea A el suceso la trayectoria superior esta en funcionamiento y sea B


el suceso la trayectoria inferior esta en funcionamiento. Dado que los
dispositivos son independientes se tiene que P (A) = 0.90.90.9 = 0.729
y P (B) = 0.95 0.9 0.9 = 0.7695. Ademas

P (A B) = P (A) P (B) = 0.729 0.7695 = 0.5610


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

dado que la trayectoria superior es independiente de la inferior.

Finalmente, para que el circuito trabaje se ha de dar A o B por lo que


la probabilidad buscada sera

P (A B) = P (A) + P (B) P (A B) =
= 0.729 + 0.7695 0.5610 = 0.9375

R3.10 Un grupo de 4n alumnos esta formado por igual numero de chicas que
de chicos. Se escoge una chica para que elija, al azar, un grupo de n
alumnos de los restantes 4n 1. Si los alumnos elegidos tienen el mismo
sexo, cual es la probabilidad de que todos sean chicos?

Solucion:

El problema puede resolverse de forma directa, sin utilizar probabilidad


condicionada, utilizando la denicion clasica de probabilidad mediante
el cociente de los casos favorables y los casos posibles:
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.
110 Probabilidad


2n
n 1
P (V /M S) = = =
2n 2n 1 2n 1
+
n n n
1+
2n
n
1 1 1 2
= = n = =
(2n 1)! 1+ 1 3
2n 1+
n!(n 1)! 2
1+
(2n)!
n! n!

(La resolucion por probabilidad condicionada es mas laboriosa y se deja


para el lector).

R3.11 Se dispone de una baraja de cartas espanola y una modeda. Hallese la


probabilidad de sacar:

(a) un rey de la baraja


(b) cara (c) en la moneda
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

(c) sacar un rey sabiendo que en la moneda ha salido:


(1) cara (c)
(2) cruz (+)
(d) un rey en la baraja y cara en la moneda

Solucion:

(a) Designemos por A el suceso sacar un rey en la baraja. Obviamente


4 1
P (A) = = .
40 10
Si consideramos los experimentos aleatorios extraccion de carta y
lanzamiento de moneda de manera conjunta, se obtiene el espacio
de 80 sucesos elementales que lo forman los 40 sucesos de la
forma (carta, c) y los 40 de la forma (carta, +). En este contexto,
acorde con la Nota 3.1.17 el anterior conjunto A es el conjunto

{(Ro, c), (Ro, +), (Rc, c), (Rc, +), (Re, c), (Re, +), (Rb, c), (Rb, +)}

donde Ro, Rc, Re, Rb designan rey de oros, copas, espadas y


8 1
bastos, respectivamente. En consecuencia P (A) = = , que
80 10
coincide con el resultado anterior.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:56:27.

You might also like