Professional Documents
Culture Documents
on a la Estadstica
Bayesiana
Introducci
on
En general, se usan probabilidades de modo informal para expresar la informacion o la incertidumbre
que se tiene acerca de observaciones de cantidades desconocidas. Sin embargo, el uso de probabilidades para expresar la informacion se puede hacer de modo formal. Desde el punto de vista matematico
se puede demostrar que con el Calculo de Probabilidades se puede representar de modo numerico el
conjunto de racional de creencias, de modo que existe una relacion entre probabilidad y e informacion
y la regla de Bayes proporciona un modo natural de actualizacion de las creencias cuando aparece
nueva informacion. Este proceso de aprendizaje inductivo por medio de la regla de Bayes es la base
de la Inferencia Bayesiana.
De manera general, los metodos bayesianos son metodos de analisis de datos que se derivan de
los principios de la inferencia bayesiana. Estos metodos, proporcionan
Estimadores de los parametros que tienen buenas propiedades estadsticas;
Una descripcion parsimoniosa (simple) de los datos observados;
Estimacion de los datos missing y predicciones de futuras observaciones;
Una metodologa computacional potente para la estimacion, seleccion y validacion de modelos.
Definiciones y Teoremas B
asicos
El concepto basico en estadstica bayesiana es el de probabilidad condicional :
Para dos sucesos A y B,
P (A|B) =
P (A B)
P (A B)
P (B)
P (A) =
k
X
P (A|Bi )P (Bi )
i=1
f (x|Y = y)P (Y = y)
o a variables continuas:
Z
f (x) =
Ejemplo:
En una fabrica de galletas se embalan en 4 cadenas de montaje; A1 , A2 , A3 y A4 . El 35% de la
produccion total se embala en la cadena A1 y el 20%, 24% y 21% en A2 , A3 y A4 respectivamente.
Los datos indican que no se embalan correctamente un porcentaje peque
no de las cajas; el 1% de
A1 , el 3% de A2 , el 2.5% de A3 y el 2% de A4 . Cual es la probabilidad de que una caja elegida al
azar de la produccion total sea defectuosa?
Defino como D = defectuosa.
Luego,
P (D) =
4
X
P (D|Ai )P (Ai ) =
i=1
= 0.0197
Ejemplo:
Supongamos que X|Y Pois(Y ), una distribucion Poisson, para x = 0, 1, 2, para y > 0, donde
Y Exp(), una distribucion exponencial
P (x|y) =
y x y
e
x!
f (y) = exp(y)
Entonces, la distribucion marginal de X es
P (x) =
P (x|y)f (y) dy
y x y
e exp [y] dy
x!
=
x!
=
x!
Z
=
0
y x exp [( + 1)y] dy
Para resolver la integral, se observa que el integrando esta relacionado con una distribucion gamma
Ga(x + 1, + 1) :
NOTA:
Si X Ga(a, b) su funcion de densidad es
f (x; a, b) =
de este modo
Z
0
ba a1
x exp[bx],
(a)
ba a1
x exp[bx]dx = 1 =
(a)
3
Z
0
xa1 exp[bx]dx =
(a)
ba
Luego
P (x) =
(x + 1)
x! ( + 1)(x+1)
x!
x! ( + 1)(x+1)
( + 1)(x+1)
p
,
1p
para x = 0, 1, 2, . . .
Se observa que es una distribucion geom
etrica con parametro p.
Ejemplo:
Si X| Exp() y Ga(, ), la distribucion marginal es
Z
1
ex
e
d
f (x) =
()
0
=
()
=
()
e(+x) d
(+1)1 e(+x) d
( + 1)
()
=
+1
() ( + x)
() ( + x)+1
,
( + x)+1
http://en.wikipedia.org/wiki/Pareto_distribution
dx
pY (y) = pX (x)
dy
donde x = g 1 (y).
Ver demostracion, e.g,. en
http://www.stat.duke.edu/~michael/screen.pdf
El teorema de Bayes
Se tiene que, para los sucesos A1 , . . . , An y B,
P (Ai |B) =
P (B|Ai )P (Ai )
P (B|Ai )P (Ai )
= P
P (B|Ai )P (Ai )
n
P (B)
P (B|Ai )P (Ai )
i=1
Ejemplo:
Volviendo al ejemplo de las galletas, supongamos que descubrimos que una caja es defectuosa.
Queremos calcular la probabilidad de que la caja proceda de A1 .
P (A1 |D) =
P (D|A1 )P (A1 )
0.01 0.35
=
0.18
P (D)
0.0197
Ejemplo:
Supongamos un juego televisivo en el que tienes que elegir entre tres puertas cerradas, A, B o C.
Detras de dos de las puertas hay una peineta y en la otra hay un coche, con igual probabilidad en
los tres casos. Por tanto, la probabilidad de ganar el coche en cada una de las puertas es
p(A) = 31 , p(B) = 13 , p(C) = 31 .
Despues de que hayas elegido una puerta, digamos A, antes de mostrarte lo que hay detras de la
puerta, el presentador (Risto Mejide) abre otra puerta, digamos B, que tiene una peineta. En este
punto te ofrece la opcion de cambiar de la puerta A a la puerta C. Que deberas hacer?
Intuitivamente parece que t
u has elegido la puerta adecuada, pero que Risto Mejide te quiere
liar... as, desde un punto de vista inocente la probabilidad de encontrar el coche entre las dos
puertas que quedan es 21 . Pero esto es falso...
Asumimos que Risto Mejide va en tu contra (cobra de la productora de television) y calculamos
cual es la probabilidad de que el coche aparezca cuando el abre la puerta B, una vez que t
u hayas
abierto la puerta A:
(i ) La probabilidad de que Risto Mejide abra la puerta B dado que el coche esta detras de la
puerta A es
p (BRM |A) =
1
2
1 1
1
=
2 3
6
1
=0
3
1
1
=
3
3
Por otro lado, dado que los sucesos son mutuamente excluyentes, por la ley de probabilidad total
p(BRM ) = p (BRM , A) + p (BRM , B) + p (BRM , C) =
1
1
1
+0+ =
6
3
2
1
2
1
3
1
2
1
3
1 13
p (BRM |C) p (C)
2
p (C|BRM ) =
= 1 =
p(BRM )
3
2
Luego es mucho mejor que elijas la puerta C .
Se puede aplicar el teorema de Bayes a variables discretas y continuas. En el caso de que la v.a.
X sea continua se tiene
f (x|y) =
f (y|x)f (x)
f (y|x)f (x)
,
=R
f (y)
f (y|x)f (x)dx
R
P (x|y)f (y)
P (x)
y x ey
ey
x!
(+1)x+1
( + 1)x+1 x (+1)y
y e
x!
f (|x) f (x|)f ()
ex
1
e
()
(+1)1 e(+x)
que esta relacionado con una distribucion gamma, es decir, |x Ga( + 1, + x).
g(x)f (x) dx
Ex (X|y)f (y) dy
Z Z
xf (x|y)dx f (y) dy
Z
Z
=
f (x|y)f (y)dy
Z
Z
=
f (x, y)dy
dx
Z
=
xf (x) dx = Ex [X]
8
dx
(ii ) La demostracion, que es mas larga, se puede ver, por ejemplo, en el libro de Lee (2012).
Ejemplo:
Volviendo al ejemplo de la Poisson, se tena que Y Exp() y X|Y Pois(Y ).Supongamos
que queremos calcular la media y varianza de X (y que no sabemos nada acerca de la distribucion
marginal de X que sabamos de antes que sigue una distribucion geometrica).
la media de la exponencial
Sustituyendo p =
1+
1
1
+ 2
+1
2
y despejando =
p
,
1p
E[X] =
se obtiene que
1p
q
=
p
p
1p
V ar[X] =
+
p
=
1p
p
2
q
1p
= 2,
2
p
p
que son los momentos que se obtienen directamente para la distribucion geometrica en la notacion
habitual.
Ejemplo:
Retomando el ejemplo de la distribucion de Pareto, donde X| Exp() y Ga(, ), se tiene
que
E[X] = E [Ex [X|]] = E [1/]
Z
1 1
=
e
d
()
0
=
()
(1)1 e d
El integrando es el n
ucleo de una distribucion gamma; Ga( 1, ). Entonces,
E[X] =
( 1)
,
=
() 1
1
E[X] = E[Z]
.
1
10
[para > 1]