You are on page 1of 7

Inferencia estadstica

Tarea 4
Juan Manuel Caldera Beltran
1. Sea X una variable aleatoria con distribucion Poisson con parametro ,
con E[X] = y V [X] = . Sea (x1 , x2 , . . . , xn ) una muestra aleatoria de
tama
no n de esta variable.
a) Obtener la funci
on de verosimilitud correspondiente.

L(|X) =
=

n
Y

P (xi |)

i=1
n
Y

e xi
xi !
i=1
Pn

xi

i=1 xi !
Pn

xi

en
= Qn
e

i=1

i=1

,
Pn

sin perder algo relevante podemos suponer que L(|X) = en

i=1

xi

b) Deducir el emv de .
Tomando logaritmo natural a ambos lados de la igualdad L(|X) =
en x1 +x2 +...+xn , obtenemos
log L(|X) = n + log()

n
X

xi ,

i=1

derivado respecto a e igualando a 0, tenemos


d
x1 + x2 + . . . + xn
(log L(|X)) = n +
= 0,
d

= 1 Pn xi .
obteniendo as
i=1
n
c) Demostrar que dicho estimador es insesgado.

Como
" n
#
h i
X
1
=E
E
xi
n i=1
n

1X
E[xi ]
n i=1

1X

n i=1

1
(n)
n
=
=

es insesgado.

d) Obtener la varianza del emv.

h i
=V
V

"

1X
xi
n i=1

n
1 X
V [xi ]
n2 i=1

n
1 X

n2 i=1

11. En una f
abrica de muebles se inspecciona meticulosamente el acabado de
las mesas cuando salen del departamento de laca. La cantidad de defectos
que son encontrados en cada mesa son registrados con el fin de conocer y
mejorar el proceso. Es razonable suponer una distribucion Poisson para el
n
umero de defectos por mesa. En la inspeccion de 15 mesas se obtuvieron
los siguientes defectos: 7, 5, 10, 2, 6, 5, 4, 9, 7, 5, 6, 7, 8, 4, 5.
a) Obtener el valor especfico de emv y la raz cuadrada de su varianza.
= 1 Pn xi , por lo tanto en
Del ejercicio anterior sabemos que
i=1
n
r h i q
90

=
=
este caso
= 6. Tambien V
15

b) Explique la relaci
on de los valores anteriores con la grafica de la funcion
de verosimilitud para .
= 6 es que el maximo de la grafica o mejor dicho
Lo que indica
el valor m
aximo de la funcion de verosimilitud se alcanza en = 6.
2

r h i q
= en la grafica de la funcion
Por otro lado, lo que indica V
n
de verosimilitud es la amplitud de esta, es decir es una medida de la
dispersi
on que hay en los valores mas verosmiles de . Notese que entre
m
as numerosa sea la muestra menor dispersion habra.
9. Para determinar la incidencia de cierta patogeno en cierta region costera
se hacen determinaciones en seis zonas localizadas en dicha region. Para
ello se toman muestras de agua y se analiza si el organismo esta presente
o no. Los resultados son los siguientes:
Zona
Muestras obtenidas ni
Muestras positivas xi

1
60
3

2
65
4

3
75
5

4
55
1

5
50
2

6
60
3

a) Suponer un modelo Binomial y obtener la forma analtica de la verosimilitud y la gr


afica de la funcion de verosimilitud relativa.

L(p|X) =

6
Y

P (xi |p)

i=1

6  
Y
ni
i=1
P6

18
365

i=1

xi

pxi (1 p)ni xi

(1 p)

P6

i=1

ni xi

= p18 (1 p)347
18  365(1p) 347
.
= 0.04931, R(p|X) = 365p
18
347

0.4
0.0

R(p|x)

0.8

p =

xi

0.03

0.04

0.05

0.06

0.07

p
Verosimilitud relativa con n=365 y x=18

0.08

b) Calcular un intervalo de verosimilitud al c = 0.15, e interpretar.


Intervalo de verosimilitud al c = 0.15: [0.03029,0.07456]. Esto indica
que los valores m
as verosmiles de p se encuentran entre 0.03029 y
0.07556, es decir los valores de p mas plausibles para obtener lo observado.
c) Que nivel de incidencia tiene el patogeno?
El pat
ogeno tiene un nivel de incidencia de entre el 3 % y 7.4 %.
10. En Sprott (2000) se reportan los resultados de un ensayo clnico para
investigar la efectividad de cierto medicamento (ramipril) para ayudar a
la sobrevivencia despues de un infarto agudo al miocardio. El estudio se
hizo con 1986 sujetos. De estos se selecciono aleatoriamente a 1004 y se les
dio el medicamento, mientras que a los restantes 982 se les administro un
placebo (grupo control). Los datos obtenidos se muestran en la siguiente
tabla de contingencia.
Tratamiento
Ramipril
Placebo
Total

Sobrevivio
834
760
1594

Fallecio
170
222
392

Total
1004
982
1986

Suponer un modelo binomial y obtener la verosimilitud relativa para cada


tratamiento, y con base en ella decidir si el ramipril tiene alg
un impacto
positivo.

170
L1 (p1 |X) = p834
1 (1 p1 )

L2 (p2 |X) =
pb1 =

834
1004

= 0.83067, pb2 =

760
982

p760
2 (1

222

p2 )

Ramipril
Placebo

= 0.77393.

834 
170
1004p1
1004(1 p1 )
834
170

760 
222
982p2
982(1 p2 )
R2 (p2 |X) =
760
222


R1 (p1 |X) =

0.4
0.0

R(p|x)

0.8

Grficas de R1 (en rojo) y R2 (en azul)

0.74

0.76

0.78

0.80

0.82

0.84

0.86

Un intervalo de verosimilitud a c = 0.15 para p1 es [0.80682, 0.85290] y


para p2 es [0.74724, 0.79922]. Como puede observarse en la grafica y en
los intervalos de verosimilitud el ramipril s tiene un impacto significativo
positivo en los pacientes.
12. El siguiente modelo fue propuesto para representar la distribucion del
n
umero de hijos por pareja de leones en los zoologicos de Mexico: X =
n
umero de hijos en la familia

x
x>0
f (x) = P (X = x) =
12
x=0
1
donde es un par
ametro desconocido tal que 0 < < 21 . Un total de 50
parejas fueron seleccionadas al azar de la poblacion, y se observaron los
datos que se muestran en la siguiente tabla:
N
umero de hijos
Frecuencia observada (parejas)

0
17

1
22

2
7

3
3

4
1

a) Verificar que la distribucion propuesta es una funcion de probabilidad.


Veamos que 0 P (X = x) 1 para todo x Z+ {0}. Para

x = 0: como 0 < < 21 y P (X = 0) = 12


1 = 1 1 es claro
que 0 < P (X = 0) < 1. Para x > 0: tenemos que 0 < x < 21
siempre que x 1 por lo tanto 0 < P (X = x) < 1 para x > 0.

Ahora veamos que

f (x) = 1.

x=0

f (x) =

x=0

1 2 X
+
f (x)
1
x=1
n
X
1 2
f (x)
+ lm
n
1
x=1

1 2
1
+
1
1
1
=1
=

0.4
0.0

R(|x)

0.8

As que f es, efectivamente, una funcion de probabilidad.


b) Obtener la gr
afica de la verosimilitud relativa.

0.32

0.34

0.36

0.38

0.40

0.42

0.44

0.46

c) Encuentra el emv para .

1 2
1

17

1 2
1

17

L(|X) =
=

22 2

7

3

49 ,

tomando logaritmo natural a ambos lados de la igualdad anterior obtenemos


log L(|X) = 17 (log(1 2) log(1 )) + 49 log
derivando respecto a e igualando a 0, tenemos
d
34
17
49
log L(|X) =
+
+
= 0,
d
1 2 1

obteniendo as = 0.389381
d) Suponer al emv como el valor verdadero de , y calcular las frecuencias
que se esperaran en el estudio. Este modelo da una aproximacion razonable de los datos?
Supongamos que = = 0.389381, entonces las frecuencias que se
esperaran son

0 hijos :

50P (X = 0) = 50 0.3623 = 18.1158

1 hijo :

50P (X = 1) = 50 0.3893 = 19.4689

2 hijos :

50P (X = 2) = 50 0.1516 = 7.5808

3 hijos :

50P (X = 3) = 50 0.0590 = 2.9518

4 hijos :

50P (X = 4) = 50 0.0229 = 1.1493,

en general puede decirse que el modelo se ajusta bastante bien a los


datos observados, claro que no todo es perfeccion como es el caso en el
que solo hay un hijo en la familia.
e) Un estudio m
as grande realizado hace 20 a
nos indico que = 0.45. Es
esto admisible con los datos obtenidos?
Un intervalo de verosimilitud para , a c = 0.15, es [ 0.336865, 0.431467],
como = 0.45 no esta dentro del intervalo, este valor no va muy acorde
con los datos obtenidos.

You might also like