You are on page 1of 4

Postgrado de Modelado y Simulacin de Sistemas

Estadstica y Simulacin

Prctica: Distribucin de la Media y Varianza Muestral


Introduccin
En esta sesin haremos varios ejercicios para ilustrar algunos de los conceptos vistos en la teora. Especficamente, trataremos de verificar, con ejercicios en R:

La convergencia de los valores muestrales a los poblacionales El teorema Central de Lmite Las diferencias entre la Distribucin Normal y la t-Student

Medias y Varianzas Muestrales y Poblacionales


Sea X una variable aleatoria uniforme discreta entre 1 y 6. Normalmente denotamos esto como X ~ U(1,6). X puede representar, por ejemplo, la probabilidad asociada a diferentes lanzamientos de un dado. La teora nos dice que la media poblacional de X es: 1 x (1/6) + 2 x(1/6) + ..... = 21/6 = 3.5 y la varianza es: E[X2] E[X]2 = (91/6) (21/6)2 = 2.9167. Podemos generar una muestra aleatoria de los valores de X usando el comando sample de S-plus: > x30<-sample(1:6,size=30,rep=T) > x30 [1] 3 1 2 2 6 3 5 3 4 3 4 4 2 5 1 5 3 1 1 4 3 5 2 1 1 6 4 4 6 1 El comando sample genera una muestra aleatoria de tamao 30 (size=30) con reemplazo (replace=T) de los nmeros contenidos en el vector especificado como su primer argumento (en este caso el vector de los nmeros del 1 al 6) Calculemos ahora la media y la varianza de estos datos: > mean(x30) [1] 3.166667 > var(x30) [1] 2.764368

Prctica: Distribucin de la Media Muestral

Postgrado de Modelado y Simulacin de Sistemas

Estadstica y Simulacin

Note que la media muestral (la de x30, 3.16) no es igual a la media poblacional (la de la variable aleatoria X, 3.5) y lo mismo sucede con la varianza. El vector x30 consiste de 30 observaciones de la variable aleatoria X. La poblacin consiste de las observaciones que se tendran si X se observara indefinidamente. La media de esta poblacin es la media de la variable aleatoria, esto es, 3.5. Un argumento similar se aplica a la varianza. Probablemente, los valores que usted obtendr al correr esto en el computador sean ligeramente diferentes. Esto se debe a que el R usa una semilla del generador de nmeros aleatorios diferente cada vez. Para controlar la semilla se puede usar el comando set.seed. Aunque los valores que usted obtenga sean diferentes, lo importante es que estos valores deben estar mas o menos cercanos a sus respectivos poblacionales. Por la misma razn, al repetir las lineas de cdigo anteriores se obtiene una muestra diferente de valores de X que no necesariamente produce las mismas estimaciones muestrales para la media y la varianza. > x30<-sample(1:6,size=30,rep=T) > mean(x30) [1] 3.566667 > var(x30) [1] 3.21954 Esto sucede porque algunas de las muestras caern cerca de la media poblacional mientras que otras se encontrarn alejadas de la misma. De hecho podemos repetir el clculo anterior sistemticamente varias veces y obtendremos cada vez medias y varianzas diferentes. Sin embargo, estas medias y varianzas tienen un patrn. La teora nos dice que si calculamos el promedio de muchas medias muestrales, estas convergern a la media poblacional ( E [ X ]= ) y que en promedio las varianzas 2 2 convergern a la varianza poblacional ( E [ s ]= ). Para ilustrar este resultado, considere las siguientes lneas de cdigo de R:
#Crea una matriz de 40 filas y 30 columnas inicializadas en 0 #Cada fila almacenar una muestra de la variable aleatoria muestras<-matrix(0,40,30) muestras #Inicializa un vector de las medias y varianzas de cada muestra en 0 medias<-rep(0,40)

Prctica: Distribucin de la Media Muestral

Postgrado de Modelado y Simulacin de Sistemas

Estadstica y Simulacin

varianzas<-rep(0,40) #Para asegurar obtener los mismos nmeros set.seed(1) #Calcula 40 muestras de 30 elementos cada una for (i in 1:40) {muestras[i,]<-sample(1:6,size=30,replace=T) medias[i]<-mean(muestras[i,]) varianzas[i]<-var(muestras[i,]) } summary(medias) summary(varianzas)

Responda las siguientes preguntas: 1. Cul es el valor promedio de las medias? Cul fue el valor mximo y mnimo obtenido? 2. Cul es el valor absoluto de la diferencia entre el promedio de las varianzas y la varianza poblacional? 3. Cul es el estimador de la varianza de X ? Cmo se compara este valor con los resultados esperados de acuerdo a la teora? Otra manera ligeramente diferente de visualizar la convergencia de la media muestral a la media poblacional a medida que aumenta el tamao de la muestra (un resultado formalmente establecido en lo que se conoce en estadstica como la ley de los Grandes Nmeros) se obtiene con el siguiente cdigo: Las siguientes lneas de cdigo generan muestras sucesivamente mayores de una distribucin normal de media 1 y desviacin estndar 0.01 (esto se hace mediante la instruccin rnorm(n,1,0.01), donde n es el tamao de la muestra) y luego grafica las medias de estas muestras versus el tamao de la muestra.
medias<-rep(0,500) tam<-rep(0,500) x<-3 for (i in 1:500) { medias[i]<-mean(rnorm(x,1,0.01)) tam[i]<-x x<-x+1 }

Prctica: Distribucin de la Media Muestral

Postgrado de Modelado y Simulacin de Sistemas

Estadstica y Simulacin

plot(tam,medias,type="l")

1. Asegrese de entender lo que este grfico esta mostrando. Describa sus observaciones. 2. Realice un experimento similar al realizado con la distribucin normal para ilustrar la convergencia de la media muestral a la poblacional con la distribucin exponencial. Describa sus resultados.

Teorema Central del Lmite


En la seccin 5.3 del libro de Verzani (pgina 160) y en la seccin 6.3 (pgina 168) se muestran ejemplos que ilustran el teorema central del lmite. Estudie y reproduzca estos resultados. 1. Escriba el cdigo necesario para generar el grfico 5.9. Discuta sus resultados.

Distribucin Normal y la t-Student


1. Realice un grfico que muestre una curva t con 5 grados de libertad, una curva t con 15 grados de libertad y una normal estndar. Discuta sus observaciones.

Para la tarea, responda todas las preguntas y ejercicios planteados en las diferentes secciones. Fecha de Entrega: Mrcoles 23 de Enero

Prctica: Distribucin de la Media Muestral

You might also like