Professional Documents
Culture Documents
Estadstica y Simulacin
La convergencia de los valores muestrales a los poblacionales El teorema Central de Lmite Las diferencias entre la Distribucin Normal y la t-Student
Estadstica y Simulacin
Note que la media muestral (la de x30, 3.16) no es igual a la media poblacional (la de la variable aleatoria X, 3.5) y lo mismo sucede con la varianza. El vector x30 consiste de 30 observaciones de la variable aleatoria X. La poblacin consiste de las observaciones que se tendran si X se observara indefinidamente. La media de esta poblacin es la media de la variable aleatoria, esto es, 3.5. Un argumento similar se aplica a la varianza. Probablemente, los valores que usted obtendr al correr esto en el computador sean ligeramente diferentes. Esto se debe a que el R usa una semilla del generador de nmeros aleatorios diferente cada vez. Para controlar la semilla se puede usar el comando set.seed. Aunque los valores que usted obtenga sean diferentes, lo importante es que estos valores deben estar mas o menos cercanos a sus respectivos poblacionales. Por la misma razn, al repetir las lineas de cdigo anteriores se obtiene una muestra diferente de valores de X que no necesariamente produce las mismas estimaciones muestrales para la media y la varianza. > x30<-sample(1:6,size=30,rep=T) > mean(x30) [1] 3.566667 > var(x30) [1] 3.21954 Esto sucede porque algunas de las muestras caern cerca de la media poblacional mientras que otras se encontrarn alejadas de la misma. De hecho podemos repetir el clculo anterior sistemticamente varias veces y obtendremos cada vez medias y varianzas diferentes. Sin embargo, estas medias y varianzas tienen un patrn. La teora nos dice que si calculamos el promedio de muchas medias muestrales, estas convergern a la media poblacional ( E [ X ]= ) y que en promedio las varianzas 2 2 convergern a la varianza poblacional ( E [ s ]= ). Para ilustrar este resultado, considere las siguientes lneas de cdigo de R:
#Crea una matriz de 40 filas y 30 columnas inicializadas en 0 #Cada fila almacenar una muestra de la variable aleatoria muestras<-matrix(0,40,30) muestras #Inicializa un vector de las medias y varianzas de cada muestra en 0 medias<-rep(0,40)
Estadstica y Simulacin
varianzas<-rep(0,40) #Para asegurar obtener los mismos nmeros set.seed(1) #Calcula 40 muestras de 30 elementos cada una for (i in 1:40) {muestras[i,]<-sample(1:6,size=30,replace=T) medias[i]<-mean(muestras[i,]) varianzas[i]<-var(muestras[i,]) } summary(medias) summary(varianzas)
Responda las siguientes preguntas: 1. Cul es el valor promedio de las medias? Cul fue el valor mximo y mnimo obtenido? 2. Cul es el valor absoluto de la diferencia entre el promedio de las varianzas y la varianza poblacional? 3. Cul es el estimador de la varianza de X ? Cmo se compara este valor con los resultados esperados de acuerdo a la teora? Otra manera ligeramente diferente de visualizar la convergencia de la media muestral a la media poblacional a medida que aumenta el tamao de la muestra (un resultado formalmente establecido en lo que se conoce en estadstica como la ley de los Grandes Nmeros) se obtiene con el siguiente cdigo: Las siguientes lneas de cdigo generan muestras sucesivamente mayores de una distribucin normal de media 1 y desviacin estndar 0.01 (esto se hace mediante la instruccin rnorm(n,1,0.01), donde n es el tamao de la muestra) y luego grafica las medias de estas muestras versus el tamao de la muestra.
medias<-rep(0,500) tam<-rep(0,500) x<-3 for (i in 1:500) { medias[i]<-mean(rnorm(x,1,0.01)) tam[i]<-x x<-x+1 }
Estadstica y Simulacin
plot(tam,medias,type="l")
1. Asegrese de entender lo que este grfico esta mostrando. Describa sus observaciones. 2. Realice un experimento similar al realizado con la distribucin normal para ilustrar la convergencia de la media muestral a la poblacional con la distribucin exponencial. Describa sus resultados.
Para la tarea, responda todas las preguntas y ejercicios planteados en las diferentes secciones. Fecha de Entrega: Mrcoles 23 de Enero