Trabajo Final Estadistica

Teorema de Limite Central
1.-Definicion: El teorema central del lmite es uno de los resultados fundamentales de la estadstica. Este teorema nos dice que si una muestra es lo bastante grande (generalmente cuando el tamao muestral (n) supera los 30), sea cual sea la distribucin de la media muestral, seguir aproximadamente una distribucin
normal. Es decir, dada cualquier variable aleatoria, si extraemos muestras de tamao n (n>30) y calculamos los promedios muestrales, dichos promedios seguirn una distribucin normal. Adems, la media ser la misma que la de la
variable de inters, y la desviacin estndar de la media muestral ser aproximadamente el error estndar. La importancia del teorema central del lmite radica en que mediante un conjunto de teoremas, se desvela las razones por las cuales, en muchos campos de aplicacin, se encuentran en todo momento distribuciones normales o casi.
Contextualizando lo anterior tenemos: La distribucin de la media muestral de una poblacin normal es una distribucin normal con la misma media poblacional y con desviacin tpica el error estndar. Este hecho nos permite calcular probabilidades cuando tenemos una muestra de una variable con distribucin normal y desviacin tpica conocida. Cuando la muestra es lo bastante grande, la solucin nos viene dada por uno de los resultados fundamentales de la estadstica: el teorema del lmite central.
La frmula formal que se utiliza para resolver problemas de este tema es:
Es muy comn encontrar esta frmula con una variable estandarizada Zn en funcion a la m media muestral como se muestra en la imagen
Ahora tenemos la frmula de la siguiente manera:
Tambin podemos encontrar esta frmula en versiones no normalizadas:
Esas son las frmulas que manejan varios autores, pero nosotros usaremos 3 formulas diferentes para resolver el problema hacindolo lo mas fcilmente posible. Estas son las frmulas que usaremos:
2.-Introduccin al teorema central del lmite El teorema central del lmite (a partir de ahora, TCL) presenta un doble inters. Por un lado, proporciona a la estadstica un resultado crucial para abordar el estudio de la distribucin asinttica de muchos tipos de variables aleatorias. Adems, el TCL proporciona una explicacin terica fundamentada a un fenmeno habitual en experimentos reales: las variables estudiadas presentan muchas veces una distribucin emprica aproximadamente Normal.
El TCL forma parte de un conjunto de propiedades relativas a las convergencias de variables aleatorias. En este tema se estudia slo un tipo de convergencia, la convergencia en ley, ya que es necesaria para entender el enunciado del TCL. Se descarta, pues, en este documento el estudio de los otros tipos de convergencias (en probabilidad, casi segura, etc.) y el estudio de las leyes de los grandes nmeros. 2.1 Sumas de variables aleatorias El TCL estudia el comportamiento de las sumas de variables aleatorias. Formalmente, la suma de dos variables aleatorias corresponde a la siguiente aplicacin: si X1 y X2 son dos variables aleatorias definidas sobre , la suma es:
La suma de dos variables puede extenderse sin dificultad a sumas de tres, cuatro,... y, en general, n variables aleatorias. El TCL se ocupa de las sucesiones de variables aleatorias. En el contexto del TCL una sucesin corresponde a un conjunto donde el primer elemento es una variable aleatoria, el segundo elemento es la suma de dos variables aleatorias, el tercero es la suma de tres variables aleatorias, y as sucesivamente. Una sucesin es un conjunto de elementos infinitos, que se designan simblicamente mediante {Xn}.
Cada uno de los elementos de la sucesin (que es una variable aleatoria) lleva asociada una determinada funcin de distribucin: Xn Fn As pues, la sucesin de variables aleatorias lleva asociada una secuencia paralela de funciones de distribucin 2.2 Historia del Teorema de Limite Central El teorema de lmite central tiene una historia interesante. La primera versin de este teorema fue postulada por el matemtico Francs-llevado Abraham de Moivre, que, en un artculo notable publicado en 1733, utiliz la distribucin normal para aproximar la distribucin del nmero de cabezas resultando de muchas sacudidas de una moneda justa. Esto que encontraba era lejano delante de su tiempo, y fue olvidada casi hasta el matemtico francs famoso Pierre-Simon Laplace rescatado le de oscuridad en su trabajo monumental DES Probabilits de Thorie Analytique, que fue publicada en 1812. Laplace ampli a De Moivre que encontraba aproximando la distribucin binomial con la distribucin normal. Pero como con De Moivre, Laplace encontrando recibido poca atencin en su propio tiempo. No era hasta que el diecinueveavo siglo era en un extremo que la importancia del teorema de lmite central fue discernida, cuando, en 1901, el matemtico ruso Aleksandr Lyapunov definido le de modo general y probado exacto cmo trabaj matemticamente. Hoy en da, el teorema de lmite central se considera ser el soberano oficioso de la teora de las probabilidades.
La distribucin de la media muestral de una poblacin normal es una distribucin normal con la misma media poblacional y con desviacin tpica el error estndar. Este hecho nos permite calcular probabilidades cuando tenemos una muestra de una variable con distribucin normal y desviacin tpica conocida. Cuando no conocemos la desviacin tpica de la variable, tambin podemos hacer clculos con la distribucin t de Student. En esta sesin veremos cmo debemos proceder cuando no sabemos si la variable de inters sigue una distribucin normal o no, o cuando sabemos seguro que su distribucin no es normal. Cuando la muestra es lo bastante grande, la solucin nos viene dada por uno de los resultados fundamentales de la estadstica: el teorema del lmite central. Lo introduciremos con un caso particular: el estudio de la binomial. Aproximacin de la binomial a la normal Supongamos que jugamos diariamente a un nmero de una lotera que, entre otros premios, devuelve el importe jugado a todos los nmeros que acaban en la misma cifra que el nmero ganador. Consideremos la variable X(n), que no da el nmero de veces que nos han devuelto el importe jugado cuando se han realizado n sorteos. En este caso sabemos que la variable aleatoria X(n) sigue una distribucin binomial de parmetros n y p =0,1. En efecto, se han hecho n sorteos (es decir, se ha repetido un mismo experimento n veces de manera
independiente) y en cada sorteo la probabilidad de que nos devuelvan el dinero es p = 1/10 = 0,1 (probabilidad de xito). Sin embargo, observemos qu sucede al aumentar el valor de n con la funcin de densidad de probabilidad de la variable X(n). Si dibujamos esta funcin de densidad de probabilidad para n = 3, obtenemos el grfico siguiente:
Si ahora consideramos n = 10, los posibles valores van del 0 al 10, y el grfico de la funcin de densidad de probabilidad es:
Si tomamos n = 100, el grfico es:
Y si por ejemplo tomamos n = 500, el grfico de la funcin de probabilidad es:
Ejemplo Cul es la probabilidad aproximada de que en un ao nos hayan devuelto el dinero al menos cincuenta veces? De hecho, debemos calcular la probabilidad P(X(365) 50). Si quisiramos obtener el valor exacto de esta probabilidad, por el hecho de que X(365) es una binomial de parmetros 365 y p = 0,1, deberamos hacer el clculo siguiente:
10
Donde cada una de estas probabilidades se encontrara mediante la frmula de la binomial que ya conocemos, en nuestro caso:
En cambio, si renunciamos a pedir que la probabilidad sea exacta y nos conformamos con una muy buena aproximacin, podemos utilizar el hecho de que la distribucin de X(365) se puede aproximar por una normal de parmetros m = 365 0,1 = 36,5 y s2 = 365 0,09 = 32,85. As:
y si llamamos Z a una variable aleatoria normal (0,1), esta probabilidad ser aproximadamente:
11
3.- Distribucin Normal Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas.
Su propio nombre indica su extendida utilizacin, justificada por las frecuencia o normalidad con la que las ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin. Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene forma de campana. En resumen, la importancia de la distribucin normal se debe principalmente a que hay muchas variables asociadas a fenmenos naturales que siguen el modelo de la normal. - Caracteres morfolgicos de individuos (personas, animales, plantas,) de una especie. Por ejemplo: tallas, pesos, envergaduras, dimetros, permetros. - Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o de una misma cantidad de abono. - Caracteres sociolgicos, por ejemplo: consciente intelectual, grado de adaptacin a un medio. - Errores cometidos al medir ciertas magnitudes. - Valores estadsticos maestrales, por ejemplo: la media. - Otras distribuciones como la binomial o la Poisson son aproximaciones normales. Y en general cualquier caracterstica que se obtenga como suma de mucho factores.
12
3.1 Funcin De Densidad Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la funcin de densidad que corresponde a tales distribuciones viene dando por la frmula
Puede tomar cualquier valor (- ,+ ) Son ms probables los valores cercanos a uno central que llamados media, conforme nos separamos de ese valor , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simtrica). Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma ms o menos rpida dependiendo de un parmetro s , que es la desviacin tpica.
13
3.2.- Muestreo En estadstica, es el proceso por el cual se seleccionan los individuos que formarn una muestra. Para que se puedan obtener conclusiones fiables para la poblacin a partir de la muestra, es importante tanto su tamao como el modo en que han sido seleccionados los individuos que la componen. El tamao de la muestra depende de la precisin que se quiera conseguir en la estimacin que se realice a partir de ella. Para su determinacin se requieren tcnicas estadsticas superiores, pero resulta sorprendente cmo, con muestras notablemente pequeas, se pueden conseguir resultados suficientemente precisos. Para seleccionar los individuos de la muestra es fundamental proceder aleatoriamente, es decir, decidir al azar qu individuos de entre toda la poblacin forma parte de la muestra. Si se procede como si de un sorteo se tratara, eligiendo directamente de la poblacin sin ningn otro condicionante, el muestreo se llama aleatorio simple o irrestrictamente aleatorio. Cuando la poblacin se puede subdividir en clases (estratos) con caractersticas especiales, se puede mostrar de modo que el nmero de individuos de cada estrato en la muestra mantenga la proporcin que exista en la poblacin. Una vez fijado el nmero que corresponde a cada estrato, los individuos se designan aleatoriamente. Este tipo de muestreo se denomina aleatorio estratificado con asignacin proporcional.
Las inferencias realizadas mediante muestras seleccionadas aleatoriamente estn sujetas a errores, llamados errores de muestreo, que estn controlados. Si la muestra est mal elegida - no es significativa - se producen errores sistemticos no controlados.
14
3.2.1 Mtodos De Muestreo Los mtodos de muestreo probabilsticas son aqullos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas. Slo estos mtodos de muestreo probabilsticas nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo probabilsticas encontramos los siguientes tipos: - Muestreo aleatorio simple: El procedimiento es el siguiente: 1) se asigna un nmero a cada individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande. - Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios solo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestras son los que ocupan los lugares i ,i+k, i+2k, i+3k,,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. el nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k.
15
El riesgo de este tipo de muestreo est en los casos en que se dan periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los ltimos 5 son mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. - Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin. (tamao geogrfico, sexos, edades). - Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades maestrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales como, por ejemplo,
16
las urnas electorales. Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos. 4.- Error Muestral De estimacin o estndar. Es la diferencia entre un estadstico y su parmetro correspondiente. Es una medida de al variabilidad de las estimaciones de muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta dnde y con qu probabilidad una estimacin basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigacin nos indicar hasta qu medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varan muestra a muestra). Un estadstico ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la desviacin de la distribucin muestral de un estadstico y su fiabilidad. Cuando se utilizan valores muestrales, o estadsticos para estimar valores poblacionales, o parmetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral. El error muestral se refiere a la variacin natural existente entre muestras tomadas de la misma poblacin. Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran cuidado para asegurar que dos muestras del mismo tamao sean representativas de una
17
cierta poblacin, no esperaramos que las dos sean idnticas en todos sus detalles. El error muestral es un concepto importante que ayudar a entender mejor la naturaleza de la estadstica inferencial. Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se denominan errores no muestrales. El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parmetro real. El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin. La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico. Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple. Ejemplo Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para simular una poblacin "grande" de manera que el muestreo pueda realizarse un gran nmero de veces, supondremos que ste se hace con reemplazo, es decir, el nmero elegido
18
se reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccion primero 4 y despus 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamao 2 que es posible seleccionar con reemplazo y tambin contiene las medias muestrales y los correspondientes errores muestrales. La media poblacional es igual a = (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina. Ntese las interesantes relaciones siguientes contenidas en la tabla: La media de la coleccin de medias muestrales es 4, la media de la poblacin de la que se extraen las muestras. Si x denota la media de todas las medias muestrales entonces tenemos: x = (3+4+3+4+5+5+2+4+6)/9 = 4 La suma de los errores muestrales es cero. e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0
19
Muestras ordenadas
Error muestral e = x -
(2,2)
2 4 = -2
(2,4)
3 4 = -1
(2,6)
44=0
(4,2)
3 4 = -1
(4,4)
44=0
(4,6)
54=1
(6,2)
44=0
(6,4)
54=1
(6,6)
64=2
En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de todos los errores muestrales es cero.
20
5.- Distribuciones Muestrales Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas muestrales. Como el anlisis de las distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores posibles calculados a partir de muestras del mismo tamao. Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:
21
Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se calcula la desviacin estndar de cada una. La coleccin de todas estas desviaciones estndar muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la siguiente figura:
22
Ejemplo Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6. Encuentre: , la media poblacional. , la desviacin estndar poblacional. x, la media de la distribucin muestral de medias. , la desviacin estndar de la distribucin muestral de medias. Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias. Solucin: La media poblacional es:
23
La desviacin estndar de la poblacin es:
A continuacin se listan los elementos de la distribucin muestral de la media y la correspondiente distribucin de frecuencias.
La media de la distribucin muestral de medias es:
d) La desviacin estndar de la distribucin muestral de medias es:
24
De aqu que podamos deducir que: Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:
6.- Distribuciones muestrales Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles a stas su estadstico. Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias ser normal sin importar el tamao de la muestra.
25
Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser normal. Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma de la distribucin muestral de medias sea aproximadamente normal, an en casos donde la poblacin original es bimodal, es realmente notable.
26

Trabajo Final Estadistica

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Trabajo Final Estadistica

Uploaded by

Copyright:

Available Formats

Teorema de Limite Central

Ahora tenemos la frmula de la siguiente manera:

Tambin podemos encontrar esta frmula en versiones no normalizadas:

Si tomamos n = 100, el grfico es:

Y si por ejemplo tomamos n = 500, el grfico de la funcin de probabilidad es:

La desviacin estndar de la poblacin es:

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

You might also like