Professional Documents
Culture Documents
,
segunda con media
.
' varian!a el estadstico
,
x
representa la media de una muestra
aleatoria de tama0o
,
n
seleccionada de la primera poblacin, ' que el estadstico
.
x
representa la media de una muestra aleatoria seleccionada de una segunda poblacin,
independiente de la muestra de la primera poblacin. 1 2u* puede decirse acerca de la
distribucin muestral de la diferencia
,
x
+
.
x
para muestras repetidas de tama0os
. ,
n y n
3 4e acuerdo al teorema del limite central, las variables
. ,
x y x
son
aproximadamente distribuidos en forma normal con medias
,
'
.
' variancias
.
.
.
,
.
,
n
y
n
respectivamente. Esta aproximacin me%ora conforme
. ,
n y n
se
incrementan.
(on lo anterior podemos concluir$
Si se sacan al a!ar muestras independientes de tama0o
. ,
n y n
de dos poblaciones
continuas, con medias
,
'
.
' varian!as
.
,
'
.
.
, respectivamente, entonces la
distribucin muestral de la diferencia de medias
. ,
x x
est distribuida
aproximadamente en forma normal con media ' varian!as$
. ,
. ,
=
x x
'
.
.
.
,
.
, .
. ,
n n
x x
+ =
4e aqu que,
.
.
.
,
.
,
. , . ,
) ( ) (
n n
X X
Z
+
=
es aproximadamente una variable normal estndar.
TEOREMA LIMITE CENTRAL
#l Lema e L&mite Ce$tral o Teorema Ce$tral el L&mite indica que, bajo
condiciones muy generales, la distribucin de la suma de variables aleatorias
tiende a una /istribucin +ormal &tambin llamada /istribucin 1aussiana'
cuando la cantidad de variables es muy grande.
Teorema2 -ea X
3
, X
4
, ..., X
n
una muestra aleatoria de una distribucin con
media ' y varianza (
)
. #ntonces, si $ es suficientemente grande, la variable
aleatoria
tiene aproximadamente una distribucin normal con y .
5ambin se cumple que si
tiene aproximadamente una distribucin normal con y .
,uanto ms grande sea el valor de $, mejor ser la aproximacin.
#l 5eorema del Lmite ,entral garantiza una distribucin normal cuando n es
suficientemente grande.
#xisten diferentes versiones del teorema, en funcin de las condiciones
utilizadas para asegurar la convergencia. Una de las ms simples establece
que es suficiente que las variables que se suman sean independientes,
idnticamente distribuidas, con valor esperado y varianza finitas.
La aproximacin entre las dos distribuciones es, en general, mayor en el centro
de las mismas que en sus extremos o colas, motivo por el que se prefiere el
nombre *5eorema del Lmite ,entral* &*central* califica al lmite, ms que al
teorema'.
#ste teorema, perteneciente a la 5eora de la $robabilidad, encuentra
aplicacin en muc%os campos relacionados, como la 6nferencia estadstica o la
5eora de renovacin.
Si se obtiene una muestra de una poblacin normal, entonces la media muestral tiene
una distribucin normal sin importar el tama0o de la muestra. Sin embargo, se puede
demostrar que de hecho no importa el modelo de probabilidad del cual se obtenga la
muestra5 mientras la media ' la varian!a existan, la distribucin de muestreo de 6 se
aproximar a una distribucin normal conforme n aumente. )o anterior constitu'e
uno de los ms importantes teoremas en inferencia estadstica ' se conoce como
5#70#89 /#L L6865# ,#+509L.
#n muc%os casos, puede concluirse en forma segura que la aproximacin
ser buena mientras n : ;<.
$ara mostrar la validez del teorema del limite central veamos el siguiente
ejemplo
-uponga que de una poblacin consistente en los valores <, 4, =, > y ?, se
toman muestras de tama"o 4 con remplazo.
@ (recuencia (recuencia 0elativa
< 3 3AB C .4
4 3 3AB C .4
= 3 3AB C .4
> 3 3AB C .4
? 3 3AB C .4
-olucin2
3.3. $aso
-e calcula la media poblacional, la varianza y desviacin estndar
poblacional.
N
X
n
i
C
7
8
.9
8
: ; 7 . 9
= =
+ + + +
=
n
i N
X
.
.
) (
:< . . :
:
8
79
8
) 7 : ( ) 7 ; ( ) 7 7 ( ) 7 . ( ) 7 9 (
. . . . .
.
= =
= =
+ + + +
=
4. $aso
1rfica de la distribucin de frecuencia para la poblacin
< 3 4 ; = B > D ?
<.3EB
<.4<<
<.4<B
=rfica de la &oblacin
6
>recuencia
?elativa
#sta grfica no puede considerarse acampanada o normal.
;. $aso
-e toman muestras de tama"o dos con remplazo.
8uestra
X
8uestra
X
8uestra
X
<, < < =, < 4 ?, < =
<, 4 3 =, 4 ; ?, 4 B
<, = 4 =, = = ?, = >
<, > ; =, > B ?, > D
<, ? = =, ? > ?, ? ?
4, < 3 >, < ;
4, 4 4 >, 4 =
4. = ; >, = B
4, > = >, > >
4, ? B >, ? D
=. $aso
-e agrupa a las medias mustrales en la tabla de frecuencia siguiente2
X
(
< 3
3 4
4 ;
; =
= B
B =
> ;
D 4
? 3
B. $aso
-e calcula la media poblacional de medias , la varianza de la medias y
desviacin estndar de las medias error estndar de las medias.
=
N
i
x
N
X f ) (
7
.8
,99
.8
) : ( , ) @ ( . ) ; ( < ) 8 ( 7 ) 7 ( 8 ) < ( 7 ) . ( < ) , ( . ) 9 ( ,
= =
+ + + + + + + +
=
x
=
N
i
x
x
N
X f
.
.
) (
. 7
7
.8
,99
.8
) 7 : ( , .. .......... ) 7 , ( . ) 7 9 ( ,
. . .
.
= =
= =
+ +
=
x
x
>. >. $aso
1rfica de la distribucin de frecuencia para la poblacin de medias
maestrales
< 3 4 ; = B > D ?
3
4
;
=
B
=rfica de la &oblacin
8edias muestrales
(recuencias
D. $aso
,onclusin
/e la apariencia acampanada de la distribucin de las medias, concluimos
que es razonable aproximar la distribucin muestral de
x
por una
distribucin normal, una vez que se conoce la media y la desviacin
estndar de la distribucin muestral.
DETERMINACION TAMA*O MUESTRA PO%LACION
#l tama"o de la muestra juega un papel importante para determinar la
probabilidad de error as como en la precisin de la estimacin. Una vez que se
%a seleccionado el nivel de confianza, dos factores importantes influyen en el
tama"o muestral2
3. 3. La varianza de la poblacin
.
Gale la pena recordar que H puede expresarse como
n
x
Z
=
#sto puede reescribirse algebraicamente como
.
. .
) (
=
x
Z
n
en donde la diferencia entre la media muestral y la media poblacional &
) x
es el error.
#l valor de H depende del nivel de confianza requerido. #sto deja por
determinar slo
.
Kes
desconocida. LMu sucede con la distribucin de esta estadstica si se
reemplaza por sN La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son KO y para :4,
respectivamente.
La siguiente figura presenta la grfica de varias distribuciones t. La apariencia
general de la distribucin t es similar a la de la distribucin normal estndar2
ambas son simtricas y unimodales, y el valor mximo de la ordenada se
alcanza en la media KOJ -in embargo, la distribucin t tiene colas ms amplias
que la normal. esto es, la probabilidad de las colas es mayor que en la
distribucin normal. 9 medida que el n!mero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.
Pro1ieaes e las istri2u#io$es t
3. ,ada curva t tiene forma de campana con centro en <.
4. ,ada curva t, est ms dispersa que la curva normal estndar z.
;. 9 medida que aumenta, la dispersin de la curva t correspondiente
disminuye.
=. 9 medida que , la secuencia de curvas t se aproxima a la curva
normal estndar, por lo que la curva z recibe a veces el nombre de curva
t con gl C
La distribucin de la variable aleatoria t est dada por2
#sta se conoce como la istri2u#i3$ t con grados de libertad.
-ean @
3
, @
4
, . . . , @
n
variables aleatorias independientes que son todas
normales con media y desviacin estndar . #ntonces la variable aleatoria
tiene una distribucin t con C nI3 grados de libertad.
La distribucin de probabilidad de t se public por primera vez en 3E<? en un
artculo de P. -. 1osset. #n esa poca, 1osset era empleado de una
cervecera irlandesa que desaprobaba la publicacin de investigaciones de sus
empleados. $ara evadir esta pro%ibicin, public su trabajo en secreto bajo el
nombre de *-tudent*. #n consecuencia, la distribucin t normalmente se llama
distribucin t de Student, o simplemente distribucin t. $ara derivar la ecuacin
de esta distribucin, 1osset supone que las muestras se seleccionan de una
poblacin normal. 9unque esto parecera una suposicin muy restrictiva, se
puede mostrar que las poblaciones no normales que poseen distribuciones en
forma casi de campana a!n proporcionan valores de t que se aproximan muy
de cerca a la distribucin t.
La distribucin t difiere de la de H en que la varianza de t depende del tama"o
de la muestra y siempre es mayor a uno. Unicamente cuando el tama"o de la
muestra tiende a infinito las dos distribuciones sern las mismas.
-e acostumbra representar con el valor t por arriba del cual se encuentra
un rea igual a . ,omo la distribucin t es simtrica alrededor de una media
de cero, tenemos . es decir, el valor t que deja un rea de
a la derec%a y por tanto un rea de a la izquierda, es igual al valor t
negativo que deja un rea de en la cola derec%a de la distribucin. #sto es,
t
<.EB
C It
<.<B
, t
<.EE
CIt
<.<3
, etc.
$ara encontrar los valores de t se utilizar la tabla de valores crticos de la
distribucin t del libro $robabilidad y #stadstica para 6ngenieros de los autores
Palpole, 8yers y 8yers.
#jemplo2
#l valor t con C 3= grados de libertad que deja un rea de <.<4B a la
izquierda, y por tanto un rea de <.EDB a la derec%a, es
t
<.EDB
CIt
<.<4B
C I4.3=B
-i se observa la tabla, el rea sombreada de la curva es de la cola derec%a, es
por esto que se tiene que %acer la resta de . La manera de encontrar el
valor de t es buscar el valor de en el primer rengln de la tabla y luego
buscar los grados de libertad en la primer columna y donde se intercepten y
se obtendr el valor de t.
#jemplo2
#ncuentre la probabilidad de Qt
<.<4B
R t R t
<.<B.
-olucin2
,omo t
<.<B
deja un rea de <.<B a la derec%a, y Qt
<.<4B
deja un rea de <.<4B a la
izquierda, encontramos un rea total de 3I<.<BI<.<4B C <.E4B.
$& Qt
<.<4B
R t R t
<.<B
' C <.E4B
#jemplo2
#ncuentre S tal que $&S R t R I3.D>3' C <.<=B, para una muestra aleatoria de
tama"o 3B que se selecciona de una distribucin normal.
-olucin2
-i se busca en la tabla el valor de t C3.D>3 con 3= grados de libertad nos
damos cuenta que a este valor le corresponde un rea de <.<B a la izquierda,
por ser negativo el valor. #ntonces si se resta <.<B y <.<=B se tiene un valor de
<.<<B, que equivale a JKLuego se busca el valor de <.<<B en el primer rengln
con 3= grados de libertad y se obtiene un valor de t C 4.EDD, pero como el valor
de est en el extremo izquierdo de la curva entonces la respuesta es t C
I4.EDD por lo tanto2
$&I4.EDD R t R I3.D>3' C <.<=B
#jemplo2
Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto
proceso en lotes es B<< gramos por milmetro de materia prima. $ara verificar
esta afirmacin toma una muestra de 4B lotes cada mes. -i el valor de t
calculado cae entre Qt
<.<B
y t
<.<B
, queda satisfec%o con su afirmacin. LMu
conclusin extraera de una muestra que tiene una media de B3? gramos por
milmetro y una desviacin estndar de =< gramosN -uponga que la
distribucin de rendimientos es aproximadamente normal.
Solucin:
/e la tabla encontramos que t
<.<B
para 4= grados de libertad es de 3.D33. $or
tanto, el fabricante queda satisfec%o con esta afirmacin si una muestra de 4B
lotes rinde un valor t entre Q3.D33 y 3.D33.
-e procede a calcular el valor de t2
#ste es un valor muy por arriba de 3.D33. -i se desea obtener la probabilidad
de obtener un valor de t con 4= grados de libertad igual o mayor a 4.4B se
busca en la tabla y es aproximadamente de <.<4. /e aqu que es probable que
el fabricante concluya que el proceso produce un mejor producto del que
piensa.