You are on page 1of 35

Unidad V: Elementos de Inferencia Estadstica

UNIDAD V
ELEMENTOS DE INFERENCIA ESTADISTICA
1. INTRODUCCIN
Todas las herramientas estadsticas con las que se cuenta hasta ahora, tales como
tablas, grficos y clculo de medidas descriptivas se podran englobar en el trmino
Estadstica Descriptiva, puesto que ellas esencialmente permiten describir, presentar y
resumir informacin que ha sido recolectada de alguna forma.
Sin embargo las tcnicas de la Estadstica escriptiva no permiten responder
interrogantes que pueden surgir cuando no se dispone de la informacin sobre todos los
individuos de la poblacin de inters sino slo de una parte de ella, es decir, que los
datos provienen de una muestra de individuos de la poblacin ba!o estudio. E!emplos de
esta situacin son"
Si se conoce que la ganancia promedio de ventas de una muestra de #$
automviles nuevos es de %&'#, (qu se puede decir sobre la ganancia media
de todas las ventas de automviles nuevos)
Si se encontr que una curso de capacitacin ayuda a encontrar traba!o a *+
de ,$ !venes de una ciudad, (qu porcenta!e de todos los !venes que
buscan traba!o se puede esperar que encuentren traba!o despus de tomar el
curso)
-ara responder este tipo de preguntas la Estadstica dispone de una gran cantidad
de mtodos que se engloban dentro de la llamada Estadstica Inferencial, los cuales se
usan esencialmente para determinar la probabilidad de ue una conclusi!n sacada a
partir de los datos de una muestra sea cierta en la poblaci!n muestreada.
.as poblaciones pueden ser ventas, personal de una empresa, consumidores de
un producto, etc.
*$&
Unidad V: Elementos de Inferencia Estadstica
El proceso conocido como inferencia estadstica, requiere consideraciones de
cmo fue seleccionada la muestra y cunto varan las observaciones de una muestra a
otra. e esta manera, los mtodos de seleccin de los individuos que se usarn en la
investigacin son de considerable importancia para la obtencin de resultados y
conclusiones vlidas.
El requisito fundamental de una buena muestra es que sea representativa de la
poblacin que se trata de describir /"oblaci!n Ob#etivo 0igura #.*1. 2ay, por supuesto
muchas formas de obtener una muestra no representativa. 3na obvia falta de
representatividad ocurre cuando la muestra se toma de la poblacin equivocada. -or
e!emplo, se quiere conocer la proporcin de personas que consumen un determinado
producto y la muestra se obtiene de los clientes de un solo supermercado.
45n cuando se est seguro que la muestra se obtiene de la apropiada poblacin,
otra fuente potencial de error en el muestreo, especialmente en las encuestas de opinin
son las respuestas ses$adas. 6uestionarios mal redactados o tcnicas de entrevistas
inadecuadas pueden dar lugar a respuestas que no refle!an la realidad que se quiere
evaluar.
-or otra parte, en muchas ocasiones no es posible obtener la muestra a partir de
todos los individuos que definen la poblacin ob!etivo, sino slo a partir de una
subpoblacin que es accesible al investigador en el momento de hacer la seleccin de
los individuos de la muestra y ella recibe el nombre de poblaci!n muestreada /0igura
#.*1.
**$
Unidad V: Elementos de Inferencia Estadstica
Poblacin objetivo
Poblacin muestreada
Muestra
Se requiere sentido comn para
hacer inferencias del muestreo a
la poblacin objetivo
Para hacer inferencias estadsticas
de la muestra a la poblacin
muestreada se requiere que la
muestra sea aleatoria
Figura 5.1" Alcances de las inferencias realizadas de una muestra
(Estadstica Biomdica, Dawson!auders " #rapp$%
6onsideremos, por e!emplo, un sondeo telefnico que reali7 la cadena de
televisin 486 inmediatamente antes de las elecciones de *&9$ entre 6arter y :eagan.
.a 486 invit a sus televidentes a llamar /por larga distancia1 para dar a conocer sus
preferencias presidenciales. En ve7 de lograr una muestra del sentir real de los electores,
la 486 obtuvo una muestra de las preferencias de los votantes que estaban
suficientemente interesados en desviar el resultado del sondeo como para invertir en las
llamadas telefnicas de larga distancia. Es claro que la 486 no reali7 un muestreo
aleatorio de la poblacin de posibles votantes. ;s demcratas hicieron las llamadas de
larga distancia, y la 486 pronostic as una victoria electoral de 6arter. 4ntes de
e<tender cualquier conclusin, es necesario evaluar qu factore e!ecti"o y ego
distinguen a la poblacin realmente muestreada /todos los votantes que hicieron las
llamadas de larga distancia1 de la poblacin ob!etivo /todos los posibles votantes1.
&os mtodos de la Inferencia Estadstica permiten 'eneralizar los resultados de
la muestra s(lo a los individuos )ue componen la po*laci(n muestreada y la
generali7acin hacia la poblacin ob!etivo est fuera del alcance de la Estadstica. Sin
embargo, si es posible suponer que la poblacin muestreada es similar a la poblacin
ob!etivo no se cometera un error grande en generali7ar los resultados hacia la poblacin
ob!etivo.
***
Unidad V: Elementos de Inferencia Estadstica
45n cuando se est seguro que la muestra se obtiene de la poblacin apropiada,
es igualmente importante que la muestra se saque de una manera ob!etiva e insesgada.
;uestras casuales o muestras seleccionadas sobre la base de que es fcil de
recolectar, son raramente representativas de la poblacin. 2ay varios mtodos
adecuados para seleccionar una muestra que permiten evitar los sesgos, y la mayora
tiene como base el concepto de muestra aleatoria o probabilstica, en la cual cada
individuo en la poblacin de inters es seleccionado /o no1 a travs del uso de
mecanismos aleatorios descriptos claramente. -or e!emplo, el caso ms simple, es el
denominado esuema de muestreo aleatorio simple en el cual cada posible muestra es
igualmente probable, lo que implica que cada individuo tiene igual probabilidad de ser
seleccionado para pertenecer a la muestra. ;s adelante se tratar con ms detalle los
distinto tipos de muestreo.
En cualquier estudio, los investigadores deben escribir de manera completamente
e<plcita la manera en la cual las muestras han sido elegidas y cuando se escribe o se lee
cualquier traba!o de investigacin uno debera hacerse las siguientes preguntas"
+El autor define claramente la po*laci(n muestreada,
+El autor discute similitudes " posi*les diferencias entre la po*laci(n
muestreada " la po*laci(n o*-etivo,
+El autor descri*e claramente el mecanismo de muestreo )ue us(,
+El mecanismo de muestreo es aleatorio, (!i no lo es, por)ue,$%
+&os mtodos de an.lisis de datos son adecuados para el es)uema de
selecci(n usado,
(=u ocurre si el investigador no ha usado un muestreo aleatorio para
seleccionar los individuos de la muestra) Supongamos por e!emplo que l simplemente
us los datos de los clientes de un supermercado para evaluar las preferencias de los
consumidores respecto a distintas marcas de un producto. ;uchos, sino la mayora, de
los estudios son de este tipo. .os datos son anali7ados luego, como si ellos hubieran
surgido a partir de una muestra aleatoria de consumidores. El problema aqu es que
estamos perdiendo la vital vinculacin entre un esquema de muestreo aleatorio y el
**,
Unidad V: Elementos de Inferencia Estadstica
apropiado mtodo de inferencia estadstica, el cual supone siempre que hubo una
seleccin aleatoria de la muestra.
En estas circunstancia, (se debera entonces abandonar la inferencia estadstica)
-robablemente no, pero deberamos siempre estar muy preocupados de tomar estos
resultados muy seriamente. .as bases de la inferencia, en este caso, han sido
severamente debilitadas />destruida?, diran algunos1. En rigor de verdad, deberamos
decir" >si pretendemos )ue tenemos una muestra aleatoria, entonces /0. .a palabra
pretender ha sido usada deliberadamente ya que no es una suposicin, puesto que
nosotros sa*emos que la muestra no es aleatoria. 4l final, nosotros deberamos aceptar
que estamos usando la inferencia estadstica slo como una gua, como una manera de
ayudar a que los datos tengan alg5n sentido, por todo esto, nuestra inferencia en estos
casos debera estar basada ms en el sentido com5n que en la teora estadstica.
En las 3nidades anteriores se estudi las reglas bsicas de probabilidad y
distintas distribuciones de probabilidad como la binomial, -oisson, @ormal y
e<ponencial. En esta unidad se usarn estas reglas de probabilidad !unto con el
conocimiento de las distribuciones de probabilidad para anali7ar cmo ciertas medidas
/media, proporcin1 pueden usarse para hacer inferencias respecto a los parmetros
poblacionales.
.a inferencia estadstica involucra dos reas principales" Estimaci!n " "rueba
de %ip!tesis, pero antes de tratar estos importantes temas es necesario mane!ar el
concepto de istribucin en el ;uestreo o istribucin ;uestral que es la base para
comprender los mtodos y herramientas de la inferencia estadstica.
&. DI'TRI(UCIN )UE'TR*+
3n ob!etivo que se presenta frecuentemente en las investigaciones de diferentes
reas es conocer el promedio de alguna caracterstica cuantitativa o la proporcin de
individuos que poseen determinada caracterstica cualitativa. -or e!emplo, la edad
media de las >mu-eres de una dada re'i(n )ue usan determinado servicio? /-oblacin
Ab!etivo1B o la proporci(n de >e'resados universitarios de un pas? /-oblacin
Ab!etivo1 que hacen una carrera de postgrado. En general, las caractersticas de inters
**'
Unidad V: Elementos de Inferencia Estadstica
en un estudio se denominan par,metros poblacionales. En los e!emplos dados los
parmetros poblacionales son la media y la proporcin y generalmente se denotan con
a la media y con a la proporcin.
-ara determinar los parmetros poblacionales se requiere conocer los valores de
la variable para todos los individuos de la poblacin, por e!emplo para determinar la
edad media se requiere conocer la edad de todas las mu!eres que usan el servicio. Sin
embargo, no siempre es posible obtener la informacin de todos los individuos que
componen la poblacin por ra7ones de costo en tiempo y dinero, y cuando eso ocurre se
hace necesario recurrir a una muestra de la poblacin. .uego, a partir de los datos de la
muestra se busca una manera de combinar la informacin de la muestra para obtener la
caracterstica de inters.
En el e!emplo donde el parmetro de inters es la edad media, se toma una
muestra de n /tama-o de la muestra1 mu!eres de la poblacin y se calcula el promedio
de las edades en la muestra. Surge entonces el interrogante a cerca de cual medida de
promedio se usar /media aritmtica o mediana1. 6ualquiera sea la medida que se use,
cada una de ellas recibe el nombre de estimador o estadstico. Si se conviene en usar la
media aritmtica, o sea, la media muestral 1 , ella es en este caso el estimador de la
media poblacional .
Se debe observar que para obtener el valor de 1 se debe combinar los valores
observados en la muestra /suma de los datos divida en el n5mero de observaciones1 y
esto ocurre con cualquier estadstico o estimador de una parmetro, de manera que
formalmente se puede dar la siguiente definicin"
Definici!n 1. Un estadstico o estimador es una funci(n de los valores
o*servados en los individuos )ue componen la muestra, es decir, es la
e1presi(n matem.tica )ue indica la forma de com*inar los datos
.a Tabla #.* muestra los smbolos de los parmetros y sus respectivos
estimadores de uso ms frecuentemente en medicina.
**C
Unidad V: Elementos de Inferencia Estadstica
Ta#!a 5.1" !m*olos usuales para par.metros " estadsticos
Caracter$tica S$%#o!o &e! 'ar(%etro S$%#o!o &e! Eta&$tico
;edia
esvo estndar
Darian7a
6orrelacin
-roporcin

1
s
s
,
r
p
El valor que toma el estimador para una particular muestra se denomina una
estimaci!n del parmetro poblacional. -or e!emplo, si en una muestra de *$$ mu!eres se
calcula el valor de la media aritmtica de las edades y se obtiene 1 E ,#.# aFos,
entonces ,#.# representa un particular valor de 1 , es decir es una estimacin del
estimador. Abviamente con cada posible muestra se tendra un valor diferente del
estimador, es decir, se obtendra una estimacin diferente para el parmetro de inters.
-or lo tanto, un estimador toma diferentes valores para cada muestra, es decir, vara de
muestra en muestra. Teniendo en cuenta este aspecto de un estimador se puede dar una
segunda definicin de estimador"
Definici!n &: Un estadstico o estimador es una varia*le )ue toma diferentes
valores para cada muestra seleccionada.
e esta manera, las estimaciones dependen de la particular muestra con que
estemos traba!ando.
En resumen, Si se est interesado en conocer alg5n par.metro de una poblacin de
inters /media, proporcin, coeficiente de correlacin, etc.1, y no es posible observar o
medir a todos los individuos de la poblacin para obtener el valor de dicho parmetro,
entonces, una posibilidad es obtener una muestra de tamaFo n y conseguir una
estimaci(n de parmetro usando un estimador del parmetro.
-or otra parte, si se pudiera e<traer todas las posibles muestras del mismo
tamaFo /n1 de la poblacin de inters y con cada una de ellas se calcula el valor del
estimador o estadstico correspondiente, se obtendra todas las estimaciones posibles del
parmetro. .uego a partir de ellos se podra construir la distribuci!n de probabilidad
**#
Unidad V: Elementos de Inferencia Estadstica
del estadstico, tal distribucin de probabilidad que recibe el nombre de distribuci!n
muestral del estadstico de inters.
6abe preguntarse por qu es tan importante el concepto de distribucin muestral,
la respuesta es simple, cuando se quiere estimar un parmetro poblacional /caracterstica
de la poblacin1 a partir de una muestra surgen otros interrogantes como"
(=u tan buena es la estimacin obtenida)
(Se puede llegar a la conclusin de que el parmetro de la poblacin es
idntico al estadstico de la muestra o es probable que e<ista alg5n error).
Si es as, (qu tan grande es dicho error)
-ara responder a estas preguntas se debe comparar los resultados obtenidos a partir de
las muestras con los resultados /esperados0. .os resultados esperados surgen
!ustamente a partir de la distribucin muestral del estadstico y de all la importancia de
ella.
Surge ahora otro problema, es ms costoso /y a veces imposible1 obtener todas
las muestras aleatorias de tamaFo n para construir la distribucin muestral del
estadstico o estimador, que observar a todos los individuos de la poblacin. e manera
que se plantean ahora nuevos interrogantes" (cmo obtener la distribucin muestral si se
tiene slo una muestra de la poblacin) -ara responder esta pregunta se debe tener en
cuenta que la distribucin muestral del estadstico depende de"
&a distri*uci(n de la po*laci(n, es decir, de la distri*uci(n de pro*a*ilidad de
la varia*le de inters (por e-emplo edad de las mu-eres )ue usan un servicio$
Del par.metro de inters (media, varia*ilidad$
Del estadstico )ue se eli-a para estimar el par.metro (media aritmtica o
mediana, desvo est.ndar muestral o ran'o intercuartos$
De la forma de selecci(n aleatoria de la muestra%
Del tama2o de la muestra%
**+
Unidad V: Elementos de Inferencia Estadstica
.a relacin e<istente entre la distribucin de probabilidad de la poblacin y
distribucin muestral del estimador1 es la que nos permite hacer afirmaciones sobre el
parmetro poblacional y cuantificar el error de dichas afirmaciones.
En efecto, la teora estadstica inferencial provee de herramientas que permiten
conocer, aunque sea apro<imadamente, la distribucin muestral del estadstico, y luego,
como ya se di!o, a partir de ella conocer el valor esperado del estadstico. e esta
manera, es posible evaluar la precisin de la estimacin obtenida con la muestra y
cuantificar el error de las afirmaciones que se hagan sobre el parmetro poblacional.
-ara clarificar estos conceptos, se considera el caso en que el parmetro
poblacional es la media y el estadstico para estimarla es la media aritmtica 1 ,
obtenida a partir de una muestra de tamaFo n de la poblacin.
6omo ya se di!o, si se quiere obtener la distribucin muestral de 1 , e<trayendo
todas las muestras de tamaFo n, esto consumira ms tiempo que el requerido para tomar
la informacin de toda la poblacin y, en consecuencia, sera poco prctico. En su lugar,
es posible usar la teora estadstica para determinar la distribucin muestral de la media
aritmtica en cualquier situacin particular, siempre que se cumplan algunas
condiciones para la distribucin de probabilidad de la variable que se est estudiando
/Der 0igura ,1.
E)e%'!o 1" En una planta em*otelladora de *e*ida se encuentra )ue la m.)uina
em*otelladora est. presentando una nota*le varia*ilidad en el llenado% 3ara analizar
este pro*lema se lleva a ca*o un estudio donde se define )ue la varia*le de inters 4
ser. la cantidad de *e*ida )ue contienen las *otellas% !upon'amos )ue la distri*uci(n
de pro*a*ilidad de 4 es tal )ue la media po*lacional es 2 5,6 litros de *e*ida, con un
desvo est.ndar 2 7,6 litros% !upon'amos a8ora, )ue se desconoce esta informaci(n "
se )uiere estimar la media po*lacional tomando una muestra aleatoria de tama2o
n9577 de la po*laci(n de *otellas% &a media aritmtica calculada a partir de la
muestra dio un valor 1 95,66 litros%
**G
Unidad V: Elementos de Inferencia Estadstica
-ara hacer afirmaciones sobre la precisin de la estimacin que d alg5n
grado de confian7a en el valor encontrado a travs de la muestra, se necesita conocer la
distribuci!n muestral de 1 .
.as propiedades de la distribucin muestral de 1 son la base para uno de los
teoremas ms importantes de la teora estadstica, llamado Teorema del +mite Central,
que se enuncia a continuacin sin mucha formalidad.
ada una poblacin con media
*
y desviacin estndar
*
/finita1, la
distribucin muestral de la media basada en muestras aleatorias repetidas de tamaFo n
/grande1 tiene las siguientes propiedades"
*. &a media de la distribuci!n muestral de 1 , es decir, el valor esperado

1
9
E( 1 $ de la distri*uci(n de pro*a*ilidad de 1 , es i'ual a la media
1
de la distri*uci(n de pro*a*ilidad de la varia*le 4%
,. El desvo est.ndar en la distri*uci(n muestral de 1 es i'ual a
n

% Esta
cantidad es denominada error est,ndar de la media 3'E)4%
'. :on muestras de tama2o 'rande, la distri*uci(n muestral de 1 si'ue un
modelo te(rico denominado modelo de distribuci!n normal, sin importar la
forma de la distri*uci(n de la po*laci(n ori'inal, siempre )ue se cumplan
las condiciones mencionadas%
Atra manera de e<presar este resultado y que resulta 5til para e<presar los
resultados de los mtodos de inferencia es la siguiente"
Teorema del lmite central "
Independiente de la distri*uci(n )ue ten'a la varia*le aleatoria 4, siempre )ue ten'a
media " varianza
6
finitas, al 8acerse lo *astante 'rande el tama2o de muestra n,
entonces la distri*uci(n del estadstico
n
4
;
H

+1,
es <ormal con media 7 " varianza 5, es decir, <(7, 5$%

**9
Unidad V: Elementos de Inferencia Estadstica
<
*
<
,
<
'
<
C
..
.
.
<
m
;
*
;
,
;
'
;
C
;
m
n H
n H +

I
DISTRI-UCI.N MUESTRAL DE LA MEDIA ARITM/TICA +0,
1O-LACI.N DE 0
MUESTRAS DE TAMA2O 3
1O-LACI.N DE 0
DISTRI-UCI.N DE LA 1O-LACI.N DE 0 CON
;EJ4
ESDKA
ESTL@4:

DISTRI-UCI.N DE LA 1O-LACI.N DE 0
;EJ4
ESDKA
ESTL@4: n

NORMAL CON
ERROR EST4NDAR
Figura 5.5: Distri*uci(n muestral de la media aritmtica (estadstico$%
**&
Unidad V: Elementos de Inferencia Estadstica
El resultado enunciado da la base para toda la inferencia estadstica sobre la
media.
Observaci!n.
Aun)ue siempre 8a" e1cepciones, tama2os de muestras de n 9 =7, o m.s, en la
'ran ma"ora de los casos ase'uran la validez del teorema del lmite central, es decir,
la distri*uci(n muestral para 1 tendr. apro1imadamente una distri*uci(n normal
para n =7 si es conocido.
En el e!emplo, y de acuerdo a lo enunciado, la distribucin muestral de 1 ser
apro<imadamente normal con media
1
E *,,$ litros y con un error estndar dado por
SE/ 1 1 E SE; E
n

9
*$$
, . $
9 7%6>57 9 $.$,.
.a importancia del SE; y del resultado enunciado radica en que a partir de l se
puede hacer la siguiente afirmacin" si el tama-o de muestra es $rande
apro1imadamente el 567 de las muestras daran valores de 1 en un intervalo ue
va desde 8&'E) a 9&'E), es decir, e1iste una probabilidad del 567 de ue el
valor calculado de 1 se encuentre dentro de ese intervalo.
Abviamente, en la prctica siempre se desconoce el valor de y casi siempre el
valor de , de manera que esto es slo el respaldo terico de toda la inferencia
estadstica, como se ver en las secciones subsiguientes.
E)e%'!o 5" En el e-emplo anterior si " son conocidos, entonces se puede afirmar
)ue apro1imadamente el ?@A de las muestran de tama2o n 9 577 daran valores de 1
entre 5,6 7%7B " 5,6 C 7%7B, es decir entre 5,5D litros " 5,6B litros, o *ien )ue e1iste
una pro*a*ilidad del ?@A )ue el valor encontrado para 1 se encuentre dentro de ese
intervalo%
6omo ya se di!o, la distribucin muestral del estimador depende del estadstico
elegido para estimar el parmetro poblacional, por e!emplo, si el estimador elegido para
estimar la media poblacional no es 1 sino la mediana, entonces el clculo de su error
*,$
Unidad V: Elementos de Inferencia Estadstica
estndar y su distribucin muestral no sigue e<actamente lo enunciado para el caso de
1 . .a teora que permite establecer la distribucin muestral de la mediana est fuera
del alcance de este curso, de manera que no ser tratada aqu.
el mismo modo que la media poblacional , por lo general, es desconocida, es
probable que el desvo estndar de la poblacin , tampoco sea conocido.
En el caso en que sea desconocido, l debe ser estimado usando los datos de la
muestra. 3n estimador ra7onable para , como ya se vio en las unidades previas, es el
desvo estndar de la muestra
*
*
,


,
_

n
1
1
!
n
i
i
+5,
:eempla7ar por S en /*1 resulta ra7onable ya que se puede demostrar que S
,
es
un estimador insesgado de
,
, es decir, EMS
,
N E
,
. Sin embargo, la distribucin muestral
del estadstico que resulta de esa sustitucin, es decir,
n !
4
H

t
+6,
ya no es @/$,*1 debido a que se usa una estimacin para y en consecuencia se
introduce en la e<presin /'1 una variabilidad adicional. En efecto, el estadstico t
definido en /'1 posee una distribucin denominada t de 'tudent, la cual tiene una
apariencia similar a la distribucin normal, simtricas y en forma de campana, pero la
distribucin t es ms dispersa. El 5nico parmetro de la distribucin t de Student es el
denominado grados de libertad y que en este caso se encuentra relacionado al tamaFo de
muestra n, y ello se e<presa diciendo que el estadstico
el estadstico t dado en la e1presi!n 3:4 tiene distribuci!n t de 'tudent con
3n ; 14 $rados de libertad.
*,*
Unidad V: Elementos de Inferencia Estadstica
:. E'TI)*CIN
En esta Seccin se dar algunas propiedades que debera cumplir un estimador
para conseguir estimaciones confiables del parmetro de inters. Se considerar
diferentes formas de estimacin y se estudiar una manera de medir la precisin en la
estimacin.
:.1. E'TI)*CIN "UNTU*+
El valor obtenido del estadstico o estimador a partir de una muestra, recibe
tambin el nombre de Estimaci!n "untual.
En el e!emplo de la embotelladora es claro que el inters no es conocer la
cantidad de bebida promedio en el grupo particular de botellas que pertenecen a la
muestra, sino en toda la poblacin. -or otra parte, la media calculada a partir de los
datos de la muestra es slo /una estimaci!n0 de la cantidad de bebida media en la
poblacin de botellas. 6abe preguntarse ahora cules son las propiedades de que debera
tener un estimador /media, mediana1 para que sea considerado como bueno y que nos
facilite la eleccin entre un estadstico y otro.
Es claro que al obtener una estimacin puntual su valor depender de la muestra
que se haya seleccionado y que el valor encontrado puede cambiar de muestra en
muestra. e esta manera, las propiedades deseables seran que cada estimacin no se
encuentre muy ale!ada del verdadero valor del parmetro, y por otra parte, que no haya
demasiada variabilidad entre los valores del estadstico, obtenidos de muestra en
muestra. Esto se puede formali7ar definiendo algunas propiedades a tener en cuenta de
los estadstico, a saber"
1. Inses$ado " Informalmente esto si'nifica ausencia de error sistem.tico% De una
manera m.s formal, un estadstico cual)uiera se dice inses'ado si la media de su
correspondiente distri*uci(n muestral es i'ual al par.metro de inters <, es decir,
E=> 2 <%
5. Eficiente " !i'nifica )ue las estimaciones o*tenidas para distintas muestras varan
poco entre ellas% De una manera m.s formal, el estimador m.s eficiente dentro de
un con-unto de estimadores inses'ado ser. a)uel )ue tiene la menor varianza%
*,,
Unidad V: Elementos de Inferencia Estadstica
6. Consistente 7 Informalmente, un estadstico E se dice consistente si su varia*ilidad
disminu"e cuando aumenta el tama2o de muestra%
Se puede demostrar que la media aritmtica es un estimador insesgado y
eficiente de la media poblacional.
Si la variabilidad de las estimaciones se mide a travs del desvo estndar, este
desvo estndar recibe el nombre de error est,ndar del estimador 3'E4.
Observaciones:
5% <o de*e confundirse Fdesvo est.ndar0 de la distri*uci(n de la po*laci(n
(varia*ilidad entre los individuos$ con Ferror est.ndar0 del estimador )ue es el
desvo est.ndar de la distri*uci(n muestral (varia*ilidad entre las estimaciones de
las muestras$%
6% Es mu" pro*a*le )ue el estadstico inses'ado m.s eficiente no estime el par.metro
po*lacional con Fe1actitud0, esto se de*e a )ue en realidad cuando realizamos la
estimaci(n s(lo tomamos una muestra, " o*tenemos uno de los posi*les valores del
estadstico )ue en 'eneral no tiene por)ue coincidir con el valor del par.metro )ue
se )uiere estimar%
:.&. E'TI)*CIN "OR INTER?*+O'
Si bien la precisin se incrementa con muestras grandes no hay ra7n para
esperar que la estimacin puntual de una muestra dada deba ser e<actamente igual al
parmetro poblacional que se supone estima. Entonces, e<isten muchas situaciones en
las cuales es preferible determinar un intervalo dentro del cual se esperara encontrar el
valor del parmetro, tal metodologa se conoce como estimaci!n por intervalos y el
intervalo se denomina Intervalo de Confian@a
.os Jntervalos del 6onfian7a son intervalos aleatorios obtenidos a partir de los
datos y en los cuales hay un $rado de confian@a prefi!ado /medido en O1 de que dicho
intervalo contenga al verdadero valor del parmetro que se quiere estimar.
El grado de confian7a se denomina nivel de confian@a y se lo denota como
*$$/*P1O, donde se considera a menudo como la probabilidad de cometer un error,
*,'
Unidad V: Elementos de Inferencia Estadstica
ya que indica la proporcin de veces en que uno se equivoca o comete un error al
suponer que el intervalo contiene al parmetro poblacional. e esta manera, *P ser la
proporcin de veces que los distintos intervalos de confian7a contienen al parmetro.
3sualmente el valor *$$ /*P 1O se lo fi!a en el &#O, lo que llevara a establecer que en
promedio slo en el #O de los casos se cometera error al suponer que el intervalo
contiene al verdadero valor del parmetro.
-ara encontrar estos intervalos debemos conocer la distribucin muestral de cada
estimador, que como ya se vio esto depende del parmetro de inters y del estadstico
que se eli!a para estimar dicho parmetro. Sin embargo es posible dar la forma general
que adopta un intervalo de confian7a en cualquier caso.
En general, si que se quiere estimar un parmetro = de la poblacin a travs del
estadstico q, y si el error estndar de la distribucin de q, que se lo denotar con SE/q1,
entonces un intervalo de confian@a para < con una confian@a del 567 3IC
567
4 viene
dado por la e<presin"
IC
859
: ;< =
1
SE+<, , < > =
5
SE+<,?
+@,
donde Q
*
y Q
,
dependen de la forma de la distribucin muestral de q.
E)e%'!o 6" En el e-emplo de la em*otelladora un intervalo de confianza para el
par.metro po*lacional E 9 , con una confianza del ?@A, correspondiente a una
estimaci(n de
) 9 1 9 5%66 litros,
calculada a partir de la muestra de tama2o n 9 577, " suponiendo )ue se conoce el
desvo est.ndar de la po*laci(n, es decir, 9 7%6 litros, est. dado por:
I:
?@A
9 G 1 H I
5
!E( 1 $ , 1 C I
6
!E( 1 $J
*,C
Unidad V: Elementos de Inferencia Estadstica
donde !E( 1 $ 9 !EK 9
n

9 7%76 " I
5
9 I
6
9 5%?D se o*tienen a partir de la
distri*uci(n muestral de
n
4
H

, )ue como se vio en la !ecci(n anterior ella <(7,


5$% 3or lo tanto,
I:
?@A
9 G5%66 H 5%?D17%76 L 5%66 C 5%?D17%76J 9 G5%5M7M L 5%6@?6J
Atra manera alternativa de e<presar los J6 para la media poblacional cuando se
usa a la media aritmtica como estimador es la siguiente"
n
z
1

,
t +5,
o bien
n
z
1
n
z
1

, ,
+
+A,
donde
,
z
E valor de 7 tal que el rea deba!o de la curva de la funcin de
densidad de una distribucin normal correspondiente al intervalo M
,
z
, 1 es igual H, si n es grande /este valor es *.&+1.
n E tamaFo de la muestra
E desviacin estndar de al poblacin muestreada
E)e%'!o @" Una corporaci(n )uiere emitir al'unos pa'ars a corto plazo " espera )ue
los intereses )ue tendr. )ue pa'ar no sean ma"ores a 55,@A% 3ara o*tener cierta
informaci(n acerca de la tasa media de inters )ue 8a*ra )ue pa'ar, la corporaci(n
pone a la venta B7 pa'ars, uno a travs de cada una de B7 firmas de correta-e% &os
valores del inters se suponen )ue tienen una distri*uci(n normal con media "
varianza
6
conocida, tal )ue 9 7,=5A% A partir de la muestra de tama2o n 9 B7, se
*,#
Unidad V: Elementos de Inferencia Estadstica
o*tiene una estimaci(n de , dada por
1
9 57,=A% &ue'o, usando la e1presi(n (6$ el
I: del 577(5$A para la media po*lacional de una distri*uci(n normal es:
AB
B.:1 1.5C 1
t '* . *$
, o *ien,
AB
B.:1 1.5C
AB
B.:1 1.5C 1 1
+ '* . *$ '* . *$
Naciendo los c.lculos se o*tiene )ue:
57%65 57%B5
e mismo modo que la media de la poblacin es desconocida, por lo general
tambin se desconoce el valor real del desvo estndar y, por lo tanto, se necesita estimar
dicho parmetro a partir de los datos de la muestra utili7ando el estadstico S. En este
caso la primera e<presin de /+1 adopta la forma
n
! t
1
n , H 1, * /
t
+B,
donde se reempla7a por ! " C
+D5,
por t
+3E1,, D5
que es el valor crtico de la distribucin
t con n81 grado de libertad.
E)e%'!o 5" !i en el estudio de tasa principal de *ancos es desconocido " se tiene una
muestra de tama2o @7 " el valor o*tenido de 1 9 ?,5A " como estimador de se usa
*
#$
*
,


,
_

n
1
1
!
n
i
i
, dando en este caso el valor ! 9 7,6B, entonces, reemplazando
este valor en la e1presi(n (O$, donde adem.s se reemplaza @
3D&4
por t
3n814E D&
% &ue'o, el
valor estimado del error est.ndar ser.,
( ) $'C . $
#$
,C . $

n
!
1 !E
" el valor de t
(n5$,>6
9 6%75% &ue'o, el intervalo de confianza para la media po*lacional
con una confianza del ?@A est. dado por:
I:
?@A
9 G?%5 H 6%7517%7=BL ?%5 C 6%7517%7=BJ 9 GM%?DL ?%57J
*,+
Unidad V: Elementos de Inferencia Estadstica
Observaciones.
*. El valor de F
i
'E34 del intervalo de confianza para el par.metro ) se lo puede
entender como cota para el error de estimaci(n% En el Pltimo e-emplo se tiene
entonces, )ue esta cota es 5%?D17%7=B97,7O% Esto se interpreta como )ue la
pro*a*ilidad de )ue el error sea menor a 7,7O es 7,?@% As, la cota para el error de
estimaci(n, OA, proporciona una medida de la e1actitud para la estimaci(n
efectuada por la empresa de investi'aron de mercado.
*ctividad 6.&"
5% !e relaciona muc8as veces un incremento en la proporci(n de a8orros de los
consumidores a una falta de la confianza en la economa, " se dice )ue ello es un
indicador de una tendencia de recesi(n econ(mica% Una muestra aleatoria de
n9677 cuentas de a8orro en una comunidad local, mostr( un incremento medio en
los valores de las cuentas de O,6A en los Pltimos 56 meses " una desviaci(n
est.ndar de @,DA%
a$ Estime el intervalo de confianza para el aumento porcentual promedio en las
cuentas de a8orro en lo Pltimos 56 meses, para a8orradores de la
comunidad%
*$ Q*ten'a una cota para su error de estimaci(n%
6% Escri*a la e1presi(n para el I: para el par.metro de la distri*uci(n *inomial
cuando n es ma"or de =7%
:.:. TE'T DE %I"TE'I' E'T*DG'TIC*
En la seccin anterior tratamos la estimacin y precisin de los estimadores, que
conforman una de las dos reas principales de la Jnferencia estadstica. En esta seccin
presentaremos una forma diferente de obtener inferencia acerca de parmetros
poblacionales, probando hiptesis respecto a sus valores.
3n test de hiptesis es una metodologa o procedimiento que permite cuantificar
la probabilidad del error que se cometera cuando se hace una afirmacin sobre la
*,G
Unidad V: Elementos de Inferencia Estadstica
poblacin ba!o estudio, es decir, nos permite medir la fuer7a de la evidencia que tienen
los datos a favor o en contra de alguna hiptesis de inters sobre la poblacin.
Se introducir la idea de tests de hiptesis a travs de un e!emplo hipottico.
E)e%'!o A. Una industria usa como uno de los componentes de las m.)uinas de
producci(n una l.mpara especial importada )ue de*e satisfacer al'unas e1i'encias%
Una de esas e1i'encias est. relacionada a su vida Ptil en 8oras% Esas l.mparas son
fa*ricadas por dos pases " las especificaciones tcnicas varan de pas a pas% 3or
e-emplo el cat.lo'o del producto americano afirma )ue la vida Ptil media de sus
l.mparas es de 5@@77 8oras, con un !D de 5677% Kientras )ue para el producto
europeo la media es de 5D@77, " el !D es de 6777%
Un lote de esas l.mparas de ori'en desconocido es ofrecido a un precio mu"
conveniente% 3ara )ue la industria sepa si 8ace o no una oferta ella necesita sa*er cual
es el pas )ue produ-o tales l.mparas% El comercio )ue ofrece tales l.mparas afirma
)ue ser. divul'ada la vida Ptil media de una muestra de 6@ l.mparas del lote antes de
la oferta% +Eue re'la de decisi(n de*en usar los responsa*les de la industria para decir
)ue las l.mparas son de procedencia americana o europea,%
Una respuesta )ue sur'e inmediatamente es la de considerar como pas productor
a)uel en la cual la media de la muestra se apro1ima m.s a la media de la po*laci(n%
As, la decisi(n sera si *+$$$ 1 (el punto medio entre 5@@77 " 5D@77$ diremos )ue
es de procedencia americanaL en caso contrario diremos )ue es de procedencia
europea%
!upon'a )ue en el da de la licitaci(n se inform( )ue, de acuerdo con la re'la de
decisi(n diramos )ue las l.mparas son de ori'en americano% +3odemos estar 8errados
en esa conclusi(n,% Q en otras pala*ras, +es posi*le )ue una muestra de 6@ l.mparas
de ori'en europeo presente una media de 5@M77, !i, es posi*le% Entonces, para un
me-or entendimiento de la re'la de decisi(n adoptada, es interesante estudiar los tipos
de errores )ue podemos cometer " las respectivas pro*a*ilidades de cometer esos
errores%
.os tests de hiptesis consisten en confrontar dos hiptesis, una llamada
Hip!tesis nula que denotamos con F
o
y otra llamada Hip!tesis alternativa denotada con
F
1
. En el e!emplo las hiptesis que se plantean son"
*,9
Unidad V: Elementos de Inferencia Estadstica
En el e!emplo las hiptesis consideradas son
N
o
&as l.mparas son de ori'en europeo, esto e)uivale a decir )ue la vida Ptil 4
de cada l.mpara si'ue una distri*uci(n con media 95D@77 8oras " un
!D96777 8oras%
N
5
L &as l.mparas son de ori'en americano, es decir la media po*lacional 9
5@@77 8oras con un !D95677 8oras%
8a!o este planteo un test de hiptesis estadstica no es otra cosa que un
procedimiento para tomar una decisi!nE ba#o incertidumbre, sobre la valide7 de la
hiptesis nula usando la evidencia de los datos. -uesto que traba!amos ba!o
incertidumbre es claro que cualquiera sea la decisin que tomemos siempre e<iste una
probabilidad de cometer error. 4 fin de clarificar esto podemos presentar el siguiente
esquema"
Ta#!a 5.5. Es)uema del procedimiento
DeciiG3
Rea!i&a& o#re F
o
Cierta Fa!a
RecHaCar F
o
Error Tipo J ecisin correcta
No recHaCar F
o
ecisin correcta Error Tipo JJ
6omo se puede ver en el esquema, con cada tipo de decisin que se tome hay
asociado una posibilidad de cometer un error. 3n procedimiento de este tipo sera
ptimo cuando las probabilidades de cometer un error, cualquiera sea la decisin que se
adopte, sean pequeFas. .amentablemente, en la mayora de los tests de hiptesis slo es
posible controlar una de ellas, con la circunstancia agravante de que estos errores son
competitivos, es decir, cuando se disminuye mucho la probabilidad de uno aumenta la
probabilidad del otro.
-uesto que, el inters generalmente es >recha7ar 2
o
? la probabilidad de error que
se controla durante este procedimiento, es !ustamente el error asociado a esta decisin
/-robabilidad del Error Tipo J1, es decir, la probabilidad de recHa@ar %
o
cuando es
cierta. .a m<ima probabilidad de error tipo J se denota con y recibe el nombre de
nivel de si$nificaci!n del test y l debe ser prefi!ado de antemano. .a probabilidad de
*,&
Unidad V: Elementos de Inferencia Estadstica
Error Tipo JJ se denota con y es 5til para encontrar la bondad del test que se mide en
trminos de la cantidad 1E denominada 1o&er &e! Tet.
El nivel de significacin que se usa generalmente es :I.I5 lo que corresponde
a un #O en trmino de porcenta!e.
:etomando el e!emplo vamos a indicar por :6 una regin determinada por los
valores de I menores que *+$$$, es decir :6ERI *+$$$S. El valor *+$$$ se
denomina punto crtico y se denotar como *
c
.
*$$$$ *,$$$ *C$$$ *+$$$ *9$$$ ,$$$$
Re'i(n de Aceptaci(n de N
7
Re'i(n de Rec8azo de N
7

Figura 5.6. Valores posi*les del estadstico del test
6on las notaciones indicadas arriba, la probabilidad de cometer cada uno de los
errores puede ser escrita del siguiente modo"
1;Error Ti'o I? : 1; 4 'erte3eCca a RC J F
I
e "er&a&era? : .
1;Error Ti'o II? : 1; 4 3o 'erte3eCca a RC J F
I
e fa!a ? :
E)e%'!o B" En el e-emplo D, cuando N
7
es verdadera, es decir, las l.mparas son de
ori'en europea, sa*emos del teorema central del lmite )ue 1 , o sea la media de las
muestras de tama2o 6@, tendr.n distri*uci(n apro1imadamente normal con media
5D@77 " 9
C$$
,#
,$$$

, es decir 4 <(5D@77, 5D77$% Entonces,


3GError #ipo IJ 9 3G 4 R: S N
7
es verdaderaJ 9
9 3G 4 5D777 S 4 <(5D@77, 5D77$J 9 3G ; (5D777 H 5D@77$>
B77J
9 3G ; 5%6@J 9 7%57D 9 57%DA%
*'$
Unidad V: Elementos de Inferencia Estadstica
-ara cada regla de decisin adoptada, es decir, para cada valor crtico <
c
se
obtiene un valor de probabilidad de error tipo *. -or otra parte, si <
c
se elige menor que
*#$$$ disminuye pero aumenta.
Sin embargo, se puede proceder de manera inversa, es decir, fi!ado
encontramos la regla de decisin que corresponder a una probabilidad de error * igual a
.
E)e%'!o K" !i se toma 9 @A, " se procede a encontrar la re'la de decisi(n
correspondiente:
@A9 3GError #ipo IJ9 3G 4 1
c
S 4 <(5D@77, 5D77$J 9 3G; T 5%DB@J,
pero se sa*e )ue, para una distri*uci(n normal est.ndar
C$$
*+#$$
+C# . *


c
1
de donde 1
c
9 5@MB6 8oras% Entonces, la re'la de decisi(n ser.
F!i 4 fuera inferior a 5@MB6 se dice )ue el lote es americano, en caso
contrario se dice )ue es europeo0%
:on esta re'la la pro*a*ilidad de error tipo II ser.
3GError #ipo IIJ 9 3G 4 U 5@MB6 S 4 <(5D@77, 5D77$J 9
9 3G; U 5%B6@J 9 O%?=A
*'*
Unidad V: Elementos de Inferencia Estadstica
Figura 5.@. Distri*uci(n muestral de 4 para el caso de la procedencia de lote
de l.mparas
"rocedimiento $eneral de un test de Hip!tesis basado en la re$i!n de recHa@o
Se da ahora una secuencia de pasos que puede ser usada sistemticamente para
cualquier test de hiptesis.
*1 Jniciar el procedimiento estableciendo, de manera clara y e<plcita, cul es la
hiptesis nula, es decir, 2
$
.
,1 3sar la teora estadstica para construir un indicador de concordancia entre
los datos y la hiptesis nula. Este indicador denominado estadstico del test
ser usado para !u7gar la hiptesis 2
$
.
'1 0i!ar el nivel de significacin deseado , que es el m<imo error aceptable
cuando se recha7a 2
$
, y usar este valor para construir la re$i!n crtica.
C1 6alcular el valor del estadstico a partir de la muestra.
#1 Si el valor del estadstico pertenece a la regin crtica, entonces rec8azar N
7
.
En caso contrario, lo que se puede afirmar es que no 8a" suficiente evidencia
para rec8azar N
7
%
+1 Si se dispone de una hiptesis alternativa y de la distribucin del estadstico
del test ba!o la suposicin que vale la hiptesis alternativa, se puede calcular
la probabilidad de error Tipo JJ.
15500 15842 16500
5%
7.93%
AMERICANO EUROPEO
*',
Unidad V: Elementos de Inferencia Estadstica
"rocedimiento $eneral de un test de Hip!tesis basado en el "8value
Atro procedimiento general de un test de hiptesis ms usado en la actualidad
debido a la disponibilidad de paquetes de programas estadsticos, consiste en tomar la
decisin a partir de la probabilidad del error Tipo J que brindan las salidas de tales
paquetes de programas, denominado 3value o simplemente -. Este procedimiento lo
podemos resumir en los siguientes pasos"
*. Suponer )ue N
o
es cierta.
,. -ara confrontar esta suposicin con la informacin /parcial1 que proveen los
datos sobre la realidad de 2
o
, se forma >una especie de indicador? de
concordancia, denominado estadstico del testE el cual es funcin del de los
datos.
'. 6omo el estadstico depende de la informacin de los datos, con cada
muestra posible hay asociado un valor de este estadstico y en consecuencia
se genera una nueva variable aleatoria. 4sociada a esta variable hay una
cierta distribucin de probabilidad, a partir de la cual se determina la
probabilidad de que la informacin de los datos concuerde con la hiptesis
nula, denominado /"8value0. e esta manera, el >-Pvalue? representara la
probabilidad de cometer un error cuando se toma la decisin de recha7ar 2
o
.
C. Es claro que si de antemano se fi!a que la m<ima probabilidad de error al
recha7ar 2
o
debe ser igual a , otra manera de tomar la decisin es comparar
el valor del -P value con . 4s
Si - entonces la decisin es RecHa@amos %
o
Si - T la decisin es No HaI evidencia suficiente para recHa@ar %
o
:.:.&. "RUE(*' DE %I"TE'I' UNI+*TER*+E' J (I+*TER*+E'
.as pruebas o test de hiptesis se relacionan con los parmetros poblacionales
/medias o proporciones, etc.1. Se puede utili7ar los estimadores puntuales de los
parmetros poblacionales como estadstico del test en cuestin.
*''
Unidad V: Elementos de Inferencia Estadstica
Supongamos, como ilustracin que se utili7a el smbolo para denotar el
parmetro poblacional de inters, por e!emplo, puede ser , /
*
P
,
1, p /p
*
Pp
,
1, y el
smbolo
U
para denotar el estimador puntual insesgado correspondiente.
esde el punto de vista prctico se puede tener inters en contrastar la hiptesis
nula F
I
7 :
I
, contra la alternativa de que el parmetro poblacional es mayor que
$
, o
sea F
1
7 L
I.
En esta situacin, se recha7ar 2
$
cuando

sea grande, o sea cuando el


estadstico del test sea mayor que un cierto valor llamado valor crtico, que separa las
regiones de recha7o y no recha7o del test /Der 0igura #.'1.
.a probabilidad de recha7ar la hiptesis nula cuando es cierta ser igual al rea
ba!o la curva de la distribucin muestral del estadstico del test sobre la regin de
recha7o. En el caso que estemos traba!ando con una distribucin normal, y un E $,$#,
se recha7a la hiptesis nula cuando

se encuentre a ms de *,+C#

U a la derecha de

$
. e esta manera, se puede definir como
Una prueba estadstica de una cola o unilateral es auella en la ue la re$i!n
de recHa@o se locali@a solamente en una cola o e1tremo de la distribuci!n
muestral del estadstico del test.
-ara detectar T
$
, se sit5a la regin de recha7o en la e<tremidad de valores
superiores a

. -ara detectar V
$
se ubica la regin de recha7o en la e<tremidad
i7quierda de la distribucin de

, o sea para valores inferiores a

.
Si hay que detectar diferencias mayores o menores de
$
, la hiptesis alternativa
ser
2
*
"
$

es decir
T
$
o bien V
$
En este caso la probabilidad de error Tipo I se repartir, entre las dos colas
de la distribuci!n muestral del estadsticoE I se recHa@ar, %
B
para valores de

maIores ue un valor crtico 3


B
9 C4 o menor ue 3
B
8 C4. Esta prueba se
llama prueba estadstica bilateral o de dos colas.
*'C
Unidad V: Elementos de Inferencia Estadstica
:.:.:. C*'O' "*RTICU+*RE' DE "RUE(*' DE %I"TE'I'
1, Cao 17 "rueba de Hip!tesis para la media de una poblaci!n
Sea una poblacin con media y desviacin estndar , y se tiene inters de
ver si la media poblacional es un dado valor
$
. Se toma una muestra aleatoria de
tamaFo n de esta poblacin. -or lo que el procedimiento a seguir ser"
a1 2iptesis nula 2
$
" E
$
b1 Estimador puntual de la media poblacional 1 . -or el teorema del lmite central,
el cual, en esencia, establece que ba!o ciertas condiciones, cualquiera la
distribucin de I, la variable aleatoria 4 tiene una distribucin
apro<imadamente normal con media y desviacin estndar
n

para el
tamaFo de muestra grande.
c1 2iptesis alternativa
1rue#a &e u3a co!a 1rue#a &e &o co!a
2
*
" T
$
/o bien V
$
1 2
*
"
$

d1 Si la poblacin tiene una distribucin normal, o estamos traba!ando con un
tamaFo de muestra grande /mayor a '$1, y la desviacin estndar es conocida,
entonces el estadstico del test ser
n
1 1
z
1

$ $

, +11,
Este estadstico tiene distribucin normal con media $ y desvo estndar *, ba!o
la hiptesis nula.
e1 Si la poblacin es normal y no se conoce la desviacin estndar, se utili7a su
estimacin puntual s, en cuyo caso el estadstico del test tiene la forma
n
s
1
t
$

+15,
*'#
Unidad V: Elementos de Inferencia Estadstica
que tiene una distribucin t
,/nP*1
con /nP*1 grados de libertad, ba!o la hiptesis
nula.
f1 :egin de recha7o
1rue#a &e u3a co!a 1rue#a &e &o co!a
En el caso del apartado d1
7 T 7

/o bien 7 VP 7

1
En el caso del apartado d1
, ,
z z o z z < >
En el caso del apartado e1
t T t
,/nP*1
/o bien t VP t
,/nP*1
1
En el caso del apartado e1
( ) ( ) * ,
,
* ,
,

< >
n n
t t o t t

E)e%'!o 8" &a producci(n diaria en una planta industrial )umica re'istrada durante
n 9 @7 das, tiene una media muestral 1 9 MO5 toneladas% !e )uiere pro*ar la 8ip(tesis
de )ue el promedio de la producci(n diaria del producto )umico es 9 MM7 toneladas
por da, contra la alternativa de )ue la media es distinta de MM7 toneladas diarias%
!upon'amos )ue se conoce )ue el desvo est.ndar de la po*laci(n es 9 65 toneladas
diarias%
&a 8ip(tesis nula es
N
7
: 9MM7 toneladas
:ontra la alternativa
N
5
:
99$
toneladas
&a estimaci(n puntual para la media po*lacional es 1 , por lo tanto , el
estadstico del test est. dado por la e1presi(n (55$
$' . '
#$
,*
99$ 9G*
$

n
1
z

3ara un 9 7,7@, la re'i(n de rec8azo es z U 5,?D o z T 5,?D%


Observaci!n.
*'+
Unidad V: Elementos de Inferencia Estadstica
*. !i el estadstico del test es ; como el definido en (5$ " donde 9
7
, entonces, si ;
es menor )ue H5,?D, entonces decimos )ue se rec8aza la 8ip(tesis nula al nivel del
@A%
6% El intervalo de confianza de 577(5$A del par.metro (par.metro po*lacional de
inters$, est. relacionado con una prue*a de 8ip(tesis estadstica, de dos colas, del
par.metro po*lacional, con nivel % En el e-emplo, el intervalo
9, , # 9G* &+ , * t t
n
1

es de tal manera )ue en un muestreo repetitivo, el 577(5
$A 9 ?@A de los intervalos contendr.n al verdadero valor de la media
po*lacional% :omo el valor MM7 no cae dentro de este intervalo, entonces nos
inclinamos a rec8azar la 8ip(tesis de )ue 9 MM7%
*ctividad 6.:"
Un vendedor de coc8es nuevos calcula )ue su compa2a tiene un B,MA de 'anancias
promedio en la venta de los autos nuevos asi'nados% El 'erente de venta apro*( los
precios para producir ese porcenta-e de 'anancias% El due2o de la compa2a )uiere
estar razona*lemente se'uro de )ue la decisi(n es correcta, para ello se toma una
muestra aleatoria de =7 coc8es en la cual se o*tiene una media " un desvo est.ndar del
porcenta-e de 'anancia de B,@A " =,?A respectivamente%
a$ E1amine los datos " utilizando solamente la intuici(n +:ree )ue ellos apo"an la
8ip(tesis del 'erente de venta,
*$ 3ara realizar un test de 8ip(tesis estadstica en este caso usara el estadstico t o
z% E1pli)ue su respuesta%
c1 Usando el procedimiento de un test de 8ip(tesis para la 'anancia media,
+aportan los datos evidencia suficiente )ue indi)ue )ue la poltica del 'erente de
ventas al apro*ar los precios 'enera una 'anancia media de B,MA por coc8e al
nivel del @A,% (!u'erencia: use uno de estos valores para el estadstico
seleccionado ;
(7%76@$
9 5%?D "
( )
$C# . , t
* '$ , $,# . $

1
*'G
Unidad V: Elementos de Inferencia Estadstica
d1 El due2o de la compa2a )uiere estar razona*lemente se'uro de )ue la decisi(n
es correcta " para lo'rarlo, l )uiere contrastar la 8ip(tesis nula con 9 7,75%
(!u'erencia: use uno de estos valores para el estadstico seleccionado ;
(7%77@$
9
6%@M "
( )
G#+C . , t
* '$ , $$# . $

1
e$ Q*ten'a la re'i(n de rec8azo para la prue*a del apartado c$
,1 Cao 57 Test de Hip!tesis para la diferencia de las medias de dos poblaciones.
Supongamos tener dos poblaciones con medias
*
y
,
y con desvos
estndares
*
y
,
respectivamente. Se quiere reali7ar un test de hiptesis para la
diferencia /
*
P
,
1 basado en muestras independientes de tamaFo n
*
y n
,
observaciones. -or lo que el procedimiento a seguir sera
a1 2iptesis nula
2
$
" /
*
P
,
1 E
$
,
donde
$
es alguna diferencia especificada que se quiere probar. En muchos
casos se desear probar la hiptesis de que no hay diferencias entre las medias
de las poblaciones, en cuyo caso
$
ser $ /cero1.
b1 Estimador puntual de la diferencia de las medias poblacionales
1 / , * 1 1
c1 2iptesis alternativa
Tet &e u3a co!a Tet &e &o co!a
2
*
" /
*P

,
1 T
$
/o 2
$
" /
*P

,
1 V
$
1
2
*
"
( )
$ , *
D
d1 Si las poblaciones tienen distribucin normal, o estamos traba!ando con
tamaFos de muestra grande /mayor a '$1, y los desvos estndares de las dos
poblaciones son"
1. 6onocidos y diferentes, entonces el estadstico del test ser
*'9
Unidad V: Elementos de Inferencia Estadstica
( )
( )
( )
,
,
,
*
,
*
$
, *
$
, *
, *
n n
D 1 1 D 1 1
z
1 1

, +16,
donde 7 tiene una distribucin normal con media $ y desvo estndar *,
ba!o la hiptesis nula.
5. 6onocidas e iguales, entonces el estadstico del test ser
( )
, *
$ , *
* *
n n
D 1 1
z
+

+1@,
donde 7 tiene una distribucin normal con media $ y desvo estndar *,
ba!o la hiptesis nula.
6. En el caso de que los desvos poblacionales sean desconocidos e iguales
entonces se utili7a el estimador
( ) ( )
,
* *
, *
,
, ,
,
* *
,
+
+

n n
s n s n
s
p
+15,
Entonces, el estadstico del test toma la forma
( )
, *
$ , *
* *
n n
s
D 1 1
t
p
+

+1A,
que tiene una distribucin t con /n
*
Wn
,
P,1 grados de libertad, ba!o la
hiptesis nula.
Observaci!n.
5% En la situaci(n en )ue no se puede o no se desea 8acer la suposici(n de )ue las dos
po*laciones con varianzas i'uales ten'an distri*uci(n normal, la prue*a t de
varianzas i'uales es robusta (es decir, no sensi*le$ con respecto a las violaciones
moderadas de la suposici(n de normalidad, siempre " cuando el tama2o de muestra
sea 'rande% En tal situaci(n, el test t de varianza con-unta puede utilizarse sin )ue
se vea seriamente afectado en su potencia% 3or otro lado, si el tama2o de muestra es
pe)ue2o " no se puede o no se desea 8acer la suposici(n de normalidad de las
po*laciones, se tiene dos alternativas: (a$ llevar a ca*o al'una transformaci!n
*'&
Unidad V: Elementos de Inferencia Estadstica
normali@ante de los datos, por e-emplo tomar el lo'aritmo de los datos, " lue'o
aplicar el test t a los datos transformadosL (*$ o *ien aplicar a los datos ori'inales
un test de distribuci!n libre o test no paramKtrico como por e-emplo el test de
ran$os de Lilco1on%
@. En el caso en que no se pueda o no se desee hacer la suposicin de que
las poblaciones, normalmente distribuidas, tienen varian7as iguales y si
los desvos estndares son desconocidos, entonces el estadstico del test
tiene la forma
( )
,
,
,
*
,
*
$
, *
n
s
n
s
D 1 1
t
+


, +1B,
donde tX tiene una distribucin t con /1 grados de libertad ba!o la
hiptesis nula, y est dado por
( )
( ) ( )
* *
,
,
,
,
,
*
,
*
,
*
,
,
,
, *
,
*

n
n s
n
n s
n s n s

+1K,
d1 :egin de recha7o
1rue#a &e u3a co!a 1rue#a &e &o co!a
-ara los casos * y ,
7 T 7

/o bien 7 VP 7

1
-ara los casos * y ,
, ,
z z o z z < >
-ara el caso '
t T t

/o bien t VP t

1.
-ara el caso '
, ,
t t o t t < >
-ara el caso C
tX T t

/o bien tX VP t

1.
-ara el caso C
, ,
t t o t t < >
Observaciones.
*C$
Unidad V: Elementos de Inferencia Estadstica
5% El uso del estadstico t " tV re)uiere )ue las muestras sean independientes " ten'an
distri*uci(n normal
6% El uso del estadstico tV re)uiere )ue las po*laciones ten'an distri*uci(n normal%
=% Un intervalo de confianza del 577(5$A para ( )
, *
en el caso 5 est. dado por
( )
1
1
]
1

+ t
,
,
,
*
,
*
,
, *
O &#
n n
z 1 1 I:

+18,
B% Un intervalo de confianza del 577(5$A para ( )
, *
en el caso = est. dado por
( )
1
]
1

+ t
, *
,
, *
O &#
* *
n n
s t 1 1 I:
p
+5I,
con los respectivos 'rados de li*ertad para t
@% Un intervalo de confianza del 577(5$A para ( )
, *
en el caso B est. dado por
( )
1
]
1

+ t
,
,
*
*
,
, *
O &#
n
s
n
s
t 1 1 I:

+51,
con los respectivos 'rados de li*ertad para tV%
D% De las Pltimas o*servaciones se puede inferir, sin ma"ores dificultades, )ue un I:
con una confianza del (5 $577A es e)uivalente a un test de 8ip(tesis de nivel %
De tal manera )ue si el I: no contiene al valor del par.metro indicado en la
8ip(tesis nula, entonces se puede rec8azar dic8a 8ip(tesis%
O% !i se )uiere evaluar las diferencias entre los par.metros de m.s de dos 'rupos, por
e-emplo la dura*ilidad de distintos tipos de cu*iertas, no es correcto realizar tales
evaluaciones usando el test de diferencias de medias tomando los diferentes pares
de medias por razones cu"a e1plicaci(n formal est. fuera del alcance del curso%
3ara solucionar este pro*lema si las mediciones resultantes son continuas " se
cumplen las si'uientes suposiciones: i$ los datos son o*tenidos de manera aleatoria
e independiente o )ue los individuos sean asi'nados a los 'rupos aleatoriamente, ii$
los valores de cada 'rupo est.n distri*uidos normalmente, iii$ la varianza dentro de
cada po*laci(n de*era ser i'ual para todas las po*laciones, e1iste una
metodolo'a conocida como an.lisis de varianza (A<QVA$ para comparar la
*C*
Unidad V: Elementos de Inferencia Estadstica
medias de los 'rupos " cu"a 8ip(tesis nula es N
7
:
5
9
6
9 /9
I
% 3or otra parte,
si los supuestos ii$ o iii$ no se cumplen e1isten metodolo'as )ue permiten todava
llevar ca*o las comparaciones deseadas%
E)e%'!o 1I7 Una compa2a desea comparar las e1pectativas salariales anuales de su
personal de ventas femenino " masculino, se'Pn un nuevo plan de compensaciones
so*re ventas, mas comisi(n% !e seleccion( al azar muestras de tama2o B7, una del
personal masculino " otra del personal de ventas femenino " se les pidi( )ue di-eran
sus in'resos anuales *a-o el nuevo plan% &as medias muestrales " las desviaciones
muestrales resultaron en
,#+& % ,'*, %
,&GC# % '*$9' %
, *
, *


s s
1 1
&a pre'unta )ue sur'e es, +proporcionan los datos evidencia )ue indi)ue una
diferencia en el promedio de in'reso anual esperado tanto entre los vendedores como
las vendedoras,%
Wa )ue se espera una diferencia en el promedio del in'reso anual entre las vendedoras
" los vendedores, es decir,
5 T

6
o *ien
5 U

6
, la 8ip(tesis nula para el test ser.
N
7
:
5 9

6
es decir N
7
:
5

6
9 D
7
9 7
contra la alternativa
( ) $ " "
, * * , * *
N decir es N
!i se supone )ue las po*laciones de los in'resos son normales con diferentes desvos
est.ndares " puesto )ue ellos son desconocidos, se los estima con s
5
" s
6
% &ue'o, el
estadstico del test est. dado por (5O$, es decir,
( ) ( )
( ) ( )
C# , ,
C$
,#+&
C$
,'*,
$ ,&GC# '*$9' $
, ,
,
,
,
*
,
*
, *

n
s
n
s
1 1
t
Al utilizar una prue*a de dos colas con 9 7,7@, se considerar. >6 9 7,76@ en cada
cola de la distri*uci(n del estadstico " se rec8aza N
7
si el valor encontrado es ma"or
)ue
&& . *
1 , / ,
, *

+n n
t

o menor )ue
&& . *
1 , / ,
, *

+n n
t

%
*C,
Unidad V: Elementos de Inferencia Estadstica
3uesto )ue, el valor o*servado t 9 6,B@ es ma"or )ue 5,??, el estadstico de la prue*a
cae en la zona de rec8azo% 3or lo tanto se rec8aza N
7
" se conclu"e )ue HaI evidencia
suficiente para ase$urar ue en las e1pectativas salariales anuales para los
vendedores es maIor ue para las vendedoras%
*ctividad 6.A.
*. -ara comparar las aptitudes para seleccionar acciones por parte de dos 40Y-, se
comparan las ganancias anuales /menos los honorarios1 para una inversin de %*$$$
/dlares1 en cada una de las '$ acciones que se encuentran en las listas de las >ms
recomendadas? de ambas empresas. .as medias y los desvos estndares /en dlares1
para cada una de las muestras, se indican en la tabla siguiente
Estadstica muestral
Empresa
5 6
#ama2o =7 =7
Kedia 6DB 5??
Desvo est.ndar 5@O 555
+Na" evidencia con los datos )ue indi)ue una diferencia entre las dos empresas
de correta-e en las 'anancias medias por acci(n recomendada,
a$ Esta*lezca N
7
*$ Enuncie la 8ip(tesis alternativa )ue m.s conviene para contestar la
pre'unta e1puesta antes%
c$ Q*ten'a la re'i(n de rec8azo para 9 7,7@%
d$ Realice la prue*a " sa)ue sus conclusiones%
e$ Q*ten'a el correspondiente Intervalo de :onfianza para la diferencia de las
medias " compare las conclusiones )ue se pueden ela*orar con l con
a)uellas o*tenidas por el test de 8ip(tesis%
*C'

You might also like