Professional Documents
Culture Documents
cJo
. a
Muy a menudo, en la prctica se tienen que tomar decisiones sobre poblaciones, partiendo de la
informacin muestral de las mismas. Tales decisiones se llaman decisiones estadsticag Por ejemplo,
se puede querer decidir a partir de los datos del muestreo, si un suero nuevo es realmente efectivo
para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda
determinada est o no cargada, etc.
En muchos casos se formulan las hiptesis estadsticas con el solo propsito de rechazarlas o
invalidarlas. Por ejemplo, si se quiere decidir si una moneda est cargada, se formula la hiptesisde
que la moneda est. bien, es decir, p : 0.5; donde p es la probabilidad de cara. Anlogamente, si se
quiere decidir sobre si un procedimiento es mejor que otro, se formula la hiptesis de que no hay
encia observada se debe meramente a
diferencia entre ios procedimientos (es decir,
hiptesis se llaman tambin hiptests
fluctuaciones en el muestreo de la misma po
y
por
flo
denotan
.
nulns se
Cualquier hiptesis quedifiera de una hiptesis dada se llamahiptesis alternatiuc. Por ejemplo,
siunahiptesis-esp:'0.5,hiptesisalternativassonp:O.7;p#O.56p>0.5.Unahiptesis
alternativa de la hiptesis nula se denota por
Ilt .
Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que los resultados
observados en una muesha aleatoria difieren macadamente de aquellos que caba esperar con la
hiptesis y con la variacin propia del muestreo, se dira que las diferencias observadas son significatiws y se estara en condiciones de rechazar la hiptesis (o al menps no aceptarla de acuerdo con la
I Y TIPO II
Si se rechaza una hiptesis cuando debera ser aceptada, se dice que se comete vn error del Tipo
se acepta una hiptesis que debera ser rechazada, se dice que se comete un
/. Si por el contrario,
277
212
[cAP.
da.
Para que cualquier ensayo de hiptesis o reglas de decisin sea bueno, debe disearse de forma
que minimice los errores de decisin. Esto no es tah sencillo como pueda parecer puesto que para un
tamao de muestra dado, un intento de disminuir un tipo de error, va generalmente acompado por
un incremento en el otro tipo de error. En la prctica, un tipo de error puede tener ms importancia
que el otro, y as se tiende a conseguir poner una limitacin al error de mayor importancia. La nica
forma de reducir al tiempo ambos tipos de error es incrementar el tamao de la muestra, lo cual
puede ser o no ser posible.
NIVEL DE SIGNIFICACION
La probabilidad mxima con la que en el ensayo de una hiptesis se puede cometer un error del
Tipo I se llama niuel de significacn del ensayo. Esta probabilidad se denota frecuentemente por o;
generalmente se fija antes de la extraccin de las muestras, de modo que los resultados obtenidos no
influyen en la eleccin.
En la prctica se acostumbra a utilizar niveles de significacin del 0.05 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un nivel de significacin del O.05 6 6"/,, al
disear un ensayo de hiptesis, entonces hay aproximadamente 5 ocasiones en 100 en que se
rechazara la hiptesis cuando debera ser aceptada, es decir, se est con un 95% de confianza de
que se toma la decisin adecuada. En tal caso se dice que la hiptesis ha sido rechazada aI niuel de
significacin del O.O5,lo que significa que se puede cometer error con una probabilidad de 0.05.
ENSAYOS REFERENTES A LA DISTRIBUCION NORMAL
Paa aclarar las ideas anteriores, supngase que con una hiptesis dada, la distribucin muestral
de un estadstico S es una distribucin normal con media p" y desviacin tpica o". Entonces la
distribucin de la variable tipificada dada por Z : (S ,.)/o.,
es una normal tipificada (media 0, varianza 1) y se muestra en la
Fig. 7-1.
--lglj
.=lD6
I'ig.7-l
Sin embargo, si al elegir una muestra aleatoria se encuentra
que z para ese estadstico se halla fuera del recorrido
- 1.96 a
1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (rea sombreada de la
figura) si la hiptesis fuese verdadera. Entonces puede decirse que esta z difiere signifcatiuamente
de la que caba esperar bajo esta hiptesis y se estara inclinado a rechazar la hiptesis.
El rea total sombreada 0.05 es el nivel de significacin del ensayo. Representa la probabilidad
de rumeter error al recbazar la hiptesis es decir, la probabilidad de cometer error del Tipo I. As
pues, se dice que la hiptesis se rechaza al niuel de significacin del0.05 o que la z obtenida del
estadstico muestral dado es significatiua al niuel de significacin del 0.O6El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama
regin crtica o regin de rechace de Ia hiptes's o regin de significacin.El conjunto de lasz que
se encuentran dentro del recorrido - 1.96 a 1.96 poda entonces llamase regin de aceptacin de h
hiptesis o regin de no significacin.
De acuerdo con lo dicho hasta ahora, se puede formula la siguiente regla de decisin o ensayo
de hiptesis o signi{icacin:
cAP.7l
(b)
2L3
Debe ponerse de manifiesto que puedgn igualmente emplearse otros niveles de significacin. Por
ejemplo, si se utilizase el nivel del 0.01 se sustituira 1.96 en todo lo visto anteriormente por 2.58
(vase Tabla 7-L). La Tabla 6-1, pgina 195, puede tambin emplearse, puesto que la suma del nivel
de significacin y el nivel de confianza es L00%.
Nivel de significacin o
0.10
001
0.05
-t.28
-1.6
45
1.28
1.645
-1.645
1.96
1.96
1.645
0.005
-2.58
-2.33
c 2.33
-2.58
2.58
-2.81
2.58
2.8I
0.002
-2.88
2.88
-3.08
y 3.08
1.
Medias.
Aqu S :
X,la
X-,,
Z = -.-:
1V11,
(f)
-EI6
2I4
-1.e6
= "+ =
1.e6
lcAP.
r
(2)
y lo rechazaramos por el contrario. Para otros niveles de significacin cambiaramos (2) apropiadamente.
Para ensayar la hiptesis de que la media poblacional es mayor que o utilizamos aun la hiptesis
nula I/o de que es igual a a. Entonces, utilizando un ensayo de una cola, aceptaramos Ilo (o al
menos no la rechazaramos) al nivel 0.05 si
ry
olVn
(vase Tabla 7-1). Para ensay la hiptesis de que la media poblacional es menor que a acepta-
i
2.
(4)
Proporciones.
de xitos en la poblacin
P-p
z:
En el caso de que P .= X/n, donde X
es el
en
(5)
\/pql"
Z= X-np
(6)
\nLPrI
3.
Diferencias de medias.
Sean Xr V iz las medias muestrales obtenidas en dos muestras gtandes de tamao nt y nz
extradas de poblaciones respectivas qqe tienen de media lt y ttz y desviaciones tpicas ot y oz.
Considrese la hiptesis nula de que no hay diferencia entre las medias poblacionales, es decir,
lt : !z- De (//), pgina 159, haciendo gr : Irz s ve que la distribucin muestral de la
diferencia de medias se distribuye aproximadamente como una normal con media y desviacin
tpica dadas por
,r.*r_*,
O:.
'\ l
(7)
x2
X,-X2-0
z _:.-'.;;.;,_
Xr-X"
\;
18)
de una manera semejante a la descrita en la Pate 1 se puede ensayar la hiptesis nula contra la
hiptesis alternativa (o la significacin de una diferencia observada) a un nivel de significacin
apropiado.
4.
2L6
cAP. 7l
Diferencias de Proporciones.
y P2 las proporciones muestrales de dos grandes muestras de tamaos txt Y ttz extradas
de poblaciones respectivas que tienen proporciones pr V p2 . Considrese la hiptesis nula de que
no hay diferencia entre los parmetros poblacionales, es decir, p1 : p2, y as lasmuestras son
realmente extradas de la misma poblacin.
Sean P1
Itn, r" : 0
donde P =
t;T;-
se
traldeladiferencia
y desviacin tpica
orr-*, =
(e)
v _ Pt-Pz-O
"Pf
Pt-Pz
oPf
(10)
P,
y de este modo
Ensayos referentes a otros estadsticos pueden disearse anlogamente. (vase Tabla 5-1, pgina
162).
ENSAYOS ESPECIALES DE SIGNIFICACION PARA PEQUEAS MUESTRAS
En el caso de pequeas muestras (n < 30) podemos formular ensayos de hiptesis y significacin
utilizando otras distribuciones adems de la normal. como Ia de Student, chi-cuadrado, F, etc.
Estas distribuciones incluyen la teora de muestreo exacto y lgicamente son vlidas an cuando las
muestras son grandes, en cuyo caso se reducen a las dadas anteriormente. Los siguientes son algunos
ejemplos.
1.
Medias.
Para ensayar la hiptesis
IIo
X-,
q1
,t.:
_s-6-: X-l
?/t
(1
1)
donde
2.
Diferencias de medias.
Supngase que se extraen aleatoriamente dos muestras de tamaos nr Y n, de poblaciones
normales cuyas desviaciones tpicas son iguales (ot: o2). $upngase tambin que estas_dos
muestras tienen medias y desviaciones tpicas dadas por X,, X: y Sr l 52 , respectivamente. Para
ensayar la hiptesis I/o de que las muestras provienen de la misma poblacin (es decir, Pt : trz
lo mismo que 01 : sz) se utiliza el valor de dado por
T-
Xt-Xz
11
"\l nr- n"
1
donde
rrS?
n:S:2
rr+n!-2
(1
2)
ENsAyos DE HrporEsrs y
2L6
srcNrFrcAcroN
Se'tt. t
(rz'
1)
(nz
-1)--
3.
n,s? +
l'
n,s',
n.;t
combinada obtenida al
Varianzas.
Para ensayar la hiptesis 116 de que una poblacin normal tiene varianza o2 consideramos la
variable aleatoria
(13)
que (vase pgrna 161) tiene la distribucin chi-cuadrado con n - 1 grados de libertad. Entonces
si una muestra aleatoria de tamao n tiene varianza s2 aceptaramos flo , basados en el ensayo de
dos colas, (o al menos no la rechazaramos) en el nivel 0.05 si
o<nsz<
(14)
X.'oz
otro nivel.
Para ensayar la hiptesis H, de que la varanza poblacional es mayor que o2 emplearamos la
hiptesis rilo , pero entonces emplearamos un ensayo de una cola. Por tanto rechazaramos Hs,
en el nivel 0.05 (y por tanto concluiramos que f/, es correcta) si la varianza muestral especfi-
que
nsz
t2
4.
Relaciones de varianzas.
F=
(16)
fi, fi son las varianzas de las dos poblaciones normales de donde se extraen las muestras.
Si /o denota la hiptesis nula de que no hay diferencia entre las varianzas poblacionales, es
decir = o3. Bajo esta hiptesis (16) se convierte en
donde
"!
F::-l
q2
(17)
q2
\,.)
Para ensayar esta hiptesis al nivel 0.1.0, por ejemplo, primero anotamos que F en (16) tiene la
distribucin F con fr - t, n - 1 grados de libertad. Entonces, utilizando un ensayo de dos colas,
aceptaramos,EIo (o no la rechazar4mos) en el nivel 0.10 si
Fo,
;s
F'o.
(/8)
cAP. 7l
2t7
Y ENSAYO DE HIPOTESTS
las
estimacin
notamos q
De
_ L.elo
eora de
ejemplo,
(/ ) en la
(1e)
vn
vn
Por tanto, al menos en el caso de los ensayos de dos colias, poamos realmente emplear el intervalo
de confiaza del Captulo 6 para esayar ttiptesir. Un resultado semejante para_ ensayos de una cola
requerira intervaloi de confianza unilaterals. A pesar de que la necesidad de tales intervalos es rara'
es posible definirlos (vase Problema 7.136 y tambin Problema 6.14).
CURVAS CARACTERISTICAS DE OPERACION. POTENCIA DE UN ENSAYO
Se ha visto cmo el error del Tipo I pued,
significacin. Es posible evitar el riesgo de error <
nunca la hiptesis. Sin embargo, en muchos casos
utilizan a menudo curuos caracterstcas de Ia opet
las probabilidades de errores del Tipo II bajo dife
cmo en ensayos dados se logra minimizar los errt
ensayo para evitar el toma decisiones equivoci
mostrar, por ejemplo, qu tamaos de muestras deben emplearse.
pasos
la
si
rpid
ejemplo en control de calidad, donde s
camb
se deben simplemente a fluctuaciones
causa de deterioro en las mquinas, rrores de los empleados, etc. Los grficos de control suministran un mtodo til y sencillo para tratar tales problemas (vase Problema 1.29).
ensay
En un intento para determina si una distribucin normal representa un buen ajuste para datos
dados, conviene utllizar papel grfico de curua normal o papel grfico de probabilidad, como a veces
se le llama (vase Problema 7.31).