You are on page 1of 7

Captulo 7

cJo

. a

Ensoyo de hiptesis y srgnlllc(Iclon


DECISIONES ESTADISTICAS

Muy a menudo, en la prctica se tienen que tomar decisiones sobre poblaciones, partiendo de la
informacin muestral de las mismas. Tales decisiones se llaman decisiones estadsticag Por ejemplo,
se puede querer decidir a partir de los datos del muestreo, si un suero nuevo es realmente efectivo
para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda
determinada est o no cargada, etc.

HIPOTESIS ESTADISTICAS. HIPOTESIS NULA


Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las
poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hiptesis
estadsticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones.

En muchos casos se formulan las hiptesis estadsticas con el solo propsito de rechazarlas o
invalidarlas. Por ejemplo, si se quiere decidir si una moneda est cargada, se formula la hiptesisde
que la moneda est. bien, es decir, p : 0.5; donde p es la probabilidad de cara. Anlogamente, si se
quiere decidir sobre si un procedimiento es mejor que otro, se formula la hiptesis de que no hay
encia observada se debe meramente a
diferencia entre ios procedimientos (es decir,
hiptesis se llaman tambin hiptests
fluctuaciones en el muestreo de la misma po
y
por
flo
denotan
.
nulns se
Cualquier hiptesis quedifiera de una hiptesis dada se llamahiptesis alternatiuc. Por ejemplo,

siunahiptesis-esp:'0.5,hiptesisalternativassonp:O.7;p#O.56p>0.5.Unahiptesis
alternativa de la hiptesis nula se denota por

Ilt .

ENSAYOS DE HIPOTESIS Y SIGNIFICACION

Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que los resultados
observados en una muesha aleatoria difieren macadamente de aquellos que caba esperar con la
hiptesis y con la variacin propia del muestreo, se dira que las diferencias observadas son significatiws y se estara en condiciones de rechazar la hiptesis (o al menps no aceptarla de acuerdo con la

evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se


estara inclinado a rechazar la hiptesis de que la moneda est: bien, aunque sera posible que fuese
un rechazamiento enneo.
Los procedimientos que facilitan el decidir si una hiptesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman
ensayos de hiptesis, ensoyos de significacin o reglas de decisin.
ERRORES DE TIPO

I Y TIPO II

Si se rechaza una hiptesis cuando debera ser aceptada, se dice que se comete vn error del Tipo
se acepta una hiptesis que debera ser rechazada, se dice que se comete un

/. Si por el contrario,

277

212

ENSAYOS DE HIPOTESIS Y SIGNIFICACION

error del Tipo

II. En cualquiera de los dos casos se comete

[cAP.

un error al tomar una decisin equivoca-

da.

Para que cualquier ensayo de hiptesis o reglas de decisin sea bueno, debe disearse de forma
que minimice los errores de decisin. Esto no es tah sencillo como pueda parecer puesto que para un
tamao de muestra dado, un intento de disminuir un tipo de error, va generalmente acompado por
un incremento en el otro tipo de error. En la prctica, un tipo de error puede tener ms importancia
que el otro, y as se tiende a conseguir poner una limitacin al error de mayor importancia. La nica
forma de reducir al tiempo ambos tipos de error es incrementar el tamao de la muestra, lo cual
puede ser o no ser posible.

NIVEL DE SIGNIFICACION
La probabilidad mxima con la que en el ensayo de una hiptesis se puede cometer un error del
Tipo I se llama niuel de significacn del ensayo. Esta probabilidad se denota frecuentemente por o;
generalmente se fija antes de la extraccin de las muestras, de modo que los resultados obtenidos no
influyen en la eleccin.
En la prctica se acostumbra a utilizar niveles de significacin del 0.05 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un nivel de significacin del O.05 6 6"/,, al
disear un ensayo de hiptesis, entonces hay aproximadamente 5 ocasiones en 100 en que se
rechazara la hiptesis cuando debera ser aceptada, es decir, se est con un 95% de confianza de
que se toma la decisin adecuada. En tal caso se dice que la hiptesis ha sido rechazada aI niuel de
significacin del O.O5,lo que significa que se puede cometer error con una probabilidad de 0.05.
ENSAYOS REFERENTES A LA DISTRIBUCION NORMAL
Paa aclarar las ideas anteriores, supngase que con una hiptesis dada, la distribucin muestral
de un estadstico S es una distribucin normal con media p" y desviacin tpica o". Entonces la
distribucin de la variable tipificada dada por Z : (S ,.)/o.,
es una normal tipificada (media 0, varianza 1) y se muestra en la
Fig. 7-1.

Como se indica en la figura, se puede estar con el 957o de


confianza de que, si la hiptesis es cierta, el valor de e obtenido
de una muestra real para el estadstico S se encontrar entre 1.96 y 1.96 (puesto que el rea bajo la curva normal entre estos
valores es 0.95).

--lglj

.=lD6

I'ig.7-l
Sin embargo, si al elegir una muestra aleatoria se encuentra
que z para ese estadstico se halla fuera del recorrido
- 1.96 a
1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (rea sombreada de la
figura) si la hiptesis fuese verdadera. Entonces puede decirse que esta z difiere signifcatiuamente
de la que caba esperar bajo esta hiptesis y se estara inclinado a rechazar la hiptesis.

El rea total sombreada 0.05 es el nivel de significacin del ensayo. Representa la probabilidad
de rumeter error al recbazar la hiptesis es decir, la probabilidad de cometer error del Tipo I. As
pues, se dice que la hiptesis se rechaza al niuel de significacin del0.05 o que la z obtenida del
estadstico muestral dado es significatiua al niuel de significacin del 0.O6El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama
regin crtica o regin de rechace de Ia hiptes's o regin de significacin.El conjunto de lasz que
se encuentran dentro del recorrido - 1.96 a 1.96 poda entonces llamase regin de aceptacin de h
hiptesis o regin de no significacin.
De acuerdo con lo dicho hasta ahora, se puede formula la siguiente regla de decisin o ensayo
de hiptesis o signi{icacin:

(o) Se rechaza la hiptesis al nivel de significacin del0.05 si la z obtenida para el estadstico S


se encuentra fuera del recorrido - 1.96 a 1.96 (es decir, z > I.96 z 1- 1.96). Esto
equivale a decir que el estadstico muestral observado es significativo al nivel del 0.05.

cAP.7l

(b)

2L3

ENSAYOS DE HIPOTESIS Y SIGNIFICACION

Se acepta Ia hiptesis (o si se desea no se toma decisin alguna) en caso conhario.

Debe ponerse de manifiesto que puedgn igualmente emplearse otros niveles de significacin. Por
ejemplo, si se utilizase el nivel del 0.01 se sustituira 1.96 en todo lo visto anteriormente por 2.58
(vase Tabla 7-L). La Tabla 6-1, pgina 195, puede tambin emplearse, puesto que la suma del nivel
de significacin y el nivel de confianza es L00%.

ENSAYOS DE UNA Y DOS COLAS

En el ensayo anterior se atenda a los valores extremos del estadstico S o su correspondiente z a


ambos lados de la media, es decir, en las dos "colas" de la distribucin. Por esta raz6n, tales ensayos
se llaman ensayos de dos colns o ensayos bilaterales.
Si4 embargo, con frecuencia se puede estar solamente interesado en los valores extremos a un
solo lado de I media, es decir, en una "cola" de la distribucin, como por ejemplo, cuando se est
ensayando la hiptesis de que un proceso es mejor que otro (que es diferente a ensayar si un proceso
es mejor o peor que otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En
tales casos, Ia regin crtica es una regin a un lado de la distribucin, con rea igual al nivel de
significacin.
La Tabla 7-1, que da los valores crticos de z para ensayos de una y dos colas a distintos niveles
de significacin, ser de utitidad para propsitos de referencia. Valores crticos de z para otros
nivelei de significacin, se pueden encontrar utilizando la tabla que da las reas bajo la curva
normal.
Tabla 7-1

Nivel de significacin o

0.10

Valores crticos de z para


ensayos unilaterales

Valores crticos de z para


ensayos bilaterales

001

0.05

-t.28

-1.6

45

1.28

1.645

-1.645

1.96
1.96

1.645

0.005

-2.58

-2.33

c 2.33

-2.58

2.58

-2.81

2.58

2.8I

0.002

-2.88

2.88

-3.08
y 3.08

ENSAYOS ESPECIALES DE SIGNIFICACION PARA GRANDES MUESTRAS


Para muestras grandes, las distribuciones muestrales de muchos estadsticos son distribuciones
casos' se pueden
tpica
a !s V
casi
normales
tesis y significan o en
reglas
ante
utilizar lo
de inters prctl
de los
ente u
asos
cin. Los
co. En cada caso, los resultados son para poblaciones infinitas o para muestreo con remplazamiento'
Para muestreo sin remplazamiento de poblaciones finitas los resultados debern modificarse. Vanse
pginas 158 y 160.

1.

Medias.

Aqu S :

media muestral; tss =,.i: t, media poblacional; o, = op: o/1/i, donde o es la


desviacin tpica poblacional y n es el tamao de la muestra. La variable tipificada viene dada
por

X,la

X-,,
Z = -.-:
1V11,

(f)

Cuando es necesrio se utiliza la desviacin muestral observada s ( G), para estimar o.


Para ensayar la hiptesis nula

-EI6

de que la media poblacional es p

o utilizaamos el estadsti-Ee (o al menos no lo

co (I ). Entonces, utilizando un ensayo de dos colas, aceptaramos

2I4

ENSAYoS DE HIPoTESIs Y sIGNIFIcAcIoN

rechazaramos) al nivel 0.05 si pa una muestra especfica de tamao n con media

-1.e6

= "+ =

1.e6

lcAP.

r
(2)

y lo rechazaramos por el contrario. Para otros niveles de significacin cambiaramos (2) apropiadamente.
Para ensayar la hiptesis de que la media poblacional es mayor que o utilizamos aun la hiptesis
nula I/o de que es igual a a. Entonces, utilizando un ensayo de una cola, aceptaramos Ilo (o al
menos no la rechazaramos) al nivel 0.05 si

ry
olVn

(vase Tabla 7-1). Para ensay la hiptesis de que la media poblacional es menor que a acepta-

ramos.EIo al nivel 0.05 si

i
2.

(4)

Proporciones.

Aqu S : P, la proporcin de "xitos" en una muestra; r" : ltp : p, donde p es la proporcin


y n es el tamao de la muestrsi o" : o, : ltulln, donde e : ! - p. La
variable tipificada viene dada por

de xitos en la poblacin

P-p

z:
En el caso de que P .= X/n, donde X

es el

en

(5)

\/pql"

nmero real de xitos en una muestra, (5) se convierte

Z= X-np

(6)

\nLPrI

Consideraciones semejantes a las hechas anteriormente para medias pueden hacerse.

3.

Diferencias de medias.
Sean Xr V iz las medias muestrales obtenidas en dos muestras gtandes de tamao nt y nz
extradas de poblaciones respectivas qqe tienen de media lt y ttz y desviaciones tpicas ot y oz.
Considrese la hiptesis nula de que no hay diferencia entre las medias poblacionales, es decir,
lt : !z- De (//), pgina 159, haciendo gr : Irz s ve que la distribucin muestral de la
diferencia de medias se distribuye aproximadamente como una normal con media y desviacin
tpica dadas por

,r.*r_*,

O:.

'\ l

(7)

x2

donde se puede, si es necesario, utilizar las desviaciones tpicas muestrales sr V sz ( 0t y 3,


como estimas de or y 02.

Con la variable tipificada dada por

X,-X2-0
z _:.-'.;;.;,_

Xr-X"

\;

18)

de una manera semejante a la descrita en la Pate 1 se puede ensayar la hiptesis nula contra la
hiptesis alternativa (o la significacin de una diferencia observada) a un nivel de significacin
apropiado.

4.

2L6

ENSAYOS DE HIPOTESIS Y SIGNIFICACION

cAP. 7l

Diferencias de Proporciones.

y P2 las proporciones muestrales de dos grandes muestras de tamaos txt Y ttz extradas
de poblaciones respectivas que tienen proporciones pr V p2 . Considrese la hiptesis nula de que
no hay diferencia entre los parmetros poblacionales, es decir, p1 : p2, y as lasmuestras son
realmente extradas de la misma poblacin.

Sean P1

De (JJ), pgina 159, haciendop, : pz: P, se ve que la


de pioporcines se distribuye aproximadamente como una
dadas por

Itn, r" : 0
donde P =

t;T;-

se

traldeladiferencia
y desviacin tpica

orr-*, =

(e)

utiliza como una estima de la proporcin poblacionalp.

Con la variable tipificada

v _ Pt-Pz-O

"Pf

Pt-Pz
oPf

(10)

P,

se puede ensayar las diferencias observadas a un nivel de significacin apropiado

y de este modo

ensayu la hiptesis nula.

Ensayos referentes a otros estadsticos pueden disearse anlogamente. (vase Tabla 5-1, pgina

162).
ENSAYOS ESPECIALES DE SIGNIFICACION PARA PEQUEAS MUESTRAS
En el caso de pequeas muestras (n < 30) podemos formular ensayos de hiptesis y significacin
utilizando otras distribuciones adems de la normal. como Ia de Student, chi-cuadrado, F, etc.
Estas distribuciones incluyen la teora de muestreo exacto y lgicamente son vlidas an cuando las
muestras son grandes, en cuyo caso se reducen a las dadas anteriormente. Los siguientes son algunos
ejemplos.

1.

Medias.
Para ensayar la hiptesis

IIo

de que una poblacin normal tiene de media r utilizamos

X-,
q1
,t.:
_s-6-: X-l
?/t

(1

1)

es la media de una muestra de tamao n. Esto es anlogo al utilizar la variable


A
X-,t
para grandes n, excepto que se utiliza 3:tftl@=TS enlugardeo. La
tipificada t =:#

donde

diferencia estriba en que mientras Z se distribuye normalmente, ? sigue una distribucin de


no es exactamente
Student. Los resultados tambin pueden emplearse cuando la distribucin
normal pero tiene una curva de distribucin en forma de campana. Ensayos de hiptesis semejantes a los de las medias en la pgina 213 pueden hacerse empleando valores crticos de en
cambio de valores crticos de z.

2.

Diferencias de medias.
Supngase que se extraen aleatoriamente dos muestras de tamaos nr Y n, de poblaciones
normales cuyas desviaciones tpicas son iguales (ot: o2). $upngase tambin que estas_dos
muestras tienen medias y desviaciones tpicas dadas por X,, X: y Sr l 52 , respectivamente. Para
ensayar la hiptesis I/o de que las muestras provienen de la misma poblacin (es decir, Pt : trz
lo mismo que 01 : sz) se utiliza el valor de dado por

T-

Xt-Xz

11
"\l nr- n"
1

donde

rrS?

n:S:2

rr+n!-2

(1

2)

ENsAyos DE HrporEsrs y

2L6

srcNrFrcAcroN

Se'tt. t

La distribucin de ? es una distribucin de Student conv: n, * n., -2 gradosde'libertad. El


empleo de (12) est plenamente justificado al hacer o, - oz : o en(12), pgina 159, y despus
utilizar como estima de o2 la media ponderada
(n,

- 1)^ii + fn, - J)9j

(rz'

1)

(nz

-1)--

donde ^31 t ,3 son estimas insesgadas de oi


combinar los datos.

3.

n,s? +

l'

n,s',

n.;t

y o!. Esta es la uarianza

combinada obtenida al

Varianzas.

Para ensayar la hiptesis 116 de que una poblacin normal tiene varianza o2 consideramos la
variable aleatoria
(13)

que (vase pgrna 161) tiene la distribucin chi-cuadrado con n - 1 grados de libertad. Entonces
si una muestra aleatoria de tamao n tiene varianza s2 aceptaramos flo , basados en el ensayo de
dos colas, (o al menos no la rechazaramos) en el nivel 0.05 si
o<nsz<

(14)

X.'oz

y la rechazaramos de otra forma. Un resultado

semejante puede obtenerse para el nivel 0.01 u

otro nivel.
Para ensayar la hiptesis H, de que la varanza poblacional es mayor que o2 emplearamos la
hiptesis rilo , pero entonces emplearamos un ensayo de una cola. Por tanto rechazaramos Hs,
en el nivel 0.05 (y por tanto concluiramos que f/, es correcta) si la varianza muestral especfi-

ca, s2, fuera tal

que

nsz

t2

y aceptaramos IIo (o al menos no la rechazaramos) de otra forma.

4.

Relaciones de varianzas.

En algunos problemas deseamos decidir si dos muestras de tamaos m y n respectivamente,


cuyas varianzas medidas son sl y sr2, provienen o no de la misma poblacin normal. En este caso
utilizamos el estadstico (vase pgina 161)

F=

(16)

fi, fi son las varianzas de las dos poblaciones normales de donde se extraen las muestras.
Si /o denota la hiptesis nula de que no hay diferencia entre las varianzas poblacionales, es
decir = o3. Bajo esta hiptesis (16) se convierte en

donde

"!

F::-l

q2

(17)

q2
\,.)

Para ensayar esta hiptesis al nivel 0.1.0, por ejemplo, primero anotamos que F en (16) tiene la
distribucin F con fr - t, n - 1 grados de libertad. Entonces, utilizando un ensayo de dos colas,
aceptaramos,EIo (o no la rechazar4mos) en el nivel 0.10 si

Fo,

;s

F'o.

(/8)

y lo rechazaramos en el caso contrario.


Procedimientos semejantes empleando ensayos de una cola pueden formularse en el caso que
deseemos ensayar la hiptesis de que una varianza poblacional determinada sea mayor que otra.

ENSAYOS DE HIPOTESIS Y SIGNIFICACION

cAP. 7l

2t7

R,ELACION ENTRE LA TEORIA DE ESTIMACION

Y ENSAYO DE HIPOTESTS

las
estimacin
notamos q

se puede obsenrar que existe

De

alos de confianza y la teora de en


aceptar flo en el nivel 0.05 es eq
pigtm 195 conducente al intervalo de confianzadel96"/o

_ L.elo

eora de
ejemplo,

(/ ) en la
(1e)

vn

vn

Por tanto, al menos en el caso de los ensayos de dos colias, poamos realmente emplear el intervalo
de confiaza del Captulo 6 para esayar ttiptesir. Un resultado semejante para_ ensayos de una cola
requerira intervaloi de confianza unilaterals. A pesar de que la necesidad de tales intervalos es rara'
es posible definirlos (vase Problema 7.136 y tambin Problema 6.14).
CURVAS CARACTERISTICAS DE OPERACION. POTENCIA DE UN ENSAYO
Se ha visto cmo el error del Tipo I pued,
significacin. Es posible evitar el riesgo de error <
nunca la hiptesis. Sin embargo, en muchos casos
utilizan a menudo curuos caracterstcas de Ia opet
las probabilidades de errores del Tipo II bajo dife
cmo en ensayos dados se logra minimizar los errt
ensayo para evitar el toma decisiones equivoci
mostrar, por ejemplo, qu tamaos de muestras deben emplearse.

GRAFICOS DE CONTROL DE CALIDAD


Es a menudo en la prctica

importante conocer cundo un proceso ha cambiado suficientemente,

de modo que puedan darse los

pasos

la

si

rpid
ejemplo en control de calidad, donde s
camb
se deben simplemente a fluctuaciones
causa de deterioro en las mquinas, rrores de los empleados, etc. Los grficos de control suministran un mtodo til y sencillo para tratar tales problemas (vase Problema 1.29).

AJUSTE DE LAS DISTRIBUCIONES TEORICAS A DISTRIBUCIONES


DE FRECUENCIA MUESTRALBS
Cuando se tiene algiuna indicacin sobre la
probabilsticos u otra causa, es posible frecuenten
llamadas "modelos" o distribuciones "esperadas")
tras de la poblacin. El mtodo utilizado general:
tpica de la muestra para estimar la media y des
7.30,7.32 y 7.33.

a la bondad d.el aiuste de las distribuciones tericas a las distribuciones


muestrales es esencialmente el mismo que l de decidir si hay diferencias importantes entre los
de significacln imporante para la bondad del
valores cle la poblacin y la muestra. tt
"trrayo
se describe ms adelante.
ajuste de distribuciones teric as, el enmyo chi-cuadrado,
El problema de

ensay

En un intento para determina si una distribucin normal representa un buen ajuste para datos
dados, conviene utllizar papel grfico de curua normal o papel grfico de probabilidad, como a veces
se le llama (vase Problema 7.31).

You might also like