You are on page 1of 10

Estructura de este tema

Tema 3 I Que es un contraste de hipotesis?


Contrastes de hipotesis I Elementos de un contraste: hipotesis, tipos de error, nivel de
significacion, region crtica.
I Contrastes para la media de una poblacion normal
Jose R. Berrendero I Comparacion de dos medias: muestras independientes y datos
Departamento de Matem aticas emparejados (solo se tratara el caso de varianzas iguales)
Universidad Aut
onoma de Madrid I Contrastes para una proporcion
I Comparacion de dos proporciones

Que es un contraste de hipotesis? Ejemplo


Los refrescos de cola light utilizan edulcorantes artificiales que
pueden perder su efecto con el tiempo.

Una hip
otesis es una afirmacion que se hace sobre la poblacion. En un experimento se pidio a varias personas que probaran
refrescos dieteticos y calificaran su grado de sabor dulce en una
La hipotesis es param
etrica si se refiere a los valores que toma escala de 1 a 10.
alguno de los parametros poblacionales.
Tras almacenar las bebidas durante un mes a alta temperatura
Por ejemplo, una hipotesis parametrica es: la media poblacional (para imitar el efecto de 4 meses de almacenamiento a
es positiva ( > 0). temperatura ambiente) las mismas personas probaron de nuevo los
refrescos y calificaron de nuevo su grado de sabor dulce.
Un contraste de hip otesis es una tecnica estadstica para juzgar
si los datos aportan evidencia o no para confirmar una hipotesis. En la siguiente tabla aparecen las diferencias en las puntuaciones
(a mayor diferencia, mayor cada del sabor):

2, 0.4, 0.7, 2, 0.4, 2.2, 1.3, 1.2, 1.1, 2.3


Elementos de un contraste de hipotesis
La mayora de los datos son positivos. Es decir, la mayora de las
personas apreciaron perdida en el nivel de sabor.
La hipotesis para la que se desea encontrar evidencia se llama
hip
otesis alternativa. Se denota H1 .
Pero las diferencias no son muy grandes (e incluso dos personas
apreciaron un incremento).
La afirmacion contraria a H1 se llama hip
otesis nula. Se denota
H0 .
La pregunta que trata de responder un contraste de hipotesis es:
Proporcionan estos datos evidencia de que el nivel medio de
Llamamos al descenso medio (desconocido) del grado de sabor
sabor decrece en media?
de los refrescos.
La media estimada a partir de los datos es x = 1.02.
Como queremos confirmar si el grado medio realmente desciende,
I Refleja esta estimacion un autentico descenso en el nivel queremos contrastar
medio de sabor?
I Se debe el resultado a razones puramente aleatorias? H0 : 0 frente a H1 : > 0

Supongamos que H0 es cierta y que vale 0 (toma el valor en el


que mas difcil es distinguir entre H0 y H1 ).
El razonamiento b
asico para hacer este contraste es:
I Supongamos que H0 es cierta, es decir, 0. Sabemos (tema 2) que
I Es el resultado obtenido a partir de los datos (
x = 1.02)
x
extra
no bajo esta hipotesis? N(0, 1).
/ n
I Si esto es as, los datos aportan evidencia contra H0 y a favor
de H1 .
Para juzgar si el valor x = 1.02 es compatible con = 0
calculamos
Para llevar a cabo el analisis anterior tenemos que estudiar que 1.02 0
t= = 3.2255
valores son los que cabe esperar que tome x cuando H0 es cierta. 1/ 10
y comparamos con la distribucion normal estandar.
Para simplificar suponemos de momento que la poblacion es
normal y que la varianza es conocida y vale = 1.
Como 3.2255 es un valor bastante improbable para una
distribucion N(0, 1), los datos proporcionan bastante evidencia en
contra de H0 y a favor de H1 .
Podemos interpretar t = 3.2255 como la distancia entre x y 0 Cuando se lleva a cabo un contraste de hipotesis se pueden
medida en desviaciones tpicas. cometer dos tipos de errores:
I Error de tipo I: Rechazar H0 cuando es cierta.
Mirando las tablas de la normal: P(Z > 3.2255) < 0.001. I Error de tipo II: Aceptar H0 cuando es falsa.

Si = 0, en menos de 1 de cada 1000 muestras se obtendra un


valor de t superior a 3.2255. De los dos errores solo vamos a poder controlar el error de tipo I.
Por ello, se deben definir las hipotesis de forma que el error de tipo
Parece que la distancia entre x y 0 es suficientemente grande I sea el mas grave (equivalentemente, H1 debe ser la hipotesis que
como para rechazar H0 : 0. queremos confirmar).

Que significa suficientemente grande? Depende de lo seguros Se llama nivel de significaci


on de un contraste a la mayor
que queramos estar a la hora de rechazar o no la hipotesis nula. probabilidad de cometer un error de tipo I cuando se utiliza ese
contraste.

Rechazaremos H0 : 0 a nivel siempre que se verifique:


Vamos a rechazar H0 : 0 siempre que la distancia entre x y
= 0 sea suficientemente grande, mayor que un valor crtico c: 
x 0

R= > z .
x 0 1/ 10
> c.
1/ 10 A R se le llama regi
on de rechazo o regi
on crtica.

Para determinar c fijamos el nivel de significacion . Los valores Para los datos del ejemplo recordemos que
= 0.01 o = 0.05 son los mas habituales.
x 0
= 3.2255
1/ 10
 
x 0 Para hacer el contraste a nivel = 0.05, buscamos en las tablas
= PH0 (Rechazar) = PH0 >c = P(Z > c).
1/ 10 z0.05 = 1.64.

Por lo tanto c = z Como 3.2255 > 1.64, estamos en la region crtica y rechazamos la
hipotesis nula 0 a nivel = 0.05.
Contrastes para la media de una poblacion normal
(varianza desconocida)
Contrastes unilaterales:
Para la mayora de los contrastes la region crtica es de la forma: I Hip otesis: H0 : 0 frente a H1 : > 0
  I Regi on crtica:
Distancia entre datos y H0 
x 0

R= > c (tablas) . R= > tn1, .
E.T. de la distancia s/ n

Hay muchos posibles contrastes (vease el formulario), pero todos I Hip


otesis: H0 : 0 frente a H1 : < 0
se basan en las ideas que hemos introducido hasta ahora. I Regi
on crtica:  
x 0
R= < tn1, .
En lo que sigue vamos a ver ejemplos de aplicacion de las formulas s/ n
en distintas situaciones.
Contraste bilateral:
I Hip otesis: H0 : = 0 frente a H1 : 6= 0
I Regi on crtica:  
|
x 0 |
R= > tn1,/2 .
s/ n

Ejemplo del edulcorante cuando es desconocida

Queremos contrastar H0 : 0 frente a H1 : > 0 (es decir, Calculamos el estadstico t:


contraste unilateral con 0 = 0) a nivel = 0.05. x 0 1.02 0
t= = = 2.697.
s/ n 1.196/ 10
Suponemos ahora que no es conocida. La aproximamos a partir
de la muestra: En las tablas de la t buscamos el valor:

2, 0.4, 0.7, 2, 0.4, 2.2, 1.3, 1.2, 1.1, 2.3 t9,0.05 = 1.833

Como 2.697 > 1.833 estamos en la region crtica y rechazamos H0


Para ello usamos el estimador: a nivel = 0.05.
sP
n
x)2
i=1 (xi Cual es la conclusion si fijamos = 0.01?
s= = 1.196
n1
Solucion con SPSS Resultado
Prueba T
que da SPSS
[Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\joser\docencia
\estap\datos\edulcorante.sav

Estadsticos para una muestra

Desviacin Error tp. de


N Media tp. la media
dulzor 10 1,020 1,1961 ,3782

Prueba para una muestra

Valor de prueba = 0
95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
dulzor 2,697 9 ,025 1,0200 ,164 1,876

I Valor de prueba: 0 (el valor de que separa H0 de H1 ).


Por defecto 0 = 0.
I Sig (bilateral): es el p-valor del test bilateral H0 : = 0
frente a H1 : 6= 0 (transparencia siguiente)

P-valor de un contraste SPSS y p-valor


A medida que el nivel de significacion disminuye es mas difcil
rechazar la hipotesis nula (manteniendo los mismos datos). Los paquetes de software estadstico dan como resultado de un test
su p-valor. SPSS llama sig(bilateral) al p-valor.
Hay un valor = p a partir del cual ya no podemos rechazar H0 .
Es decir si < p ya no se rechaza H0 . Conociendo el p-valor, el usuario puede tomar la decision de
aceptar o rechazar H0 para cualquier .
A p se le llama el p-valor del contraste. El p-valor indica el punto
de division entre el rechazo y la aceptacion: SPSS siempre calcula el p-valor para el contraste bilateral. Si
Pg
I Si < p, no podemos rechazar H0 a nivel . queremos hacer un contraste unilateral, tenemos que dividir
I Si > p, podemos rechazar H0 a nivel . entre 2 el valor calculado por SPSS.

En el ejemplo, el p-valor del contraste es 0.025/2 = 0.0125. Esto


El p-valor se interpreta como una medida de la evidencia
significa:
estadstica que los datos aportan a favor de la hipotesis alternativa
H1 (o en contra de H0 ): cuando el p-valor es peque no (digamos, I Si < 0.0125 no podemos rechazar 0.
menor o igual que 0.05) se considera que hay una fuerte evidencia I Si > 0.0125 podemos rechazar 0.
a favor de H1 .
Mnimo 357
Mximo 588
Rango 231,00
Amplitud intercuartil 161,50
Ternera Media
Comparacion de dos medias (muestras independientes) Mediana
401,1500
380,5000
22,90510

Varianza
Desv. tp.
10492,871
102,43472
Parece que, en estas muestras, las salchichas de pavo tienen mas
Mnimo 253
Mximo 645 sodio en media. Pero las dos muestras se solapan bastante. Son
Se ha considerado la cantidad de caloras y de sodio en salchichas Rango
Amplitud intercuartil
392,00
158,75 las diferencias muestrales significativas?
de varias
Resumen marcas de
del procesamiento de los casos dos tipos: ternera y pavo.

Vlidos
Casos
Perdidos Total
Aportan evidencia estos datos para afirmar que el contenido
tipo N Porcentaje N Porcentaje N Porcentaje
sodio Pavo 16 100,0% 0 ,0% 16 100,0% 600,00 medio de sodio de las salchichas de pavo es distinto al de las
Ternera 20 100,0% 0 ,0% 20 100,0%
salchichas de ternera?
Descriptivos

sodio
tipo
Pavo Media
Estadstico
460,8125
Error tp.
21,79435
500,00
X1 , . . . , Xn1 es una muestra de N(1 , )
Mediana 469,5000

sodio
Varianza 7599,896 Y1 , . . . , Yn2 es una muestra de N(2 , )
Desv. tp. 87,17738
Mnimo 357
Mximo 400,00
588
Rango 231,00 Supuestos necesarios:
Amplitud intercuartil 161,50
Ternera Media 401,1500 22,90510
Mediana
Varianza
380,5000
10492,871
I Las muestras proceden de dos poblaciones normales.
300,00
Desv. tp. 102,43472
Mnimo 253
I Las varianzas son desconocidas pero iguales.
Mximo 645
Rango
Amplitud intercuartil
392,00
158,75
I Las dos muestras son independientes.
Pavo Ternera
tipo

Pgina 1

600,00

500,00

Con los datos del ejemplo,


sodio

Hip
otesis que queremos contrastar ( = 0.05)
400,00
|
x y | = |460.81 401.15| = 59.66
H0 : 1 = 2 frente a H1 : 1 6= 2

300,00
15 7599.89 + 19 10492.871
Regi
on crtica (formulario) sp2 = = 9216.556 y sp = 96
34

Pavo Ternera
| x y |
tipo
R= > tn1 +n2 2,/2 . |
x y | 59.66 59.66
q
1 t= = p = = 1.853
+ 1
s q
p

n1 nPgina
2 1 sp n11 + n12 96 1/16 + 1/20 32.2

Estimador combinado de la varianza


t34,0.025 2.04
(n1 1)s12 + (n2 1)s22
sp2 =
n1 + n2 2 Como 1.853 < 2.04, no podemos rechazar H0 . Las diferencias
encontradas en las cantidades medias de sodio de las dos muestras
no son significativas al nivel = 0.05.
Con SPSS
Estadsticos de grupo

Desviacin Error tp. de


tipo N Media tp. la media
sodio Pavo 16 460,8125 87,17738 21,79435
Ternera 20 401,1500 102,43472 22,90510

Prueba de muestras independientes

Prueba de
Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
Error tp.
Sig. Diferencia de la 95% Intervalo de confianza
F Sig. t gl (bilateral) de medias diferencia para la diferencia

Inferior Superior
sodio Se han
asumido
,008 ,930 1,853 34 ,073 59,66250 32,2003 -5,77649 125,10149
varianzas
iguales
No se han
asumido
varianzas
iguales 1,887 33,84 ,068 59,66250 31,6170 -4,60214 123,92714

I El p-valor es 0.073. Esto significa que se puede rechazar H0 si


> 0.073. Al nivel = 0.05 no podemos rechazar.
p
I Error tpico de la diferencia: sp 1/n1 + 1/n2 .

Comparacion de dos medias (datos emparejados) Par


ametros:
I 1 es el contenido medio detectado por rayos X
I 2 es el contenido medio detectado por analisis qumico.
Se usan cinco dosis de una sustancia ferrosa para determinar si existen diferencias
entre llevar a cabo un analisis qumico de laboratorio o un an
alisis de fluorescencia por
rayos X para determinar el contenido de hierro. Cada dosis se divide en dos partes Hip
otesis:
iguales a las que se aplica cada uno de los dos procedimientos. Los resultados Cuando las muestras no son independientes, en lugar de
obtenidos son los siguientes:
contrastar H0 : 1 = 2 frente a H1 : 1 6= 2 , se contrasta
Dosis 1 2 3 4 5
Rayos X 2.0 2.0 2.3 2.1 2.4 H0 : = 0 frente a H1 : 6= 0,
An
alisis Qumico 2.2 1.9 2.5 2.3 2.4

donde es el valor esperado de las diferencias di = xi yi .

Se supone que las poblaciones son normales. Aportan los datos evidencia suficiente a
nivel = 0.05 para afirmar que el contenido medio de hierro detectado cuando se Dosis 1 2 3 4 5
utiliza el an
alisis qumico es diferente del contenido medio detectado cuando se xi 2.0 2.0 2.3 2.1 2.4
utilizan rayos X? yi 2.2 1.9 2.5 2.3 2.4
di 0.2 0.1 0.2 0.2 0
Con estos datos: d = 0.1 y Sd = 0.1414.
Regi
on crtica (formulario):
 
|d|
R= > tn1;/2 .
Sd / n

Mirando en las tablas t4;0.025 = 2.776.


Por otra parte,

|d| 0.1
= = 1.5811.
Sd / n 0.1414/ 5

Como 1.5811 < 2.776, los datos disponibles no permiten afirmar a


nivel 0.05 que los dos metodos proporcionan cantidades medias de
hierro diferentes.

Prueba T
[Conjunto_de_datos0]

Estadsticos de muestras relacionadas


Otro ejemplo con SPSS
Desviacin Error tp. de
Media N tp. la media
Par 1 X 2,1600 5 ,18166 ,08124
AQ 2,2600 5 ,23022 ,10296

Correlaciones de muestras relacionadas

N Correlacin Sig.
Par 1 X y AQ
5 ,789 ,113
Queremos comparar la media de dos poblaciones. Para ello,
obtenemos dos muestras aleatorias independientes con los
Prueba de muestras relacionadas
siguientes resultados:
Diferencias relacionadas
95% Intervalo de Muestra 1 230 235 238 242 242 246
confianza para la

Media
Desviacin
tp.
Error tp. de
la media
diferencia
Inferior Superior t
Muestra 2 232 234 239 245 248 253
-,10000 ,14142 ,06325 -,27560 ,07560 -1,581

Introducimos los datos en SPSS con el resultado siguiente:


Prueba de muestras relacionadas

Sig.
gl (bilateral)
4 ,189
Prueba T
Salida SPSS
[Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\joser\docencia\estap\datos\salida-2medias.sav Cuestiones
Estadsticos de grupo
I Calcula la media de la muestra 1
Desviacin Error tp. de
Muestra N Media tp. la media
Datos 1,00 6 5,74166 I Calcula el error tpico de la media de la muestra 1
2,00 6 241,8333 8,23205 3,36072

I Calcula un IC de nivel 95% para 1


Prueba de muestras independientes

Prueba de Levene para I Cuanto vale el error tpico de la diferencia?


la igualdad de varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
diferencia
I Cuanto vale el p-valor del contraste de H0 : 1 = 2 frente a
Diferencia Error tp. de
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior H1 : 1 6= 2 ?
Datos Se han asumido
varianzas iguales 1,601 ,234 -,732 10 ,481 -3,00000 -12,12963 6,12963
No se han asumido I Cuanto vale el p-valor del contraste de H0 : 2 1 frente a
varianzas iguales -,732 8,934 ,483 -3,00000 4,09742 -12,27950 6,27950
H1 : 2 > 1 ?

Hip
otesis:
Contrastes para una proporcion
H0 : p 0.7 frente a H1 : p > 0.7,

donde p es la proporcion poblacional que pierde peso.

Regi
on crtica (formulario):
En un estudio, 1000 personas siguieron una dieta de
adelgazamiento durante 3 meses. De las 1000 personas, 791 p p
0
perdieron mas de 3 kg de peso. Permiten los datos afirmar, con el R= q > z
p0 (1p0 )
nivel de significacion = 0.01, que mas del 70% de la poblacion Pgina 1 n
perdera mas de 3 kg de peso de seguir la misma dieta durante el
mismo tiempo? En este caso, n = 1000, p0 = 0.7, p = 0.791 y z0.01 = 2.33.

p p0 0.791 0.7
q = q = 6.28
p0 (1p0 ) 0.70.3
n 1000

Por lo tanto, podemos rechazar H0 y afirmar que mas del 70% de


la poblacion perdera mas de 3 kg de peso de seguir la misma dieta
durante el mismo tiempo.
Comparacion de dos proporciones Par
ametros:
I p1 : Probabilidad de sufrir un infarto si se toma el
Se ha llevado a cabo un estudio para determinar si un medicamento.
medicamento dirigido a reducir el nivel de colesterol reduce I p2 : Probabilidad de sufrir un infarto si se toma el placebo.
tambien la probabilidad de sufrir un infarto. Para ello, a hombres
de entre 45 y 55 a
nos se les asigno aleatoriamente uno de los dos Estimadores de los par
ametros:
tratamientos siguientes:
56 84
I 2051 hombres tomaron un medicamento para reducir el nivel p1 = = 0.0273 y p2 = = 0.0414
2051 2030
de colesterol
I 2030 hombres tomaron un placebo otesis: H0 : p2 p1 frente a H1 : p2 > p1 .
Hip
Durante los cinco anos que duro el estudio, 56 de los hombres que
tomaron el medicamento, y 84 de los que tomaron el placebo, Estimaci on de la probabilidad de infarto si fuese p1 = p2 (es
sufrieron infartos. decir, cuando H0 es cierta pero es difcil distinguir H0 de H1 ):

Numero total de infartos 56 + 84


Podemos afirmar a nivel 0.05 que el medicamento es efectivo? p = = = 0.0343
Numero total de personas 2051 + 2030

Regi
on crtica (formulario)




p2 p1
R= r   > z
p(1 p) 1 + 1



n1 n2

Con los datos del ejemplo:


p2 p1 0.0141
r  =q 1 1
 = 2.47
p(1 p) n11 + 1 0.0343 0.9657 2051 + 2030
n2

z0.05 = 1.64
Como 2.47 > 1.64, podemos rechazar H0 y afirmar que el
medicamento es efectivo a nivel = 0.05.

You might also like