Professional Documents
Culture Documents
67 MATEMÁTICAS
Inferencia Estadística.
Tests de hipótesis.
24-13859-13
Temario 1993
tema 67
matemáticas
1. Inferencia Estadística
1.1. Muestreo Aleatorio
2. Contraste de hipótesis
2.1. Elementos de un contraste de hipótesis
3
tema 67
matemáticas
INTRODUCCIÓN
5
tema 67
matemáticas
1 Inferencia Estadística
El modo más eficaz de conseguir que una muestra sea representativa es elegirla
al azar. Hablamos entonces de muestreo aleatorio. Existe también el muestreo
no aleatorio, aunque las muestras obtenidas por este procedimiento carecen de la
representatividad de las anteriores, y por tanto no resulta tan adecuado.
Dentro del muestreo aleatorio podemos distinguir las siguientes clases:
Muestreo aleatorio simple
Cada muestra tiene la misma probabilidad de ser elegida. Una vez identificados
(por ejemplo numerándolos) todos los elementos de la población y decidido
el tamaño de la muestra, los elementos que formarán parte de la muestra se
eligen aleatoriamente. Si después de cada selección se devuelve el individuo
seleccionada a la población para que pueda volver a ser elegido, el muestreo es
con reemplazamiento.
Muestreo aleatorio sistemático
Es similar al anterior, aunque resulta más cómoda la elección de los individuos.
Con los individuos identificados, se decide el tamaño de la muestra, n, se se-
lecciona aleatoriamente el primer individuo, n0, y se calcula el entero, k, más
próximo al cociente entre el tamaño de la población y el tamaño de la muestra,
esto es N/n. Los siguientes, a partir de n0, se eligen de k en k, teniendo en cuenta
que si se sobrepasa el valor de N debemos comenzar otra vez. Este procedi-
miento puede resultar menos representativo que el anterior.
6
tema 67
matemáticas
Supongamos una población con media μ y varianza σ2. Consideremos todas las
muestras posibles de tamaño n y se calcula el valor de la media de cada una de
las muestras. Consideremos la variable aleatoria X , que asigna a cada muestra el
valor de la media obtenida. Sean μ X y σ X la media y la desviación típica de la
variable. Así, tenemos:
7
tema 67
matemáticas
σ
σX = . Esto indica que a medida que n crece, la variabilidad con la que la
n
media muestral se distribuye alrededor de la media poblacional disminuye, con
lo que aumentaría la precisión para estimar la media poblacional por el estadís-
tico muestral.
Si la población tiene distribución normal, entonces X sigue también una distri-
bución normal. Si la población no sigue una distribución normal, a medida que
n crece, la distribución de X se aproxima a una normal. Consideraremos una
buena aproximación a partir de tamaños muestrales n = 30. Si la población no
es normal y n < 30, entonces X sigue la distribución t-Student.
Ejemplo
La edad de los alumnos de cierto instituto se distribuye con una media de 14 y una
desviación típica de 2 años. Tomamos al azar una muestra de 100 alumnos y que-
remos calcular la probabilidad de que la edad media sea superior a los 14.5 años.
Los parámetros poblacionales son μ = 14 y σ = 2. Como el tamaño de la muestra
es n – 100 > 30 entonces la variable aleatoria que asigna a cada muestra de tama-
ño 40 su edad media se distribuye:
σ 2
X ≈ N μ, = N 14, = N (14, 0.2 )
n 100
Así, la probabilidad que deseamos calcular es:
X − 14 14.5 − 14
P ( X > 14.5 ) = P > = P ( Z > 2.5 ) =
0.2 0.2
= 1 − P ( Z ≤ 2.5 ) = 0.0062
p ⋅ (1 − p )
μP = p y σ P =
n
Si además np > 5 y n ⋅ (1 − p ) > 5 , se considera buena la aproximación normal
de la binomial, y entonces:
p ⋅ (1 − p )
P ≈ N p,
n
8
tema 67
matemáticas
Ejemplo
Después de aprobarse su utilización, un fármaco ha curado de su enfermedad al
52% de los pacientes que lo utilizaron. Si, antes de aprobarlo se hubiera decidido
suministrarlo a una muestra de 500 de estos pacientes, se quiere calcular la proba-
bilidad de que el fármaco hubiese sido eficaz en menos del 50% de los pacientes.
El parámetro poblacional es p = 0,52
Como np = 500 ⋅ 0, 52 = 260 > 5 y n ⋅ (1 − p ) = 500 ⋅ 0, 48 = 240 > 5
p ⋅ (1 − p )
P ≈ N p, = N ( 0, 52; 0, 022 )
n
y por tanto la probabilidad que deseamos calcular es:
P − 0, 52 0, 5 − 0, 52
P ( P < 0, 5 ) = P < = P ( z < −0, 91) = 0,1814
0, 022 0, 022
Supongamos que nos encontramos con una población cuya distribución denotare-
mos por f (x) y sea θ un parámetro desconocido de dicha distribución. Entendere-
mos por problema de estimación el que trata de inferir el valor de θ en base a los
datos de una muestra.
La estimación de parámetros de uso común son de dos tipos: la estimación pun-
tual, en la que se aproxima el valor del parámetro a partir de un estadístico cal-
culado en la muestra, la estimación por intervalos de confianza, en la que se
ofrece un intervalo que debe contener el verdadero valor del parámetro con cierta
probabilidad.
XX Estimación puntual
()
el valor del parámetro: E θ = θ . En caso contrario se dice que el estimador tiene
sesgo, cuyo valor es θ − E (θ ) .
9
tema 67
matemáticas
10
tema 67
matemáticas
2 Contraste de hipótesis
El contraste de hipótesis, también conocido como test de hipótesis, es, en esencia,
un procedimiento que permite verificar una afirmación acerca de la función de
densidad de una variable aleatoria. Evidentemente también en este procedimiento
trabajaremos con muestras aleatorias, y el objetivo será determinar si los datos
ofrecen evidencia estadística para poder aceptar la hipótesis que se plantea.
En ocasiones, se desea contrastar si una variable aleatoria, se distribuye según un
modelo normal, o si dos variables aleatorias dadas son o no independientes. Son
ejemplos de contrastes en los que se pretende verificar el modelo a aplicar a la
variable o variables aleatorias. Hablamos en este caso de contrastes no paramé-
tricos.
En otros casos, se desea verificar si el valor de la media de una distribución es
μ = 10 , o si cierta proporción vale p = 0.4. Estos son ejemplos de contrastes cuyas
hipótesis consisten en afirmaciones acerca del valor de un parámetro de la función
de densidad. Hablamos entonces de contrastes paramétricos, y son en los que
nos centraremos en adelante.
H 0 : μ = 38
H1 : μ > 38
Habitualmente se toma como la hipótesis a contrastar, aceptándola o rechazán-
dola. Vamos a trabajar en términos de probabilidad y, en consecuencia, tanto si
aceptamos como si rechazamos existe la posibilidad de equivocarse. Podemos
rechazar H0 siendo ésta cierta (error de tipo I) o aceptarla siendo falsa (error de
tipo II).
11
tema 67
matemáticas
En estos dos casos estaríamos cometiendo un error al tomar una decisión equivo-
cada. La siguiente tabla muestra las diferentes situaciones al aceptar o rechazar la
hipótesis nula y el error cometido, si es el caso.
H0 Cierta Falsa
Se acepta No hay error Error de tipo II
Se rechaza Error de tipo I No hay error
12
tema 67
matemáticas
De las tablas de la normal sabemos que el valor zα = 1.645 cumple P(Z ≤ zα) = 0,95.
Con lo cual:
k − 38
= 1.645 ⇒ k = 0.125 ⋅1.645 + 38 ⇒ k = 38.2056
0.125
Por tanto, la región crítica será el intervalo (38.2056, +∞). Solamente quedará
comprobar si el estadístico de contraste utilizado cae o no dentro de la región de
rechazo. Del enunciado teníamos X = 39 que pertenece claramente al intervalo,
con lo que deberemos concluir el test rechazando la hipótesis nula. Es decir, exis-
te evidencia estadística para afirmar que la talla media de zapato de las mujeres
españolas es mayor que una 38.
Vamos a resumir los pasos necesarios para realizar un contraste de hipótesis. Su-
pongamos que, con un nivel de significación α, deseamos contrastar el valor de
un parámetro poblacional λ y consideremos conocida la distribución. Seguiremos
los pasos siguientes:
1. Plantear las hipótesis nula y alternativa.
2. Elegir un estimador de λ cuya distribución sea conocida bajo la hipótesis
nula.
3. Determinar la región crítica.
4. Calcular el valor del estadístico de contraste en la muestra.
5. Aceptar o rechazar la hipótesis nula en función de si el estadístico de contraste
queda fuera o dentro de la región crítica.
Ejemplo
Un partido político asegura que en las próximas elecciones obtendrá el 80% de
los votos. Una encuesta realizada por una empresa privada sobre 1600 personas
revela que 1200 personas votarán a este partido. Veamos si, para un nivel de signi-
ficación del 5% podemos aceptar la hipótesis que mantiene el partido político.
Se trata de contrastar el valor del parámetro p de una distribución binomial (es
decir, de una proporción). Planteamos las hipótesis
H 0 : p = 0.8
H1 : p ≠ 0.8
13
tema 67
matemáticas
P − zα < Z < zα = 0.95 ⇔ P Z < zα = 0.975 ⇒ zα = 1.96
2 2 2 2
14
tema 67
matemáticas
BIBLIOGRAFÍA
CASELLA Y BERGER: Statistical Inference. Wadsworth and Brooks/Cole, 1990.
DE GROOT: Probabilidad y Estadística. Addison-Wesley Iberoam., 1988
HOEL, P. G.: Introducción a la estadística matemática. Ariel, SA, 1980
15
tema 67
matemáticas
RESUMEN
Inferencia Estadística.
Tests de hipótesis.
1.
1 Inferencia Estadística
Es la rama de la Estadística que trata de sacar conclusiones de la población objeto de estu-
dio a partir de la información que proporciona una muestra.
σ
X ≈ N μ,
n
p ⋅ (1 − p )
P ≈ N p,
n
17
tema 67
matemáticas
2.
2 Contraste de hipótesis
Es un procedimiento que permite verificar una afirmación acerca de la función de densidad
de una variable aleatoria. El objetivo será determinar si los datos ofrecen evidencia esta-
dística para poder aceptar la hipótesis que se plantea.
18