You are on page 1of 20

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

El objetivo básico de la estadística inferencial es


sacar conclusiones sobre la población a partir de la
información contenida en una muestra aleatoria de Estimar valores
la población.

La media de una
muestra permite llegar a
Con otras palabras podemos decir que la conclusiones de la
inferencia estadística consiste en el proceso de media de una población
selección y utilización de un estadístico
muestral, mediante el cual, utilizando la
información que nos proporciona una muestra
aleatoria, nos permite llegar a conclusiones
sobre características poblacionales
En inferencia estadística se llama estimación al conjunto de
procedimientos que permiten dar un valor aproximado de un parámetro
de una población a partir de los datos proporcionados por una muestra.

Estimación puntual Estimación por intervalos

La estimación puntual consiste en obtener un único


número calculado a partir de las observaciones
muestrales, y que es utilizado como estimación del
valor del parámetro θ. Se le llama estimación puntual
porque a ese número, que se utiliza como estimación
del parámetro θ, se le puede asignar un punto sobre la
recta real
El estimador del parámetro poblacional θ es una función de las
variables aleatorias u observaciones muestrales y se representa por

  ( X1 , X 2 ,, X n )
Para una realización particular de la muestra:

  ( x1 , x2 ,, xn )
Queda claro que existe diferencia entre estimador y estimación. El
estimador, el estimador es un estadístico y por tanto una variable
aleatoria y el valor de una variable para una muestra concreta será la
estimación puntual, porque solo ofrece un valor del parámetro. Por
tanto el estimador  teniendo una distribución muestral. Veamos un
ejemplo:
En una universidad que cuenta con una facultad de ingeniería donde se
estudia la carrera de ingeniería de sistema en los últimos 8 años la nota
promedio de los graduados en de 4,3 puntos

X x  4,3   4,3

En este momento podemos hacernos la siguiente pregunta: ¿Con qué


promedio de calificaciones se gradúo un estudiante de ingeniería de
sistema en los últimos 8 años?
La respuesta a esta interrogante es una estimación puntual y se puede
plantear, es probable que su promedio de calificaciones finales del
estudiante de ingeniería de sistemas en los últimos 8 años sea 4,3
puntos. Esta afirmación es muy poco precisa y tiene un muy poco valor en
un proceso de investigación.
Resumen de parámetros poblacionales, estimadores y estimaciones

Parámetros Estimadores Estimaciones


n n

X i x i
Media  X  i 1
x i 1
n n

1 n 1 n
Varianza  2
 
2
 i
n  1 i 1
( X  X ) 2
s 
2
 i
n  1 i 1
( x  x ) 2

X Número de éxitos x
proporción p p  p
n Número de pruebas n
PROPIEDADES DE LOS ESTIMADORES PUNTUALES

Estimador insesgado: Si tenemos un gran número de muestras de tamaño n


y obtenemos el valor del estimador en cada una de ellas, sería deseable que
la media de todas estas estimaciones coincidiera con el valor de medio de la
población de la cual fueron extraídas las muestras representativas de dicha
población. Se dice que un estimador es insesgado si su esperanza matemática
coincide con el valor del parámetro a estimar.

Estimador eficiente: Se dice que los estimadores son eficientes cuando


generan una distribución muestral con el mínimo error estándar posible, es
decir, entre dos estimadores insesgados de un parámetro dado es más
eficiente el que tenga menor varianza.
PROPIEDADES DE LOS ESTIMADORES PUNTUALES

Estimador consistente: Un estimador se considera consistente cuando su


valor tiende hacia el verdadero valor del parámetro a medida que aumenta el
tamaño de la muestra . Es decir, la probabilidad de que la estimación sea el
verdadero valor del parámetro tiende a 1.

Estimador suficiente: Se dice de un estimador que es suficiente cuando es


capaz de extraer de los datos de la muestra toda la información importante
sobre el parámetro.
En inferencia estadística se llama estimación al conjunto de
procedimientos que permiten dar un valor aproximado de un parámetro
de una población a partir de los datos proporcionados por una muestra.

Estimación puntual Estimación por intervalos

La estimación por intervalo consiste en


obtener un rango a partir de las observaciones
muestrales, dentro del cual tendremos cierta
certeza o confianza que este el parámetro θ.
Retomemos el ejemplo que utilizamos para el caso de la estimación
puntual, y ahora podemos plantear: En una universidad que cuenta con
una facultad de ingeniería donde se estudia la carrera de ingeniería de
sistema en los últimos 8 años la nota promedio de los graduados esta
entre 4 y 4,6 puntos

X x  4,3  0,4   4,3  0,4

En este momento podemos hacernos la siguiente pregunta: ¿Con qué


promedio de calificaciones se gradúo un estudiante de ingeniería de
sistema en los últimos 8 años?
La respuesta a esta interrogante es una estimación por intervalo y se
puede plantear, el promedio de calificaciones finales del estudiante de
ingeniería de sistemas en los últimos 8 años esta entre 4 y 4,6 puntos
con un 95% de confianza.
El objetivo de la estimación por intervalo de confianza es obtener un
espacio de poca amplitud y con una alta probabilidad de que el
parámetro θ se encuentre en su interior. Seleccionado una
probabilidades cercanas a la unidad, que se representan por 1-α y cuyos
valores más frecuentes suelen ser 0,90, 0,95 y 0,99. Donde α es el nivel
de significación y 1-α coeficiente de confianza

Si quisiéramos obtener una estimación por intervalo del parámetro


poblacional θ desconocido, tendremos que obtener dos estadísticos:
 
 ( X 1 , X s , , X n ) y  ( X 1 , X s , , X n )
que nos darán los valores extremos del intervalo, de forma tal que:

 

P  ( X 1 , X s ,, X n )     ( X 1 , X s ,, X n )  1  
 

A continuación se discutirán algunos casos de estimación por intervalo.


1.- Intervalo de confianza para la media de una población normal, siendo σ
conocida

Se tiene una muestra aleatoria de n observaciones de una distribución N(μ, σ).


Si σ es conocida, y la media muestral observada es x , entonces el intervalo
de confianza para la media poblacional μ, al nivel de confianza del 100(1-α)%
estara dado por:
 
   
 x  z , x  z
2

2

 2 n 2 n

z : Estadígrafo de la distribución normal


α: Nivel de significación

Distribución de la media de la muestra


Veamos el caso que la estimación de la media poblacional con la varianza
conocida se realice con α=0,05, es decir un 95% de confianza: tendríamos el
siguiente intervalo de confianza, tendríamos z z  z
0 , 05 0 , 025
2 2

95%

z  z 0,05  z0, 025


2 2

z0, 025  1,96 z0, 025  1,96

-1,96
Veamos el caso que la estimación de la media poblacional con la varianza
conocida se realice con α=0,01, es decir un 99% de confianza: tendríamos el
siguiente intervalo de confianza, tendríamos z z  z
0 , 01 0 , 005
2 2

-2,57

z0, 005  2,57 z0, 005  2,57


Sigamos trabajando con el caso de la facultad de ingeniería donde se
estudia la carrera de ingeniería de sistema supongamos que tomemos una
muestra aleatoria de 123 graduados y se calcula la media de sus notas de
graduación igual a 4,3 y la desviación estándar es 2,31. Estime un intervalo
con un 95% de confianza de la nota media de graduación en los ultimo 8
años


x  z
2 n
Intervalo de la media estimada con
un 95% de confianza (=0,05)
2,12
4,3  1,96  4,7
123
  4,3  0,4
2,12
4,3  1,96  3,9
123
2.- Intervalo de confianza para la media de una población normal,
siendo σ desconocida

Supongamos que x y s es la media y la desviación estándar de una


muestra que fue obtenida de forma aleatoria de una población con
distribución N(, ). Como  es desconocida, para realizar la estimación se
utilizan los resultados de la muestra para establecer el intervalo de confianza
de la media poblacional,  con un nivel de confianza de 100(1-)%, utiliza la
siguiente ecuación.

 s s 
 x  t ,n1 , x  t


 2 n 2
, n 1 n

Donde
t y t es la distribución de t-Student con n-1 grados de libertad.
, n 1
2

En trabajo con la distribución t-Student es similar a la forma de trabajo con


la distribución normal. Veamos un ejemplo:
Se estudia el tamaño al nacer de una serie de peces de colores, para ello se
toma una muestra al azar de 20 peces y se miden los mismos los resultados
n

x
obtenidos son los siguientes:
i
0,95 0,78
0,85 0,93 x i 1
 0,9255
0,92 0,93
n
0,95 1,05 n
0,93
0,86
0,93
1,06
 i
( x  X ) 2

t 0,05  2,093 t 0,05  2,093


s i 1
 0,0809
n 1
,19
2 1 1,06 2
,19

0,92 0,96
0,85 0,81
0,81 0,96 t  t 0, 05  2,093
, n 1 ,19
2 2

s 0,0809
x  t  0,9255  2093  0,8876
2
, n 1 n 20   0.9255  0,0378
s 0,0809
x  t  0,9255  2093  0,9634
, n 1 n 20
2
2.- Intervalo de confianza para la proporción de una población
normal.
Para determinar el intervalo de confianza de la estimación de la proporción
poblacional p̂ con un nivel de confianza de 100(1-)%, viene dado por
la siguientes ecuaciones:
 z2 z 2
z 2
z 2 
p 2 z pq  2  pq  2 
 2 p 2
 z  2
 2n

2 n 4n , 2n 2 n 4n  Muestras
 z 2
z 2  pequeñas
   
 1  2
1  2

 n n 
 pq pq 
 p  z , p  z  Muestras
 2 n 2 n  grande

Donde: q  1 p
además z tiene el mismos significad que cuando se estimo la media
2 Veamos un ejemplo.
Un laboratorio reporta que cuando realiza 55 ensayos 15 dieron positivos a la
presencia de nicotina en sangre. Sea p la proporción a largo plazo de los
resultados de la determinación de nicotina en sangre. Estime un intervalo de
confianza para p con un nivel de significación de un 99%.

 pq pq  z  z 0,01  z0,005  2,57


 p  z , p  z 
 2 n 2 n  2 2

 0,2727 * 0,7273 0,2727 * 0,7273 


0,2727  2,57 , 0,2727  2,57 
 55 55 

0,1184, 0,4270 pˆ  0,2727  0,1543


POSIBLES BIBLIOGRAFÍA QUE PUEDEN SER UTILIZADAS EN EL CURSO.
 Murray Spiegel. Probabilidad y Estadística. Editorial McGraw.Hill. España 2010.
David Moore. Estadística Aplicada Básica. Editorial Mozart Art.S.L. España 2004.
Antonio Vargas. Estadísticas Descriptiva e Inferencial. Editorial Compobell. S.L. España 1995.
Elmer Mode. Elementos de Probabilidad y Estadística. Editorial Reverté. S.A. España. 2005.
Irwin Miller y John Freund. Probabilidad y Estadística para Ingeniero. Editorial Reverté. S.A.
México. 2004
2004. Juan Murgiondo y Javer Tejedor. Análisis Descriptivo de datos en Educación. Editorial
Murralla. S.A. España. 2005.
Roberto Pagano. Estadística para las ciencias del comporamiento. Editorial Thonson. México.
2003.
Geolfrey Norman y David Streiner. Bioestadística. Editorial Harcourt. España. 2005.
 Robert Soka y Rohlf F. Introducción a la bioestadística. Editorial Reverté S.A. España. 2002.
Sidney Siegel y John Castella. Estadística no paramétrica. Aplica a las ciencias de la conducta.
Editorial Trilla. México. 1998.
Jay Davore. Probabilidad y Estadística para Ingeniería y Ciencias. Editorial Thomson. México.
2001.
Susan Milton y Jesse Arnold. Probabilidad y Estadística con aplicaciones para la ingeniería y
ciencias computacionales. Editorial McGraw Hill. México. 2004
Eduardo Bologna. Estadística para Psicología y Educación. Editorial Brujas. Argentina. 2011.

You might also like