You are on page 1of 8

TEORIA PROBABILIDAD Y ESTADISITICA

CONCEPTOS EN LA MUESTRA EN LA POBLACION


Denominacin Estadsticas Parmetros
Simbologa
x ; Me; S
x
2
; S
x
;

x
;

o
x
2
;o
x
;
Funcin Son Estimadores Deben Ser estimados
Caractersticas Son conocidos
Son variables
Son desconocidos
Son fijos

2 - TIPOS DE ESTIMACIONES: Hay dos tipos fundamentales de estimaciones:
a) Estimacin puntual: es un procedimiento de estimacin en el que se estima al parmetro
mediante un solo valor muestral. los estimadores puntuales estn constituidos por las estadsticas,
denominacin que se da a los clculos muestrales conocidos que permiten estimar a los
correspondientes valores poblacionales desconocidos, denominados parmetros
b) Estimacin por intervalos: es un procedimiento que permite, a partir de un estimador
puntual, obtener dos valores que limitan un intervalo denominado intervalo de confianza dentro del
cual se encuentra el parmetro a estimar con una cierta probabilidad conocida cercana a uno,
denominada nivel de confianza.

Condiciones: el muestreo debe basarse en las siguientes condiciones:
- la representatividad: significa que la muestra debe integrarse con una
proporcin de elementos similares a la composicin existente en la
poblacin. Esta condicin, si bien es importante, debe tener algn tipo de
limitacin, ya que si se exige una composicin exactamente igual a la de la
poblacin, se terminar extrayendo una muestra de tamao igual a aqulla,
de modo que la representatividad debe cumplirse con aqullos atributos
que son fundamentales.
- la confiabilidad: resulta ser, en cierto modo, consecuencia de lo anterior,
pero asimismo constituye un principio sobre la seguridad de que la toma de
la informacin no producir sesgos o errores en los resultados que se
obtienen, tomando en consideracin que un dato errneo en la muestra
incide en la confiabilidad mucho ms que uno en la poblacin.


Estimacin por intervalos: como ya se ha dicho, consiste en un procedimiento que permite, a
partir de un estimador puntual, encontrar dos valores que limitan un intervalo denominado
intervalo de confianza, dentro del cual puede encontrarse el parmetro a estimar con una cierta
probabilidad conocida, cercana a uno, que se denomina nivel de confianza y que se simboliza NC.
Este punto ser desarrollado ms adelante con mayor profundidad.
Algunas caractersticas de los intervalos de confianza:
1) El intervalo de confianza tiene dos lmites que se obtienen sumando y restando
un mismo valor al estimador puntual media muestral x . Estos lmites se denominan lmite
superior y lmite inferior del intervalo de confianza.
2) Si el Nivel de Confianza aumenta, su superficie en el grfico sera mayor y eso
se correspondera con mayores valores para los z
1
. En ese caso, a mayor NC, mayor amplitud en el
intervalo de confianza. Pero asimismo, una mayor amplitud para el intervalo implica que hay ms
valores posibles para estimar la media poblacional
x
, lo que convierte a la estimacin en algo
menos precisa, es decir que a mayor amplitud del intervalo, menor precisin en la estimacin.
Conclusin: a mayor nivel de confianza, menor precisin en la estimacin.
3) Si el Nivel de confianza llegara a tomar el valor extremo mximo para una
probabilidad, es decir un valor igual a 1, el valor de los z
1
sera, segn se puede observar en la tabla
normal, el mximo posible, es decir que los z
1
seran iguales a . En ese caso, no sera posible
obtener resultados para los lmites del intervalo de confianza porque daran un resultado
indefinido. Conclusin: no puede exigirse un nivel de confianza igual a la unidad porque no se
obtendran resultados prcticos para los lmites del intervalo.
4) La decisin de tomar al Nivel de Confianza entre dos valores simtricos de z
1
no slo es
la nica solucin posible desde el punto de vista de la bsqueda inversa en la tabla; tambin
conduce a un intervalo mnimo, ya que el intervalo conseguido es ms pequeo que cualquier
otro que pueda obtenerse tomando los valores de z
i
de cualquier otra forma diferente.
5) El Nivel de Confianza es una probabilidad, y como tal, segn el planteo pascaliano, es el
resultado de realizar un cociente entre el nmero de casos favorables sobre el nmero de casos
posibles. Recordando este concepto, puede decirse entonces que de cada cien intervalos que se
construyan, en una proporcin de ellos igual a NC el parmetro quedar encerrado en el
intervalo construido. Esta es una forma de medir la confianza existente de que en un porcentaje
de los casos se estime correctamente el parmetro desconocido.
Poblacin
Consiste en la totalidad de las observaciones en las que estamos interesados. Es el conjunto
de todos los elementos a los que se somete a un estudio estadstico.

Individuo
Un individuo o unidad estadstica es cada uno de los elementos que componen la
poblacin

Tamao de poblacin
Es el nmero de observaciones en la poblacin, puede ser finito o infinito.

En el campo de la inferencia estadstica el estadstico se interesa en llegar a conclusiones con
respecto a al poblacin cuando es imposible o poco prctico observar todo el conjunto de
observaciones que constituyen la poblacin. Aveces es imposible probar TODOS, por eso
debemos depende de un subconjunto de observaciones de la poblacin para ayudarnos a
hacer inferencias con respecto a la misma poblacin.
P-valor
El p-valor es una medida directa de lo verosmil que resulta obtener una muestra como la
actual si es cierta H0. Los valores pequeos indican que es muy infrecuente obtener una
muestra como la actual, en cambio, los valores altos que es frecuente. El p-valor se emplea
para indicar cunto (o cun poco) contradice la muestra actual la hiptesis alternativa.
- Un valor P es el nivel (de significancia) ms bajo en el que el valor observado de la
estadstica de prueba es significativo.
- El valor P es el nivel de significancia ms pequeo que conduce al rechazo de la
hiptesis nula Ho.
- El valor P es el mnimo nivel de significancia en el cual Ho sera rechazada cuando se
utiliza un procedimiento de prueba especificado con un conjunto dado de informacin.
Una vez que el valor de P se haya determinado, la conclusin en cualquier
nivel particular resulta de comparar el valor P con


Muestra
Es un subconjunto de una poblacin. Esta debe ser representativa para la poblacin, porque a
veces nos vemos tentados a elegir muestras mediante la seleccin de miembros ms
convenientes para la poblacin. Y esto nos puede llevar a inferencias errneas con respecto a
la poblacin.
La muestra es una fraccin del total de los resultados experimentales que genricamente
llamamos poblacin.
Muestreo
Es la reunin de datos que se desea estudiar, obtenidos de una proporcin
reducida y representativa de la poblacin.

Estimador
Para , parmetro desconocido de una poblacin X , los estimadores sern herramientas
que permitirn la estimacin de tal parmetro. A tal efecto, entenderemos
como estimador cualquier variable aleatoria, (X1,X2,...,Xn) (o simplemente ) , que se defina
a partir de la sucesin de variables aleatorias, X1,X2,...,Xn ; que integran una muestra de
tamao n extrada al azar de una poblacin, es decir, toma un valor para
cada n observaciones o datos. Estos datos corresponden a los valores de la variable que
representan a la poblacin en los n "individuos" de la muestra.

Estimacin puntual
Si a partir de las observaciones de una muestra se calcula un solo valor como estimacin de un
parmetro de la poblacin desconocido, el procedimientose denomina estimacin puntual.
Un estimador puntual T de un parmetro es cualquier estadstica que nos permita a partir de los
datos muestrales obtener valores aproximados del parmetro .
Para indicar que T es un estimador del parmetro escribimos =T .


Sesgado
Cualquier procedimiento de muestreo que produzca inferencias que sobrestimen o
subestimen de forma consistente alguna caracterstica de la poblacin se dice que esta
Sesgado. Para eliminar cualquier posibilidad de sesgo en el procedimiento de muestreo, es
deseable elegir una muestra aleatoria en el sentido de que las observaciones se realizan de
forma independiente y al azar.
Xi, i=1,2,, n es una variable aleatoria que representa la i-esima medicin o valor de la
muestra que observamos. Entonces las variables aleatorias X1,X2,Xn constituirn entonces una
muestra aleatoria de la poblacin f(x) con valores numricos x1,x2,,xn si las mediciones se
obtienen al repetir el experimento n veces independientes bajo esencialmente las mismas
condiciones.
Aclaracin: debido a las condiciones idnticas bajo las que se seleccionan los elementos de la
muestra, es razonable suponer que las n variables aleatorias son independientes y que cada
una tiene la misma distribucin de probabilidad f(x). F(x1,x2,,xn)= f(x1),f(x2,),, f(xn)
En estadstica se llama sesgo de un estimador a la diferencia entre su esperanza matemtica y
el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo se
llama insesgado o centrado.

Estimador insesgado
Se denomina as a aquel estimador cuya esperanza matemtica da como resultado el parmetro a
estimar.
Demostracin de que es insesgado:
E x E
n
x
n
E x
n
E x
n n
n
i i i x x x
( ) ( ) = = = = = =

|
\

|
.
|
|
1 1 1 1 1

(buscar una para la varianza)

Muestra aleatoria
Sean X1,X2,Xn variables aleatorias independientes, cada una con al misma distribucin de
probabilidad f(x). Definimos entonces a X1,X2,Xn como una muestra aleatoria de tamao n de la
poblacin f(x) y escribimos su distribucin de probabilidad conjunta como:
F(x1,x2,,xn)= f(x1),f(x2,),, f(xn)

Estadstica
Cualquier funcin de las variables aleatorias que forman una muestra aleatoria
Nota: u y o
2
,miden el centro de localizacin y la variabilidad de una distribucin de
probabilidad. Estos parmetros son constantes y de ninguna manera resultan afectados o
influidos por las observaciones de una muestra aleatoria.



Media
Es la media de localizacin central mas comnmente utilizada en estadstica. Emplea toda ala
informacin disponible. Su nica desventaja real es que puede resultar afectada de manera
adversa por valores extremos. La media aritmtica es el valor promedio de la
distribucin

Mediana
La mediana es fcil e calcular si el nro. De observaciones es relativamente pequeo. No resulta
influida por los valores extremos y en consecuencia da un mejor centro de los datos. Al
trabajar con muestras que se seleccionan de poblaciones, las medias de las muestras por lo
general no varan tanto de la muestra a otra como la mediana.

La Moda
Para conjuntos pequeos de datos su valor casi no tiene utilidad si es que existe. Solo ene le
caso de una gran cantidad de datos tiene un sentido significativo. Sus dos ventajas principales
son que no requiere clculo y se puede usar para datos cualitativos as como para
cuantitativos. La moda es el valor que ms se repite en una distribucin.

Rango de la muestra
Puede ser una medida pobre d la variabilidad, en particular si el tamao de la muestra o
poblacin es grande. Considera solo los valores extremos y no nos dice nada acerca de la
distribucin de los valores intermedios.

Varianza de la muestra
Que considera la posicin de cada observacin en relacin con la media de la muestra.

Estadstica
Es una variable aleatoria que depende solo de la muestra observada

Distribucin muestral
Es la distribucin de probabilidad de una estadstica. Esta depende del tamao de la
poblacin, el tamao de las muestras y el mtodo de eleccin de las muestras.

La distribucin muestra de X con tamao muestral n es la distribucin que resulta cuando un
experimento se lleva a cabo una y otra vez y resultan diversos valores de X. Esta distribucin
muestral entonces, describe la variabilidad de los promedios mustrales alrededor de la
media de poblacin u. Se aplica el mismo principio en el caso de la distribucin de S
2
, la
distribucin muestral produce informacin acerca de la variabilidad de los valores de s
2

alrededor de o
2
en experimentos que se repiten.







Distribuciones mustrales de medias
Suponga que una muestra aleatoria de n observaciones se toma de una poblacin normal con
media u y varianza o2. Cada observacin Xi, i=1,2,, n de la muestra aleatoria tendr entonces
la misma distribucin normal que la poblacin que se muestra. De aqu por la propiedad
reproductiva de la distribucin normal que se establece:
Teorema a usar:
Si X1,X2,Xn son variables aleatorias independientes que tienen distribuciones normales con
media u1,u2,,un y varianzas o21,o22,,o2n respectivamente, entonces la variable aleatoria:
Y=a1X1 + a2X2 + + anXn
Tiene una distribucin normal con media
Uy= a1u
1
+ a2u
2
+ + anu
n

Y varianza
0
2
1 = a12o
2
1 + a22o
2
2 + a
2
no
2
n
Por eso concluimos que:
X = (X1 + X2 + + Xn ) / n
Tiene distribucin normal con media
Ux= (u + u + + u)/ n = u
O
2
x= o
2
+ o
2
+ + o
2
= o
2
/n
Si tomamos muestra de una poblacin con distribucin desconocida, finita o infinita, la
distribucin muestral de X aun ser aproximadamente normal con media u y varianza o2/n
siempre que el tamao de la muestra sea grande. Esta es una consecuencia inmediata del
teorema del lmite central.

Inferencia estadstica
Es una teora que consiste en aquellos mtodos por los que se realizan inferencias o
generalizaciones acerca de una poblacin. Esta se puede dividir en dos reas principales:
estimaciones y pruebas de hiptesis.

Una estimacin puntual de algn parmetro de la poblacin U es solo un valor de una
estadstica .

Estimador insesgado
Sea une estimador cuyo valor es una estimacin puntual de algn parmetro poblacional
desconocido U. Ciertamente, desearamos que la distribucin muestral de tuviera una media
igual al parmetro estimado. Se dice que un estimador que posee esta propiedad es insesgado.

Estimador mas eficiente
Si consideramos todos los posibles estimadores insesgado de algn parmetro, el de menor
varianza se llama as.

Una estimacin por intervalo de un parmetro poblacional U es un intervalo de la forma
1<U< 2 , donde 1 y 2 dependen del valor de la estadstica para una muestra particular y
tambin de la distribucin de muestreo .

De esta manera el intervalo estimado indica, por su longitud, la precisin de la estimacin
puntual.
P(1<U< 2) = 1 alfa .

- Intervalo de confianza : 1<U< 2 de (1- alfa)*100% .
- Coeficiente de confianza o grado de confianza : La fraccin 1 alfa
- Limites de confianza: L y U

Entre ms amplio sea el intervalo de confianza, podemos tener mas confianza de que el
intervalo dado contenga el parmetro desconocido.

Error tipo I
El error de tipo I se comete cuando la hiptesis nula es verdadera y, como
consecuencia del contraste, se rechaza. La probabilidad de cometer Error de
tipo I es el nivel de significacin .
Este tipo de error se denomina error de tipo I (eI), de modo que o es, precisamente, la
probabilidad de cometer ese tipo de error, es decir, es la probabilidad de rechazar una
hiptesis que es verdadera. Luego: o = P(e
I
)


Error tipo 2
El error de tipo II se comete cuando la hiptesis nula es falsa y, como consecuencia
del contraste se acepta. La probabilidad de cometer Error de tipo II depende del
verdadero valor del parmetro. Se hace tanto menor cuanto mayor sea n.

En los experimentos aleatorios no se puede predecir el resultado, ya que ste depende
del azar.


Resulta imposible controlar simultneamente ambos errores, por lo que en Teora de Decisin se
determina que el nico error que puede controlarse anticipadamente es el error de tipo I, por lo cual
debe fijarse o con anterioridad a la realizacin de cualquier prueba de hiptesis.

Nivel Significancia
La probabilidad alfa mas alta de rechazar H0 cuando H0 es cierto.

Hiptesis nula H0: afirmacin acerca del valor de un parmetro poblacional.
Hiptesis alterna H1: afirmacin que se aceptar si los datos muestrales
proporcionan evidencia de que la hiptesis nula es falsa.
Nivel de significancia: probabilidad de rechazar la hiptesis nula cuando es
verdadera.

Teorema Central del limite
Si una poblacin tiene media y desviacin tpica , y tomamos muestras de
tamao n (n>30, cualquier tamao si la poblacin es "normal"), las medias de
estas muestras siguen aproximadamente la distribucin: N(, /raz(n)).

Regresin Lineal
La muestra consiste en pares ordenados de datos. Bsicamente consideramos a una de ellas
como dato cierto o conocido mientras que la otra variable es de tipo aleatorio.
La ventaja consiste en una reduccin del error estndar que muchas veces es fuertemente
significativo. Las predicciones que hagamos con el promedio de regresin dinmico se
adecuan mucho ms a la realidad que aquellas que analizamos con el promedio aritmtico.

Recta de Regresion
Esa recta tiene una caracterstica. No tiene que pasar por ningn par de puntos, pero al mismo
tiempo debe pasar a menor distancia de todas las observaciones que cualquier otra recta. Es la
recta que hace mnimos los errores. O recta de cuadrados mnimos porque los errores suelen
medirse en escala cuadrtica. [] (^ es aproximacin lineal) [ = a + (b * x) ]
Para que se cumpla esa condicin, la pendiente y la ordenada se calculan con frmulas
especficas.

Recta regresin poblacional

Recta regresin muestral

- Hiptesis Nula (H0), que es la Hiptesis concreta que se formula acerca del valor del
parmetro, y que consiste en suponer que el parmetro toma un valor determinado. Se
denomina as porque el propsito del estudio es anularla o rechazarla.
- Hiptesis Alternativa (H1), que constituye otra Hiptesis diferente de la Hiptesis
Nula.
- Las Pruebas de Hiptesis son los procedimientos estadsticos apropiados que
permiten probar la validez de cualquier supuesto formulado respecto del valor de un
parmetro

La principal diferencia, ya anticipada, entre la Teora de Estimacin y la Teora de Decisin, es
que en la primera no se sabe cul es el valor de un parmetro y se intenta estimarlo mediante
una investigacin muestral, mientras que en la segunda se supone un valor determinado para
un parmetro y mediante una investigacin muestral se trata de probar si ese supuesto es
correcto.

Para poder establecer un mtodo objetivo, se debe elegir una probabilidad cercana a cero
(0,01; 0,05 0,10 se consideran los valores ms comunes), llamada Nivel de significacin,
que se simboliza con o, y que se representa como un rea (como toda probabilidad en una
funcin de densidad), que se ubica a la derecha, a la izquierda o a ambos lados (en este caso,
con la mitad de o en cada lado) segn como se haya definido la Hiptesis alternativa

valor crtico simbolizado con zc (o eventualmente tc), que divide al eje de las abscisas en
dos zonas: la zona de rechazo, que se extiende por debajo de o, y la zona de no rechazo,
que se extiende a lo largo del resto del eje.

You might also like