You are on page 1of 5

Conceptos Bsicos de la Inferencia Estadstica

16 de agosto del 2011

Miguel ngel Chong Rodrguez

miguel@sigma.iimas.unam.mx

Introduccin
Una caracterstica del humano es tratar de interpretar los fenmenos que lo rodean, aprender del mundo a partir de lo que se observa y de su experiencia a lo largo del tiempo. parte fundamental la observacin. A partir de estas experiencias uno aprende a hacer deducciones tiles del mundo en que vive. No en valde parte de mtodo cientco tiene como

Hay una gran variedad de fenmenos que quisieramos describir, pero podemos empezar por clasicarlos entre fenmenos deterministas y fenmenos aleatorios. Un

fenmeno determinista es aquel que, cuando se reproduce en las mismas condiciones, podemos predecir fenmeno aleatorio es el que cada vez que se realiza, aun bajo condiciones casi
idnticas, el

con certeza cul va a ser el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenmenos no son parte de nuestro estudio. Por otro lado, el

resultado no se conoce con certeza, adems que el resultado slo se sabe despus de realizado el experimento. Las herramientas con la que contamos para estudiar los fenmenos aleatorios son: 1. la probabilidad (a) como un grado de conanza o fundada apariencia de que algo suceda. (b) En los juegos o probabilidad clsica, es la razn entre el nmero de casos favorables y el nmero de casos posibles. (c) y su formalizacin basada en planteamiento axiomtico de Kolmogorov en 1933. 2. y la estadstica. (a) que es el estudio de los datos cuantitativos de la poblacin, adems que (b) es la rama de la matemtica que utiliza grandes conjuntos de datos numricos para obtener inferencias basadas en el clculo de probabilidades. (c) la estadstica clsica o frecuentista se basa en la

regularidad estadstica, es decir que, al repetir

un fenmeno aleatorio un nmero grande de veces en condiciones constantes, las proporciones en las que ocurren los posibles resultados son muy estables. (d) la estadstica subjetiva o Bayesiana que incorpora el conocimiento que tiene el individuo sobre el fenmeno aleatorio.

Concepto de medicin y de variable


Para cuanticar o clasicar lo que percibimos de un fenmeno aleatorio necesitamos hacer mediciones u observaciones que nos ayudarn a investigar una o varias caractersticas de inters sobre el fenmeno. Para un correcto manejo de nuestras mediciones, las observaciones deben ser registradas tomando en cuenta su
tipo, para poder saber que tipo de operaciones podemos hacer con ellas.

Cada variable tiene una escala de medicin, como vemos a continuacin

Variables

Escalas de medicin

Categricas

Nominales
Ordinales intervalo

Numricas

De

De razn

Absoluta
1. Una variable es

categricas

cuando el registro de la medicin es un elemento a una categora, y

las categoras cumplen con ser: mutuamente excluyentes razones y tablas de contingencia. (a) Nominales

1 y exhaustivas2 ; con este tipo de variables

podemos calcular, frecuencia de ocurrencia en cada categora, la(s) moda(s), proporciones, porcentajes,

Cuando las categoras slo se les da un nombre pero no tienen un orden entre ellas, Ejemplos:

 

Est de acuerdo con las obras de continuacin del segundo piso del Perifrico? S No. Sexo: Masculino, Femenino.

(b) Ordinales Cuando el registro de la medicin se expresa en grados de intensidad que tienen un orden, pero no se puede determinar el incremento entre los grados. Ejemplo:

 

Grados de satisfaccin en un servicio Muy bueno, Bueno, Regular y Malo. Nivel socio econmico: Bajo, Medio, Alto

2. Tenemos una variable

numrica cuando el resultado de nuestra medicin son valores numricos.

Con

este tipo de variables podemos calcular promedios o medias, desviaciones estndar, modas, correlaciones. (a) Escala de intervalo: hay un orden entre observaciones, y la distancia entre las mismas tiene

signicado. En esta escala hay un cero, pero no indica ausencia de medicin. Un ejemplo tpico de este tipo de variable con esta escala, es la temperatura cuando se mide en grados Fahrenheit o en grados Centgrados. Sabemos que la diferencia entre 30 C y 35 C es la misma que entre 45 C y 50 C y si se dice que un lquido se encuentra a 0 C, no signica que no tiene temperatura.

(b) Escala de razn: el cero s indica una ausencia de la variable, es decir una completa ausencia de medicin. Las variables peso, altura son de este tipo. (c) Escala absoluta: se usa para variables discretas o conteos. familia. Ejemplo: Nmero de hijos en una

Conceptos estadsticos: poblacin y muestra


Denamos como

poblacin

a todos los elementos presentan una caracterstica comn que estamos estuY entendermos como una

diando, acerca de la cual intentamos sacar alguna conclusin. subconjunto de elementos de la poblacin.

muestra

a un

1 No hay un elemento que pertenezcan a dos 2 Todo elemento pertenece a una categora.

o ms categoras a la vez.

Por qu estudiamos muestras en vez de la poblacin? Porque en ocasiones es poco factible o hasta imposible observar la totalidad de los individuos, es por esto que en lugar de examinar toda la poblacin, se estudia una pequea Una

3 parte de la poblacin.

muestra de tamao n en general, es decir sin jar los valores la denotaremos como
X = {X1 , X2 , X3 , . . . , Xn } .
4

Por otro lado cuando ya hemos observado los valores de la muestra , la escribiremos como

= {X1 = x1 , X2 = x2 , X3 = x3 , . . . , Xn = xn } .

Y siempre que la variable que midamos sea numrica, una vez que tenemos una muestra de tamao

{X1 , X2 , X3 , . . . , Xn }

entonces podemos obtener la

muestra ordenada y la denotaremos como

X(1) , X(2) , X(3) , . . . , X(n) ,


donde que

X(1) es la observacin ms chica, X(2) X(n) representa la observaci mayor.

es la segunda observacin ms chica, y as sucesivamente hasta

Estadstica descriptiva
La estadstica descriptiva tiene como n presentar resmenes de un conjunto de datos

X = {X1 , X2 , X3 , . . . , Xn }

y poner de maniesto sus caractersticas, mediante representaciones numricas y grcas. Los datos se usan para nes comparativos, y no se usan principios de probabilidad. El inters se centra en describir el conjunto dado de datos y no se plantea el extender las conclusiones a otros datos diferentes o a una poblacin.

Estadstica descriptiva

Numricamente Grcamente

Medidas de tendencia central Medidas de dispersin Histograma Grco de tallo y hojas

Media Mediana Moda

Percentiles Deciles

Cuartiles

Varianza muestral Desviacin estndar Rango intercuantil

Rango

Coeciente de variacin

Distribucin acumulada . . .

1. Medidas de tendencia central (a)

Media X
n

X
3 Qu 4 Una

=
i=1

Xi n

tan pequea debe de ser la muestra para ser representativa de la poblacin. realizacin de la muestra.
4

(b)

Mediana X

es el valor tal que el

50% de los datos son menores que l y el 50% son mayores. = X


X

Aqu

hay que distinguir entre dos casos: Si el tamao de la muestra

es par entonces

(n 2)

+X 2

+1) (n 2

Por otro lado si el tamao de la muestra es impar (c) (d)

= X n+1 . X ) (
2

Moda: es el valor o categora ms frecuente. El cuantil o porcentil de %, P% es aquel


y un

valor tal que un

de los datos son menores a l

(1 ) %

de ellos es mayor a l, es decir

X(1) , X(2) , . . . , X(p1)


25%

Primer cuartil
50%

P25%

, X(p) , . . . , X(q) ,
25%

Segundo cuartil

P50%

X(q+1) , . . . X(s1) ,

tercer cuartil

P75%

X(s) , . . . , X(n1) , X(n)


25%

75%

2. Medidas de dispersin
n

(a) (b) (c) (d)

Varianza muestral se dene como S = Rango R = X(n) X(1) Rango intercuantil RIC = P75% P25%
2

i=1

) (Xi X

n1

, y la desviacin estndar es

S=

S2.

Coeciente de variacin cv = 100 X


X = {X1 , X2 , X3 , . . . , Xn }
y

3. Medidas de dependencia entre dos muestras tamao (a)

Y = {Y1 , Y2 , Y3 , . . . , Yn }

de

Covarianza medida de variabilidad conjunta


cov (X, Y ) =
n i=1

Yi Y Xi X n1

(b)

Coeciente de Correlacin si la varianza es conocida


r = cov (X, Y ) V ar (X ) V ar (Y )

(c)

Coeciente de Correlacin si la varianza es desconocida


r = = cov (X, Y ) SX SY
n i=1 n i=1

Xi X
2

Yi Y
n i=1

Xi X

Yi Y

You might also like