You are on page 1of 54

Estadstica Descriptiva:

1. Muestreo y Presentacin de
los Datos.
Ricardo anculef Alegra
Universidad Tcnica Federico
Santa Mara

Estadstica:
Dos conceptos fundamentales: muestra y poblacin
Poblacin o Poblacin Objetivo: conjunto de
elementos sobre los que queremos hacer afirmaciones
Muestra: subconjunto de la poblacin que se extrae
para ser estudiado

Estadstica:
Porqu una muestra?
Imposibilidad o costo excesivo de realizar un censo en
que se mide toda la poblacin

Estadstica:
Herramientas con dos Objetivos Bsicos
Describir la muestra: Estadstica Descriptiva
Obtener conclusiones de la poblacin a partir de la
muestra: Inferencia Estadstica.

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Marco Muestral: conjunto de elementos de la
poblacin suceptible de ser muestreada. Ejemplo:
Domingo 24 Agosto en La Tercera

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Porqu candidato votara usted?

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Si la eleccin tuviera que definir entre ellos dos
Por cul votara usted?

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Poblacin Objetivo?
Marco Muestral?
Muestra?

Tcnicas de Muestreo
Cmo recolectar los datos?
Muestreo No-Aleatorizado (o No-Probabilista)
Se basa en el juicio personal del investigador.
Puede generar buenas muestras pero no permite una
evaluacin estadstica de confianza.
Frecuentemente usado como primera aproximacin o si al
estudio sigue un stage especfico de validacin.

Muestreo Aleatorizado (o Probabilista)


Se controla la probabilidad de seleccionar un determinado
individuo del marco muestral.
Permite estudiar objetivamente la confianza de las
generalizaciones hacia la poblacin objetivo.

Tcnicas de Muestreo
Cmo recolectar los datos?
Muestreo no-Aleatorizado o no-Probabilista
Muestreo por convenciencia
Muestreo por juicio
Muestreo por cuota
Muestreo tipo bola de nieve (snowball)

Muestreo Aleatorizado o Probabilista:


Muestreo aleatorio simple
Muestreo sistemtico
Muestreo estratificado
Muestreo por grupos

Muestreo NO ALEATORIZADO

Tcnicas de Muestreo
Muestreo por Conveniencia
Los elementos de la muestra se eligen por estar en el
lugar o en el momento adecuado para la investigacin.
El criterio de seleccin (lugar, tiempo y demases) es
completamente dependiente del investigador, sin reglas
predeterminadas.

Tcnicas de Muestreo
Muestreo por Conveniencia
Ejemplos: encuestas en la calle, encuestas a
estudiantes, encuestas web

Tcnicas de Muestreo
Muestreo por Juicio
Un tipo de muestreo por conveniencia
Se selecciona de acuerdo a alguna caracterstica
especifica del encuestado juzgada por el encuestador
Clientes/Consumidores de un cierto tipo
Expertos en un tema o aspecto de la organizacin
Personajes lderes de opinin

Tcnicas de Muestreo
Muestreo por Juicio

Tcnicas de Muestreo
Muestreo por Cuota
Intenta mejorar la representatividad de la muestra
separando a la poblacin de acuerdo a variables de
control: edad, sexo, raza, nivel socio-econmico
A casa subgrupo o estrato se le asigna una cuota o
proporcin de muestreo, tpicamente % de la poblacin
Otros criterios: varianza.
Dentro del grupo se muestrea por conveniencia

Tcnicas de Muestreo
Muestreo tipo bola de nieve
Se selecciona un grupo inicial (usualmente de forma
probabilista aunque el resultado final no lo sea)
Los nuevos encuestados se seleccionan en base a las
referencias de los encuestados anteriores, explotando
sus redes sociales
Muy utilizado en ciencias sociales, cuando la
caracterstica a estudiar es rara o escasa y cuando es
difcil conseguir encuestados.

Tcnicas de Muestreo
Muestreo tipo bola de nieve (ejemplo)

Muestreo ALEATORIZADO

Tcnicas de Muestreo
Muestreo Aleatorio Simple
Cada elemento del marco muestral tiene la misma
probabilidad de ser seleccionado y cada elemento se
selecciona de manera independiente de los otros
con reemplazo: se pueden repetir elementos
sin reemplazo: no se pueden repetir elementos
Procedimiento: se indexa a la poblacin y luego se
elige un ndice de manera aleatoria hasta completar el
tamao deseado de la muestra.

Tcnicas de Muestreo
Muestreo Aleatorio Simple
Para muchos estudios se siguen utilizando tablas de
nmeros aleatorios aunque existen muchos algoritmos
generadores de los mismos.
cmo usar una tabla de nmeros aleatorios?

Tcnicas de Muestreo
Muestreo Aleatorio Simple

Tcnicas de Muestreo
Muestreo Aleatorio Sistemtico
Se elige un elemento de partida aleatoriamente y el
resto se elige en sucesin hasta completar la muestra
Regla de sucesin: Si n es el tamao de la muestra y N
el de la poblacin muestral se determina s = floor(N/n)
El genera un nmero aleatorio x. El k-simo
seleccionado es (x+ks) mod N
Se elige el x-simo
Luego el (x+s)-simo
Luego el (x+2s)-simo
etc

Tcnicas de Muestreo
Muestreo Aleatorio Sistemtico
Tiene cada elemento la misma probabilidad de ser
seleccionado? tiene cada subconjunto la misma
probabilidad de ser seleccionado?
Importante: el registro desde donde se selecciona no
debe presentar sesgo peridico, sino se reduce la
representatividad de la muestra.
Si el registro est ordenado de acuerdo a lo que se
estudia se puede aumentar la representatividad.
Se puede prescindir de identificar exactamente el
tamao del marco muestral

Tcnicas de Muestreo
Muestreo Aleatorio Estratificado
Antes de seleccionar los elementos, se agrupa la
poblacin muestral en estratos de acuerdo a una
variable importante: edad, gnero,ocupacin.
Objetivo: reducir la variabilidad que se puede
observar dentro de cada estrato
Dentro de cada estrato se puede proceder con
muestreo simple o sistemtico
El nmero de elementos a elegir puede ser
proporcional al tamao o inversamente proporcional a
la variabilidad del estrato

Tcnicas de Muestreo
Muestreo Aleatorio por Grupos
Se divide a la poblacin en grupos lo ms
homogneos entre ellos y lo ms heterogneos
internamente
Se seleccionan aleatoriamente los grupos a encuestar
ya sea de manera simple o sistemtica
Cada grupo seleccionado se muestrea
completamente: se toman todos sus elementos.
En ocasiones slo se conocen los grupos y no los
elementos que componen cada grupo.

Tcnicas de Muestreo
Muestreo Aleatorio
por Grupos
Ejemplo: Estudio sobre los niveles satisfaccin de los
profesores de escuelas primarias

Tcnicas de Muestreo
Muestreo Aleatorio
por Grupos
Ejemplo: Estudio sobre los niveles satisfaccin de los
profesores de escuelas primarias

Tcnicas de Muestreo
Muestreo Aleatorio
por Grupos
Ejemplo: Encuesta a los
espectadores de una
pelcula: se muestrean los
horarios a encuestar.

En el muestreo aleatorizado se conoce


la probabilidad de seleccin de cada
uno de los elementos.
Mejorable segmentando.

En el muestreo NO aleatorizado se
seleccionan las instancias de acuerdo al
criterio del investigador.
Mejorable segmentando.

Tcnicas de Muestreo
Tcnica

Muestreo
NO
probabilstico

Fortalezas

Debilidades

Rpido y barato.
Muestreo por Permite una rpida prima
conveniencia aproximacin a la
poblacin.

Tendencias en la seleccin del


lugar/momento usado para
obtener las muestras

Costo bajo, conveniente,


no toma mucho tiempo.
Muestreo por
Puede a aumentar la
juicio
representatividad del
muestreo por conveniencia

No permite la generalizacin,
es subjetivo.
Puede generar una muestra
orientada hacia demostrar lo
que el investigador cree

La muestra puede
Muestreo por
controlarse para ciertas
cuota
caractersticas.

Tendencias en la seleccin, no
asegura la representatividad.

Muestreo de
bola de nieve

Puede estimar
caractersticas poco
comunes.

Toma mucho tiempo.

Tcnicas de Muestreo
Tcnica
Muestreo
aleatorio
simple

Muestreo
probabilstico

Muestreo
sistemtico

Muestreo
estratificado

Muestreo de
grupo

Fortalezas

Debilidades

Se entiende con facilidad,


resultados proyectables.

Es difcil construir el marco


de la muestra, costoso,
menor precisin, no asegura
la representatividad.

Puede aumentar la
representatividad, ms fcil
de poner en prctica que el
MAS, no es necesario el
marco exacto de la muestra.

Puede reducir la
representatividad si hay
sesgo en la construccin del
registro.

Incluye todas las subpoblaciones importantes,


precisin (si se eligen bien
los estratos)

Es difcil seleccionar las


variables de estratificacin
relevantes, no es factible
estratificar conforme a
muchas variables, costoso.

Fcil de poner en prctica,


costo efectivo.

Inexacto, es difcil calcular e


interpretar los resultados.

Tcnicas de Muestreo
Tamao de la Muestra (n)
Problema duro de la Estadstica Inferencial
Criterios Generales
Qu se va a medir
Qu se quiere determinar
Nivel mximo de error admisible
Nivel de confianza con qu se quiere obtener la
estimacin del tamao muestral
Variabilidad de las caractersticas a medir

Estadstica Descriptiva
Cmo organizar y presentar los datos?

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos
El muestreo se realiza con el objetivo de llevar a cabo un
experimento: observacin, medicin o registro de
caractersticas o atributos de la poblacin de las cules se
tiene incertidumbre.
Lo ltimo (incert.) es lo que define un experimento
Se conocen los posibles valores, pero
No se sabe a-priori cules van a ser los resultados
Es repetible bajo condiciones esencialmente
equivalentes

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos
Producto del muestreo y la medicin obtenemos datos
Para propsitos estadsticos es til distinguir entre los
siguientes tipos de datos:
Numricos o Cuantitativos
Cualitativos
Estructurados: formados por conjuntos de los
anteriores, pero correspondientes a una misma
medicin (ejemplo: grafos, matrices)

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos
Numricos o Cuantitativos: operables aritmticamente
Escala Intervalar: Tienen sentido las diferencias.
Escala de Razn: Tienen sentido los cuocientes.
Discretos/Continuos.
Cualitativos:
Categricos: Son slo nombres de referencia.
Ordinales: Se pueden jerarquizar u ordenar.

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos
Ejercicio: Deseamos estudiar los hbitos de estudio de
un conjunto de sansanos y su impacto sobre el
rendimiento acadmico
Sugiera variables a medir en cada una de las categoras
definidas anteriormente

Estadstica Descriptiva
Concepto Fundamental: Frecuencia
La frecuencia de un suceso en la muestra es el nmero
de veces que ste se repite en la muestra (valor de una
caracterstica o de un subconjunto de valores).
Llamaremos frecuencia relativa a la fraccin de veces
que ste aparece en la muestra.
Si la frecuencia del suceso es k y la muestra es de
tamao n la frecuencia relativa est dada por: k/n

Estadstica Descriptiva
Presentacin de los Datos
Datos Categricos: Usualmente se presenta la frecuencia
con la que ocurre cada uno de los valores posibles
Diagramas de sectores (de torta)
Diagramas de barras

Estadstica Descriptiva
Presentacin de los Datos
Datos Categricos: Usualmente se presenta la frecuencia
con la que ocurre cada uno de los valores posibles
Diagramas de Pareto: diagrama de barras ordenado
descendentemente por frecuencia. Se suele incluir la
frecuencia acumulada hasta cada elemento.

Estadstica Descriptiva
Presentacin de los Datos

Estadstica Descriptiva
Presentacin de los Datos
Datos Ordinales: Los diagramas de barras se suelen
ordenar de acuerdo a la jerarqua natural de los valores
posibles. Ejemplo: estratos econmicos:

Estadstica Descriptiva
Presentacin de los Datos
Datos Cualitativos: Cuando son muchos es posible
agruparlos en subconjuntos, pero generados en gral. por
criterios no-estadsticos.

Estadstica Descriptiva
Presentacin de los Datos
Datos Cuantitativos: En universo de posibles valores es
infinito o muy grande. En la muestra puede no repetirse
ningn valor. Cmo presentarlos?

Estadstica Descriptiva
Presentacin de los Datos
Datos Cuantitativos. Tabligrama: El ltimo dgito se
expresa separado de los ms significativos.
Consideremos los siguientes datos

Estadstica Descriptiva
Presentacin de los Datos
Datos Cuantitativos: Tabligrama
15
16
17
18

455677888888
000000122333345556677799
001233344456788
05

Estadstica Descriptiva
Presentacin de los Datos
Datos Cuantitativos. Tablas de frecuencias: Agrupar los
valores en intervalos y registrar la frecuencia (relativa o
absoluta) de ese grupo de valores en la muestra

Estadstica Descriptiva
Presentacin de los Datos
Tablas de frecuencias. Cuntos intervalos K considerar?
Cmo deben estar estos distribuidos?
Histograma: Los intervalos son todos del mismo tamao y
cubren uniformemente el rango de los datos.
Rango = mximo mnimo
Amplitud de cada clase: A = (Rango+1)/K
1er Intervalo: [a1,b1]=[(min 0.5), (min 0.5)+A]
2do Intervalo: [a2,b2]=[b1, b1 + A]

k-simo: [ak,bk]=[bk-1, bk-1 + A]

Estadstica Descriptiva
Presentacin de los Datos
K := N Clases
R := Rango = mx { xi } - mn { xi } = 162 - 107 = 55
A := Amplitud = ( R + 1 ) / K = ( 55 + 1 ) / 7 = 8

Lmites

Marca

Frecuencias
ABS - REL - REL. AC.

106,5-114,5
114,5-122,5
122,5-130,5
130,5-138,5
138,5-146,5
146,5-154,5
154,5-162,5

110,5
118,5
126,5
134,5
142,5
150,5
158,5

5
3
5
8
6
7
6

0,125
0,075
0,125
0,2
0,15
0,175
0,15

0,125
0,2
0,325
0,525
0,675
0,85
1

Estadstica Descriptiva
Presentacin de los Datos
9

Histograma

8
7
6
5
4
3
2
1
0
110,5

118,5

126,5

134,5

142,5

150,5

158,5

Estadstica Descriptiva
Presentacin de los Datos
9
8

Polgono de Frecuencias

7
6
5
4
3
2
1
0
102,5

110.5

118,5

126,5

134,5

142,5

150,5

158,5

166,5

Estadstica Descriptiva
Presentacin de los Datos
1
0.9

OJIVA

0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
102,5

110,5

118,5

126,5

134,5

142,5

150,5

158,5

166,5

You might also like