Professional Documents
Culture Documents
Qu es Poblacin? P
Conjunto formado por TODAS las unidades (personas, animales o cosas) que tienen algo en comn. La poblacin debe ser listada en lo que llamaremos Marco Muestral.
Qu es una muestra?
M
Una muestra es un subconjunto de la poblacin. Ella debe cumplir con ser REPRESENTATIVA.
Tcnicas de Muestreo
Las ms comunes son: Muestreo Aleatorio Simple. Muestreo Estratificado.
Qu es una variable?
Caracterstica que cambia de sujeto a sujeto.
Qu es un dato?
Es una realizacin de una caracterstica o variable, al ser evaluada en un sujeto.
Qu es Informacin?
Llamaremos informacin al conjunto de datos.
Tipos de Variables Variable Cualitativa: Variable Cuantitativa: Nominal Ordinal Discreta Continua
Tabulacin
La informacin que a continuacin se muestra representa el nivel de instruccin de 20 personas: B,M,S,S,B,B,M,M,M,S,S,M,B,B,M,M,B,M,S,B
Nivel de Instruccin Bsico Medio Superior Total Frecuencia Absoluta 7 8 5 20 Porcentaje 35 40 25 100
Supongamos que tenemos una muestra de 110 fumadores y se examina la marca del cigarrillo. Tenemos la siguiente tabla:
Marca de Cigarros Advance Belmont Derby Viceroy Total
35
30
25 Frecuencia Absoluta
20
15
10
Belmont 25%
Derby 28%
Formula de Sturger: K = 1+ [3.3 log10 (n )] En este ejemplo K=1+[4.29]=5 R=Rango=Mximo - Mnimo=7.0 - 3.1= 3.9
R 3.9 = 0 . 78 C i= = K 5
Tabla de Frecuencia
Nota 3,10-3,88 3,88-4,66 4,66-5,44 5,44-6,22 6,22-7,00 Marca de Clase 3,49 4,27 5,05 5,83 6,61 Frecuencia Absoluta 3 3 6 4 4 20 Frecuencia Frec. Absoluta Frec. Relativa Relativa Acumulada Acumulada 0,15 3 0,15 0,15 6 0,30 0,30 12 0,60 0,20 16 0,80 0,20 20 1,00 1,00
0 | 3444455555566666677 2| 4| 6| 8| 10 | 0
Medidas Resmenes
Llamaremos medidas resmenes a aquellas cantidades que resumen y describen la informacin de manera que sean representativos del conjunto de datos.
Medidas Tendencia Central Moda Mediana Promedio Percentiles Dispersin Rango Rango Intercuartlico Varianza Coeficiente de Variacin Forma Asimetra
MODA (MO): Es la realizacin que tiene mayor frecuencia. Para datos agrupados en intervalos se adopta como moda la marca de clase del intervalo con mayor frecuencia. En caso de existir ms de una moda hablaremos de multimodalidad. Ejemplo:
Marca de Cigarros Advance Belmont Derby Viceroy Total Frecuencia Absoluta 22 27 31 30 110 Porcentaje 20,00 24,55 28,18 27,27 100,00
Moda
En el caso de datos agrupados en intervalo, la moda se calculara como:
1 Moda = LI i + + ci 2 1
OBSERVACION: La moda puede existir o no existir La moda puede ser nica o existir mas de una moda
x
i=1
X n
i
i=1
PERCENTIL- Llamaremos percentil % a aquel valor de la variable en estudio, que acumula el % de la informacin. Necesariamente no es una medida de tendencia central. 1) Calcular la posicin: n 100 X + X ( m ) ( m+1) 2) Si posicin es un entero (m): P =
2
P = X (m+1)
PERCENTIL- En el caso de datos agrupados en intervalo: 1) Calcular la posicin: n 100 2) Determinar en que intervalo cae la posicin obtenida en 1) 3) Del intervalo obtenido en 2): LI i , ni , ci , N i 1 4)
n ci P = LI i + N i 1 100 ni
MEDIANA
Me = P50
Cuartiles
Medidas de Dispersin
R= Mx Mn RI = Q3 Q1
S= S
S CV = X
(x
S =
2 i=1
X)
n 1
Medidas de Dispersin
Para datos agrupados la varianza es calculada como:
n (X
i
X)
S =
i=1
n 1
2
Se realiz un experimento para comparar el efecto de dos dietas (A y B) sobre el aumento de peso en 20 sujetos que son distribuidos al azar en dos grupos. Los datos fueron: Dieta A: -1.0 0.0 2.1 3.1 3.3 4.3 5.0 5.2 5.5 6.8 Dieta B: 2.5 3.0 4.0 5.7 6.0 6.9 7.0 7.2 7.3 8.1
Dieta Min Q1 Me Promedio Q3 Mx R RI 2 S CV A -1.0 1.05 3.8 3.43 5.1 6.8 7.8 4.05 6.14 0.72 B 2.5 3.5 6.45 5.77 7.1 8.1 5.6 3.6 3.8 0.33