You are on page 1of 54

Mtodos cuantitativos I

Introduccin Definiciones bsicas Variables Presentacin de informacin Medidas estadsticas Indicadores de salud

Jos Espinoza

ESTADISTICA DESCRIPTIVA DEFINICIONES BASICAS

Poblacin
Conjunto de objetos (realmente existentes o posibles) que verifican una definicin bien determinada. Por objeto entendemos cualquier persona, animal, familia, institucin, etc. As por ejemplo, constituirn una poblacin los universitarios peruanos, las familias peruanas, etc.

ESTADISTICA DESCRIPTIVA DEFINICIONES BASICAS

Muestra

Cualquier subconjunto de una poblacin. La muestra hace siempre referencia a una poblacin de la cual es parte. La muestra se obtiene a travs de las tcnicas de muestreo. Ejemplo: muestra de universitarios peruanos, una muestra de familias peruanas, etc

ESTADISTICA DESCRIPTIVA DEFINICIONES BASICAS

Parmetro

Toda funcin definida sobre los valores numricos de una poblacin. Ejemplos, La media de las edades de todos los universitarios peruanos El promedio de edad de pacientes que llegan a

emergencia peditrica.

Estadsticos

Toda funcin definida sobre los valores numricos de una muestra. As por ejemplo, ser estadsticos la media aritmtica de las edades de una muestra de 250 universitarios peruanos.

Datos : Es conjunto de todos los valores asignados a cada uno de los elementos de una muestra o poblacin. Los datos pueden ser: a) Cualitativos atributo :Si el valor asignado es un

Ejemplo: hombre, nivel primario, bien informado b) Cuantitativo :Si el valor asignado es un

nmero real Ejemplo: 15 aos, 65 kgs., 165 cm., 5 hijos

DEFINICION DE ESTADISTICA

Es una ciencia que es parte de las matemticas, que recolecta ordena, analiza los datos de una muestra,
extrada de una cierta poblacin que a partir de esta muestra, valindose del clculo de probabilidades se encarga de hacer inferencia acerca de la poblacin. Segn esta definicin la estadstica consta de 2 partes: -Recoleccin, ordenacin y anlisis de los datos mostrados. -Verificacin de inferencia acerca de la poblacin de sus parmetros a partir de la muestra.

ESTADISTICA APLICADA A LOS PROYECTOS DE INVERSION Apoya el proceso de investigacin en la fase de recoleccin, ordenamiento, procesamiento, y anlisis de los datos acumulados en una investigacin. En las investigacin por la viabilidad de recursos (tiempo, dinero y factibilidad) en lugar de estudiar toda una poblacin se usa una muestra. Posteriormente valindose del clculo de probabilidades se encarga de hacer inferencia acerca de la poblacin.

VARIABLES
Se define las variables, como magnitudes que tienden a sufrir modificaciones o cambios dentro de un dominio determinado. Clasificacin de las variables. a) Por su generalidad o nivel de Abstraccin:

Tericos Intermedias Empricas

Tericos
Son aquellas variables que necesitan definirse operacionalmente; por que sus cualidades no son fcilmente observables ni medibles. Ejemplo :

Intermedias
Son variables que permiten especificar a las variables tericas, con el fin de hacer las observables y medibles. Ejemplo

Empricas
Son aquellas variables que no necesitan definirse operacionalmente; porque sus valores se identifican en forma inmediata y son fcilmente medibles. Ejemplo: Edad, sexo, nmero de hijos por familia

b) Por su relacin Causal Independientes. Son aquellos que no dependen de ninguna variable dentro de un contexto determinado, indica: -Causa -Determinantes -Antecedentes Dependientes Son aquellos que dependen de otra u otras variables dentro de un contexto determinado, indica: -Resultado -Efecto -Consecuencia

Interviniente Son las que van a especificar las condiciones o requisitos para que las
otras variables X e Y tomen sus correspondientes valores

Ejemplo: El escaso fomento de la educacin alimentaria en la poblacin, genera mayor desnutricin en las familias de bajo nivel de instruccin.

En este caso las variables son:


-Educacin alimentara: X (variable independiente) -Desnutricin infantil: Y (variable dependiente) -Nivel de instruccin: Z (variable interviniente)

Por su Naturaleza Variables Cuantitativas Es aquella cuyos valores del dominio de variacin son contados o medidos. Se clasifican en: -Cuantitativa Discreta: Cuando los valores slo puede asumir valores enteros. Ejemplo: Nmero de hijos por familia. -Cuantitativas Continuas: Cuando los valores del dominio de variacin son susceptibles de ser medidos y pueden ser valores decimales. Ejemplo: Edad, peso, talla, etc.

c)

Por su Naturaleza. Variables Cualitativas Es aquella cuyo dominio de variacin son objeto de clasificacin Sexo (Masculino, Femenino).

Variables Ordinales. Son aquellos cuyo dominio de variacin son objeto de clasificacin y orden. Nivel de instruccin (primaria, secundaria, superior)

d) De acuerdo a su dimensin del campo de variacin.

Variable aleatoria unidimensional: Cuando se refiere al estudio de una sola variable.


Ejemplo: Cuando en cierta investigacin se est analizando el nivel de colesterol de los pacientes que llegan a un establecimiento de salud.

d) De acuerdo a su dimensin del campo de variacin.

Variables Bidimensionales: Cuando se refiere al estudio de dos variables. Cabe indicar que para el manejo de distribuciones bidimensionales, es necesario que las variables guarden relacin Ejemplo: Cuando en cierta investigacin se estudia la intensidad del dolor a traves del tiempo en cada esquema teraputico de los pacientes sometidos a artroscopia de rodilla

d) De acuerdo a su dimensin del campo de variacin.

Variables Pluridimensional

Cuando se refiere el estudio de tres variables ms Cuando en cierta investigacin se estudia el Rendimiento Escolar, Inteligencia, Creatividad y Capacidad de Orden de un grupo de sujetos

Medicin de Variables
Las variables no slo se clasifican, sino que tambin es necesario medirlas. La medicin se hace necesaria con el fin de diferenciar, por comparacin un elemento de otro, en las caractersticas de la variable, esta se hace a travs de niveles o escalas, entre las cuales tenemos:
ESCALA NOMINAL

Es el nivel ms simple de medicin donde la variable establece categoras sin orden. En este nivel de medicin las categoras slo se nombran o se enumeran, pero no se comparan. En este nivel las variables pueden ser: -Dicotmicas:Si tienen dos categoras o clases -Tricotmicas: Si tienen tres categoras o clases. -Politmicas : Si tiene ms de tres categoras.

ESCALA ORDINAL. Es el segundo nivel de medicin donde la variable establece categoras jerarquizadas. Este nivel de medicin no mide las magnitudes de las diferencias, pero si permite apreciar que los valores asignados a los individuos caen ms alto o bajo que otros. Ejemplo: Rendimiento Acadmico , Adaptacin Social ESCALA DE INTERVALOS. Es el tercer nivel de medicin, entre cuyos diversos valores que toma la variable existen a la vez, clasificacin orden y grado de distancia iguales entre las diferentes caractersticas, es decir, los intervalos son considerados como equivalentes y con un origen convencional (La unidad de medida no necesariamente tiene que partir del valor cero, solo sirve como punto o valor de comparacin). Ejemplo: -Edad. -Peso.

ESCALA DE RAZON O PROPORCION

Es el nivel ms alto de medicin y donde la variable supone o comprende a la vez a todos los casos anteriores : Orden, Clasificacin, Distancia y Origen nico natural o punto de origen natural (la unidad de medida necesariamente tiene que partir del valor cero) Ejemplo: Rendimiento Escolar: Uno puede tener un Rendimiento escolar de 16, pero para llegar a esta nota, no
necesariamente tiene que haber empezado de cero, ya que esta implica la falta de capacidad.

NOTA: Las variables que segn su naturaleza son cualitativas por su medicin pertenecen a la escala nominal: y las ordinales a la escala ordinal. Las variables que segn su naturaleza son cualitativas pertenecen a la escala de intervalo o razn

Es buena idea codificar las variables como nmeros para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.

Sexo (Cualit: Cdigos arbitrarios)


1 = Hombre 2 = Mujer 1 = Blanca 2 = Negra,...

Raza (Cualit: Cdigos arbitrarios)


Felicidad Ordinal: Respetar un orden al codificar.


1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz

Se pueden asignar cdigos a respuestas especiales como


0 = No sabe 99 = No contesta...

Estas situaciones debern ser tenidas en cuentas en el anlisis. Datos perdidos (missing data)

Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico. No todo est permitido con cualquier tipo de variable.

Presentacin ordenada de datos


7 6

Gnero Hombre

Frec. 4

5 4 3 2

Mujer

1 0 Hombre Mujer

Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.

Tablas de frecuencia

Exponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad


Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas
Muy tiles para calcular cuantiles (ver ms adelante)

Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

Sexo del encuestado Porcentaje vlido 41,9 58,1 100,0

Vlidos

Hombre Mujer Total

Frecuencia 636 881 1517

Porcentaje 41,9 58,1 100,0

Nmero de hijos Porcentaje vlido 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcentaje acumulado 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

Vlidos
Niv el de felicidad Porcentaje vlido 31,1 58,0 11,0 100,0 Porcentaje acumulado 31,1 89,0 100,0

Vlidos

Perdidos Total

Frecuencia Muy feliz 467 Bastante feliz 872 No demasiado feliz 165 Total 1504 No contesta 13 1517

Porcentaje 30,8 57,5 10,9 99,1 ,9 100,0

Perdidos Total

0 1 2 3 4 5 6 7 Ocho o ms Total No contesta

Frecuencia 419 255 375 215 127 54 24 23 17 1509 8 1517

Porcentaje 27,6 16,8 24,7 14,2 8,4 3,6 1,6 1,5 1,1 99,5 ,5 100,0

Datos desordenados y ordenados en tablas

Variable: Gnero

Gnero Hombre Mujer

Frec.

Modalidades:
H = Hombre M = Mujer
4
6 10=tamao muestral

Frec. relat. porcentaje 4/10=0,4=40% 6/10=0,6=60%

Muestra:
MHHMMHMMMH

equivale a HHHH MMMMMM

Ejemplo

Cuntos individuos tienen menos de 2 hijos?

Nmero de hij os Porcent. (vlido) 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcent. acum. 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos

Qu porcentaje de individuos tiene 6 hijos o menos?

97,3%

Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual?

0 1 2 3 4 5 6 7 Ocho+ Total

Frec. 419 255 375 215 127 54 24 23 17 1509

50%

2 hijos

Grficos para v. cualitativas

Diagramas de barras

Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar tambin a variables discretas

Diagramas de sectores (tartas, polares)


No usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

Pictogramas

Fciles de entender. El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.

Grficos diferenciales para variables numricas


419
400

375

300

Son diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.

Recuento

255 215
200

127
100

54 24 23 17

Diagramas barras para v. discretas


Se deja un hueco entre barras para indicar los valores que no son posibles
250

7 Ocho o ms

Nme ro de hijos

Histogramas para v. continuas


El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Recuento

200

150

100

50

20

40

60

80

Edad del encue stado

Diagramas integrales

Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms general del que visteis en bachillerato.)

Resumen sobre estadsticos

Posicin

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.


Cuantiles, percentiles, cuartiles, deciles,...

Centralizacin

Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda

Dispersin

Indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza

Forma

Asimetra Apuntamiento o curtosis

Estadsticos de posicin

Se define el cuantil de orden como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Estadsticos de posicin

Percentil de orden k = cuantil de orden k/100


La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%

Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.


Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75

Ejemplos

El 5% de los recin nacidos tiene un peso demasiado bajo. Qu peso se considera demasiado bajo?
Percentil 5 o cuantil 0,05
Percentil 5 del peso

frecuencia

10

15

20

25

3 Peso al nacer (Kg) de 100 nios

Ejemplos
Qu peso es superado slo por el 25% de los individuos?
Percentil 75 o tercer cuartil
Percentil 75 del peso
30 frecuencia 0 5 10 15 20 25

50

55

60

65

70

75

80

85

Peso (Kg) de 100 deportistas

Ejemplos

El colesterol se distribuye simtricamente en la poblacin. Supongamos que se consideran patolgicos los valores extremos. El 90% de los individuos son normales Entre qu valores se encuentran los individuos normales?
Percentiles 5 y 95

frecuencia

10

15

20

180

200

220 Colesterol en 100 personas

240

260

Ejemplos

Entre qu valores se encuentran la mitad de los individuos ms normales de una poblacin?


Entre el cuartil 1 y 3

Percentiles 25 y 75

frecuencia

10

15

20

150

160

170 Altura (cm) en 100 varones

180

190

Ejemplo
Nmero de aos de escolarizacin Porcentaje acumulado ,3 ,7 1,1 1,9 3,5 8,0 11,7 16,6 22,2 52,8 61,4 73,0 77,9 90,7 93,6 96,6 98,0 100,0 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total Frecuencia 5 5 6 12 25 68 56 73 85 461 130 175 73 194 43 45 22 30 1508 Porcentaje ,3 ,3 ,4 ,8 1,7 4,5 3,7 4,8 5,6 30,6 8,6 11,6 4,8 12,9 2,9 3,0 1,5 2,0 100,0

Estadsticos Nmero de aos de escolarizacin N Vlidos 1508 Perdidos 0 Media 12,90 Mediana 12,00 Moda 12 Percentiles 10 9,00 20 11,00 25 12,00 30 12,00 40 12,00 50 12,00 60 13,00 70 14,00 75 15,00 80 16,00 90 16,00

20%?

90%?

Estadsticos de centralizacin
Aaden unos cuantos casos particulares a las medidas de posicin. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.

Media (mean) Es la media aritmtica (promedio) de los valores de una variable. Suma de los valores dividido por el tamao muestral. Media de 2,2,3,7 es (2+2+3+7)/4=3,5 Conveniente cuando los datos se concentran simtricamente con respecto a ese valor. Muy sensible a valores extremos. Centro de gravedad de los datos

Mediana (median) Es un valor que divide a las observaciones en dos grupos con el mismo nmero de individuos (percentil 50). Si el nmero de datos es par, se elige la media de los dos datos centrales. Mediana de 1,2,4,5,6,6,8 es 5 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5 Es conveniente cuando los datos son asimtricos. No es sensible a valores extremos.
Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!

Moda (mode) Es el/los valor/es donde la distribucin de frecuencia alcanza un mximo.

Altura mediana

Algunas frmulas

Datos sin agrupar: x1, x2, ..., xn

Media

Datos organizados en tabla

si est en intervalos usar como xi las marcas de clase. Si no ignorar la columna de intervalos.

xi

n
i

Media

x
Variable L0 L1 L1 L2
... Lk-1 Lk xk n nk Nk

xi ni

fr. x1 x2 n1 n2

fr. ac. N1 N2

Cuantil de orden i es el menor intervalo que tiene frecuencia acumulada superior a n =0,5 es mediana

Li

n Ni 1 ( Li Li 1 ) ni

Ejemplo con variable en intervalos


Peso
40 50 50 60 60 70 70 - 80 80 - 90 90 - 100 100 130

M. Clase
45 55 65 75 85 95 115

frec
5 10 21 11 5 3 3

Fr. acum.
5 15 36 47 52 55 58

En el histograma se identifica unidad de rea con individuo. Para calcular la media es necesario elegir un punto representante del intervalo: La marca de clase. La media se desplaza hacia los valores extremos. No coincide con la mediana. Es un punto donde el histograma estara en equilibrio si tuviese masa.

Ejemplo (continuacin)
Peso 40 50 M. Clase 45 Fr. 5 Fr. ac. 5

xi ni

45 5 55 10 115 3 69 ,3 58

50 60
60 70 70 - 80 80 - 90 90 - 100 100 130

55
65 75 85 95 115 58

10
21 11 5 3 3

15
36 47 52 55 58

Mediana C0,5

0,5 58 N i 1 ( Li Li 1 ) ni 0,5 58 15 60 (70 60 ) 66 ,6 21 Li 1

P75 C0,75

Li

0,75 58 N i 1 43,5 36 ( Li Li 1 ) 70 (80 70 ) 76 ,8 ni 11

Moda = marca de clase de (60,70] = 65 Cada libro ofrece una frmula diferente para la moda (difcil estar al da.)

Variabilidad o dispersin

Los estudiantes de Bioestadstica reciben diferentes calificaciones en la asignatura (variabilidad). A qu puede deberse?

Diferencias individuales en el conocimiento de la materia.

Podra haber otras razones (fuentes de variabilidad)? Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. Las notas seran las mismas en todos? Seguramente No.

Dormir poco el da del examen, el croissant estaba envenenado...


Diferencias individuales en la habilidad para hacer un examen.

El examen no es una medida perfecta del conocimiento.


Variabilidad por error de medida.

En alguna pregunta difcil, se duda entre varias opciones, y al azar se elige la mala
Variabilidad por azar, aleatoriedad.

Medidas de dispersin
Miden el grado de dispersin (variabilidad) de los datos, independientemente de su causa.
0.05
Mn.

2,1,4,3,8,4. El rango es 8-1=7 Es muy sensible a los valores extremos.

0.03

0.04

Amplitud o Rango (range): Diferencia entre observacines extremas.

P25

P50

P75

Mx.

0.02

25%

25% 25% Rango intercuartlico

25%

Rango intercuartlico (interquartile range):

0.01

Rango

Es la distancia entre primer y tercer cuartil.


Rango intercuartlico = P75

- P25

0.00
150

160

170

180

190

Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. No es tan sensible a valores extremos.

Varianza S2 (Variance): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.

1 n

( xi
i

x )2

Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable. De interpretacin difcil para un principiante.
La expresin es fea, pero de gran belleza natural (fsicamente). Contiene la informacin geomtrica relevante en muchas situaciones donde la energa interna de un sistema depende de la posicin de sus partculas.
Energa de rotacin (va el coeficiente de inercia): patinadores con brazos extendidos (dispersos) o recogidos (poco dispersos) Energa elstica: Muelles estirados con respecto a su posicin de equilibrio (dispersos) frente a muelles en posicin cercana a su posicin de equilibrio (poco dispersos)

Desviacin tpica (standard deviation) Es la raz cuadrada de la varianza

Tiene las misma dimensionalidad (unidades) que la variable. Versin esttica de la varianza. Cierta distribucin que veremos ms adelante (normal o gaussiana) quedar completamente determinada por la media y la desviacin tpica.

S
50 40 30

20

10

A una distancia de una desv. tpica de la media hay ms de la ms de la mitad.

Desv. tp. = 568,43 Media = 2023 0


0 50 0 90

N = 407,00
0 30 3. 0 90 2. 0 50 2. 0 10 2. 0 70 1. 0 30 1.

A una distancia de dos desv. tpica de la media las tendremos casi todas.

Peso recin nacidos en partos gemelares

Dispersin en distribuciones normales


0.05
0.04 0.01 0.02 0.03 0.05

0.02

0.03

0.04

x 2s 95 %

0.01

x s 68.5 %
0.00

0.00

150

160

170

180

190

150

160

170

180

190

Centrado en la media y a una desv. tpica de distancia hay aproximadamente el 68% de las observaciones. A dos desviaciones tpicas tenemos el 95% (aprox.)

Datos casi normales. Eje x medido en desviaciones tpicas


Encuentras relacin entre rango intercuartlico y desviacin tpica? Y entre los bigotes y dos desviaciones tpicas? Podras caracterizar las observaciones anmalas?

0.3

densidad

densidad

0.2

0.1

x s 66 %

x 2s 95 %

0.1

0.2

0.3

x s 71 %

x 2s 94 %

0.0

-3
0.4

-2

-1

0.0

-3

-2

-1

densidad

0.3

densidad

0.2

0.1

0.1

0.2

0.3

x s 68 %

x 2s 94 %

x s 70 %

x 2s 94 %

0.0

-3

-2

-1

0.0

-3

-2

-1

Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.

Mide la desviacin tpica en forma de qu tamao tiene con respecto a la media Tambin se la denomina variabilidad relativa. Es frecuente mostrarla en porcentajes

CV

S x

Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.

Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin en peso que en altura.

No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente Por ejemplo 0C 0F
Los ingenieros electrnicos hablan de la razn seal/ruido (su inverso).

Asimetra o Sesgo

Una distribucin es simtrica si la mitad izquierda de su distribucin es la imagen especular de su mitad derecha.
En las distribuciones simtricas media y mediana coinciden. Si slo hay una moda tambin coincide La asimetra es positiva o negativa en funcin de a qu lado se encuentra la cola de la distribucin. La media tiende a desplazarse hacia las valores extremos (colas). Las discrepancias entre las medidas de centralizacin son indicacin de asimetra.

Estadsticos para detectar asimetra

Hay diferentes estadsticos que sirven para detectar asimetra.


Basado en diferencia entre estadsticos de tendencia central. Basado en la diferencia entre el 1 y 2 cuartiles y 2 y 3. Basados en desviaciones con signo al cubo con respecto a la media.
Los calculados con ordenador. Es pesado de hacer a mano.

En funcin del signo del estadstico diremos que la asimetra es positiva o negativa.

Distribucin simtrica asimetra nula.


0.5 0.20 0.05 0.10 0.1 0.2 0.15

0.20

0.15

0.05

0.10

0.3

0.4

x s
0.00

x s 66 %
0.00

x s 78 %

78 %
0.0

10

12

14 x

16

18

20

-2

-1

0 x

6 x

10

12

14

Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribucin con respecto a la distribucin normal o gaussiana. Es adimensional. Platicrtica (aplanada): curtosis < 0 Mesocrtica (como la normal): curtosis = 0 Leptocrtica (apuntada): curtosis > 0
En el curso sern de especial inters las mesocrticas y simtricas (parecidas a la normal).

2.0

Aplanada

Apuntada como la normal


0.8

Apuntada

1.5

0.3

1.0

0.2

0.5

0.1

x s 57 %
0.0

x s 68 %
0.0

0.2

0.4

0.6

x s 82 %
0.0

0.0

0.2

0.4

0.6

0.8

1.0

-3

-2

-1

-2

-1

Ejercicio: descriptiva con SPSS


Descriptiv os para Nmero de hijos Estadstico 1,90 1,81
20%

28% n=419 25% n=375


25%

Porce ntaje

Media Intervalo de Lmite confianza para la inferior media al 95% Lmite superior Media recortada al 5%

Error tp. ,045

17% n=255 14% n=215


15%

1,99

8% n=127
10%

1,75 Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil 2,00 3,114 1,765 0 8 8 3,00 Asimetra Curtosis 1,034 1,060 ,063 ,126

4% n=54 2%
5%

2%

1%

n=24 n=23 n=17

7 Ocho o ms

Nmero de hijos Est sombreado lo que sabemos interpretar hasta ahora. Verifica que comprendes todo. Qu unidades tiene cada estadstico? Variabilidad relativa?
Calcula los estadsticos que puedas basndote slo en el grfico de barras.

You might also like