Professional Documents
Culture Documents
La Ciencia se ocupa en general de fenmenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico) La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida donde la variablidad no es la excepcin sino la regla Carrasco de la Pea (1982)
Tema 1: Introducin
Definicin
La Estadstica es la Ciencia de la Sistematizacin, recogida, ordenacin y a i v presentacin de los datos referentes a un fenmeno t rip que presenta variabilidad o incertidumbre para su sc De estudio metdico, con objeto de
P b ro a li bi d ad
In
r fe
y poder de esa forma hacer previsiones sobre los a c i mismos, tomar decisiones u obtener conclusiones. n
Tema 1: Introducin 3
Los fumadores tienen ms bajas laborales que los no fumadores En qu sentido? Mayor nmero? Tiempo medio?
Fumadores y no fumadores en edad laboral. Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas? Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?
Estratificado? Sistemticamente?
tiempo medio de baja en fumadores y no (estadsticos) % de bajas por fumadores y sexo (frecuencias), grficos,...
Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.
Nivel de confianza del 95% Significacin del contraste: p=2% Tema 1: Introducin
Obtener conclusiones
Tema 1: Introducin
Poblacin y muestra
Poblacin (population) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo.
Muestra (sample) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debera ser representativo Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).
Tema 1: Introducin
Variables
Una variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables.
El grupo sanguneo
{A, B, AB, O} Var. Cualitativa {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal {0,1,2,3,...} Var. Numrica discreta {162 ; 174; ...} Var. Numrica continua
El nmero de hijos
La altura
Tema 1: Introducin
Tipos de variables
Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)
Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)
Es buena idea codificar las variables como nmeros para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.
0 = No sabe 99 = No contesta...
Estas situaciones debern ser tenidas en cuentas en el anlisis. Datos perdidos (missing data)
Tema 1: Introducin
Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico. No todo est permitido con cualquier tipo de variable.
Tema 1: Introducin
10
Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos) Edades:
Hijos:
Las modalidades/clases deben forman un sistema exhaustivo y excluyente Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)? Bien: Cul es su grupo sanguneo?
Mal: De los siguientes, qu le gusta: (deporte, cine) Bien: Le gusta el deporte: (S, No) Bien: Le gusta el cine: (S, No) Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)
Tema 1: Introducin 11
Frec. 4 6
6 5 4 3 2 1 0 Hombre Mujer
Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.
Tema 1: Introducin 12
Tablas de frecuencia
Exponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca).
Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas
Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%
Nmero de hijos Po rcentaje vlido 41,9 58,1 100,0 Frecuencia 0 419 1 255 2 37 5 3 215 4 127 5 54 6 24 7 23 Ocho o ms 17 To tal 1509 No co ntes ta 8 1517 Po rcentaje 27 ,6 16,8 24,7 14,2 8,4 3,6 1,6 1,5 1,1 99,5 ,5 100,0 Po rcentaje vlido 27 ,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Po rcentaje acumulado 27 ,8 44,7 69,5 83,8 92,2 95,8 97 ,3 98,9 100,0
Sexo del encues tado Frecuencia 636 881 1517 Porcentaje 41,9 58,1 100,0
Vlido s
Vlido s
Nivel d e felicid ad Frecuencia Po rcentaje Vlido s Muy feliz 467 30,8 Bas tante feliz 87 2 57 ,5 No demas iado feliz 165 10,9 To tal 1504 99,1 Perdido s No co ntes ta 13 ,9 To tal 1517 100,0 Po rcentaje vlido 31,1 58,0 11,0 100,0 Po rcentaje acumulado 31,1 89,0 100,0
Perdido s To tal
Tema 1: Introducin
13
Variable: Gnero
Modalidades:
H = Hombre M = Mujer
Muestra:
MHHMMHMMMH
Ejemplo
Cuntos individuos tienen menos de 2 hijos? frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos Qu porcentaje de individuos tiene 6 hijos o menos? 97,3% Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual? 2 hijos
Nmero de hijos Frec. 419 255 37 5 215 127 54 24 23 17 1509 Po rcent. (vlido ) 27 ,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Po rcent. acum. 27 ,8 44,7 69,5 83,8 92,2 95,8 97 ,3 98,9 100,0
0 1 2 3 4 5 6 7 Ocho + To tal
50%
Tema 1: Introducin
15
Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar tambin a variables discretas
No usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.)
Pictogramas
Fciles de entender. El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.
Tema 1: Introducin
16
375
Recuento
Son diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.
300
255 215
200
127
100
54 24
0 1 2 3 4 5 6
23
17
7 Ocho o ms
Se deja un hueco entre barras para indicar los valores que no son posibles
250 200
Nmero de hijos
El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Recuento
150
100
50
20
40
60
80
Tema 1: Introducin
17
Diagramas integrales
Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms general del que visteis en bachillerato.)
Tema 1: Introducin
18
Qu hemos visto?
Representaciones grficas
Diferenciales Integrales
Tema 1: Introducin
19