Professional Documents
Culture Documents
I. Q. Epidemióloga
Resumen sobre estadísticos
Posición
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Percentiles, cuartiles,
Centralización
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Dispersión
Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
Desviación típica, coeficiente de variación, rango, varianza
Forma
Asimetría
Apuntamiento o curtosis
MEDIDAS DE FRECUENCIA
CATEGÓRICAS NUMÉRICAS
• PROMEDIO ARITMÉTICO
• RAZÓN (Ratio) Mean ± DS
• Coeficiente de Variación
• PROPORCIÓN
• PREVALENCIA (Porcentaje) • MEDIANA (Median)
INCIDENCIA
• ACUMULADA (Riesgo) • RANGO INTERCUARTILICO
Risk
• DENSIDAD (Tasa ) • CUARTILES, DECILES,
Rate PERCENTILES
VARIABLES NUMÉRICAS
30
No. vasos f % % 25
con agua 20
Frec 15 Serie1
10
Acum 5
0
1 2 2% 2% 1 2 3 4 5 6 7 8
2 8 8% 10%
3 15 15% 25%
4 25 25% 50%
5 25 25% 75%
6 15 15% 90%
7 8 8% 98%
8 2 2% 100%
TOTAL 100 100%
Ejemplo
Calcular la frecuencia en porcentaje y la frecuencia acumulada.
Media (‘mean’) Es la media aritmética (promedio) de los valores de una variable. Suma
de los valores dividido por el tamaño muestral.
Media de 2,2,3,7 es (2+2+3+7)/4=3,5
Conveniente cuando los datos se concentran simétricamente con respecto a ese
valor. Muy sensible a valores extremos.
Centro de gravedad de los datos
Mediana (‘median’) Es un valor que divide a las observaciones en dos grupos con el
mismo número de individuos (percentil 50). Si el número de datos es par, se elige la
media de los dos datos centrales.
Mediana de 1,2,4,5,6,6,8 es 5
Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Es conveniente cuando los datos son asimétricos. No es sensible a valores
extremos.
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
80 + 5+ 5 + 5 + 5 = 100
100 ÷ 5 = 20 = PROMEDIO
Me = 5
Mo Me x
ASIMETRICA POSITIVA
Media aritmética
n
1
x
i 1
xi
n
PROPIEDADES DE LA MEDIA
DISTRIBUCION NORMAL
Mo Mo
Distribución Normal
22
Identificación de una distribución
Distribución Simétrica
CUARTILES
Q1 Q2 Q3
t de espera 41’ 50’ 55’
Faltas asistencia 4 6 9
x 4.0 3.4
RANGO
INTERCUARTILICO
D1 D2 D3 D4 D5 D6 D7 D8 D9
P2.5
95% P97.5
Dr. Reynaldo Carvajal Ortiz
Ejemplos
El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué
peso se considera “demasiado bajo”?
Percentil 5 o cuantil 0,05
15
10
5
0
1 2 3 4 5
15
10
5
0
50 55 60 65 70 75 80 85
Percentiles 5 y 95
20
15
frecuencia
10
5
0
Percentiles 25 y 75
20
15
frecuencia
10
5
0
5) La distribución no es simétrica V
6) Tres de cada 10 diez incapacidades son mayores a
12 días o menores a 4 días V
Dr. Reynaldo Carvajal Ortiz
VARIABILIDAD
X
VARIABILIDAD
DATOS
VARIANZA
DESVIACION ESTANDARD
1 -2 4
2 -1 1
3 0 0
4 +1 1
1 2 3 4 5
5 +2 4
10
S = 1.6 X ±S
Dr. Reynaldo Carvajal Ortiz
“ EJERCICIOS PARA APLICACIÓN DE CONCEPTOS”
DÍAS DE INCAPACIDAD EN UNA EMPRESA PROMEDIO = 15
Mediana = 10 s = 2.5
( x x) 2
s
2
i 1
n 1
Ejemplo - Varianza
Las edades de personas que tienen EDA:
10, 54, 21,33,53.
Se determina la media:
10+54+21+33+53 / 5 = 171 / 5 = 34,2
El calculo de la varianza:
(10–34,2)² + (54-34,2)² + (21-34,2)² +
(33-34,5)²+(53-34,2)² / 4 =
= 1506,8 / 4 = 376,7
Medidas de dispersión - Desviación estándar
• Símbolo S
• Si la distribución es normal
( x x) 2
s i 1
n 1
Ejemplo – Desviación Estandar
Las edades de personas que tienen Enfermedad diarreica aguda:
Se determina la media:
El cálculo de la varianza:
= 1506,8 / 4 = 376,7
S = √ S² =√ 376,7 = 19,4
Cálculo de la varianza y desviación estándar
5 5-5 02
6 6-5 12
7 7-5 22
8 8-5 32
9 9-5 42
10 10-5 52
Coeficiente de variación
Muestra 1 Muestra 2
Rango: 7,8.
≥ 60 años
Índice de Envejecimiento = -----------------
≤ 15 años
Porcentaje a
X 100
a + b
CASOS NUEVOS
• Varía entre 0 y 1
• No tiene unidad de medida
• Expresa “Riesgo de …”
RIESGO = 0.30
CASOS NUEVOS
• Cohorte dinámica
• Su unidad de medida es t -1
INFORMACIÓN TOTAL
TOTAL HOMBRES ACCIDENTADOS 15
TOTAL PERSONAS ACCIDENTADAS 20
TOTAL DE MUJERES QUE LABORAN 40
TOTAL ACCIDENTES EN HOMBRES 70
TOTAL DE ACCIDENTES 80
INFORMACIÓN TOTAL
TOTAL HOMBRES ACCIDENTADOS 15
TOTAL PERSONAS ACCIDENTADAS 20
TOTAL DE MUJERES QUE LABORAN 40
TOTAL ACCIDENTES EN HOMBRES 70
TOTAL DE ACCIDENTES 80
Clase de datos:
Utilizando cuestionarios
Mediante la observación
Realizando entrevistas
Recolección de datos estadísticos
Ventajas Desventajas
No importa el grado de Alto costo
educación del entrevistado
Flexibilidad tanto en el Requiere personal calificado
contenido como en la manera
de preguntar
Puede abordar temas La inseguridad no facilita la
complejos entrevista
Demora (requiere más tiempo)
Recolección de datos estadísticos
Organización de datos
Se requieren cálculos.
Recolección de datos estadísticos
Tiempo o cronológicas
Lugar o geográficas
Cantidad o cuantitativas
Cualidad o cualitativas
Tabular
Gráfica
Resumen numérico
Agrupación de datos
Distribución:
(Last, 1995)
Presentación tabular
La presentación tabular es:
Básica
Insustituible
Fundamental
Título
Encabezado
Columna matriz
Cuerpo
Nota encabezado
Nota a pie
Fuente
Requisitos de una tabla
Debe ser lo más simple posible, es mejor 2 ó 3 tablas
sencillas a una muy compleja.
20 – 23 ] (1 caso)
24 – 27 ]]]]] ]] (7 casos)
Líneas simples
Líneas de partes componentes
Barras verticales simples
rotos
15
10
Barras verticales compuestas 5
0
Barras horizontales simples Primero Segundo Tercero
Turno
Barras horizontales de partes componentes
Barras horizontales compuestas
Circular o pastel
Partes principales de una Gráfica
Numeración
Título
Encabezado
Escalas
Diagramas
Simbología
Nota a pie
Fuente
Resumen de tipos de Graficos
83
Agrupación de datos
Graficos
I. Quirurgica 201087
PROGRAMAS
Fisioterapia 45 25 305
17
Microbiologia 40 302010 18
Medicina 50 80 90 100 19
+ 19
0 100 200 300 400
85
Agrupación de datos
Gráficos
Los factores se
50 100
45 90
representan a lo largo
40 80 del eje x en forma
Nro de defectos
35 70 decreciente
30 60
25 Rotura del tablero de fibra 50 La curva de frecuencia
20 40 indica los pocos
15 Bordes dehilachados 30
Rasgadura de la tela 20
factores vitales que
10
5 Decoloración10 requieren atención
0 0 Defectos del interior del techo
Total 50
89
Diagramas de dispersión
Es una
representación
gráfica de dos
variables que
muestran cómo
se relacionan
entre sí
Se utiliza para
confirmar o
negar la
sospecha
90
Taller
Ejercicio: Con los datos siguientes elabore el análisis
estadístico descriptivo.