You are on page 1of 15

1.

Gráfica de valores individuales

Exploración de datos y evaluar relaciones entre las variables, Variabilidad de los


datos y comparación de datos

Grafica.
Gráfica de valores individuales de Material Particulado PM 10 µg/m³
120

110

100

90
µg/m³

80

70

60

50

40
2008 2009 2010
AÑO

Fuente: Autores

Grafica.

Gráfica de valores individuales de Morbililidad Menores de 5 Años

250
Morbililidad Menores de 5 Años

200

150

100

50

0
2008 2009 2010
AÑO

Fuente: Autores
Interpretación de los resultados

Las gráficas de valores individuales para material partículado PM10, muestran


que cada año tiene un promedio de contaminación distinto. El año 2009 tiene
una media menor que los años 2008 y 2010.

Las gráficas de valores individuales para morbilidad de menores de 5 años,


muestran que cada año tiene un promedio de contaminación distinto. El año
2008 tiene una media menor que los años 2009 y 2010; en contraste el año
2009 no muestra una correlación entre la contaminación del aire por material
partículado y la morbilidad de menores de 5 años.

2. Histograma agrupado

Histograma agrupado, es el que muestra los histogramas de cada año en la


misma gráfica. El histograma agrupado mostrará la cantidad de superposición
entre los datos de cada centro de envío.

Grafica.

Histograma de Material Particulado PM 10 a µg/m³


Normal
AÑO
0,06
2008
2009
2010
0,05
Media Desv.Est. N
78,83 14,66 12
0,04 58,75 8,551 12
Densidad

61,08 6,680 12

0,03

0,02

0,01

0,00
40 60 80 100 120
µg/m³

Fuente: Autores
Grafica.

Histograma de Morbililidad Menores de 5 Años


Normal
0,012 AÑO
2008
2009
0,010 2010

Media Desv.Est. N
120 59,57 12
0,008
114,5 72,54 12
Densidad

75,67 36,83 12

0,006

0,004

0,002

0,000
-60 0 60 120 180 240
Morbililidad Menores de 5 Años

Fuente: Autores

Interpretación de los resultados

Tal como pudo apreciar en la gráfica de valores individuales, las medias de cada
año son distintas. Los tiempos de entrega promedio son:

AÑO PM 10 Morbilidad
2008 78.83 120
2009 58.75 114.5
2010 61.08 75.6

El histograma agrupado muestra que los años 2009 y 2010 son similares en
cuanto al promedio de contaminación por PM 10 y a la dispersión de los datos.
En contraste, el año 2008 es mayor y mass disperso. Para morbilidad el
histograma agrupado muestra que los años 2008 y 2009 son similares en cuanto
al promedio y a la dispersión de los datos. En contraste, el año 2010 es manor y
menos disperso.
2. Histograma en paneles

Para determinar si los datos en cada año siguen una distribución normal.

Grafica.

Histograma de Material Partículado PM 10 µg/m³


Normal
40 60 80 100 120
2008 2009 2008
8
Media 78,83
6 Desv.Est. 14,66
N 12
4 2009
Media 58,75
Frecuencia

2 Desv.Est. 8,551
N 12
0
2010 2010
8
Media 61,08
6 Desv.Est. 6,680
N 12
4

0
40 60 80 100 120
µg/m³
Variable de panel: AÑO
Fuente: Autores

Grafica.
Histograma de Morbililidad Menores de 5 Años
Normal
-60 0 60 120 180 240
2008 2009 2008
4,8 Media 120
Desv.Est. 59,57
3,6 N 12
2,4 2009
Media 114,5
Frecuencia

1,2 Desv.Est. 72,54


N 12
0,0
2010 2010
4,8 Media 75,67
Desv.Est. 36,83
3,6 N 12
2,4

1,2

0,0
-60 0 60 120 180 240
Morbililidad Menores de 5 Años
Variable de panel: AÑO
Fuente: Autores
Interpretación de los resultados

La contaminación en cada año, no se distribuyen normalmente, tal como lo


demuestran las curvas de distribución que exhiben el mismo patrón,
exceptuando el año 2008 que se distribuye mejor solamente para el caso de
morbilidad de menores de 5 años..

3. Examen de las relaciones entre dos variables

Las gráficas pueden ayudar a identificar si existen asociaciones entre variables y


la fuerza de cualquier asociación. El conocer la relación entre variables puede
ayudar a orientar análisis adicionales y a determinar qué variables resulta
importante analizar.

Gráfica de Dispersión
Gráfica de dispersión de µg/ m³ vs. Morbililidad Menores de 5 Años
0 60 120 180 240
2008 2009
120

100

80

60
µg/ m³

40
2010
120

100

80

60

40
0 60 120 180 240
Morbililidad Menores de 5 Años
Relación entre la morbilidad menores de 5 años y la contaminación del aire PM10
Variable de panel: AÑO, con cobertura de área
Gráfica de matriz de Año. PM 10 µg/m³. Morbililidad Menores de 5 Años
50 75 100
2010

2009
AÑO
2008

100

µg/m³ 75

50

200

Morbililidad Menores de 5 Años


100

0
2008 2009 2010 0 100 200

4. Interpretación de los resultados

Los puntos de la gráfica de dispersión no muestran un patrón claro en ninguno


para los tres años. La línea de regresión de morbilidad en correlación al PM 10,
es relativamente plana, lo que sugiere poca asociación entre variables.
Grafica. Dispersión de datos con rezago de un mes en la contaminación del
aire PM 10.

Gráfica de matriz de AÑO. PM 10 µg/m³P1. Morbililidad Menores de 5 Años


50 75 100
2010

2009
AÑO

2008

100

µg/m³P1 75

50

200

Morbililidad Menores de 5 Años


100

0
2008 2009 2010 0 100 200

Grafica. Dispersión de datos con rezago de dos meses en la contaminación


del aire PM 10.

Gráfica de matriz de AÑO. PM 10 µg/m³P2. Morbililidad Menores de 5 Años


50 75 100
2010

2009
AÑO

2008

100

µg/m³P2 75

50

200

Morbililidad Menores de 5 Años


100

0
2008 2009 2010 0 100 200
Grafica. Dispersión de datos con rezago de tres meses en la contaminación
del aire PM 10.

Gráfica de matriz de AÑO. PM10 µg/m³P3. Morbililidad Menores de 5 Años


50 75 100
2010

2009
AÑO

2008

100

µg/m³P3 75

50

200

Morbililidad Menores de 5 Años


100

0
2008 2009 2010 0 100 200

Interpretación de los resultados

Los puntos de la gráfica de dispersión mejoran en el patrón de correlación. La


línea de regresión de morbilidad en correlación al PM 10, aumenta la pendiente
positiva, aunque los datos se muestran dispersos en relación a la correlación.
Análisis de datos

El campo de estadísticas proporciona principios y metodologías para recopilar,


resumir, analizar e interpretar datos. También sirve para sacar conclusiones de
análisis de resultados. Las estadísticas se pueden usar para describir datos y
hacer inferencias. Ambos elementos pueden orientar decisiones.

1. Estadísticas descriptivas

Ejecución del ANOVA (análisis de varianza)

En general, una prueba de hipótesis supone verdadera una afirmación inicial y


luego prueba esta afirmación mediante datos de muestra.

Las pruebas de hipótesis incluyen dos hipótesis: la hipótesis nula (señalada


como H0) y la hipótesis alternativa (señalada como H1). La hipótesis nula es la
afirmación inicial y con frecuencia se especifica sobre la base de investigaciones
anteriores o de conocimiento común. La hipótesis alternativa es lo que usted
puede considerar verdadero.

Salida de la ventana Sesión

ANOVA unidireccional: Morbililidad Menores de 5 Años vs. AÑO

Fuente GL SC MC F P
AÑO 2 14015 7007 2,07 0,143
Error 33 111840 3389
Total 35 125855

S = 58,22 R-cuad. = 11,14% R-cuad.(ajustado) = 5,75%

ICs de 95% individuales para la media


basados en Desv.Est. agrupada
Nivel N Media Desv.Est. ------+---------+---------+---------+---
2008 12 120,00 59,57 (----------*----------)
2009 12 114,50 72,54 (----------*-----------)
2010 12 75,67 36,83 (----------*-----------)
------+---------+---------+---------+---
60 90 120 150

Desv.Est. agrupada = 58,22


Intervalos de confianza simultáneos de Tukey del 95%
Todas las comparaciones de dos a dos entre los niveles de AÑO

Nivel de confianza individual = 98,04%

AÑO = 2008 restado de:

AÑO Inferior Centro Superior -+---------+---------+---------+--------


2009 -63,81 -5,50 52,81 (-----------*-----------)
2010 -102,65 -44,33 13,98 (-----------*-----------)
-+---------+---------+---------+--------
-100 -50 0 50

AÑO = 2009 restado de:

AÑO Inferior Centro Superior -+---------+---------+---------+--------


2010 -97,15 -38,83 19,48 (----------*-----------)
-+---------+---------+---------+--------
-100 -50 0 50

ANOVA unidireccional: Material Partículado µg/m³ vs. AÑO

Fuente GL SC MC F P
AÑO 2 2895 1448 13,06 0,000
Error 33 3659 111
Total 35 6554

S = 10,53 R-cuad. = 44,18% R-cuad.(ajustado) = 40,79%

ICs de 95% individuales para la media


basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -------+---------+---------+---------+--
2008 12 78,83 14,66 (-----*-----)
2009 12 58,75 8,55 (-----*-----)
2010 12 61,08 6,68 (-----*-----)
-------+---------+---------+---------+--
60 70 80 90

Desv.Est. agrupada = 10,53

Intervalos de confianza simultáneos de Tukey del 95%


Todas las comparaciones de dos a dos entre los niveles de AÑO

Nivel de confianza individual = 98,04%

AÑO = 2008 restado de:

AÑO Inferior Centro Superior ------+---------+---------+---------+---


2009 -30,63 -20,08 -9,54 (--------*--------)
2010 -28,30 -17,75 -7,20 (--------*--------)
------+---------+---------+---------+---
-24 -12 0 12

AÑO = 2009 restado de:

AÑO Inferior Centro Superior ------+---------+---------+---------+---


2010 -8,21 2,33 12,88 (--------*--------)
------+---------+---------+---------+---
-24 -12 0 12

Interpretar los resultados

El proceso de toma de decisiones para una prueba de hipótesis se puede basar


en el valor de probabilidad (valor p) para la prueba específica.

• Si el valor p es menor o igual a un nivel predeterminado de significancia


nivel ∞ finito, usted rechaza la hipótesis nula y da crédito a la alternativa.

• Si el valor p es mayor que el nivel ∞ finito, no se rechaza la hipótesis nula


y no se puede dar crédito a la hipótesis alterna.

El método de Tukey compara las medias para cada par de niveles de factor
utilizando un nivel de significancia por familia (frecuentemente mencionado como
nivel de significancia por familia) para controlar la tasa de errores de tipo de I El
nivel de significancia por familia es la probabilidad de cometer uno o más errores
de tipo I para todo el conjunto de comparaciones. El método de Tukey ajusta el
nivel de confianza individual, de acuerdo con el nivel de significancia por familia
que usted elija.
Los resultados se presentan como un conjunto de intervalos de confianza para la
diferencia entre pares de medias. Utilice los intervalos para determinar si las
medias son diferentes:

• Si un intervalo no contiene cero, existe una diferencia estadísticamente


significativa entre las medias correspondientes.
• Si el intervalo sí contiene cero, la diferencia entre las medias no es
estadísticamente significativa, la cual aplica para morbilidad de menores
de 5 años y PM 10.

Salida de la ventana Gráfica

Gráfica de valores individuales de Material Patículado PM 10 µg/m³ vs. AÑO


120

110

100

90
µg/ m³

80

70

60

50

40
2008 2009 2010
AÑO
Gráfica de caja de Material Partículado PM 10 µg/m³
120

110

100

90
µg/m³

80

70

60

50

40
2008 2009 2010
AÑO

Gráficas de residuos para Material Partículado PM 10µg/m³


Gráfica de probabilidad normal vs. ajustes
99 40

90
Porcentaj e

20
Residuo

50
0
10

1 -20
-20 0 20 40 60 65 70 75 80
Residuo Valor aj ustado

Histograma vs. orden


40
10,0
Frecuencia

7,5 20
Residuo

5,0
0
2,5
-20
0,0
-20 -10 0 10 20 30 40 1 5 10 15 20 25 30 35
Residuo Orden de observ ación
Gráfica de valores individuales de Morbililidad Menores de 5 Años vs. AÑO

250
Morbililidad Menores de 5 Años

200

150

100

50

0
2008 2009 2010
AÑO

Gráfica de caja de Morbililidad Menores de 5 Años

250
Morbililidad Menores de 5 Años

200

150

100

50

0
2008 2009 2010
AÑO
Gráficas de residuos para Morbililidad Menores de 5 Años
Gráfica de probabilidad normal vs. ajustes
99

90 100
Porcentaj e

Residuo
50
0

10
-100
1
-100 0 100 80 90 100 110 120
Residuo Valor aj ustado

Histograma vs. orden

8
100
Frecuencia

Residuo
4 0

2
-100
0
-100 -50 0 50 100 150 1 5 10 15 20 25 30 35
Residuo Orden de observ ación

Interpretar los resultados

Las gráficas de valores individuales y las de caja indican que el tiempo de


entrega varía entre los centros de envío, lo que resulta coherente con las
gráficas del capítulo anterior.

• Gráfica de probabilidad normal: para detectar no normalidades. Una línea


aproximadamente recta indica que los residuos se distribuyen
normalmente.
• Histograma de los residuos: para detectar diversos valores máximos,
valores atípicos y no normalidades. El histograma debe ser
aproximadamente simétrico y con forma de campana.
• Residuos contra los valores ajustados: para detectar varianza no
constante, términos de orden superior omitidos y valores atípicos. Los
residuos se deben dispersar aleatoriamente en torno a cero.
• Residuos versus orden: para detectar la dependencia del tiempo de los
residuos. Los residuos no deben exhibir un patrón claro.

Para los años en morbilidad de menores de 5 años y PM 10 de, las gráficas de


residuos cuatro en uno no indican infracciones de supuestos estadísticos. El
modelo del ANOVA de un factor ajusta los datos de manera razonablemente
adecuada.

You might also like