You are on page 1of 27

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz


Marco Antonio Percastre Bentez Miguel Padilla Haro

15 de Diciembre de 2011

Contenido
1. Introduccin 2. Objetivo 3. Diseo del Estudio 4. Tcnicas Descriptivas 4.1. Anlisis Descriptivo 4.1.1. Descripcin de los Datos 4.1.2. Estadsticas Descriptivas 4.1.3. Deteccin de Observaciones Discrepantes 4.1.4. Caras de Chernoff 4.1.5. Curvas de Andrews 4.2. Escalamiento Multidimensional 4.3. Anlisis de Componentes Principales 4.4. Anlisis de Conglomerados para Observaciones 4.5. Anlisis de Conglomerados para Variables 4.6. Anlisis de Factores 4.7. Anlisis de Discriminantes 5. Conclusiones

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

1. Introduccin ENFERMEDAD DEL DENGUE: El dengue es una enfermedad causada por un virus, que se trasmite nicamente a travs de la picadura del mosquito llamado Aedes Aegypti. La enfermedad es estacional, y se manifiesta durante los meses clidos. El mosquito: a. Vuela y pica durante las horas del da. b. Vive en casas, lugares sombreados, frescos y tranquilos. c. Es de contextura pequea y obscura. El mosquito se reproduce cuando una hembra deposita una cantidad cercana de 100 huevos. El mosquito adulto vive en un radio de 100 metros de su criadero. La hembra busca recipientes con agua limpia y en calma para de sus huevos. Deposita los huevos contra la pared del recipiente, en zona hmeda y sobre el agua. En contacto con el agua, los huevos comienzan a desarrollarse. Los mosquitos despus de un da de nacer ya pueden procrear. Cuanto ms calor hace, el ciclo de vida del mosquito se cumple en menos das. La persona. Una persona es afectado y es blanco final del mosquito, es amplificador de la infeccin, debe ser la persona accesible y atractiva a los mosquitos, los factores que determinan la incidencia de la infeccin son genticos, susceptibilidad, edad, estado de salud, inmunidad, debe causar baja mortalidad y capacidad de generar elevados niveles de viremia con duracin que permita la infeccin de otros vectores (Secretara de Salud, 1993) TRASMICION DE LA ENFERMEDAD: Se trasmite cuando hembra del Aedes Aegypti se alimenta con sangre de una persona enferma y luego pica a otra persona sana. La enfermedad no es se trasmite directamente de una persona a otra. Sin el mosquito no hay enfermedad. EPIDEMIOLOGIA: La distribucin del dengue obedece a determinantes de tipo geogrficos, que condicionan su aparicin e incidencia estacional, su afeccin universal a grupos humanos, al mosquito y a su patrn de transmisin. Distribucin geogrfica: Los virus del dengue frecuentemente se transportan de un lugar a otro en personas que se infectan en visitas que hacen a regiones endmicas; el perodo de incubacin puede ser de 3 a 14 das y la disponibilidad de transporte areo permite desplazamientos tan distantes de un estado a otro, o de un pas a otro y hasta de un continente a otro en poco tiempo, si el destino es una rea infestada por especies de mosquitos susceptible, se alimenta de la sangre del viajero en el perodo virmico de la infeccin y sobreviviera al ciclo extrnseco del virus, muy probablemente marcara el inicio de un brote. 2. Objetivo Encontrar las variables que determinan el patrn de transmisin de la enfermedad del dengue.

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

3. Diseo del Estudio Dentro de la trasmisin de la enfermedad existen variables que van determinando el aumento de los casos de dengue en el estado de Veracruz, es importante hacer nfasis en el mosquito como trasmisor de la sangre infectada, y las personas que intervienen. Podemos separar las variables que contribuyen en el patrn de transmisin por parte de las personas, como: la marginacin y total de poblacin. Las variables que contribuye en el patrn de transmisin, por parte del mosquito como: temperatura, altitud, y precipitacin. Las variables que pueden ser importantes en el patrn de transmisin por parte en ambos como; latitud y longitud la cual describe el lugar donde habitan y conviven ambos. 4. Tcnicas Descriptivas 4.1. Anlisis Descriptivo 4.1.1. Descripcin de los Datos La descripcin de las variables es la siguiente. MUNICIPIO: lugar dentro del estado de Veracruz al que hacemos referencia. CASOS: nmero de casos de la enfermedad de dengue en cada municipio correspondiente. TEMPERATURA: temperatura promedio durante el periodo en que se presentaron los casos. PRECIPITACION: precipitacin promedio durante el periodo en que se presentaron los casos. ALTITUD: altura promedio del municipio marcada como metros sobre el nivel del mar. MARGINACION: es una medida que se consider para medir LATITUD: es una medida que se considera junto con la longitud para ubicar el lugar del municipio al que hacemos referencia y as poder tener una variable numrica de municipios. LONGITUD: es una medida que se considera junto con la latitud para ubicar el lugar del municipio al que hacemos referencia y as poder tener una variable numrica de municipios. POBLACION: total de habitantes del municipio en el periodo que registraron los casos. La lista completa de las observaciones se muestra a continuacin.

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

NUMERO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48

MUNICIPIO Agua Dulce Amatln de los Reyes Angel R. Cabada Atzalan Boca del Ro Catemaco Cerro Azul Chocamn Coatzacoalcos Coatzintla Colipa Crdoba Cosoleacaque Cuitlhuac Fortn Gutirrez Zamora Hueyapan de Ocampo Isla Jltipan Jamapa Juan Rodrguez Clara La Antigua Lerdo de Tejada Manlio Fabio Altamirano Martnez de la Torre Medelln Minatitln Misantla Nautla Orizaba Pnuco Papantla Paso de Ovejas Playa Vicente Poza Rica de Hidalgo Pueblo Viejo San Andrs Tuxtla Santiago Tuxtla Sayula de Alemn Soledad de Doblado Temapache Txpam Tihuatln Tres Valles Ursulo Galvn Vega de Alatorre Veracruz Yecuatla

CASOS TEMPERATURA PRECIPITACION ALTITUD MARGINACION LATITUD 1 9 3 4 14 44 4 1 39 10 3 26 4 2 1 6 9 33 2 1 30 2 2 18 191 5 6 188 12 10 4 80 1 56 14 4 4 4 1 1 96 160 3 8 6 2 225 3 26.60276 24.118425 25.678982 21.045904 27.047541 24.683083 23.424061 21.199368 26.347895 23.931856 24.185312 22.632614 26.195778 26.584908 22.951189 22.480101 26.904949 27.163265 26.202982 26.966925 27.013481 27.764389 26.294937 27.333288 23.322868 26.604975 26.295834 23.140566 23.924654 21.747452 22.748549 22.534071 27.630096 26.875893 23.85075 22.581911 25.104107 25.31481 26.315323 27.408964 23.237335 23.628078 24.015692 26.169437 27.81967 23.716511 27.522085 23.878256 41.200035 44.961143 32.59156 75.466957 13.976697 32.655014 36.965408 45.135654 33.124352 37.75169 52.713787 43.465389 29.760178 37.84626 43.280323 46.354103 18.990231 21.219717 27.555941 12.711237 19.540945 10.23668 31.998295 12.007128 61.72628 13.326662 33.917099 59.741798 55.507881 38.472656 12.302532 40.859776 10.131244 29.043999 36.881371 12.300589 32.923588 30.478539 23.353075 12.697787 33.054993 33.101318 31.912621 25.49918 10.349794 43.909981 14.364526 54.736439 7 697 22 138 1 400 154 1338 3 88 238 824 50 380 958 46 32 52 50 17 21 24 6 24 69 8 28 41 11 1262 9 50 63 28 50 9 342 40 95 95 31 9 90 25 1 38 0 238 -1.48 -0.661 -1.201 -0.889 -2.004 -1.066 -1.591 -0.679 -1.712 -1.673 -1.212 -1.885 -0.976 -1.268 -1.6 -0.069 -1.425 -1.086 -1.253 -1.196 -1.023 -1.595 -1.508 -1.353 -1.379 -1.274 -1.741 -1.224 -1.502 -1.877 -1.552 -1.216 -1.348 -1.337 -1.713 -1.511 -1.186 -1.075 -0.524 -1.246 -1.135 -1.627 -0.885 -1.443 -1.684 -1.242 -1.864 -1.214 18.136944 18.844167 18.581944 19.9649073 19.100833 18.419444 21.190278 19.010833 18.14 20.481389 19.921111 18.9008333 17.995278 18.811389 18.896944 20.4669445 18.1552775 18.0275 17.963889 19.019722 18.0397915 19.369444 18.628056 19.1064583 20.1175279 19.0378703 17.988889 20.0361903 20.160556 18.849722 22.1739817 20.4004724 19.281944 17.8120488 20.535 22.1951385 18.449722 18.464167 17.881667 19.045278 20.9213491 20.9040556 20.745139 18.22 19.405278 19.992639 19.199167 19.906667

LONGITUD POBLACION -94.147222 -96.914444 -95.3927775 -97.0114813 -96.107222 -95.113611 -97.738889 -97.033333 -94.480278 -97.46 -96.724722 -96.934074 -94.636944 -96.72 -96.997778 -97.142639 -95.164444 -95.528333 -94.716389 -96.212778 -95.2965973 -96.376389 -95.520278 -96.3109028 -97.0650833 -96.1348147 -94.558611 -96.9159921 -96.726667 -97.103611 -98.0978703 -97.2243332 -96.440278 -95.6877429 -97.453889 -97.8470835 -95.212222 -95.3679165 -94.959722 -96.416111 -97.6527777 -97.4377224 -97.5445835 -96.1218055 -96.361944 -96.683889 -96.137778 -96.736111 43856 36731 31979 48075 134648 45243 24593 15102 265568 39069 6164 176448 53713 23180 45829 26317 39667 38743 37600 9933 33391 23273 20049 20520 118482 35011 152313 60539 9750 118101 90241 169604 30647 49232 152294 50141 141867 54343 27878 27126 102662 125688 80912 43907 27516 18671 453361 12444

4.1.2. Estadsticas Descriptivas En las siguientes graficas presentamos la descripcin de cada variable que se consider para este anlisis, dentro de las grafica tenemos la distribucin de cada una de las variables de inters y dentro de sus tablas tenemos las medidas de descripcin de tendencia central como la media, la mediana, y la moda, de igual forma estn las medidas de dispersin como la varianza, la desviacin estndar. Los intervalos de confianza para la media, la mediana y la desviacin estndar con un nivel confianza al 95%. Hace una comparacin entre los intervalos de confianza para la mediana y la media y nos sirvi para tener la informacin resumida de cada variable de inters que se involucr.

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Summary for POBLACION


A nderson-D arling N ormality Test A -S quared P -V alue < M ean S tD ev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 47760 33108 9 5 % C onfidence Inter vals
Mean Median 30000 40000 50000 60000 70000 80000 90000

4.44 0.005 70675 78917 6227937878 2.9411 11.3795 48 6164 26519 41762 99557 453361 93591 50857 98850

100000

200000

300000

400000

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tD ev 65696

Summary for LONGITUD


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum -96.617 -96.915 9 5 % C onfidence Inter vals
Mean Median -97.0 -96.8 -96.6 -96.4 -96.2 -96.0

0.67 0.077 -96.324 1.008 1.016 0.388398 -0.776057 48 -98.098 -97.057 -96.428 -95.425 -94.147 -96.032 -96.132 1.263

-98

-97

-96

-95

-94

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0.839

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Summary for LATITUD


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 18.985 18.838 9 5 % C onfidence Inter vals
Mean Median 18.8 19.0 19.2 19.4 19.6

0.92 0.018 19.310 1.120 1.255 0.749008 0.006358 48 17.812 18.427 19.042 20.097 22.195 19.636 19.506 1.403

18

19

20

21

22

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0.932

Summary for MARGINACION


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tD ev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum -1.4258 -1.4844 9 5 % C onfidence Inter vals
Mean Median -1.50 -1.45 -1.40 -1.35 -1.30 -1.25 -1.20

0.49 0.212 -1.3168 0.3754 0.1409 0.83330 1.59206 48 -2.0040 -1.5940 -1.3055 -1.1478 -0.0690 -1.2077 -1.2156 0.4702

-2.0

-1.5

-1.0

-0.5

0.0

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0.3125

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Summary for ALTITUD


A nderson-D arling N ormality Test A -S quared P -V alue < M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 78.95 27.40 9 5 % C onfidence Inter vals
Mean Median 0 50 100 150 200 250

8.45 0.005 170.88 316.58 100224.88 2.60662 6.27190 48 0.00 18.00 43.50 127.25 1338.00 262.80 64.20 396.55

300

600

900

1200

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 263.55

Summary for PRECIPITACION


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 27.847 28.746 9 5 % C onfidence Inter vals
Mean Median 28 30 32 34 36 38

0.60 0.110 32.335 15.459 238.974 0.442556 0.005039 48 10.131 19.128 32.789 42.760 75.467 36.824 37.123 19.363

10

20

30

40

50

60

70

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 12.869

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Summary for TEMPERATURA


A nderson-D arling N ormality Test A -S quared P -V alue < M ean S tD ev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 24.435 23.915 9 5 % C onfidence Inter vals
Mean Median 24.0 24.5 25.0 25.5 26.0 26.5

1.29 0.005 25.003 1.957 3.830 -0.25123 -1.20836 48 21.046 23.348 25.209 26.808 27.820 25.571 26.300 2.451

21.0

22.5

24.0

25.5

27.0

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 1.629

Summary for CASOS


A nderson-D arling N ormality Test A -S quared P -V alue < M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 12.522 4.000 9 5 % C onfidence Inter vals
Mean Median 0 10 20 30 40

8.94 0.005 28.167 53.879 2902.908 2.59959 5.97824 48 1.000 2.250 5.500 24.000 225.000 43.811 10.000 67.487

50

100

150

200

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 44.852

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

En el cuadro siguiente se compara la normalidad de cada variable, en donde se puede apreciar que solo las observaciones de tres variables se distribuyen normal, estn son marginacin, longitud y precipitacin. Bajo los cuadros anteriores y este cuadro de comparaciones se puede asegurar mejor esta deduccin de la normalidad de estas tres variables.

Probability Plot of CASOS, TEMPERATURA, PRECIPITACIO, ALTITUD, ...


Normal - 95% CI
C A SO S TE M P E RA TU RA P RE C IP ITA C IO N

99 90 50 10 1 -50

99 90 50 10 1

99 90 50 10 1

50 A LTITU D

150 99 90 50 10 1

20

25 M A RG IN A C IO N

30 99 90 50 10 1

40 LA TITU D

80

Percent

99 90 50 10 1 -1000 99 90 50 10 1 -100.0

0 LO N G ITU D

1000 99 90 50 10 1

-2

-1 P O BLA C IO N

16.0

18.5

21.0

-97.5

-95.0

200000

400000

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

En el cuadro siguiente hacemos la comparacin de los histogramas entre las variables de inters. Como anteriormente habamos descrito, se puede apreciar en este cuadro que los datos de la marginacin, la precipitacin y la longitud se distribuyen normal y este cuadro nos sirvi para apreciarlo de una mejor manera y compararlo con las otras variables donde los datos no se distribuyen normales.

Histogram of CASOS, TEMPERATURA, PRECIPITACIO, ALTITUD, ...


C A SO S 30 15 0
0 50 0 10 0 15 0 20

TE M P E RA TU RA 5.0 2.5 0.0


21 22 23 24 25 26 27 28

10 5 0
10 20

P RE C IP ITA C IO N

30

40

50

60

70

Frequency

A LTITU D 30 15 0
0 0 30 0 60 0 90 00 12

16 8 0
. -2 0

M A RG IN A C IO N 10 5 0
. -1 5 .0 -1 . -0 5 0 0. 18 19

LA TITU D

20

21

22

10 5 0
8 -9 7 -9

LO N G ITU D 20 10 0
6 -9 5 -9 4 -9 0 00 10 00

P O BLA C IO N

00 00 00 00 00 00 20 30 40

10

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

En el cuadro siguiente se muestra los boxplot de cada variable de inters, permite hacer la comparacin entre variables, como en los cuadros anteriores. Una de las observaciones de este cuadro seria: que tanto los casos como la altitud, como la poblacin y en un solo caso la marginacin tienen dentro de sus datos casos atpicos, mientras que en los otros datos no se aprecia.

Boxplot of CASOS, TEMPERATURA, PRECIPITACIO, ALTITUD, ...


C A SO S 200 27 TE M P E RA TU RA 60 40 20 0 A LTITU D 1000 -1 500 0 -94 LO N G ITU D 400000 -96 -2 P O BLA C IO N 20 21 0 M A RG IN A C IO N 22 LA TITU D P RE C IP ITA C IO N

100

24

18

200000

-98

4.1.3. Deteccin de Observaciones Discrepantes Es importante verificar la presencia de observaciones lejanas o discrepantes porque estas pueden influenciar los resultados de manera significativa. El grafico siguiente muestra las distancias Mahalanobis (distancia entre los datos y el centroide del espacio multivariado) para cada una de las observaciones (municipios). Los puntos que se encuentran por encima de la lnea horizontal de referencia son observaciones discrepantes. Este es un mtodo multivariado muy poderoso para detectar observaciones discrepantes porque toma en cuenta las diferentes escalas entre las variables y las correlaciones entre ellas. Las observaciones discrepantes identificadas corresponden a los municipios de Veracruz y de Chocomn. Veracruz se encuentra muy alejado de la lnea de referencia mientras que Chocomn se encuentra muy cerca de esta lnea.

11

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Outlier Plot of CASOS, ..., POBLACION


47

5
8

Mahalanobis Distance

1 2

16 9 12 6 11 5 7 14 15 13 22 19 21 18 17 20 24 23 26 25

28

30 31

36 44

4.183
42

27 29

32

34 35 37

39 41 40

43 45 48

2
3

10

33

38

46

10

20 30 Observation

40

50

4.1.4. Caras de Chernoff En este anlisis nos permite analizar y comparar entre los municipios que tan parecidos entre ellos y si alguno de ellos es muy diferente entre sus caractersticas que se midieron. Se aprecia que existe un caso atpico y con mucha diferencia entre los dems, es el caso de Veracruz. Tambin se puede apreciar que podemos separar tres grupos como parte de una diferencia muy generalizada y es a travs del color de la carita entre los que son de carita amarilla, los de carita roja y lo de carita naranja.

12

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Agua Dulce

Amatln de los Reyes Angel R. Cabada

Atzalan
Index

Boca del Ro
Index

Catemaco
Index

Cerro Azul
Index

Chocamn
Index

Coatzacoalcos
Index

Coatzintla
Index

Colipa
Index

Crdoba
Index

Cosoleacaque
Index

Cuitlhuac
Index

Fortn
Index

Gutirrez Zamora Hueyapan de Ocampo


Index Index

Isla
Index

Jltipan
Index

Jamapa
Index

Juan Rodrguez Clara


Index

La Antigua
Index

Lerdo de Tejada Manlio Fabio Altamirano


Index Index

13
Index Index Index

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Martnez de la Torre

Medelln

Minatitln

Misantla
Index

Nautla
Index

Orizaba
Index

Pnuco
Index

Papantla
Index

Paso de Ovejas
Index

Playa Vicente
Index

Poza Rica de Hidalgo


Index

Pueblo Viejo
Index

San Andrs Tuxtla


Index

Santiago Tuxtla
Index

Sayula de Alemn
Index

Soledad de Doblado
Index

Temapache
Index

Txpam
Index

Tihuatln
Index

Tres Valles
Index

Ursulo Galvn
Index

Vega de Alatorre
Index

Veracruz
Index

Yecuatla
Index

14
Index Index Index

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

4.1.5. Curvas de Andrews La aplicacin de la tcnica de anlisis descriptiva conocida como curvas de Andrews sugiere la existencia de dos grupos bien definidos que se muestran en la grfica siguiente. Los dos grupos identificados se han marcado en color diferente. Tambin se puede apreciar una observacin discrepante en el grupo de color rojo. Esta observacin discrepante seguramente corresponde al municipio de Veracruz.

-10

-5

10

-3

-2

-1

4.2. Escalamiento Multidimensional Se ha seleccionado el escalamiento multidimensional mtrico porque todas las ocho variables del estudio son numricas. Para realizar el escalamiento multidimensional en los datos se procedi a construir la matriz de distancias con la mtrica Euclidiana. La medida de bondad de ajuste para dos dimensiones es de 0.4795 y se considera valida. Esto significa que los datos se pueden graficar de manera adecuada utilizando dos dimensiones. En las grficas siguientes se muestran los resultados obtenidos. En la primera se han graficados las tres primeras dimensiones en grupos de dimensiones. En la segunda grafica se muestran los resultados en tres dimensiones. En la tercera grafica se muestran los resultados en dos dimensiones (dimensin 1 vs. Dimensin 2).

15

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Los resultados sugieren la existencia de dos grupos de datos muy bien definidos. En la tercera grafica se han identificado todas las observaciones y se ha marcado con diferente color a los grupos identificados. Las observaciones ms cercanas son ms parecidas y las ms alejadas son menos parecidas. La observacin 47, que corresponde al municipio de Veracruz, parece ser un outlier (caso atpico).

Escalamiento Multidimensional Metrico


-0.2 0.2 0.0 0.2

0.0

Dimension 1

-0.2 0.2 Dimension 2 0.0 -0.2 0.2

0.0

Dimension 3

-0.2 -0.2 0.0 0.2 -0.2 0.0 0.2

16

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Escalamiento Multidimensional Metrico

0.2 0.1 Dimension 3 0.0 -0.1 0.0 -0.2 0.0 Dimension 1 0.2 -0.2 0.4 0.2 Dimension 2

Escalamiento Multidimensional Metrico


0.4
47

0.3 0.2
25 42 31 36 35 10 43 29 12 30 15 2 48 11

Dimension 2

0.1 0.0 -0.1 -0.2 -0.3 -0.2


4

41 28 32 7

46 14 6 37 3 38

45 22 33 24 26 40 20 44 23

5 34 27 1 19 13 9 1817 21 39

16

-0.1

0.0 Dimension 1

0.1

0.2

17

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Los grupos que se forman son los siguientes.

GRUPO 1 (izquierda) NUMERO MUNICIPIO 2 Amatln de los Reyes 4 Atzalan 7 Cerro Azul 8 Chocamn 10 Coatzintla 11 Colipa 12 Crdoba 15 Fortn 16 Gutirrez Zamora 25 Martnez de la Torre 28 Misantla 29 Nautla 30 Orizaba 31 Pnuco 32 Papantla 35 Poza Rica de Hidalgo 36 Pueblo Viejo 41 Temapache 42 Txpam 43 Tihuatln 46 Vega de Alatorre 48 Yecuatla

GRUPO 2 (derecha) NUMERO MUNICIPIO 1 Agua Dulce 3 Angel R. Cabada 5 Boca del Ro 6 Catemaco 9 Coatzacoalcos 13 Cosoleacaque 14 Cuitlhuac 17 Hueyapan de Ocampo 18 Isla 19 Jltipan 20 Jamapa 21 Juan Rodrguez Clara 22 La Antigua 23 Lerdo de Tejada 24 Manlio Fabio Altamirano 26 Medelln 27 Minatitln 33 Paso de Ovejas 34 Playa Vicente 37 San Andrs Tuxtla 38 Santiago Tuxtla 39 Sayula de Alemn 40 Soledad de Doblado 44 Tres Valles 45 Ursulo Galvn 47 Veracruz

4.3. Anlisis de Componentes Principales La estimacin de los componentes principales se ha realizado con la matriz de correlacin y los eigenvalores obtenidos se muestran en la tabla y grafica siguientes.
Eigenvalue Proportion Cumulative 2.7869 0.348 0.348 1.9110 0.239 0.587 1.2975 0.162 0.749 0.9938 0.124 0.874 0.5271 0.066 0.940 0.3362 0.042 0.982 0.1118 0.014 0.996 0.0358 0.004 1.000

18

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Scree Plot of CASOS, ..., POBLACION


3.0 2.5 2.0

Eigenvalue

1.5 1.0 0.5 0.0 1 2 3 4 5 Component Number 6 7 8

Los resultados anteriores sugieren que 4 componentes principales son adecuados para describir las observaciones. Los primeros cuatro componentes principales describen el 87.4% de la varianza total. Las ecuaciones para los primeros cuatro componentes principales son las siguientes.

PC1 y1 0.134CASOS 0.559TEMPERATURA 0.377 PRECIPITACION 0.234 ALTITUD 0.063MARGINACION 0.458LATITUD 0.509 LONGITUD 0.005POBLACION

PC 2 y2 0.525CASOS 0.106TEMPERATURA 0.173PRECIPITACION 0.251ALTITUD 0.478MARGINACION 0.192 LATITUD 0.102 LONGITUD 0.587 POBLACION PC 3 y3 0.253CASOS 0.152TEMPERATURA 0.429PRECIPITACION 0.491ALTITUD 0.006MARGINACION 0.493LATITUD 0.337 LONGITUD 0.363POBLACION
PC 4 y4 0.440CASOS 0.022TEMPERATURA 0.322 PRECIPITACION 0.565 ALTITUD 0.593MARGINACION 0.030 LATITUD 0.169 LONGITUD 0.040 POBLACION
Las grficas siguientes muestran detalles del biplot para los primeros dos componentes principales (primer componente vs. Segundo componente). El biplot muestra que existen dos grupos muy bien definidos, divididos con una lnea vertical que pasa por el centroide. Estos grupos son iguales a los identificados en el escalamiento multidimensional. El grupo 1 se encuentra a la derecha y el grupo 2 se encuentra a la izquierda. El grupo de la izquierda (grupo 2) presenta valores mayores en las variables TEMPERATURA y LONGITUD, muestras que el grupo de la derecha presenta valores

19

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

mayores para las variables LATITUD, PRECIPITACION, y ALTITUD. En el biplot tambin se aprecia que las variables TEMPERATURA y LONGITUD estn muy correlacionas. Asimismo, las variables POBLACION Y CASOS estn muy correlacionadas. Finalmente las variables LATITUD, PRECIPITACION Y LATITUD se encuentran muy correlacionadas. Existe un outlier identificado con el nmero 47 y que corresponde al municipio de Veracruz.

Biplot of CASOS, ..., POBLACION


6 5 4

Second Component

3 2 1 0 -1 -2 -3 -2 -1 0 1 First Component 2 3
TEMPERATURA LONGITUD POBLACION CASOS LATITUD PRECIPITACION ALTITUD MARGINACION

20

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Score Plot of CASOS, ..., POBLACION


6 5 4
47

Second Component

3 2 1 0 -1 -2 -3 -2 -1 0 1 First Component
9 27 17 1 18 21 19 13 39 5 45 22 34 33 24 26 4044 23 20 35 10 37 3 38 6 14 46 12

42 25 32 3128 41 36 7 30 4 16 8

29 43 11 48 15 2

Loading Plot of CASOS, ..., POBLACION


POBLACION CASOS

0.50

Second Component

0.25
TEMPERATURA

LATITUD

0.00
LONGITUD PRECIPITACION ALTITUD

-0.25
MARGINACION

-0.50 -0.50 -0.25 0.00 First Component 0.25 0.50

21

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

4.4. Anlisis de Conglomerados para Observaciones El anlisis de cluster tiene como objetivo formar grupos de observaciones (conglomerados) cuando estos grupos no se conocen de antemano. El anlisis se realiz utilizando un mtodo no-jerrquico porque la cantidad de datos y variables es relativamente pequea. Se emple la liga de Ward y la distancia Euclidiana para el clculo de los conglomerados. Se identificaron 2 conglomerados bien definidos. Estos conglomerados son iguales a los identificados en el escalamiento multidimensional, excepto por el municipio 14 (Cuitlhuac) que fue incluido en el grupo 1. El grupo 1 se encuentra a la derecha marcado en verde, y el grupo 2 se encuentra a la izquierda marcado en rojo.

Ward Linkage, Euclidean Distance 36.23

Dendrogram

Distance

24.15

12.08

0.00
1 3 38 13 19 39 6 37 17 23 44 18 21 34 5 9 27 47 20 26 24 33 40 22 45 2 14 8 12 15 30 4 16 43 11 48 29 46 7 10 35 31 36 25 28 32 41 42

Observations

Los resultados numricos del anlisis son los siguientes.


Final Partition Number of clusters: 2 Within cluster sum of squares 103.819 153.034 Average distance from centroid 1.73113 2.44711 Maximum distance from centroid 6.37967 4.06780

Cluster1 Cluster2

Number of observations 25 23

Cluster Centroids Variable CASOS TEMPERATURA PRECIPITACION ALTITUD MARGINACION LATITUD Cluster1 -0.137469 0.821371 -0.607378 -0.358563 -0.072591 -0.688810 Cluster2 0.149423 -0.892795 0.660194 0.389742 0.078903 0.748706 Grand centroid -0.0000000 -0.0000000 0.0000000 0.0000000 0.0000000 -0.0000000

22

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

LONGITUD POBLACION

0.781968 0.037760

-0.849965 -0.041044

-0.0000000 0.0000000

Distances Between Cluster Centroids Cluster1 Cluster2 Cluster1 0.00000 3.15376 Cluster2 3.15376 0.00000

4.5. Anlisis de Conglomerados para Variables La aplicacin del mtodo de conglomerados para variables proporciona el dendrograma siguiente en donde se sugiere una manera de combinar las variables. El dendrograma sugiere que las variables CASOS y POBLACIONES se podran combinar con la variable MARGINACION. Las variables TEMPERATURA y PRECIPITACION tambin se podran combinar con la variable ALTITUD. Finalmente las variables LATITUD y LONGITUD se podran combinar con las variables anteriores. Estas combinaciones son solo una sugerencia y deben combinarse con otro mtodo, por ejemplo, anlisis de factores. El dendrograma se construy utilizando una liga completa.

Complete Linkage, Absolute Correlation Coefficient Distance 0.37

Dendrogram

Similarity

33.58

66.79

100.00
S CA OS PO N IO AC BL N N RA IO IO TU AC AC RA IN IT IP PE RG M A EC M TE PR D TU TI AL D TU TI LA D TU GI N LO

Variables

4.6. Anlisis de Factores La extraccin de factores se realiz con el mtodo de componentes principales. Se ha decidido extraer hasta 3 factores que explican el 75% de la varianza total. Los resultados sin rotacin aparecen a continuacin. El scree plot tambin se ha incluido.

23

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz


Unrotated Factor Loadings and Communalities Variable CASOS TEMPERATURA PRECIPITACION ALTITUD MARGINACION LATITUD LONGITUD POBLACION Variance % Var Factor1 0.224 -0.933 0.629 0.391 0.105 0.765 -0.850 0.008 2.7869 0.348 Factor2 0.725 0.146 -0.239 -0.346 -0.661 0.266 -0.141 0.812 1.9110 0.239 Factor3 -0.288 0.173 -0.489 -0.559 -0.007 0.562 -0.384 -0.413 1.2975 0.162 Communality 0.659 0.922 0.692 0.585 0.448 0.971 0.890 0.829 5.9954 0.749

Scree Plot of CASOS, ..., POBLACION


3.0 2.5 2.0

Eigenvalue

1.5 1.0 0.5 0.0 1 2 3 4 5 Factor Number 6 7 8

Hay cuatro mtodos en Minitab para rotar ortogonalmente los factores de carga iniciales que se encuentran aplicando los mtodos de extraccin por componentes principales o por mxima verosimilitud. Una rotacin ortogonal simplemente rota los ejes para proporcionar una perspectiva diferente. Los mtodos son equimax, varimax, quartimax, y orthomax. Minitab rota las cargas con la finalidad de minimizar un criterio de simplicidad. Un parmetro, gamma, dentro de este criterio es determinado por el mtodo de rotacin. Si se usa un mtodo con un valor bajo de gamma (cercano a 0), la rotacin tendera a simplificar los renglones de las cargas; si se utiliza un mtodo con un valor alto de gamma (cercano a 1), la rotacin tendera a simplificar las columnas de las cargas. La tabla siguiente resume los mtodos de rotacin.

24

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Mtodo de Rotacin Equimax Varimax Quartimax Orthomax

Objetivo Rotar las cargas de manera que las cargas sean altas en un factor pero bajas en otros. Maximizar la varianza de las cargas elevadas al cuadrado. Cargas simples. Valor determinado por el usuario, basado en el valor de gamma.

Valor de Gamma Nmero de factores / 2 1 0 0-1

A continuacin se presentan los resultados de realizar la rotacin Varimax.


Rotated Factor Loadings and Communalities Varimax Rotation Variable CASOS TEMPERATURA PRECIPITACION ALTITUD MARGINACION LATITUD LONGITUD POBLACION Variance % Var Factor1 -0.146 0.615 -0.174 0.076 0.043 -0.982 0.924 0.081 2.2606 0.283 Factor2 0.097 -0.737 0.813 0.757 0.293 -0.035 -0.188 0.028 1.9098 0.239 Factor3 -0.793 -0.011 -0.005 0.082 0.601 -0.078 0.036 -0.907 1.8250 0.228 Communality 0.659 0.922 0.692 0.585 0.448 0.971 0.890 0.829 5.9954 0.749

La rotacin con la cual se obtiene la mejor interpretacin es Varimax porque es la que mejor ayuda en la interpretacin de los resultados. El objetivo es obtener una estructura simple en la cual, para cada una de las variables, se cumpla lo siguiente: una de las cargas es grande para uno de los factores y las otras cargas son pequeas. En la prctica es difcil obtener este resultado, pero la rotacin produce cargas que son cercanas a la estructura simple deseada. Para interpretar los factores es necesario examinar las cargas de los factores rotados. Movindose horizontalmente de izquierda a derecha a travs de los 3 factores en cada rengln, se identifica la carga ms grande (en valor absoluto). Esto se hace para cada una de las 8 variables. Para evaluar la significancia de las cargas de los factores, se sugiere utilizar un valor mnimo de 0.5. Este procedimiento se ha realizado en el modelo de 3 factores obtenido mediante la rotacin Varimax. Las cargas ms significativas se han marcado en negritas. El modelo obtenido cumple con las caractersticas deseadas: una de las cargas es grande para uno de los factores y las otras cargas son pequeas. Despus de identificar las cargas potencialmente significativas, se intenta descubrir algn significado en los factores. Esto se puede hacer fcilmente si el grupo de variables asociadas con cada factor tiene algn sentido para el investigador. Para el modelo obtenido se pueden formar los siguientes grupos. Nota: es importante mencionar que los grupos siguientes son iguales a los sugeridos por el anlisis de conglomerados para variables.

25

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

El factor 1 agrupa a las variables:


Variable LATITUD LONGITUD Factor1 -0.982 0.924

LATITUD, LONGITUD.
Factor3 -0.078 0.036 Communality 0.971 0.890

Factor2 -0.035 -0.188

El factor 2 agrupa a las variables: TEMPERATURA, PRECIPITACION, ALTITUD.


Variable TEMPERATURA PRECIPITACION ALTITUD Factor1 0.615 -0.174 0.076 Factor2 -0.737 0.813 0.757 Factor3 -0.011 -0.005 0.082 Communality 0.922 0.692 0.585

El factor 3 agrupa a las variables: CASOS, MARGINACION, POBLACION.


Variable CASOS MARGINACION POBLACION Factor1 -0.146 0.043 0.081 Factor2 0.097 0.293 0.028 Factor3 -0.793 0.601 -0.907 Communality 0.659 0.448 0.829

La interpretacin de los factores es la siguiente. Recordar que la descripcin exacta de las variables no se conoce. Factor 1: GEOGRAFIA. Este factor pretende agrupar las caractersticas relacionadas con la ubicacin geogrfica en donde se presentan los casos de dengue. Factor2: CLIMA. Este factor pretende agrupar las caractersticas relacionadas con la el clima prevaleciente en la regin donde se presentan los casos de dengue. Factor 3: POBLACION. Este factor pretende agrupar las caractersticas relacionadas con la poblacin afectada por el dengue.

4.7. Anlisis de Discriminante El anlisis de discriminante se utiliza para clasificar observaciones en dos o ms grupos cuando se tiene una muestra con grupos conocidos. Para realizar el anlisis de discriminante se han creado dos grupos iguales a los obtenidos con el mtodo de escalamiento dimensional. Los resultados aplicando el anlisis de discriminante lineal indican que el 100% de las observaciones fueron clasificadas de manera correcta. Los resultados siguientes tambin muestran la distancia cuadrada entre grupos, la funcin discriminante para los grupos, y los promedios para los grupos.
Group 1 2 Count 22 26 Summary of classification True Group Put into Group 1 2 1 22 0 2 0 26 Total N 22 26 N correct 22 26 Proportion 1.000 1.000 N = 48 N Correct = 48 Proportion Correct = 1.000

Squared Distance Between Groups 1 2 1 0.0000 51.5243 2 51.5243 0.0000

26

Anlisis Exploratorio de los Casos de Dengue del Ao 2003 en el Estado de Veracruz

Linear Discriminant Function for Groups 1 2 Constant -30483 -29726 CASOS -2 -2 TEMPERATURA -40 -35 PRECIPITACION 11 11 ALTITUD -1 -1 MARGINACION 22 24 LATITUD -338 -346 LONGITUD -704 -696 POBLACION 0 0 Variable CASOS TEMPERATURA PRECIPITACION ALTITUD MARGINACION LATITUD LONGITUD POBLACION Pooled Mean 28.167 25.003 32.335 170.88 -1.3168 19.310 -96.324 70675 Means for Group 1 2 37.773 20.038 23.104 26.609 42.755 23.519 290.36 69.77 -1.2880 -1.3411 20.210 18.549 -97.202 -95.582 69448 71714

5. Conclusiones El anlisis exploratorio se realiz con 48 observaciones y 8 variables numricas. Las curvas de Andrews sugieren la existencia de dos grupos bien definidos, aunque no proporciona informacin de las observaciones que corresponden a cada grupo. Tambin sugiere la existencia de al menos un outlier (caso atpico), pero no se conoce su identidad. El escalamiento multidimensional proporciona una evidencia ms slida acerca de la existencia de dos grupos de observaciones bien definidas. El mtodo permiti la identificacin de las observaciones que integran cada uno de los grupos. El anlisis de componentes principales indica que cuatro componentes principales son suficientes para explicar el 87.4% de la varianza total. El anlisis grafico del biplot tambin sugiere la existencia de dos grupos bien definidos y la existencia de un outlier (caso atpico) identificado como el municipio de Veracruz. El anlisis de conglomerados para observaciones sugiere dos conglomerados prcticamente iguales a los grupos identificados en el escalamiento multidimensional. El anlisis de conglomerados para variables sugiere que las ocho variables del estudio se podran asociar en tres grupos. El anlisis de factores sugiere la existencia de tres factores que explican el 75% de la varianza total. Los factores encontrados son similares a los grupos de variables sugeridos por el anlisis de conglomerados para variables. El anlisis de discriminante clasifica sin error las observaciones en dos grupos bien definidos. Dado que la enfermedad se trasmite con el piquete de un mosquito, un grupo podra estar relacionado con este de los mosquitos ya que dependen la poblacin de los mismos de la temperatura, la precipitacin y la altitud. El otro grupo estara relacionado con las personas, ya que los casos de enfermos se contabilizan a travs de las personas, la marginacin se mide en la poblacin donde estn las personas y el total de personas est dentro de la variable llamada poblacin, en el ltimo grupo donde est la latitud y longitud hace referencia a los mosquitos y personas, viendo que es el lugar geogrfico donde viven y conviven.

27