Professional Documents
Culture Documents
un ndice compuesto
y aproximacin para medir
los cambios en el tiempo
Jos Vences Rivera
En este trabajo se desarroll una metodologa para la This paper shows the development of a methodology
construccin de un ndice compuesto que resume la in- aimed for the creation of a compound index that sum-
formacin contenida en fenmenos de naturaleza mul- marizes the information contained in multidimensional
tidimensional. La varianza explicada por este ndice es phenomena. The variance explained according to this
casi igual a la obtenida por la tcnica de anlisis de com- index is almost identical to that obtained with the tech-
ponentes principales (ACP) respecto a la varianza total nique of Principal Components Analysis (PCA) in regard
del conjunto original de variables consideradas, lo cual to the total variance of the original set of considered
fue corroborado mediante simulacin de Monte Carlo variables. This was proven by means of a Monte Carlo
y con aplicacin a datos derivados de los censos de po- simulation as well as by applying data that derived from
blacin y vivienda levantados por el Instituto Nacional Population and Housing Censuses conducted by the
de Estadstica y Geografa (INEGI). El resultado de los National Institute of Statistic and Geography (INEGI).
cambios en el tiempo se obtiene al establecer un espa- The result of changes over time is obtained by having
cio comn de mediciones. established a common space of measurements.
Las ventajas del nuevo ndice comparado con el de The advantages of the new index, compared with
la primera componente principal son: el clculo es muy that of the first main component, are that the cal-
simple e intuitivo; es de fcil interpretacin, ya que los culation is very simple and intuitive; it is of easy in-
resultados se dan en la misma escala que las variables terpretation since the results are given in the same
de insumo; y no se prevn problemas de comunicacin scale that the input variables; and that we do not
con el usuario en general. foresee communication problems with the user.
Palabras clave: ndice multivariado, marginacin, pri- Key words: multivariate index, marginalization, first
mera componente principal, varianza explicada, ponde- main component, explained variance, weight, orthog-
rador, proyeccin ortogonal. onal projection.
Recibido: 13 de noviembre de 2013
Aceptado: 24 de abril de 2014
Mnima distancia
v de v a u
y la norma o magnitud de este vector se calcula
como:
u
Mejor aproximacin
Cuadro 1
Varianza promedio explicada por I frente a Y1
n = 100 n = 2 456 n = 10 000
Dimensin p
I Y1 Y1 / I I Y1 Y1 / I I Y1 Y1 / I
Cuadro 2 Contina
Estadstica Ao I1 I2 I3 I4 I5 I6 I7 I8 I9
1990 12.54 38.88 22.37 13.12 20.36 57.87 21.07 37.42 62.72
1995 10.79 24.25 14.35 7.40 14.84 64.91 17.13 34.65 64.26
Promedio 2000 9.47 29.48 10.55 5.03 10.49 46.31 14.47 33.55 51.65
2005 8.36 23.78 5.88 2.72 9.59 41.17 11.11 31.43 46.08
2010 6.83 20.20 3.95 1.98 8.05 36.80 6.32 30.61 39.50
1990 6.93 10.14 13.68 7.91 12.61 7.55 12.51 17.62 9.31
1995 6.04 5.61 12.19 5.27 10.47 7.50 10.58 17.09 11.30
Desviacin
2000 5.43 8.83 7.70 3.50 8.68 7.92 10.68 16.88 13.29
estndar
2005 5.00 7.80 5.50 1.86 8.12 7.60 9.06 16.57 15.12
2010 4.24 6.82 3.88 1.35 7.33 6.81 4.76 16.47 11.87
1990 55.26 26.09 61.17 60.29 61.91 13.04 59.40 47.10 14.85
1995 55.97 23.12 84.90 71.11 70.54 11.56 61.76 49.32 17.58
Coeficiente de
2000 57.35 29.94 72.94 69.57 82.70 17.11 73.81 50.33 25.73
variacin
2005 59.80 32.81 93.47 68.44 84.69 18.46 81.57 52.71 32.82
2010 62.07 33.76 98.34 67.87 91.00 18.50 75.27 53.81 30.06
Estadstica Ao I1 I2 I3 I4 I5 I6 I7 I8 I9
1990 0.818 0.814 0.769 0.720 0.751 0.751 0.777 0.785 0.651
1995 0.797 0.693 0.649 0.677 0.736 0.733 0.764 0.747 0.756
Correlacin
2000 0.837 0.817 0.694 0.745 0.767 0.747 0.790 0.773 0.762
mediaa
2005 0.817 0.792 0.561 0.685 0.733 0.698 0.768 0.730 0.750
2010 0.805 0.782 0.529 0.591 0.740 0.682 0.743 0.710 0.729
En el cuadro 2 se muestran algunas estadsticas Por su parte, las mayores dispersiones las pre-
descriptivas para los indicadores considerados. Ah senta el indicador correspondiente a la poblacin
se observa que, en promedio, los indicadores de re- radicada en localidades rurales; en contraste, las
zago social tienden gradualmente a la baja al trans- menores se registran donde no disponen de ener-
currir el tiempo, es decir, experimentan una mejora, ga elctrica; por ejemplo, para el 2010, la varianza
pero segn el coeficiente de variacin, el beneficio del primero es casi 150 veces ms grande en rela-
del desarrollo entre las entidades no es equitativo; cin con el segundo, lo cual significa que las varian-
por lo tanto, el nuevo ndice sinttico tendr que zas de los indicadores son heterogneas, a pesar
reflejar esta situacin en trminos numricos. de estar medidos en la misma escala (en porcen-
Cuadro 3 Contina
1990 1995 2000 2005 2010 1990a 1995 2000 2005 2010 1990 1995 2000 2005 2010
2.36 2.33 2.25 2.32 2.32 07 Chis. 52.4 42.3 32.3 21.5 16.9 6 5 4 3 2
2.06 1.82 2.08 2.13 2.15 20 Oax. 49.7 38.7 31.2 20.7 16.3 5 4 4 3 2
1990 1995 2000 2005 2010 1990a 1995 2000 2005 2010 1990 1995 2000 2005 2010
1.75 1.88 2.12 2.41 2.53 12 Gro. 47.0 39.1 31.4 21.9 17.6 5 4 4 3 2
1.17 0.99 0.88 0.75 0.66 13 Hgo. 41.8 32.8 23.4 14.6 11.2 5 4 3 2 2
1.13 1.12 1.28 1.08 1.08 30 Ver. 41.5 33.7 26.0 16.1 12.7 5 4 3 2 2
0.83 0.79 0.72 0.64 0.71 21 Pue. 38.8 31.4 22.4 14.1 11.4 4 4 3 2 2
0.75 0.75 0.72 0.66 0.56 24 SLP 38.1 31.1 22.4 14.2 10.9 4 4 3 2 2
0.57 0.59 0.30 0.16 0.10 32 Zac. 36.5 29.9 19.7 12.0 9.3 4 3 2 2 1
0.52 0.66 0.66 0.46 0.47 27 Tab. 36.0 30.5 22.0 13.3 10.6 4 4 3 2 2
0.48 0.77 0.70 0.57 0.43 04 Camp. 35.6 31.2 22.3 13.8 10.4 4 4 3 2 2
0.40 0.79 0.38 0.43 0.42 31 Yuc. 35.0 31.4 20.2 13.2 10.4 4 4 3 2 2
0.36 0.39 0.45 0.46 0.53 16 Mich. 34.7 28.5 20.7 13.3 10.8 4 3 3 2 2
0.21 0.13 0.08 0.10 0.06 11 Gto. 33.3 26.6 18.3 11.7 9.2 4 3 2 2 1
0.16 -0.19 -0.11 -0.14 -0.26 22 Qro. 32.8 24.4 17.1 10.6 8.0 4 3 2 2 1
0.01 0.00 -0.11 -0.02 0.05 10 Dgo. 31.5 25.7 17.0 11.2 9.1 4 3 2 2 1
-0.04 -0.23 -0.19 -0.14 -0.15 29 Tlax. 31.1 24.1 16.6 10.7 8.4 4 3 2 2 1
-0.13 0.05 0.06 0.19 0.12 18 Nay. 30.2 26.1 18.1 12.1 9.4 4 3 2 2 1
-0.14 -0.21 -0.10 -0.15 -0.26 25 Sin. 30.1 24.2 17.1 10.6 8.1 4 3 2 2 1
-0.19 -0.22 -0.36 -0.33 -0.42 23 Q. Roo 29.7 24.2 15.4 9.8 7.5 3 3 2 1 1
-0.46 -0.54 -0.36 -0.44 -0.27 17 Mor. 27.3 21.9 15.5 9.4 8.0 3 3 2 1 1
-0.60 -0.73 -0.60 -0.62 -0.55 15 Mx. 26.0 20.5 13.9 8.5 7.1 3 3 2 1 1
-0.61 -0.57 -0.69 -0.69 -0.72 28 Tamps. 26.0 21.7 13.3 8.3 6.5 3 3 2 1 1
1990 1995 2000 2005 2010 1990a 1995 2000 2005 2010 1990 1995 2000 2005 2010
-0.76 -0.70 -0.69 -0.73 -0.78 06 Col. 24.7 20.7 13.4 8.1 6.3 3 3 2 1 1
-0.77 -0.59 -0.76 -0.77 -0.82 14 Jal. 24.6 21.5 12.9 7.9 6.1 3 3 2 1 1
-0.86 -0.84 -0.76 -0.75 -0.70 26 Son. 23.7 19.8 12.9 8.0 6.6 3 2 2 1 1
-0.87 -0.76 -0.78 -0.68 -0.52 08 Chih. 23.7 20.3 12.7 8.3 7.2 3 3 2 1 1
-0.89 -1.04 -0.97 -0.96 -0.91 01 Ags. 23.5 18.3 11.5 7.1 5.8 3 2 2 1 1
-0.97 -0.82 -0.80 -0.71 -0.68 03 BCS 22.8 19.9 12.6 8.2 6.6 3 2 2 1 1
-1.05 -1.16 -1.20 -1.14 -1.14 05 Coah. 22.0 17.5 10.0 6.3 5.1 3 2 2 1 1
-1.35 -1.25 -1.27 -1.25 -1.14 02 BC 19.4 16.8 9.6 5.8 5.1 2 2 1 1 1
-1.38 -1.47 -1.39 -1.33 -1.38 19 NL 19.1 15.2 8.8 5.5 4.2 2 2 1 1 1
-1.69 -1.71 -1.53 -1.50 -1.48 09 DF 16.3 13.5 7.9 4.7 3.9 2 2 1 1 1
a Las observaciones estn ordenadas con base en esta columna, en forma descendente.
Niveles de rezago: <10 = 1; [10,20) = 2; [20,30) = 3; [30,40) = 4; [40,50) = 5; >50 = 6.
Fuente: clculos propios con base en los nueve indicadores de marginacin del CONAPO.
taje), pero los recorridos son diferentes de forma En el cuadro 3 se presentan los resultados ob-
notoria. Esto, junto con el hecho de que concep- tenidos tanto por la primera componente prin-
tualmente se establece la misma importancia para cipal (Y1) como por el nuevo ndice (I), as como
cada variable, conlleva a que el ndice compuesto los niveles de rezago social a partir de este lti-
se genere a partir de las variables estandarizadas mo; las observaciones estn ordenadas de ma-
respecto a su desviacin estndar, es decir, que se nera descendente conforme al nuevo ndice para
utilice la matriz de correlaciones en lugar de la de 1990.
covarianzas.
Los lmites de los intervalos de valores que co-
Al final de este mismo cuadro se pueden ver rresponden a los niveles de rezago fueron esta-
las correlaciones medias entre cada indicador y el blecidos de manera arbitraria, pero razonada, al
resto, donde se observa que, en general, son altas observar la situacin que prevalece en el ao inicial
para los cinco aos, por lo que, dado el traslape de (1990), esto es, no se utiliz ningn procedimiento
informacin, es posible construir ndices sintticos de anlisis de conglomerados; se mantuvieron
que den cuenta de manera resumida de la situa- fijos a lo largo del tiempo con el fin de observar los
cin multivariada prevaleciente en los conjuntos cambios de nivel entre las unidades de observacin
de datos originales. al pasar de un ao a otro.
Primero se determina el vector que correspo de En contraste, con el nuevo ndice, estas limita-
a la magnitud del ndice en la direccin de v: ciones son esclarecidas. En particular, se observa
que el rezago social disminuye a lo largo del tiem-
w = (18.6)*(.472, .442, .191, .460, .252, po para todas las entidades federativas, reflejando
.350, .258, .156, .239) as el comportamiento de las variables originales,
=(8.8, 8.2, 3.5, 8.6, 4.7, 6.5, 4.8, 2.9, 4.4). en una escala tambin de cero a cien en trminos
porcentuales.
As, conforme a lo expresado en el apartado 4, la
magnitud del ndice en la direccin de u para 1990 es: Con base en los resultados del nuevo ndice,
en la grfica 1 se ilustra la disminucin gradual
w u= 18.3 del rezago social en el tiempo; se observa que, en
Grfica 1
ndices de rezago social por entidad federativa, 1990-2010
(ordenadas conforme a I para 1990)
60
1990
50 1995
2000
40
Porcentaje
2005
2010
30
20
10
0
Chis.
Oax.
Gro.
Hgo.
Ver.
Pue.
Zac.
Tab.
Camp.
Yuc.
Mich.
Gto.
Qro.
Dgo.
Tlax.
Nay.
Sin.
Mor.
Mx.
Tamps.
Col.
Jal.
Son.
Chih.
Ags.
Coah.
SLP
Q.Roo
BCS
BC
NL
DF
Entidad federativa
70
60
6 5 5
50
5 4 4
ndice de rezago %
40
4 4 4
30
3 3 3 2 2
20 2
2 2 2 2 2 2
1 1 1
10 1 1 1
1 1 1
0
Chis. Oax. Gro. BC NL DF.
Entidad
1990 1995 2000 2005 2010
general, la brecha entre las entidades federativas En contraste con la primera componente prin-
es cada vez ms cerrada. cipal, el nuevo ndice tiene una interpretacin in-
tuitiva, ya que al considerar el promedio de la co-
Mientras tanto, en la grfica 2 se destaca que rrelacin entre cada variable y el resto, de manera
las tres entidades con mayor rezago social son inmediata se asocia el mayor valor con la impor-
Chiapas, Oaxaca y Guerrero; en el otro extremo tancia de la variable correspondiente, y es ah don-
se ubican el Distrito Federal, Nuevo Len y Baja de debe ponerse especial inters, de manera tal
California. que invertir en ella para abatir su rezago, si fuera
el caso, indirectamente se estara mejorando la si-
tuacin de las otras variables y, por lo tanto, bene-
7. Conclusiones ficiando a la poblacin objeto de anlisis, por ser el
fin ltimo de las polticas sociales.
El nuevo ndice compuesto refleja la situacin que
prevalece en las unidades de observacin, segn las
variables originales consideradas, esto es, permite 8. Consideraciones finales
un ordenamiento de las unidades de observacin y
mide los cambios aproximados en el tiempo. La metodologa para generar el ndice tiene
sentido cuando las variables son numricas y
Dicho ndice est dado en la misma escala de estn correlacionadas; de preferencia, medidas en
medicin que las variables de insumo (en particu- la misma direccin, es decir, todas debern ser de
lar, si stas expresan un porcentaje); entonces, el bienestar, o bien, de rezago. Por lo tanto, el ndice
ndice tendr una variacin entre cero y 100. es de uso generalizado a cualquier fenmeno con
estas caractersticas de medicin.
El nuevo ndice es fcil de calcular, de interpretar
y, por lo tanto, tambin sin problemas para comu- El nuevo ndice sinttico es con fines explorato-
nicarlo o explicrselo al usuario no especializado. rios y descriptivos; se aplica a datos poblacionales.