You are on page 1of 6

Anlisis factorial: preferencia del anlisis

de factor comn frente al anlisis de


componentes principales
Jos Lpez Ruiz y Jos Antonio Prez-Gil

La eleccin del anlisis de Componentes Principales versus Factor Comn en tareas de


i nvestigacin exploratoria de datos, no es una cuestin fcil. Ello es debido a que ambas tcnicas
sirven a propsitos similares, y comparten caractersticas matemticas muy parecidas, an
cuando conceptualmente se fundamentan en modelos tericos diferentes.
El objeto principal del Anlisis Factorial es simplificar el anlisis complejo de un conjunto
ms o menos numeroso de variables interrelacionadas entre s obtenindose un nmero reducido
de factores o funciones que se establecen como descriptores de las interrelaciones observadas.
La estimacin de las medidas de cada uno de los factores para cada caso de estudio, construccin de Escalas de medidas-, se justifica por criterios de simplificacin o parsimonia y
por el uso de estos factores como medidas que pueden ser puestas en relacin con otras variables
observadas.
Se puede establecer que el valor que toma la funcin o factor, para un sujeto dado, puede
estimarse como una combinacin lineal de las variables originales. Esto puede expresarse como
Fk= EBjk Xjn (1), donde Xjn es el valor en puntuaciones tpicas de la j-sima variable en el sujeto
n; Bjk es el coeficiente o peso de la j-sima variable en el k-simo factor.
El Anlisis de Componentes Principales suele utilizarse como procedimiento alternativo al
Anlisis de Factor Comn. Estos componentes se obtienen mediante una transformacin
matemtica de la matriz de correlaciones de las variables observada en una matriz que permita
establecer combinaciones lineales al modo de las obtenidas en el procedimiento de factor comn
y tal que puedan ser aplicados los mtodos de construccin de escalas de medidas de los
componentes principales. Los componentes se obtienen por combinaciones lineales de las
variables observadas con las ponderaciones proporcionales a los pesos de los componentes,
expresndose como PCm =E[Bij / li) Xj ] (2), donde Bij es el peso de la j-sima variable en el isimo componente; li es el autovalor asociado al componente i-simo, y Xj es la j-sima variable
observada.
An cuando las expresiones (1) y (2) son similares, existe una diferencia fundamental
referida a la Varianza acumulada por cada uno de los factores y componentes en las respectivas
expresiones (Jreskog, 1979). En el anlisis de componentes principales la variabilidad est

referida a la varianza total, quedando sta repartida proporcionalmente entre cada uno de los
componentes. En el procedimiento de Factor comn la varianza acumulada por cada factor est
referida a la varianza explicada o "comunalidad", dado que la varianza total se descompone en
sus dos componentes: la parte de varianza explicada, acumulada por los factores comunes, y la
parte de varianza especfica o "unicidad" que queda excluida de los factores comunes y asignada
a la aportacin de los factores nicos o especficos.
Entendemos que este tratamiento diferencial de la variabilidad es una fuentede error
responsable de resultados diferentes en investigaciones aplicadas. La mayor proporcin de
varianza acumulada por los componentes principales suponen que cada componente acumula
parte de varianza explicada y parte de varianza no explicada, como muestra Jreskog (op. cit.).
Con esta investigacin pretendemos mostrar los aspectos relevantes que hacen crtico el uso de
uno u otro procedimiento.

Mtodo
Sujetos
Por simulacin se obtuvo tanto una muestra de 300 sujetos, como las puntuaciones obtenidas
por ellos en nueve escalas de medidas, (X1, X2, ..., X9). Dichas escalas fueron construidas de
modo que se ajustaran a las restricciones de aplicacin que imponen los modelos de anlisis de
las tcnicas a utilizar.
Instrumentos
Se han utilizado los procedimientos estadsticos: Factor Analysis, Anova, Crosstab, Npar y
Quick-Clusters, contenidos en el paquete estadstico paraciencias sociales, SPSS/PC+ V.2.0.
Procedimiento
Se analiz la matriz inicial de datos realizando un Anlisis Factorial mediante los
procedimientos Mxima Verosimilitud (ML) y Anlisis de Componentes Principales (PC),
especificando rotacin Varimax, resultando seis escalas de medida, tres para los factores
comunes y tres para los componentes resultantes del anlisis; estas escalas se construyeron
utilizando el Procedimiento de Regresin. Como material de estudio se eligieron las siguientes
escalas: escalaF1 y escala PC1 correspondientes al primer factor y primer componente
respectivamente resultantes del procedimiento ML y PC, y en el que las saturaciones relevantes
correspondieron a las variables observadas, X1, X2 y X3; escala F2, y escala PC2 correspondientes al segundo factor y segundo componente respectivamente resultantes del procedimiento
ML y PC, y en el que las saturaciones relevantes correspondieron a las variables observadas, X4,
X5 y X6; escala F3, y escala PC3 correspondientes al tercer factor y tercer componente
respectivamente resultantes del procedimiento ML y PC, y en el que las saturaciones relevantes
correspondieron a las variables observadas, X7, X8 y X9.

Con el fin de obtener un elemento de referencia externa estas escala fueron puestas en
relacin, mediante ANOVA, con una variable de agrupamiento obtenida de la aplicacin del
procedimiento Quick-Cluster con las nueve variables observadasXI,..., X9; dicha variable as
obtenida (G 1) proporcion dos valores o agrupamientos distintos para los sujetos.

Resultados
La Tabla l. presenta los valores de las nueve escalas en la prueba de bondad de ajuste a la
funcin de probabilidad Normal de Kolmogorov-Smirnov.

En la Tabla 2 se puede observar las saturaciones de cada variable sobre lostres factores y tres
componentes respectivamente extrados en el Anlisis Factorial.

La Tabla 3 presenta el porcentaje de varianza acumulada por los factores comunes


y componentes principales obtenidos en ambos procedimiento.

A continuacin se ofrecen los resultados del Anlisis de Varianza realizado con la variable
Grupo (G1) y los factores y componentes. Tabla 4.

E1 ANOVA realizado permiti mostrar que los dos grupos obtenidos en el procedimiento
Quick Cluster presentaron puntuaciones significativamente distintas, (p< 0.01), en todos los
factores y componentes a excepcin del factor F3 en el que la puntuaciones de los sujetos en el
factor, no reportan diferencias significativas (p=.6765) en los dos subgrupos, F=.17, para
gl=1,298.

Discusin
Entendemos que los resultados del presente trabajo se ajustan a las restricciones que imponen
los procedimientos utilizados, (Ver Tablas 1 y 2), y que apoyan nuestra hiptesis. Esperbamos

que al aplicar un anlisis de varianza de los factores y componentes con la variable G1, la varianza
explicada por los factores fuese menor que en los Componentes principales. En efecto si
comparamos cada factor con el componente principal equivalente se observan estas diferencias
en la varianza explicada. Esto se traduce en diferencias en el estadstico F y por consiguiente en
la probabilidad asociada a cada comparacin.
Aun cuando estas diferencias quedan constatadas, tambin es cierto que la proporcin de
varianza acumulada por ambos trminos (factor y componente equivalente) suele ser
suficientemente grande como para que la toma de decisin sean coincidentes, es decir se tomen
en el mismo sentido. No obstante estas diferencias se hacen criticas conforme el autovalor
obtenido en la matriz de correlaciones se aproxima a la unidad. Se constata que para el tercer
autovalor de la matriz inicial su valor es 1.15. Como se puede observar en la Tabla 3, este
autovalor reporta valores distintos en la matriz final que se obtiene en cada uno de los dos
procedimientos usados, y esta diferencia se traduce en proporciones distintas de varianza comn
acumulada segn qu procedimiento se use. Esta diferencia de varianza se traduce en estadsticos
F distintos y en diferentes probabilidades asignada en el ANOVA y por consiguiente en tomar
decisiones distintas segn qu procedimiento se utilice; as si utilizamos el componente PC3
tendremos que concluir que existen diferencias significativas (p<.0061) entre los valores del
componente en cada grupo, y si por el contrario usamos el factor comn F3 la decisin a tomar
es justamente la contraria, es decir, concluiramos que no existen diferencias significativas
(p=.6765) entre los valores del factor en cada grupo. Ver Tabla 4.
No obstante, en la misma tabla, puede observarse que aunque la significacin de PC3 el
porcentaje de v arianza explicada por l mismo es nfima (2.5%).
A pesar de que el Anlisis de Componentes principales ha venido siendo el procedimiento
ms usado, recientemente son cada vez ms numerosos los autores que describen el Anlisis de
Factor Comn como el procedimiento preferido (McArdle,1990; Steiger, 1990). Tomando como
referencia la matriz inicial, en trminos de varianza acumulada en los factores y los componentes
equivalentes se obtienen resultados similares cuando el autovalor asociado es grande; en el caso
de que el autovalor tome valores en torno a la unidad se presentan diferencias en los resultados.
En consecuencia consideramos que la caracterstica de ser ms conservador cl procedimiento de
factor comn queda apoyada por los resultados de este trabajo y en este sentido consideramos
adecuado preferir el procedimiento de factor comn frente al de componentes principales.

Conclusiones
Las escalas de medida para los factores utilizando el procedimiento de mxima verosimilitud
en el anlisis del factor comn, se muestran ms conservadoras en la toma de decisin en
comparacin a las obtenidas utilizando anlisis de componentes principales.
Cuando el autovalor en la matriz inicial arroja valores en torno a la unidad, la eleccin del
procedimiento del factor comn (ML) o componente principal se hace crtico.
Frente al anlisis de componenetes principales, las escalas construidas con el mtodo de
mxima verosimilitud del anlisis del factor comn permiten delimitar con mayor precisin la
significacin del anlisis de varianza entre los factores hipotetizados y variables externas.

Referencias
J RESKOG, k.G. & SRBOM, D. (1979) " Advances in Factor Analysis and Structural
Equation Models ". Cambridge, Massachusetts: Abt Books.
MCARDLE,J.J.(1990). Principles versus Principals of Structural Factor Analyses. "Multivariate
Behavioral Research", 25 (1), 81-87.
STEIGER. J.H. (1990). Some Additional Thoughs on Components, Factor, and Factor
Indeterminacy. "Multivariate Behavioral Research", 25 (1), 81-87.

You might also like