Professional Documents
Culture Documents
RESUMEN
Se han estudiado los efectos, sobre los resultados del test, del fallo de
la no-norrnalidad ^(distribuciones uniformes) y de la homogeneidad de las
varian^as, considerando, asimismo, otras variaciones en la naturaleza del
conjunto de datos experimentales. Para ello se han utilizado tcnicas Mon-
tecarlo de Simulacin, obteniendo conclusiones sobre el grado de sensiti-
vidad^ del test F en los casos considerados.
Asimismo, se exponen algunas ideas tendentes a sealar futuras lineas
de investigacin sobre el tema.
Basado en esta necesidad, el presente trabajo trata de estudiar la eficacia del test F
considerando el fallo simultneo de distintas hiptesis del madelo lineal, y baja diferen-
tes condiciones.
Las condiciones en las que se realiza el presente anlisis pueden resumirse como
sigue:
Para llevar a cabo el anlisis se han generado, en principio, 1G0 veces tres muestras
de 10 elementos provenientes de distribuciones normales y uniformes, con medias
iguales entre s e iguales sucesivamente a 12, 12,5, 13, 13,5, 14, I4,5, 15, y con
desviaciones tpicas iguales entre s, e iguales sucesivamente a cr = 5, 10 y 15 por 100
de las medias.
L,c^s resultados pueden verse en la tabla [, donde en la parte superior de cada celda
se encuentra el valor correspondiente a^c = O,OI y en la inferior a^c = 0,05.
Del anlisis de ambas tablas se sigue que las diferencias entre los valores de ^c
admitidos (U,O1 y O,OS) y los simulados, son debidas exctusivamente al muestreo en
todos los casos, si queremos realizar la inferencia con un 99 por 100 de probabilidad, y
en casi todos, si slo exigimos el 95 por t00 (en las tablas I y li se indica ccan un
asterisco aquellos valores que difieren significativamente para 9S por l00 de su corres-
pondiente terico). Como puede verse, slo en un caso dicha diferencia aparece en el
par de valores obtenidos, correspondiendo a = 13,5, varianzas iguales y distribucin
nvrmal.
TABLA 1
Tipc^ de
NORMALES UNIFORMES
distribucin
Valores de N CV CV CV CV CV CV
l S^0 1 O%O S % 1 S%O 1 O% S%
I^ o 0 o a a 3
S S S 3 4 8
1 Z,S 0 1 1 0 2 2
S 8 S S 4 4
13 1 1 1 0 1 1
8 4 S 3 S S
13.5 1 4* 0 1 l i
4 10* S 4 ? 7
14 4* 0 0 0 2 2
10 S 3 3 7 7
14.5 0 0 0 0 2 2
S S S 3 4 4
1S 1 2 1 2 0 1
S 6 4 8 S S
ROBUSTEZ DE[. TEST F Al. F,ALLAR ALCUNAS HIPOTESIS 119
TweLw II
Tipa de
distr^bucibn NORMALES UNIFORMES
Valores de N CV CV CV CV CV CV _
i S% 10 % S% 1 S Ja 10 %o' S%a
12 2 1 1 4 2 1
9 S 4 ^9 9 4
12,50 2 1 1 2 1 1
9 S 6 4 4
13 1 S 1 3 2 2
S 9 S 9 S S
13,50 S* 1 0 0 0 0
9 1 S b 2 2
14 1 Z 0 4* 2 2
1 9 3 9 S S
14,50 2 0 2 4* 3 3
9 3 9 9 10* 6
1S 1 0 1 2 1 2
S 4 8 ? 4 9
La simple observacin de la posicin que ocupa dicho caso en las tablas, asY como el
hecho de que cumple las hiptesis, nos indica que se trata de un fenmeno de azar,
encontrndonos en el S por 100 de los casos que escapan a la inferencia.
Puede afirmarse que el test F es muy robusto^, cuando la hiptesis nula es cierta,
aunque se trate de distribuciones uniformes con b^ja Kurtosis, las varianzas sean
distintas y cambien sensiblemente los coeficientes de variacin de las distribuciones
para distintos valores de {esta afirmacin es vlida para muestras de tamao n= 10, o
valores aproximados).
a las medias: Desviaciones tipicas iguales a c^", ^ a" y? cs"' en cadageneracin, orde-
3 3
nadas proporcionalmente al valor de las medias ( los cs' son distintos al ser distintas las
medias).
b) Heterogeneidad de las varianzas, ordinalmente proporcionales de forma inversa a
4 2
las medias: I3esviaciones tpicas igual a a', ^ a", 3 a"' en cada generacin, ordena-
^ En los tres casos se han considerado las tres variaciones en las desviaciones tpicas
respectivamente a= S, 10 y IS por l00 de sus medias correspondientes en cada caso.
Los resultados pueden verse en las tablas 1 II, I V y V, donde, como anteriormente,
la variable retenida ha sido el nmero de veces que el test ha detectado diferencia
significativa para x= 0,01 y x= 0,05 ( parte superior e inferior de cada casilla}.
Vemos que los factores que fundamentalmente afectan los resultados son, lgica-
mente, los valores de a (separacin entre medias} y CV (coeficiente de variacin). No
siendo significativamente diferentes los resultados obtenidos generando normales o
uniformes, ni aprecindose efecto por el hecho de ser la heterogeneidad de las varianzas
directa o inversamente proporcional a las medias, existiendo diferencia entre ambos
casos y los resultados obtenidos en el caso de varianzas homogneas, en el que, a
igualdad de otras condiciones, el test es mucho ms potente que en los dos casos de
heterogeneidad considerados.
En las bguras I, II y IIi se han representado para x= 0,01 las curvas de potencia
del test respecto a la separacin entre medias expresada en porcentaje de la media que
hemos considerado base ( = l S) para la operatividad de las simulaciones.
Vemos que el test es ms patente para mayor separacin entre medias y menor
coeficiente de variacin, y que la diferencia de resultados, entre el caso de homogenei-
Rnfl USTEZ DEL TEST F AL FALLAR ALGUNAS H tPOTESIS 121
TABLA iii
Tipo de
NORMALES UNIF1tMES
distribucisn
Valures de O CV CV CV CV CV CV
IS% 10%- S% 1S^lo 10% S%
O,S 1 ? 27 6 18 37
7 24 S6 S 30 S1
^- l,0 11 S3 94 l0 47 91
25 77 99 19 67 100
l, S 20 94 00 1S 94 100
37 99 100 43 97 100
dad y heterogeneidad de las varianzas, aparece patente para pequeas diferencias entre
medias, y pequeos coefcientes de variacin.
As por ejemplo:
e
Para o = 1,5, ^100 = 10 ). La potencia del test es segn las casos;
Heterogeneidad H.
Distribucin CV Humugeneidad
directa ^nversa
TAH^A IV
^1'ip dc UNIFORMES
NORMALES
distribucin
va^f^^ d^ d cv cv cv cv cv cv
is ^o ^o % s ^^ rs ^a Iv % s ^o
^- 0,5 2 5 11 5 2 7
6 l4 25 I1 15 18
*^ 1,0 S 22 4b 10 11 43
l 31 73 22 35 73
1,5 10 41 8K 7 33 85
24 63 99 21 2 98
E1 test es muy robusto para ,grandes diferencias entre medias y pequeos coefcien-
tes de variacin.
TwBLA V
0,5 1 6 10 4 8 9
8 12 19 12 12 22
1,0 S 12 44 1 9 33
1S 29 67 9 21 9
1,S 5 4b 8S 9 4b 91
23 68 96 23 70 99
2,0 1S 78 98 2S 79 100
29 92 99 44 95 100
0. 9 ^
0.8 ^
0.7 -^
0,6 ,.^
0.5 -^
0. 4 -^
0.3 ^
0.2 -1
0.^ -^
- T-
^o
Figura I '
.0
0.9
o.a
o.s
0.5
0.4
0,3
0.2
0.1
-1 _ ^._
10 20
Figura 2
Curva de pr^tencia del test respecto a 11U0 ^^` en el caso de homogeneidad de varianzas
varian zas
N-n = Curva corr+esponicntc a distrb^uciones normalas con coeficiente de variacin n por cien.
U-n = Idem para distribuciones uniformes.
126 ESTADiSTFCA ESPAOGA
1.0 ^
0.9 -^
0. 8 ~
0.? -^^
0.6 ^
0.5 -^^
0.4 ^
0.3 -^
0.2 ^
0.1-
Figura 3
BIBLIGGRAFIA
BRADLEY, J. V.: A Sampling Study of the Central limit theorem and the Robustness of One-Sample
Paramctric Test, en Studies in Research Methodology IV AMRL Tech^tica! Doc u^nent Report.
C^hio (U. S. A.) (1963).
BRwDLEY, J. V.: The Central Limit Effect fr a Variety of Populations and the Robustness of 2,
and F, en Studies in Researrh Mtthodo!gy ^i Technical Document Report. Ohio (U. S. A.)
C1 9^4).
Dwv^o, F. N., y.JONNSON, N. L.: The Effect of Nonnormality on the Power Function of the
F-test in the analysis of Variance . Biometrlka, 38, pp. 43-57 { 1951).
DONAI.S4N: Power of the F-test for Non-normal Distributions and Unequal Error Variances.
RA1VD Ccrrporation Report. Santa Mnica (Califarnia), 196.
DONALSON, T. S.: Rbustness of the F-test io errors of both Kinds and the correlation between
the numerator and denominator of the F-ratio. .^ourn. Arrieric. Stat. Assoc. June, pp, 660-676
(1968).
HORSNE[,L, G.: The Effect of Unequa! Group variances of the F-test for the Homogeneity of
Groups Means. Biornetrika, 40, pp. 128-36 (1953).
PEARSON, E. S.: The Analysis of variance in cases of Non-normal Variations. Biometrika, 28,
pp. 114-33 (1931).
SRivwsTwvw, A. B. L.: Effect of Nonnomarlity on the Power Function of t-Test^^ . Biometrika, 45,
pp. 421-430 (1958).
SUMMARY
The aim of the present work is to anatyse the robustness of the F-test when sorne of
t ^e hipotheses for inference are not true. The effects of departure from the hypotheses
of normally distributed ta uniforrn populations, and equal to unequal variances, are
studied, considering some variations in the nature of the set of experimental data.
For doing the analysis, Montecarlo Simulation Thechniques has been used.
Conclusions have been taken related with the insensitivity of the test investigated
to the underlying assumptions and variations.
Finally, some ideas concerning future research on the field have been commented.