Professional Documents
Culture Documents
Anlisis de Covariancia
Anlisis de Covariancia
1. Introduccin En el anlisis de covariancia se combinan los conceptos del anlisis de variancia para un diseo experimental y para regresin. El anlisis de covariancia es utilizado en casos en los que la variable respuesta de un diseo experimental est relacionada con una o ms variables concomitantes. En este captulo se tratar el caso de la covariancia lineal con una sola variable concomitante y se presentar el anlisis para el Diseo de Bloques Completos al Azar. El estudiante sin embargo, no tendr ningn problema en llevar esta tcnica a un Diseo Completamente al Azar.
2. Modelo Aditivo Lineal El modelo aditivo lineal para un anlisis de covariancia en un Diseo de Bloques Completos al Azar es el siguiente: Y^ + r^+Z?( Xij-X..) + % donde: Yij es el valor o rendimiento observado en el i-simo tratamiento, j-simo bloque. ju es el efecto de la media general. Ti es el efecto del i-simo tratamiento. Yj es el efecto del j-simo bloque. y? es el coeficiente de regresin lineal de Y sobre X. Xij es el valor de la variable independiente en el i-simo tratamiento, j-simo bloque. X es la media de la variable independiente. sij es el efecto del error experimental en el i-simo tratamiento, j-simo bloque. t es el nmero de tratamientos. b es el nmero de bloques. i = 1,..., t j = 1,..,b
reyzagui
rre@lamolina.edu.pe
100
Anlisis de
Ejemplo 1: Se desarroll un experimento cuyo objetivo era determinar si la exposicin en agua calentada artificialmente afectaba el crecimiento de las ostras. Cinco bolsas con diez ostras cada una fueron aleatoriamente asignadas a cinco temperaturas (T1, T2, T3, T4, T5); cada bolsa constitua una unidad experimental. Se utilizaron cinco estanques, cada uno calentado a una de las cinco temperaturas. Las ostras fueron limpiadas y pesadas al comienzo y al final del experimento un mes despus. El experimento se repiti cuatro veces para lo cual fueron necesarios 4 meses. Cada repeticin constituye un bloque. Los pesos iniciales y finales se presentan en la siguiente tabla: Blo T1 T2 T3 q. XY XY XY I 20.4 24.6 27.2 32.6 26.8 31.7 II 19.6 23.4 32.0 36.6 26.5 III 25.1 30.3 33.0 37.7 IV 18.1 21.8 26.8 31.0 30.7 26.8 30.4 Tot 83.2 100.1 119.0 108.7 al 137.9 126.6 El modelo aditivo lineal es el siguiente: Yij=// + ri+rj+/?(Xij-X..) + % donde: Yij es el peso final de una bolsa de ostras tratada con la i-sima temperatura de agua (tratamiento) en el j-simo mes (bloque). ju es el efecto de la media general de los pesos. Ti es el efecto de la i-sima temperatura del agua. y es el efecto del j-simo mes. p es el coeficiente de regresin lineal de Y, el peso final de las ostras, sobre X, el peso inicial. Xij es el peso inicial de una bolsa de ostras tratada con la i-sima temperatura de agua (tratamiento) en el j-simo mes (bloque). X es el peso medio inicial de las bolsas de ostras. s es el efecto del error experimental con la i-sima temperatura de agua, en el j-simo mes. t = 5 (Nmero de tratamientos). b = 4 (Nmero de bloques). T4 XY 22.4 29.1 23.2 28.9 28.6 35.2 24.4 30.2 98.6 123.4 T5 XY 21.8 27.0 24.3 30.5 30.3 36.4 29.3 35.0 105.7 128.9 Total X Y 118. 145. 6 0 125. 150. 6 1 143. 515. 170. 616. 2 9
i = 1,..., t
j = 1,..,b
3. Suposiciones del Modelo Estadstico Adems de los supuestos de un Diseo de Bloques Completos al Azar, se deben cumplir los siguientes: 1. Los valores de X son fijos, medidos sin error, y no son afectados por los tratamientos. Ing. Ral Eyzaguirre Prez reyzaguirre@lamolina.e du.pe
101
Anlisis de Covariancia 2. Las variables X y Y deben tener variancias homogneas entre los tratamientos. 3. La regresin de Y sobre X debe ser lineal.
4. Anlisis de Covariancia La met odol oga para efec tuar el An lisis de Cov aria ncia se resu me a cont inua cin :
a d SCX 5;^ 7>x Exx Sxx SPx r 5x7 Txy EXY SXY SCY BYY TYY EYY SYY SC aj. y c u a d r a d o s x* m e d i o s p a r a e v a l u a r d i f e r e n c i a s e n t r e m e
d e c u a d r a d o s , g r a d o s d e l i b e r t
d i a s a j u s t a d a s d e t r a t a m i e n t o s Los pasos para la construccin del cuadro ANCOVA son los siguientes: 5. Calcule los grados de libertad (Columna gl). 6. Calcule las sumas de cuadrados total en X y Y y la suma de productos total: xy SC(X) = SS^2-^= 1 ;= 1 t b donde: t b = 1 j = 1 b X Y
X =
T Y
TCX = t
T C
t b 3. Calcule las sumas de cuadrados en X y Y y la suma de productos para cada una de las fuentes de variacin (Columnas SCX, SPXY, SCY): Para Bloques: B TC, XX j=1 X 2 t H^ I n b X Y nxr Z_i
1
b ^V x r YY # 1
Anlisis de Covariancia Para Tratamientos: ' X2 ' XY 'Y2 1xx ~ Z-i x XY ~ Z-i XY
1
YY ~ Z-i
y i=\ i=\ " i=\ Para el Error (Por diferencia): Exx = SC(X) B^ -T^ EXY= SP(XF) -Bxy-Txy EYY = SC(7) BYY - TYY 4. Calcule las sumas de cuadrados y productos para Tratamientos + Error: ^XX ~ *-XX ~"~ ^XX ^XY ~ *-XY " "
~"~ -^XY *YY ~"~ ^YY 5. Calcule las sumas de cuadrados ajustadas (Columna SC aj.): F2
^YY ~
i j y 616 92
6. Calcule la suma de cuadrados ajustada para evaluar diferencias entre las medias ajustadas de los tratamientos: SCr+ - sc 7. Calcule los grados de libertad ajustados (Columna gl aj.). 8. Calcule los cuadrados medios ajustados (Columna CM aj.). Ejemplo 1 (Cont): A continuacin se presentan los clculos para la construccin del cuadro ANCOVA para el ejemplo tratado en esta seccin: tb sc(x) = XSX-rc, tb (5) (4) SP(XF) = ^ Z Va ~ TC*y =i j=\ = (20.4 2 +19.6 2 +... + 29.3 2 )- 515'2 =309.79 ((20.4)(24.6) + (19.6)(23.4) + ... + (29.3)(35.0))(515'2^616^ = 325.67 tb
( 5 X 4 ) fe II XT ^=Z^^-rC^ ((118.6) (145.0) + (125.6) (150.!) + ... + (127.2) (151.8)) (515.2) (616.9) 5 (5X4) b y2 BYY =^-^-7U7 22 2 2
( 1 4 5 . 0 2 + 1 5 0 . r + . . . + 1 5 1 . 8 2
) 6 1 6 . 9 2 = 7 1 . 3 7
2 = 176.79
1
1XY ~ _ 7 ^X T =1 * ((83.2)(100.1) + (119.0) (137.9) + ...(105.7) (128.9)) (515.2)(616.9) _ 1Q1 _ -------------------------------------------------------------------------------181.61 4 T/2 r =Y-TC
6 i=\
YY
_ Y 4 (5X4)
Anlisis de Covariancia
gl 3 4 12 16
Cantidades para evaluar diferencias medias ajustadas de tratamientos 4.1. Prueba de Hiptesis para el Coeficiente de Regresin El primer paso en un anlisis de covariancia es evaluar la significancia del coeficiente de regresin. Si el coeficiente de regresin resulta significativo, entonces se justifica el uso de la variable concomitante X en el modelo y por lo tanto, los efectos de los tratamientos debern evaluarse con los datos corregidos por la regresin. De no resultar significativo este coeficiente, los efectos de los tratamientos seran evaluados a
partir de un Anlisis de Variancia sin considerar el efecto de la variable concomitante X. El procedimiento de prueba de hiptesis para el coeficiente de regresin es el siguiente: Hiptesis: H
0
= 0 H
1
: 0 Estas hiptesis con equivalentes a: H0: El peso final de las ostras no depende linealmente del peso inicial. I n
: = 0 H
1
Regla de Decisin: La hiptesis nula se rechaza con un nivel de significacin si el Fc resulta mayor que el valor de tabla F(1-, 1, gl(Error aj.)) . Ejemplo 1 (Cont.): H
0
Anlisis de Covariancia H1: El peso final de las ostras s depende linealmente del peso inicial. E2 X Y 74.502 Fc =-----E^ = 6463 = 31305 F CMEaj. 0.2743 (1, 11) El valor de tabla para un nivel de significacin del 5% es F(0951 11)= 4.84. Como el valor calculado es mayor que el valor de tabla se rechaza H0 y se concluye que existe suficiente evidencia estadstica para aceptar que el peso final de las ostras depende linealmente del peso inicial. 4.2. Prueba de Hiptesis para los efectos de los tratamientos En el caso que la regresin resulte significativa, las hiptesis para los tratamientos se
plantearn en trminos de los efectos (medias) de los tratamientos ajustados por la regresin. Hiptesis: H0: JUi aj. = Uaj. V i H1: //i aj. * //aj. para al menos algn i Estadstico de Prueba: Fc = CM(Trat aj.)^ CME aj. Regla de Decisin: La hiptesis nula se rechaza con un nivel de significacin a si el Fc resulta mayor que el valor de tabla F 1 .. [-a, gl(trat. aj.), gl(Error aj.)J Ejemplo 1 (Cont.): H
0
3 , 4 , 5
H 1 : / /
i
j . ^ j U a j . p a r a a l m e n o s a
: A a j . = / / a j . i = 1 , 2 ,
l g n i o literalmente: H0: Las cinco temperaturas son igualmente efectivas en el crecimiento de las ostras. H1: Con al menos una de las temperaturas se obtienen resultados diferentes en el crecimiento de ostras. Fc = CM(Trat aj.) = 3.1493 = 1 1 4 8 ^ CME aj. 0.2743 (4,11) El valor de tabla para un nivel de significacin del 5% es F(095,4,11)= 3.36. Como el valor calculado es mayor que el valor de tabla se rechaza H0 y se concluye que existe suficiente I n 1
Anlisis de Covariancia evidencia estadstica para aceptar que con al menos una temperatura se obtiene un peso final diferente para las ostras.
5. Pruebas de Comparacin de Medias de Tratamientos Para aplicar las pruebas de comparacin de medias de tratamientos se debe trabajar con las medias de los tratamientos ajustadas por la regresin. Para efectuar el ajuste, se debe calcular primero el coeficiente de regresin estimado, el cual es dado por: E XY
tratamientos
ajustadas por la
estndar para las pruebas son: 1. Prueb aty DLS C M E aj 1 (Xi^E* X^)2 l-----hri rj 1
2 d
3 . D u n
Estas frmulas se aplican si el diseo es un DCA con ri y rj repeticiones para el par de tratamientos que se estn comparando (rT es el nmero de repeticiones para el tratamiento testigo). En el caso de un DBCA, que es el diseo que se est tratando en esta seccin, el nmero de repeticiones para cada tratamiento es igual a b, por lo que en las frmulas anteriores ri = rj = rT = b y 1ri + 1rj =2/ b. 74.5 Ejemplo 1 (Cont.): Efecte la pruebe de Tukey. 0 Las hiptesis son las siguientes: H0: Aaj. = Mj aj. V i j = 1, 2, ... 5, con i *j H1: //i aj. ^^yaj. El coeficiente de regresin estimado es: E E XY P 1.15 27
Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I Covariancia Las medias de las variables X y Y sin ajustar para cada tratamiento son: X1% = 20.8 Y1 =25.025 X2. = 29.75 Y2. =34.475 X3. = 27.175 Y 3. =31.65 X4. = 24.65 Y4. =30.85
Anlisis de
X = 25.76
Las medias de Y ajustadas para cada tratamiento segn la frmula Yi. aj = Yi. - (Xi. - X) son: Y1 aj =30.74 Y2.aj =29.88 Y3.aj =30.02 Y4.aj =32.13 Y5.aj =31.46
El valor de tabla con a = 5%, p = 5 tratamientos y 11 grados de libertad para el error ajustado es AES(T) = 4.57. La amplitud lmite significativa de Tukey est dada por la siguiente frmula: CME aj. ALS(T) = AES(T) 2 donde b = 4, CME aj. = 0.2743 y EXX = 64.63. A continuacin se presentan los resultados para las 10 comparaciones: Tratamientos comparados 1y2 1y3 1y4 1y5 2y3 2y4 2y5 3y4 3y5 4y5 T2 29.88 \Y -Y 1 i* aj 0.867 0.724 1.387 0.716 0.143 2.254 1.583 2.111 1.440 0.671 sd j 0.488 0.393 0.316 0.368 0.287 0.352 0.303 0.287 0.264 0.274 T1 30.74 2.232 1.798 1.445 1.684 1.314 1.608 1.386 1.310 1.207 1.254 T5 31.46 n.s. n.s. n.s. n.s. n.s. * * * * n.s. T4 32.13 ALS(T) Significancia 2i(X,-Xj.)2~ H--------------bEXX
T3 30.02
Prez
reyzaguirre@lamolina.e du.pe
108
2 3 4 5 Analysis of Variance for Y, using Adjusted SS for Tests Sourc X Bloq Trat Error Total Term Const X O 1 D 1 3 4 1 1 9 Seq SS 342.35 0.697 12.597 3.017 358.67 0 Coef StDev 1.151 6 1.15273 Fit 29.68 A 8 1 1 3 8 2 5 0 Adj 85.87 0.402 3.149 0.274 F 3 . 1 . 1 .
Lev Differen Tra of Means 3 0.1433 4 2.2539 5 1.5828 Tra 3 t subtracte d from:
R denotes an observation with a large standardized residual. Tukey Simultaneous Tests Response Variable Y All Pairwise Comparisons among Levels of Trat Trat = 1 subtracted from: Lev Differen SE of Tra of Means Differe T2 -0.8669 0.6908 3 -0.7237 0.5565 4 1.3870 0.4473 3.101 5 0.7159 0.5210 1.374 Trat 2 subtracted from: Adjus P0.721 0.696 0.062 0.654
Lev Differen SE of Tra of Means Differe T4 2.111 0.4052 5.208 5 1.440 0.3736 3.854 Trat 4 subtracted from:
Lev Tra 5 I n
SE of Differe 0.3880
Anlisis de Covariancia Ejercicios 1. En una estacin experiment al se realiz un experiment o en el que se evalu el efecto del tiempo de cosecha sobre el rendimiento de grano de maz. Se dise un experiment o con cuatro tratamiento s usando una distribucin de bloques completos al azar. Los tratamiento s fueron 30, 35, 40 y 45 das despus de ocurrida la polinizaci n (para el tiempo de cosecha). El nmero de plantas por parcela til fue de 52. La variedad usada fue V1 y el cultivo se efectu con riego. Los valores se presentan
en al siguiente tabla: Rendimiento de grano seco (Kg / parcela til) y N de plantas de maz cosechada sa diferentes fechas de la polinizaci n. X: N de plantas Y: Producci n de grano seco (Kg / parcela) Das de tratamiento 30 35 40 45 X 41 40 37 32 Bloques I Y 4.08 4.26 4.72 4.00 X 24 36 32 38 II Y 2.78 4.23 4.92 4.53 X 31 44 38 40 Y X
5X Y
12. Presente el Modelo Aditivo Lineal y defina cada uno de sus componentes en trminos del problema. 13. Presente el cuadro de ANCOVA y realice las pruebas correspondientes. 14. Encuentre las medias de los tratamientos ajustados. I n
20 4.7 3
15 4.0 0
9. Presente el Modelo Aditivo Lineal y defina cada uno de sus componentes en trminos del problema. 10. Presente el cuadro ANCOVA y realice las pruebas correspondientes. 11. Realice la prueba de Tukey. 2. La siguiente informacin corresponde a pesos iniciales (X) y ganancias de peso (Y) en Kg de lechones en un ensayo comparativo de 6 raciones en 5 corrales (bloques). Corral 1X Y 2X Y 3X Y 4X Y 1 17 4.32 16 3.72 19 4.23 22 4.79 2 22 4.5 1 15 4.3 16 4.23 21 4.9 Raciones 3 4 18 22 3.8 4.54 6 17 15 4.5 4.19 21 19 3.8 4.24 21 18 4.02 4.39
Anlisis de Covariancia d) Efecte la prueba de Dunnett. Considere que la racin 1 es el testigo. 3. Se tiene un experiment o con 3 variedades de trigo y se desea averiguar en que variedad se tiene mayor peso de races (Y) en gramos de materia seca. Se cree que el nmero de plantas (X) influye sobre el tamao de las races por lo cual se utilizar el Anlisis de Covariancia en este experiment o, el mismo que se lleva a cabo utilizando cinco macetas en invernadero . El diseo estadstico utilizado es el DCA. N de Maceta X I
1 2 3 4 5
6 4 6 4 4
8 5 4 5 7
15. Plantee el modelo estadstico adecuado y explique cada uno de sus componentes en trminos del enunciado. 16. Presente el cuadro de ANCOVA y realice las pruebas correspondientes. 17. Utilice la prueba t para evaluar si con la variedad I se obtienen pesos superiores en ms de 0.5 gr que con la variedad II.
111