You are on page 1of 16

Ao de la Promocin de la Industria Responsable y

del Compromiso Climtico

Universidad Nacional de San Agustn


Facultad de Administracin
Escuela Profesional de Administracin
Sede Mollendo

ESTADISTICA II
Tema:
Anlisis de varianza de una va y por bloques.
Docente:
Lic. Esther Yanet Yanapa Zapana

Integrantes:
Jose Llano Mamani
Nadier Taco Chipana
Yanira Ternero Daz
Yomira Mamani Llerena

Mollendo - 2014

El anlisis de varianza lo vamos a utilizar para verificar si hay diferencias


Estadsticamente significativas entre medias cuando tenemos ms de dos muestras o
grupos en el mismo planteamiento. En estos casos no utilizamos la t de Student que
solamente es un procedimiento vlido cuando comparamos nicamente las medias de
dos muestras. Como explicaremos ms adelante, cuando tenemos ms de dos muestras
y comparamos las medias de dos en dos suben las probabilidades de error al rechazar la
hiptesis de no diferencia porque queda suficientemente explicada por factores aleatorios
(que tambin se denomina error muestral). En primer lugar recordamos qu es la varianza
y qu nos cuantifica. La frmula de la varianza ya nos es conocida; es la desviacin tpica
elevada al cuadrado:

Utilizamos el smbolo X para designar las puntuaciones individuales, y el smbolo M para


designar la media aritmtica de la muestra; va a ser el smbolo de la desviacin tpica
de la muestra si no se indica expresamente que se trata del smbolo de la desviacin
tpica de la poblacin1.
El denominador ser N-1 si queremos obtener una estimacin de la varianza de la
poblacin. Esto es lo que haremos habitualmente en el clculo de las varianzas propias
del anlisis de varianza.
Una varianza grande indica que hay mucha variacin entre los sujetos, que hay mayores
diferencias individuales con respecto a la media; una varianza pequea nos indica poca
variabilidad entre los sujetos, diferencias menores entre los sujetos. La varianza cuantifica
todo lo que hay de diferente entre los sujetos u observaciones.
Como iremos viendo la varianza se puede descomponer en varianzas parciales y a este
descomponer la varianza le denominamos anlisis de varianza. La varianza expresa
variacin, y si podemos descomponer la varianza, podemos aislar fuentes de variacin.

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 2

Cuando de los sujetos tenemos varios tipos de informacin, el anlisis de varianza nos va
a responder a esta pregunta De dnde vienen las diferencias?
El anlisis de varianza2 no constituye un mtodo o procedimiento nico; segn lo diseos
y datos disponibles existen diversos modelos de anlisis de varianza. En esta introduccin
nos referiremos al anlisis de varianza para varias muestras independientes,y ms
concretamente al anlisis de varianza para slo dos muestras independientes (Aunque en
este caso solemos utilizar la t de Student) porque es de comprensin ms sencilla. La
misma explicacin bsica se puede extrapolar a otras situaciones (ms de dos muestras
independientes, ms de dos muestras relacionadas, diseos factoriales, etc., que iremos
viendo ms adelante).

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 3

ANALISIS DE VARIANZA DE UNA VIA


El anlisis de la varianza de un factor (ANOVA) es una metodologa para analizar la
variacin entre muestras y la variacin al interior de las mismas mediante la determinacin
de varianzas. Es llamado de una va porque analiza un variable independiente o Factor ej:
Velocidad. Como tal, es un mtodo estadstico til para comparar dos o ms medias
poblacionales. El ANOVA de un criterio nos permite poner a prueba hiptesis tales como:

H 0 1 2 3 .... k
H 1 : Al menos dos medias poblacionales son diferentes.
Los supuestos en que se basa

la prueba

t de dos muestras que utiliza muestras

independientes son:
1.

Ambas poblaciones son normales.

2.

2
2
Las varianzas poblacionales son iguales, esto es 1 2 .

El estadstico tiene una distribucin muestral resultando:

sb2
Fc 2
sw
El valor crtico para la prueba F es: F (k 1, k (n 1))
Donde el nmero de grados de libertad para el numerador es k-1 y para el denominador
es k(n1), siendo el nivel de significancia
k = nmero de muestras.
Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 4

3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Programa 3.


Como los empleados se seleccionan aleatoriamente para cada programa el diseo se
denomina DISEO COMPLETAMENTE ALEATORIZADO Se observa el aprovechamiento
de los empleados en los programas:

TRATAMIENTOS

c=1

c=2

c=3

Programa
Programa 1

Programa 3

r=1

85

80

82

r=2

72

84

80

r=3

83

81

85

r=4

80

78

90

r=5

**

82

88

Medias

80.00

81.00

85.00

Xj

Media de medias o media


total

82.14

VARIANZA DE UNA VIA


Considrese un factor con p niveles (variable categrica con p categoras), identificndose
cada uno con un determinado grupo de objetos. Supngase que se desea comparar la
ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 5

distribucin de un marcador numrico Y entre los p grupos. Para tal fin se toma una
muestra de objetos en cada grupo y se observa el referido marcador. El conjunto de datos
disponibles para el anlisis tendra la forma:

El modelo de anlisis de la varianza a una va (ANOVA-1) supone que Y N i j i, (i, ).


Ntese que , es el valor esperado del marcador en el i-simo grupo. Asimismo el
modelo supone que la dispersin del marcador es igual para todos los grupos (condicin
de homoscedasticidad). Esta hiptesis deber ser contrastada mediante un test de
homogeneidad de varianzas (ver test de Bartlet)

DISEO DE UNA VIA


Disponemos de r poblaciones, generalmente correspondientes a r tratamientos
experimentales. Cada uno de los tratamientos Ti, (i=1, , r) se supone que tiene
distribucin normal con media mi y varianza s2, comn a todos ellos, es decir se trata de
poblaciones normales y homoscedsticas. De cada una de las poblaciones (o
tratamientos), tomamos una muestra de tamao ni.
Las observaciones obtenidas se pueden recoger en una tabla de la forma

Es decir xij es la observacin j del grupo experimental i.


Llamaos

a las medias muestrales de los grupos y

a la media de todas las

observaciones.

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 6

Cuando se trata de un experimento diseado, es decir, cuando se trata de la aplicacin de


r tratamientos a un conjunto de unidades experimentales, estas deben seleccionarse para
que sean homogneas, de forma que no se introduzcan factores de variacin distintos del
que se desea controlar. La asignacin de los tratamientos a cada una de las unidades
debe hacerse al azar. Es lo que se conoce como diseo completamente al azar.
El modelo matemtico subyacente a este tipo de diseo es

Donde

es la cantidad que depende del tratamiento usado (descompuesta en

una media global y un efecto del tratamiento) y

es

la

cantidad

que

depende

solamente de la unidad experimental y que se identifica con el error experimental.

La hiptesis de que los distintos tratamientos no producen ningn efecto (o la de que las
medias de todas las poblaciones son iguales) se contrasta mediante el anlisis de la
varianza de una va, comparando la variabilidad entre grupos con la variabilidad dentro de
los grupos.

El anlisis de la varianza se basa en la descomposicin de la variabilidad total en dos


partes, una parte debida a la variabilidad entre las distintas poblaciones o tratamientos
(variabilidad entre grupos o variabilidad explicada por el diseo) y otra parte que puede
considerarse como la variabilidad intrnseca de las observaciones (variabilidad dentro de
los grupos o residual).

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 7

TIPOS DE VARIACIN Y SUMAS DE CUADRADOS


1. Variacin total entre los 14 empleados, su puntuacin no fue igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL

SCT
i 1

( Xij X )

j 1

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2


SCT = 251.7
2. Variacin entre los diferentes tratamientos o Variacin entre muestras o variacin entre
programa 1, programa 2 y programa 3
EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA GENERAL
r

SCTR r j ( X j X ) 2
j 1

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2


SCTR = 65.71
3. Variacin dentro de un tratamiento o muestra o programa dado que no todos los
empleados dentro de un mismo programa obtuvieron los mismos puntajes. Se denomina
Variacin dentro de los tratamientos.
VARIACIN DENTRO DEL TRATAMIENTO O VARIACIN DEL ERROR

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 8

CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO

SCE
i 1

(X
j 1

ij

X j )2

SCE = SCT - SCTR =

186

4. Grados de libertad
Grados de libertad totales = n - 1 = 14-1 = 13
Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2
Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 = 11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

5. Cuadrados medios (Suma Cuadrados/ Grados libertad)


CMT = Cuadrado medio total = SCT / (n-1) =

19.4

CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) =

32.9

CME = Cuadrado medio del error = SCE/ gle.=

16.9

EJEMPLO:
1.- Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
mtodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo
grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas
y se ejercita en el pedaleo de alta frecuencia. Despus de un mes de entrenamiento se
realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los
tiempos empleados fueron los siguientes:

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 9

A un nivel de confianza del 95% Puede considerarse que los tres mtodos producen
resultados equivalentes? O por el contrario Hay algn mtodo superior a los dems?
Solucin:
Comenzamos calculando los totales y los cuadrados de los totales divididos por el nmero
de observaciones:

A continuacin calculamos los cuadrados de las observaciones y su total:

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:


SC(total) = 2984 - 2940 = 44
SC(intra) = 2984 2966,8 = 17,2
SC(entre) = 2966,8 2940 = 26,8

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 10

Los cuadrados medios sern:


CM(entre) = 26,8/2 = 13,4
CM(intra) = 17,2/12 = 1,43

Por consiguiente el estadstico de contraste vale:


F = 13,4/ 1,43 = 9,37
El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es
3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que los tres mtodos de
entrenamiento producen diferencias significativas.

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 11

ANALISIS DE VARIANZA POR BLOQUES

Cuando slo hay dos tratamientos, el anlisis de varianza de una va equivale al test t de
Student para muestras independientes. A su vez, el anlisis de varianza para el diseo en
bloques con dos tratamientos, equivale a la dcima de t de Student para muestras
pareadas.
Como ya se vio anteriormente, cuando se comparan ms de dos pares de tratamientos, la
dcima de t de Student no conserva el nivel de significacin correspondiente y es ms
correcto utilizar el anlisis de varianza.
El diseo en bloques aleatorios es apropiado y eficiente cuando se desea investigar las
diferencias entre los promedios de k tratamientos en condiciones homogneas, vale decir,
eliminando las diferencias iniciales entre las unidades experimentales. Estas condiciones
homogneas pueden ser: parcelas de terreno, lotes de produccin, camadas de ratones,
o una misma persona sometida a diferentes tratamientos. Se supone que la variabilidad
de las unidades experimentales entre parcelas, lotes, camadas o personas, es mayor que
dentro de esos bloques. Por tanto, al adjudicar los k tratamientos aleatoriamente a las
unidades que constituyen un bloque, se obtiene un efecto de tratamiento limpio de esa
variacin entre bloques que podra llegar a encubrir la diferencia entre tratamientos.
Comparando con el diseo completamente aleatorio, se tiene por tanto una fuente de
variacin adicional a las entre tratamientos y dentro de tratamientos: la variacin entre
bloques. La suma de cuadrados correspondiente se simbolizar por SCB. Los grados de
libertad para el clculo de CMB sern: b 1, el nmero de bloques menos 1. La SCB se
calcula usando los valores de las sumas de los yij pertenecientes a cada uno de los
bloques:

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 12

Y la tabla de ANOVA ser:

Nota: la suma de cuadrados entre tratamientos es la misma (escrita de otra manera) para
el ANOVA de una va. Lo que cambia es lo que llamamos suma de cuadrados dentro de
tratamientos que ahora se dividi entre las SC de Bloques y la SC Residual.
Ejemplo:
Se tienen tres especies de ctricos a los cuales se mide la razn entre el rea de las hojas
y el peso seco, bajo 3 condiciones de sombra (sol, semisombra y sombra)

En este problema no interesa determinar si hay diferencias entre las condiciones de


sombra (bloques), supuesto para haber decidido este diseo, sino que interesa analizar si
las tres especies difieren en sus resultados. Para el anlisis usamos SPSS (Instrucciones:

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 13

Analizar - Modelo Lineal General - Univariante - Modelo - Personalizado - Efectos


Principales - Tipo III y no incluir la interseccin en el modelo).
La tabla de anlisis de varianza es entonces:

En la prueba de significacin, como se dijo ms arriba, slo interesa investigar la


diferencia entre tratamientos.
Luego, las hiptesis son:

H0 = 1 = 2 = 3
H1 : al menos dos medicamentos son iguales
Esto hace que la F de inters sea la F de los tratamientos, F observado de 19,536 con un
valor p de 0,009. Por tanto se rechaza la hiptesis de nulidad y se acepta que hay al
menos dos tratamientos (especies) que difieren significativamente en sus efectos (razn).
Para saber cules de las diferencias observadas entre los promedios de los tratamientos
son significativas se pueden emplear los mismos mtodos de comparacin para medias
presentados para el diseo completamente aleatorio.
Para saber si en este caso, fue ms eficiente el diseo en bloques que un diseo
completamente aleatorio, analizaremos la conclusin a la que se habra llegado con este
ltimo. Slo necesitamos eliminar los bloques como fuente de variacin.
ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 14

Notar primero que la suma de cuadrados de los tratamientos es exactamente igual a la


anterior. .Lo que cambia es que la suma de cuadrados de los bloques est incluida en la
suma de cuadrados residual o intragrupos. El F observado de 1,295 tiene un valor p de
0,341, este resultado muestra que los tratamientos no son estadsticamente significativos
al 5%. Esto confirma que, en este caso, fue adecuado el diseo en bloques porque logr
remover de la suma de cuadrados residual, la variacin debida a la diferencia entre
bloques.

Diagnsticos
Un diseo en bloques NO ser apropiado si:
- no hay homogeneidad de varianzas del error de los bloques
- no hay homogeneidad de varianzas del error de los tratamientos
- Efectos temporales
- interaccin entre bloque y tratamiento

Para analizar la homogeneidad de varianzas por bloques y tratamientos, podemos hacer


un ANOVA de una va definiendo un factor con k b niveles. Para hacer esto ser
necesario tener repeticiones en cada nivel del factor (lo que no

ocurre en nuestro

ejemplo)

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 15

El ANOVA se fundamenta en el estudio de las varianzas. Como establece


diferencia entre las medias poblacionales, es un mtodo matemtico creado para
probar la hiptesis de que las medias aritmticas de ms de dos grupos
poblacionales son iguales.
No obstante que el anlisis de varianza permite obtener una conclusin que se
refiere a la poblacin contenda en una muestra..
Como en estadstica hay varias subespecialidades, entre estas se encuentra el
anlisis de experimentos que nada tiene que ver con un laboratorio, se trata de
optimizar recursos para obtener la mayor informacin til ante un problema, es
muy usado en el desarrollo de nuevos productos, evaluacin de proveedores, etc.
En esta rea de estadstica, se identifican los diferentes tipos de de diseos de
experimentos. Al diseo ms sencillo se le conoce como anlisis de varianza de
una va o factor. La va es el elemento que se desea evaluar. Y tambin existe
anlisis de varianza de dos vas.

ANALISIS DE VARIANZA DE UNA VIA Y POR BLOQUES

Pgina 16

You might also like