You are on page 1of 21

INFERENCIA ESTADÍSTICA

1
PARA UNA Y DOS MUESTRAS
ANÁLISIS DE VARIANZA (ANALYSIS OF VARIANCE – ANOVA)

Ing. Fausto Redrován - 2017


2 Contenido

 Anova
 Ejemplo
 Origen de las variaciones

Ing. Fausto Redrován - 2017


3
Análisis de Varianza – ANOVA

Ing. Fausto Redrován - 2017


4 Análisis de Varianza – ANOVA

 Esta prueba se utiliza para determinar si las medias muestrales


provienen de poblaciones con medias iguales, cuando hay más de
dos poblaciones en estudio.
 El análisis de varianza (ANOVA) permite comparar
simultáneamente todas las medias, evitando tener que realizar
pruebas en grupos de dos con las técnicas vistas anteriormente.
 Suposiciones necesarias para el análisis de varianza
 Las poblaciones tienen distribución normal
 Las poblaciones tienen varianzas iguales (homocedasticidad)
 Las muestras son independientes
 La variable dependiente es cuantitativa (escalar) y la variable independiente es
categórica (nominal u ordinal).
Ing. Fausto Redrován - 2017
5 Análisis de Varianza – ANOVA

 Usamos ANOVA de un factor cuando queremos saber si las medias


de una variable (dependiente) son diferentes entre los niveles o
grupos de otra variable (independiente – factor).
 Por ejemplo, si comparamos el número de hijos entre los grupos o
niveles de clase social: los que son clase baja, clase trabajadora,
clase media-baja, clase media-alta y clase alta.
 Es decir, vamos a comprobar mediante ANOVA si la variable
“número de hijos” está relacionada con la variable “clase social”.
 Concretamente, se analizará si la media del número de hijos varía
según el nivel de clase social a la que pertenece la persona.

Ing. Fausto Redrován - 2017


6 Análisis de Varianza – ANOVA

Si las medias de la variable dependiente son


iguales en cada grupo o categoría de la
variable independiente, los grupos no difieren
en la variable dependiente, y por tanto no hay
relación entre las variables.
En cambio, y siguiendo con el ejemplo, si las
medias del número de hijos son diferentes entre
los niveles de la clase social es que las variables
están relacionadas.
Ing. Fausto Redrován - 2017
7 Análisis de Varianza – ANOVA

 Se utiliza para verificar si los experimentos son afectados por el tratamiento


en sí o por efectos externos aleatorios.
Tratamientos: Alternativas de la experimentación (Efectos Fijos)
Variabilidad de los resultados: Efectos aleatorios
 ¿En verdad los resultados están cambiando por los efectos fijos o por los
efectos aleatorios? Esto es lo que hay que averiguar.
𝐻0 : 𝜇 = 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛 Medias de cada tratamiento
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑛𝑜 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎 𝜇 La negación de H0

Ing. Fausto Redrován - 2017


8 Análisis de Varianza – ANOVA

 En Excel se utiliza Análisis de varianza de un factor:


Factor: Variable que está cambiando en cada tratamiento
 Si las poblaciones muestreadas son normales y sus varianzas son iguales, el
estadístico F se distribuye según el modelo de probabilidad F de Fisher-
Snedecor:
 Los grados de libertad del numerador “Entre grupos” son el número de grupos
menos 1
 Los del denominador “Dentro de los grupos”, son el número total de
observaciones menos el número de grupos.

Ing. Fausto Redrován - 2017


9 Análisis de Varianza – ANOVA

Ing. Fausto Redrován - 2017


10 Análisis de Varianza – ANOVA

F0: Estadístico F determinado por Excel. El F observado


Fc: Estadístico F crítico determinado por Excel. El F de tabla
 Si F0 < Fc entonces H0 no se puede rechazar. Es decir, los
únicos cambios se producen por los efectos fijos de los
tratamientos.
 Por el contrario, si F0 > Fc entonces H0 se rechaza y se
acepta H1. Se producen cambios debido a efectos
aleatorios.

Ing. Fausto Redrován - 2017


11 Análisis de Varianza – ANOVA
Ejemplo
 Supóngase que en un experimento se está interesado en
determinar cómo varía la absorción media de humedad en el
concreto de entre cinco diferentes mezclas de concreto.
 Las mezclas varían en el porcentaje en peso de uno de sus
ingredientes.
 Se desea probar que las mezclas tienen los mismo valores
promedios de absorción.
 Use un nivel de significancia de 5% para verificar dicha hipótesis.

Ing. Fausto Redrován - 2017


12 Análisis de Varianza – ANOVA
Ejemplo
 Los tratamiento se presentan por lo general en las columnas, y cada fila es
una muestra de cada tratamiento.

mezcla fórmula
1 2 3 4 5

551 595 639 417 563

457 580 615 449 631


muestras
450 508 511 517 522

731 583 573 438 613

499 633 648 415 656

632 517 677 555 679

Ing. Fausto Redrován - 2017


13 Análisis de Varianza – ANOVA
Ejemplo
H0: Las medias de cada tratamiento son iguales
H1: Al menos una media de un tratamiento no es igual
Excel:

Ing. Fausto Redrován - 2017


14 Análisis de Varianza – ANOVA
Ejemplo
 Columnas o Filas, es como agrupo los tratamientos
 Alfa es el nivel de significancia de 5% = 0.05

Ing. Fausto Redrován - 2017


15 Análisis de Varianza – ANOVA
Ejemplo

F0 P Fc

Ing. Fausto Redrován - 2017


16
Origen de las Variaciones

Ing. Fausto Redrován - 2017


17 Origen de las Variaciones

 Entre grupos  Significa que la diferencia se hace entre tratamientos.


Efectos fijos entre los tratamientos, provocados por el experimentador.
 Dentro de los grupos Significa que la diferencia se hace entre los datos
del mismo tratamiento. Variabilidad por efectos aleatorios, es decir, lo que
ocurre dentro del tratamiento (lo que debería salir igual, pero no, debido a
efectos aleatorios).
F:
 Se encuentra a partir de los datos F0. El F observado
Valor crítico para F:
 FC. El F crítico

Ing. Fausto Redrován - 2017


18 Origen de las Variaciones
Utilizando el Ejemplo
Análisis:
 Como F0>Fc (4,3 > 2,76) entonces H0 se rechaza y se acepta H1
 Es decir, sí hay diferencia en los tratamientos, y por tanto, hay una relación entre las
variables promedio de absorción de humedad (dependiente) y tipo de mezcla de
concreto (independiente).
 El valor pequeño de significancia (0.0088) indica que las diferencias entre las media del
promedio de absorción de humedad y los tipos de mezclas de concreto son significativas.
 Habría que determinar cuál es el tratamiento que causa la diferencia.
 Para determinar cuál, se puede tomar de dos en dos y realizar una Prueba de Hipótesis
sobre Diferencia de Medias.
 O se puede realizar ANOVA repetidas veces sin considerar un tratamiento diferente cada
vez, hasta determinar que H0 no se puede rechazar, por lo que, el tratamiento no
considerado sería el causante de la diferencia.

Ing. Fausto Redrován - 2017


19 Origen de las Variaciones
Utilizando el Ejemplo
Uso de la Probabilidad:
Hay software que utiliza el valor P para el análisis:
 Si el valor P<α entonces H0 se rechaza y se acepta H1
 Si el valor P>α entonces H0 no se puede rechazar
Análisis:
 Como P<α (0.0088 < 0.05) entonces H0 se rechaza y se acepta H1
Conclusión:
 Algún tratamiento está haciendo la diferencia. ¿Cuál?

Ing. Fausto Redrován - 2017


20 Análisis de Varianza – ANOVA
G1: Control G2: Droga 1 G3: Droga 2 G4: Droga 3
Ejercicio #1:
49.2 97.07 62.1 110.6
Los datos muestran la 44.54 73.4 94.95 57.1
45.8 68.5 142.5 117.6
aplicación de una cierta 95.84 91.85 53 77.71
droga en individuos y se midió 30.1 106.6 175 150
el nivel de un cierto 36.5 0.57 79.5 82.9

parámetro en la sangre. 82.3 0.79 29.5 111.5


87.85 0.77 78.4
Probar la hipótesis, a un nivel 105 0.81 127.5
95.22
de significancia del 5%, de 97.5
que el nivel promedio en la 105
sangre de los pacientes es el 58.05

mismo. 86.6
58.35
72.8
116.7
45.15
70.35
77.4
Ing. Fausto Redrován - 2017
21 Análisis de Varianza – ANOVA
Ejercicio #2:
Para comparar la efectividad de cuatro tipos de fertilizantes para cierto
tipo de producto, se dividió una zona de cultivo en veinte parcelas de
igual tamaño y se administraron cada uno de los fertilizantes en cinco
parcelas elegidas aleatoriamente.
Al finalizar el periodo de cultivo se registraron las cantidades del producto
obtenidas en las parcelas asignadas a cada tipo de fertilizante con los
siguientes resultados, en las unidades de medida que corresponda.
Con una significancia de 5% Fertilizante A Fertilizante B Fertilizante C Fertilizante D
determine si existe evidencia
de que hay diferencia en las 27 26 24 23
cantidades promedio del
producto que se obtuvieron 21 23 26 27
con los cuatro tipos de
fertilizante 24 20 27 26

23 26 22 23

28 23 24 25

Ing. Fausto Redrován - 2017

You might also like