You are on page 1of 7

Trabajo de Estadística

1. Explique en que consiste y cuando se debe aplicar el diseño completamente al azar con un
solo criterio de clasificación.

El diseño completamente al azar consiste en que todas las corridas experimentales se


realizan en orden aleatorio completo y está centrado en comparar los tratamientos en
cuanto a sus medias poblacionales y compara más de dos tratamientos.

Se debe aplicar cuando sólo se consideran dos fuentes de variabilidad como son los
tratamientos y el error aleatorio.

6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un


medio específico. Para ello se realiza un experimento, teniendo como punto de partida la
misma cantidad de microorganismos. Se hacen cuatro repeticiones y se obtienen los
siguientes resultados. ¿Estos datos son evidencia suficiente para afirmar que los niveles de
pH donde se logra menor y mayor crecimiento son e1 3 y el 2, respectivamente? Explique
su respuesta.

Nivel de pH Crecimiento promedio (en %)


1 80
2 105
3 75

Según la tabla mostrada no podemos afirmar que el nivel de PH influya directamente en


el crecimiento promedio en 1 y en 2 porque puede haber otros factores que influyen.

Los datos que nos proporciona no nos ayudan a tomar buenas decisiones.

11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.
Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de
moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados
obtenidos se muestran a continuación.

NUMERO DE REPLICA
Marca de spray 1 2 3 4 5 6
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69

a) Formule la hipótesis adecuada y el modelo estadístico.


Formulación de Hipótesis Nula H0: u1= u2
H0: u1= u3
H0: u2= u3
Formulación de Hipótesis Nula HA: u1≠ u2
HA: u1≠ u3
HA: u2≠ u3

Modelo Estadístico: Xij= u + αi +yj +eij

b) ¿Existe diferencia entre la efectividad promedio de los productos en spray?


Realizamos primero el siguiente cuadro.

Grupos n Sumatoria Promedio Varianza


Spray 1 6 414 69 26
Spray 2 6 355 59,17 66,97
Spray 3 6 377 62,83 66,17

Pasamos a realizar mediante un análisis de varianza ANOVA. Teniendo las siguientes


medias.
Marca 1: 69
Marca 2: 59,17
Marca 3: 62,83
A simple vista se puede dedujeron esto, que la marca 1 es la que presenta mayor
efectividad, mientras que el producto 2 y 3 no tienen mucha diferencia, sin embargo, es
prudente analizar la varianza de estos datos más a fondo.

c) ¿Hay algún spray mejor? Argumente su respuesta.


Realizamos ANOVA para los datos.

Fuente de Suma de grados de Cuadrado F0 Valor - P


variabilidadCuadrados libertad Medio
Tratamientos 281,33 5 56,26 0,8328 3,1058
Error 810,638 12 67,55
Total 1092 17

Considerablemente el spray 1, dado que la tabla ANOVA indica que existe diferencia
entre las medias de los datos, sin embargo el método LSD puede ser de utilidad para
comprobar la HA que indica que al menos una de las medias es diferente con respecto al
método utilizado

Comparaciones = (3(3-1))/2= 3
LSD = t0.05/2, 18 √67,55(1/6 + 1/3)
LSD = 2.1315(4,22) = 8,99

d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada


una de las marcas.
H0 I yi-yjI LSD ni nj
u1- u2 I69-59,16 9,84 8,99 3 7
u1- u3 69-62,83 6,17 8,99 3 7
u2-u3 59,16-62,83 3,16 8,99 3 7

e) Dibuje las gráficas de medias y los diagramas de caja simultáneos, después


interprételos.

f) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Los datos de efectividad de cada spray presentan una distribución normal con respecto,
a esto se puede comprobar gracias a la correlación entre sí es de 0,98(√0,9735).
Los datos cumplen con el supuesto de homogeneidad al presentase en una distribución
similar entre sí.

Unido a lo anterir los datos presentan independencia, lo que indica que la probabilidad de
cada uno de ellos no está influida porque el otro suceso, es decir, que los sucesos no
estan realcionados.

16. Los datos que se presentan enseguida son rendimientos en toneladas por hectárea de un
pasto con tres niveles de fertilización nitrogenada. El diseño fue completamente aleatorizado,
con cinco repeticiones por tratamiento.

Niveles de nitrógeno
1 2 3
14.823 25.151 32.605
14.676 25.401 32.460
14.720 25.131 32.256
14.5141 25.031 32.669
15.065 25.267 32.111
123
a) ¿Las diferencias muestrales hacen obvia la presencia de diferencias poblacionales?

No específicamente dado que, al estudiar una pequeña parte de la población, no


podemos asumir que todas las demás sean iguales ya que existen determinados factores
para cada parte que no se aprecian a simple vista.

b) Obtenga el análisis de varianza e interprételo.

Realizamos los cálculos mediante ANOVA.

Fuente de Suma de grados de Cuadrado F0 Valor - P


variabilidad Cuadrados libertad Medio
Tratamientos 788,36 2 394,18 10102,8 3,885
Error 0,468 12 0,039
Total 788,82 14
g) Analice los residuos, ¿hay algún problema?

Se puede apreciar una diferencia bastante marcada entre la F0 y la F de tablas, lo cual


indica que existe una diferencia entre las medias de los tratamientos por lo que
procedemos a realizar el cálculo de LSD (Diferencia Mínima Significativa).
El LSD nos ayudará a comprobar con respecto la HA ¿Cuál de las medias es diferente con
respecto al método utilizado?

Comparaciones = (3(3-1))/2= 3
LSD = t0.05/2, 12 √0.039(1/3 + 1/5)
LSD = 2.178(0,1438) = 0,3131

EJERCICIOS CON BLOQUES.


EJERCICIO 1. ¿En qué situaciones se aplica un diseño en bloques completos al azar? ¿En qué
difieren los factores de tratamientos y de bloque?

Un diseño en bloques al azar se aplica cuando se quiere Cuando se quieren comparar


ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles
diferencias se deban principalmente al factor de interés y no a otros factores que no se
consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se
controlan o nulifican para hacer la comparación, las conclusiones podrían ser afectadas
sensiblemente. El diseño en bloques completos al azar se aplica cuando el efecto de un
tratamiento a comparar depende de otros factores que pueden influir en el resultado de
un experimento y que deben de tomar en cuenta para anular su posible efecto y evitar
sesgo al comparar los factores de interés.

La diferencia radica en que estos últimos no se incluyen en el experimento de manera


explícita porque interese analizar su efecto sino como un medio para estudiar de manera
adecuada y eficaz al factor de interés para no sesgar la comparación
Estos entran al estudio con un nivel de importancia secundaria con respecto al factor de
interés y la inclusión de estos es un medio y no un fin para lograr la comparación

EJERCICIO 6.Aunque en el análisis de varianza para un diseño en bloques completos al azar


también se puede probar la hipótesis sobre si hay diferencia entre los bloques, se dice
que esta hipótesis se debe ver con ciertas reservas. Explique por qué.

La hipótesis que se plantea:


H0: y1 = y2=…= yb =0
HA : y≠0 para algún bloque j

Esta no es una prueba F exacta, sino aproximada debido a la restricción de aleatorización.


En la práctica se recomienda su interpretación porque es evidencia a favor o en contra de
que valió la pena el esfuerzo de controlar el factor de bloque. Si resulta significativa
implica que el factor de bloques tiene influencia sobre la variable de respuesta, y debe ser
tomado en cuenta para mejorar la calidad de esta. Pero si no se rechaza y se acepta que
los bloques son iguales en respuesta media entonces no se controla ese factor en futuros
experimentos.
La restricción de aleatorización se debe al hecho de que no se aleatoriza el orden de las
corridas experimentales en relación a los bloques. El experimento supone que solo se
aleatoriza el orden de las corridas dentro de cada bloque, lo cual evita sesgos en la
comparación de los tratamientos, pero no los impide en la comparación de bloques.

EJERCICIO 11. En una empresa lechera se tienen varios silos para almacenar leche (cisternas de 60
000 L). Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento.
Se sospecha que en algunos silos hay problemas, por ello, durante cinco días se decide registrar la
temperatura a cierta hora crítica. Obviamente la temperatura de un día a otro es una fuente de
variabilidad que podría impactar la variabilidad total.

Día
Silo Lunes Martes Miércoles Jueves Viernes
A 4.0 4.0 5.0 0.5 3.0
B 5.0 6.0 2.0 4.0 4.0
C 4.5 4.0 3.5 2.0 3.0
D 2.5 4.0 6.5 4.5 4.0
E 4.0 4.0 3.5 2.0 4.0

a) En este problema, ¿cuál es el factor de tratamiento y cuál el factor de bloque?

El factor de tratamiento son los silos y el factor de bloque los días.

b) Suponga un DBCA, formule las hipótesis adecuadas y el modelo estadístico.

Modelo estadístico:

i=1,2,…, k
Modelo Estadístico: Yij = u + Ʈi +yj +eij
j=1,2,…, b

Donde Yij en la medición que corresponde el tratamiento i y al bloque de j, u es la media


global poblacional, Ʈi es el efecto debido al tratamiento i, y es el efecto debido al bloque j
y eij el error aleatorio.

Hipótesis: H0: u1= u2= u3= …=uk =u


H1: Al menos dos son distintas

También se pueden expresar como:


H0: Ʈ1= Ʈ2= Ʈ3= … = Ʈk =0
H1: Ʈ1≠0 , para algún i

En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media


poblacional lograda con cada tratamiento es la misma para los k tratamientos y que, por
lo tanto, cada respuesta media u es igual a la media poblacional, u.
c) ¿Hay diferencia entre los silos?

Realizamos Anova para los tratamientos.

Fuente de Suma de grados de Cuadrado F0 Valor - P


variabilidad Cuadrados libertad Medio
Tratamientos 4,46 4 1,115 0,69 0,246
Bloques 9,76 4 2,44 1,51 0,6009
Error 25,84 16 1,615
Total 40,06 24

Aquí podemos observar que el valor-p de los silos es mayor que el valor de significancia, o
sea, 0,246 >0,05 lo que significa estadísticamente son iguales.

d) ¿La temperatura de un día a otro es diferente?

Por medio del problema anterior podemos observar que la temperatura es igual porque el
valor-p de los bloques es 0,609 y el nivel de significancia es 0,05 así que se muestra que el
valor-p del bloque es mayor que la significancia y por lo tanto las temperaturas son
iguales.

e) Revise residuos, ¿hay algún problema evidente?

En el recuadro de la gráfica de probabilidad normal nos muestra que el supuesto de


normalidad se cumple porque los residuos o puntos están más o menos cerca de la línea
recta.
Por mientras que en el recuadro vs ajuste también se cumple el supuesto de varianza
porque los residuos se ubican aleatoriamente dentro de una banda horizontal.

EJERCICIO 16. Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el
tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas
y cada corrida requiere aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco
corridas diarias. El experimentador decide correr los experimentos con un diseño en cuadro latino
para controlar activa mente a los lotes y días. Los datos obtenidos son:

You might also like