Professional Documents
Culture Documents
Realiza un grfico sencillo del tiempo en funcin del sistema operativo, que
visualice la posible influencia del sistema operativo sobre el tiempo.
plot(tiempos)
En el diagrama de cajas podemos observar que el tiempo de realizacin para la misma tarea s
est influenciado por el sistema operativo, en general, los tiempos de los operadores bajo
Windows se concentran sobre el valor 25, en Linux sobre los 22.5 y en MacOS sobre los 24,
adems, por la amplitud de la caja y la longitud de los bigotes podemos observar como los
tiempos son ms homogneos en Windows, seguido por MacOs y finalmente por Linux.
Albert PR
Calcula los tiempos medios bajo cada sistema operativo, y establece un ranking de
rapidez.
Realizamos un pequeo programa para separar los datos por sistema operativo:
i=1;win=c();lin=c();mac=c();
while(i<= length(tiempos[,1])){
if (tiempos$so[i]== "Windows") { win=c(win,tiempos$tiem[i]) }
if (tiempos$so[i]== "Linux") { lin=c(lin,tiempos$tiem[i]) }
if (tiempos$so[i]== "MacOS") { mac=c(mac,tiempos$tiem[i]) }
i=i+1;
}
mean(win);mean(lin);mean(mac)
[1] 25.08
[1] 22.2
[1] 24.29
Es decir, el tiempo medio bajo Windows es de 25.08, bajo Linux de 22.2, y bajo MacOs de
24.29, por tanto, en un ranking de rapidez, el ms rpido sera Linux, seguido de MacOs y por
ultimo estara Windows.
Aplica el ANOVA para demostrar o refutar que el tiempo medio depende del sistema
operativo. Qu se puede decir usando un nivel de confianza del 5%?
Albert PR
plot (mianova)
En el anterior grfico observamos la varianza de los errores para los tres sistemas operativos,
pese a que los valores en Linux son ms dispersos, es decir, la varianza es mayor, considero
que no hay una diferencia significativa de errores entre sistemas operativos, es decir, los
errores son similares independientemente del sistema operativo.
En el anterior grfico relacionamos los cuantiles tericos de la normal con los de los errores
estimados. Vemos que hay bastantes alejados de la diagonal, pero por lo general se
mantienen cerca.
Con los dos anteriores grficos podemos decir que es razonable aplicar el modelo ANOVA
bajo esta muestra.
Albert PR
tiempos.tiem
Linux
std r
LCL
MacOS
Windows
Windows
MacOS
Linux
25.08
24.29
22.2
La ltima tabla que nos devuelve nos indica el ranking, que punta a Windows y MacOS como
a y a Linux como b, es decir, sita en el mismo nivel a Windows y MacOs.
Albert PR
Ejercicio 2: Las variables prodA, prodB, prodC y prodD recogen la produccin (en miles de
unidades) de 4 lneas en las que se aplican mtodos distintos (A, B, C y D) que se quieren
comparar.
boxplot(prodA,prodB,prodC,prodD)
Vemos que la produccin s que parece estar influenciada por el mtodo de produccin, siendo
la produccin A y D muy homogneas, la C relativamente homognea y la B bastante dispersa,
en cuanto a las miles de unidades, parece ser que la B es la ms productiva, la C y D estn en un
nivel similar y la A sera la menos productiva.
mean(prodA);mean(prodB);mean(prodC);mean(prodD)
[1] 70.155
[1] 76.72
[1] 72.875
[1] 74.025
La B sera la ms productiva, seguida de la C, D y por ltimo la A.
Albert PR
Aplica el ANOVA para demostrar o refutar que la productividad media depende del
mtodo. Qu se puede decir usando un nivel de confianza del 1%?
plot(mianova)
Albert PR
En el anterior grfico observamos la varianza de los errores para los cuatro sistemas de
produccin, podemos observar que los valores de B son muy dispersos, en A son relativamente
dispersos, y tanto en D como en C la varianza es poca y estn ms concentrados.
En el anterior grfico relacionamos los cuantiles tericos de la normal con los de los errores
estimados. Vemos que hay por los extremos hay bastantes datos alejados de la diagonal,
pero por lo general se mantienen cerca.
Con los dos anteriores grficos podemos decir que es razonable aplicar el modelo ANOVA
bajo esta muestra.
Albert PR
X, means and individual ( 95 %) CI
std r
LCL
74.74
73.94
20
73.75
73.04
71.76
La ltima tabla que nos devuelve nos indica el ranking, que punta a todos los mtodos como
a.
Ejercicio 3: Una asignatura tiene 5 grupos de laboratorio, con un profesor distinto en cada
grupo. Alumnos de algn grupo se han quejado por creer que con su profesor, las notas son
ms bajas que en otros grupos. Utiliza los datos labo de las notas para saber qu puede
aportar la estadstica a este caso. Describe el mismo esquema de trabajo de los ejercicios
anteriores.
Primero, vamos a realizar un plot sobre los datos para ver a que nos enfrentamos:
plot(labo)
Albert PR
Podemos ver que, a simple vista, s parece que las notas del grupo B son significativamente ms
bajas. Vamos a comparar las medias para ver que esto es cierto, para ello utilizaremos la misma
funcin que hemos programado en el ejercicio 1:
i=1;A=c();B=c();C=c();D=c();E=c();
while(i<= length(labo[,1])){
if (labo$gr[i]== "A") { A=c(A,labo$nota[i]) }
if (labo$gr[i]== "B") { B=c(B,labo$nota[i]) }
if (labo$gr[i]== "C") { C=c(C,labo$nota[i]) }
if (labo$gr[i]== "D") { D=c(D,labo$nota[i]) }
if (labo$gr[i]== "E") { E=c(E,labo$nota[i]) }
i=i+1;
}
mean(A);mean(B);mean(C);mean(D);mean(E);
[1] 5.775
[1] 5.348
[1] 6.235
[1] 5.981818
[1] 5.978571
Albert PR
Podemos ver que, como habamos intuido en el diagrama de cajas, las notas del grupo B son
bastante ms bajas, las del A, D, y E son similares y las del grupo C son bastante ms altas.
Procedemos a realizar un contraste de hiptesis y a aplicar el modelo anova sobre los datos:
:
{ 0
1 : 0
mianova=aov(labo$nota~labo$gr, data=labo)
summary(mianova)
Df Sum Sq Mean Sq F value Pr(>F)
labo$gr
Albert PR
En el anterior grfico relacionamos los cuantiles tericos de la normal con los de los errores
estimados. Vemos que por los extremos hay bastantes alejados de la diagonal, pero por lo
general se mantienen cerca.
NOTA: En este caso, el plot no me devuelve el grfico Residuals vs Factors Levels, por lo
que, pese a que aceptaremos que es razonable aplicar el modelo ANOVA, somos menos
rotundos que en los dos ejercicios anteriores.
Por ltimo, realizaremos un nuevo ranking para ver si hay diferencias estadsticamente
significativas (al 5%) entre los grupos.
Con el paquete agricolae instalado y cargado, procedemos a realizar comparaciones por el
mtodo LSD de Fisher:
LSD.test(y=mianova, trt="labo$gr", alpha=0.05, console=TRUE)
Study: mianova ~ "labo$gr"
labo.nota
std r
LCL
Albert PR
Groups, Treatments and means
a
6.235
5.982
5.979
ab
5.775
5.348
La ltima tabla que nos devuelve nos indica el ranking, que por un lado punta al mismo nivel
a a los grupos C, D, y E, por otro lado punta como b al grupo B, y entre ambos, punta
como ab al grupo A.