You are on page 1of 31

45

PROBLEMA 37: La produccin de biomasa vegetal en parcelas de


0.1 hectreas en determinadas condiciones sigue una
distribucin normal de media 37 y desviacin tpica 12, medido
en las unidades adecuadas:
1. Cul es la probabilidad al elegir una parcela al azar de
que su produccin de biomasa sea inferior a 35 unidades?
2. Si se eligen 9 parcelas, cul es la probabilidad de que la
media muestral de biomasa sobrepase el valor 39?
1. Si se eligen 3 grupos de 9 parcelas, cul es la
probabilidad de que al menos dos de ellos arrojen una
produccin media superior a 34?
3. Cul sera este valor si los grupos fueran de 25
parcelas?
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos
X: produccin de biomasa vegetal en una parcela de 0.1 hectreas
( )
X N 37,12
46














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos
X: produccin de biomasa vegetal en una parcela de 0.1 hectreas
( )
X N 37,12
Resultados
1. Cul es la probabilidad al elegir una parcela al azar de que
su produccin de biomasa sea inferior a 35 unidades?


2. Si se eligen 9 parcelas, cul es la probabilidad de que la
media muestral de biomasa sobrepase el valor 39?


( ) ( )
X 37 35 37
p X 35 p p Z 0.166 0.434
12 12
| |
< = < = < =
|
\ .
( )
( )
( )
X N , X N 37, 4
n
X 37 39 37
p X 39 p p Z 0.5 0.308
4 4
| |

|
\ .
| |

> = > = > =
|
\ .

47














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
3. Si se eligen 3 grupos de 9 parcelas, cul es la
probabilidad de que al menos dos de ellos arrojen una
produccin media superior a 34?
Definimos Y: nmero de grupos con produccin media
superior a 34










( )
( )
( )
( )
( ) ( ) ( ) ( )
0 3 1 2
X N , X N 37, 4
n
X 37 34 37
p X 34 p p Z 0.75 0.773
4 4
Y Bin 3,0.773
p Y 2 1 F 1 1 f 0 f 1
3 3
1 0.773 0.227 0.773 0.227 1 0.131 0.869
0 0
| |

|
\ .
| |

> = > = > =
|
\ .
( = = + =

(
| | | |
= + = =
( | |
\ . \ .

48














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
4. Cul sera este valor si los grupos fueran de 25 parcelas?










( )
( )
( )
( )
( ) ( ) ( ) ( )
0 3 1 2
X N , X N 37,2.4
n
X 37 34 37
p X 34 p p Z 1.25 0.894
2.4 2.4
Y Bin 3,0.894
p Y 2 1 F 1 1 f 0 f 1
3 3
1 0.894 0.106 0.894 0.106 1 0.031 0.969
0 0
| |

|
\ .
| |

> = > = > =
|
\ .
( = = + =

(
| | | |
= + = =
( | |
\ . \ .

49














PROBLEMA 39:El applet http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.html
del aula virtual de Bioestadstica simula muestreo aleatorio de
una problacin normal de media 0 y varianza 1. Utilizando este
applet genrense 50 muestras de 3 elementos cada una. A
continuacin genrense 50 muestras de 100 elementos cada
una, al nivel de confianza del 95%. Qu se observa en cuanto a
los valores de las medias muestrales y la amplitud de los
intervalos comparando ambos casos?
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
Las medias muestrales varan ms en las muestras de 3 elementos que en las
de 50. La explicacin se obtiene del clculo de la varianza de la media muestral:


La amplitud de los intervalos es mayor en las muestras de 3 elementos, dado
que:





( )
2
VAR X
n

=
( )
2,n 1
S
IC 95% X t
n

=
50














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
51














PROBLEMA 40: Con el mismo applet
http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.html genrense repetidas
veces 50 muestras en los siguientes casos:
a. n=5, 1-=0.95
b. n=200, 1-=0.95
c. n=200, 1-=0.99
d. n=200, 1-=0.90
Reflexione y responda a las siguientes cuestiones:
1. En el caso a, cul es la causa de que los intervalos tengan
diferente amplitud?, qu ocurre cuando el intervalo no
contiene el valor 0?, Por qu los intervalos obtenidos son
diferentes para cada muestra?.
2. Comparando los casos b y c, qu se observa en cuanto a la
amplitud de los intervalos calculados?.
3. Comparando los casos b, c y d, qu se observa en cuanto al
nmero de intervalos que no contienen la media y en cuanto
a la amplitud de los mismos?, qu relacin existe entre
ambas?.
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
52














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
1. Los intervalos tienen diferente amplitud debido a que en los mismos
aparece la variable aleatoria S, varianza muestral.


Si el intervalo no contiene el valor 0 es un intervalo errneo.
Los intervalos son diferentes en cada muestra porque en ellos
aparecen dos variables aleatorias: la media muestral y la desviacin
muestral. De la media muestral depende el valor medio del intervalo
y de la desviacin muestral su amplitud.

2. La amplitud de los intervalos aumenta cuando disminuye o lo que
es lo mismo cuando aumenta el nivel de confianza. Es decir, a mayor
confianza menor precisin del intervalo.
3. La proporcin de intervalos que no contienen a la media es en
promedio igual a , por lo que dicha proporcin se disminuye cuando
se aumenta la confianza, lo que implica una disminucin de la
precisin del intervalo (aumento de su amplitud)


( )
2,n 1
S
IC 95% X t
n

=
53














PROBLEMA 42:A fin de estudiar los niveles de colesterol en la
poblacin de cierta comunidad autnoma, se seleccion de modo
aleatorio una muestra de 64 individuos. La media del colesterol
en dicha muestra fue de 190 y la varianza de 100. Estimar,
asumiendo que la variable tiene distribucin normal, con una
confianza del 95% dentro de qu valores se encuentra el valor
medio de colesterol de dicha comunidad.
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
Siendo la variable normal, el estadstico:

Y por tanto el intervalo aleatorio de confianza bidireccional es;

Que en la muestra obtenida produce un intervalo de confianza calculado de;


Cuya interpretacin es: con una confianza del 95% la verdadera media de
colesterol se encuentra entre 187.5 y 192.5, o bien, con una confianza del 95%
el error mximo comentido al estimar la media a partir de la media muestral
obtenida es de 2.5


n 1
X
T
S n



( )
2,n 1
S
IC 95% X t
n

=
( )
0.025,63
10
IC 95% 190 t [187.5,192.5]
64
= =
54














PROBLEMA 47: Un predador natural del caracol es el zorzal cantor.
En un estudio de seleccin natural, se compar la proporcin de
caracoles no listados en dos colonias presentes en diferentes habitats:
la primera en un entorno rocoso y la segunda en una cinaga de fondo
uniforme. Los investigadores plantearon la hiptesis de que, debido a
su capacidad para armonizar con el fondo, los caracoles no listados de
la cinaga estaran ms protegidos de los zorzales que los
correspondientes de la colonia rocosa, siendo en consecuencia mayor
su proporcin en la colonia de dicha cinaga. En el estudio se
extrajeron 863 ejemplares de la colonia de las rocas, de los que 380
eran no listados, y 560 caracoles de la colonia de la cinaga, de los que
297 eran no listados. Se denomina p
1
a la proporcin de caracoles no
listados en las rocas y p
2
a la proporcin de caracoles no listados en la
cinaga:
1. Estimar el valor mximo de la proporcin de caracoles no listados
en las rocas con una confianza del 95%.
2. Estimar la diferencia entre las proporciones de caracoles no listados
en la cinaga y en las rocas con una confianza del 95%.
3. Plantear el contraste de hiptesis adecuado para establecer si la
hiptesis de los investigadores es correcta, razonando la decisin.
Cul es la conclusin de este contraste?.
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
55














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






1 2 1 2
380 297
p 0.44; p 0.53; n 863; n 560
863 560
= = = = = =
Resultados
1. Estimar el valor mximo de la proporcin de caracoles no
listados en las rocas con una confianza del 95%:
Se trata de establecer el intervalo de confianza unilateral
superior para el parmetro p
1
. Dado el alto valor del tamao de
la muestra se puede establecer:











( )
( )
( )
( )
(
1 1
1 1
1 1 1 1
1 1
p 1 p
p 1 p
P N p , IC p 95% 0, p z
n n
0.44 1 0.44
0, 0.44 1.645 0, 0.468
863

| (
| |

(
| = + =
| (
\ .
\
| (

( = + = (

(
\

56














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






1 2 1 2
380 297
p 0.44; p 0.53; n 863; n 560
863 560
= = = = = =
Resultados
2. Estimar la diferencia entre las proporciones de caracoles no listados
en la cinaga y en las rocas con una confianza del 95%.
Se trata de establecer el intervalo de confianza bilateral para la
diferencia de parmetros p
2
-p
1
. Dados los tamaos muestrales:

, y por tanto,







Que se interpreta como que hay un 95% de confianza de que la
verdadera diferencia de proporciones de caracoles no listados entre la
cinaga y las rocas se encuentra entre un 3.7% y un 14.3%.

( ) ( )
( ) ( )
( )
i i 2 1 2 1
i i
i
2 2 1 1
2 1
p 1 p P P p p
P N p , N 0,1
n
p 1 p p 1 p
n n
| |

|
|

\ .
+

( )
( ) ( )
( ) ( )
2 2 1 1
2 1 2 1 2
2 1
p 1 p p 1 p
IC p p 95% p p z
n n
0.53 0.47 0.44 0.56
0.53 0.44 1.96 0.037,0.143
560 863


= + =
= + = (

57














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






1 2 1 2
380 297
p 0.44; p 0.53; n 863; n 560
863 560
= = = = = =
Resultados
3. Plantear el contraste de hiptesis adecuado para establecer si
la hiptesis de los investigadores es correcta, razonando la
decisin. Cul es la conclusin de este contraste?.
Considerando que nuestro inters se centra en establecer si es
cierta o no la hiptesis de mayor predacin sobre los caracoles
no listados en las rocas y puesto que esta afirmacin slo se
mantendr en caso de que se considere que la proporcin p
2
es
mayor que p
1
, el contraste adecuado ser de tipo unilateral
superior:



Resolveremos el contraste calculando el P valor y tomando la
decisin adecuada utilizando un nivel de significacin de 0.05.


0 2 1 2 1
1 2 1 2 1
H :p p 0 p p
H :p p 0 p p

> >

58














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






1 2 1 2
380 297
p 0.44; p 0.53; n 863; n 560
863 560
= = = = = =
Resultados
Como ya se ha visto:




Y en caso de que la hiptesis nula sea cierta, el estadstico del
contraste:




Donde la estimacin de las proporciones se realizar a partir de
H
0
:


( )
( ) ( )
( )
2 1 2 1
2 2 1 1
2 1
P P p p
N 0,1
p 1 p p 1 p
n n


+

( )
( ) ( ) ( ) ( )
( )
0 0
0 0 0 0 0 0 0 0
2 1 2 1
2 1
2 2 1 1 2 2 1 1
2 1 2 1
P P p p
P P
N 0,1
p 1 p p 1 p p 1 p p 1 p
n n n n


=

+ +

0 0
2 1
380 297
p p 0.4757
863 560
+
= = =
+
59














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
Calculamos ahora el P valor











Lo que nos lleva a rechazar la hiptesis nula, aceptando la
alternativa, es decir, aceptando la hiptesis de los
investigadores en el sentido de que la proporcin de caracoles
no listados es menor en las rocas que en la cinaga.


( ) ( )
( ) ( )
( )
0 0 0 0
2 1
2 2 1 1
2 1
P P
Pvalor p Z
p 1 p p 1 p
n n
0.09
p Z p Z 3.32 0.00045
0.4757 0.5243 0.4757 0.5243
560 863
| |
|
|

= > =
|
|
+
|
|
\ .
| |
|
|
> = > =
|
|
+
|
\ .
60














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados

El P valor obtenido se puede interpretar como que si la
proporcin de caracoles no listados fuera igual en las rocas que
en la cinaga, la probabilidad de que al obtener dos muestras
de 560 y 863 individuos respectivamente se tuvieran resultados
tan alejados de lo esperado como los obtenidos en esta muestra
sera de 0.00045.

Dicho de otro modo, si se repitiera el experimento 100000
veces, slo esperamos que en 45 de ellas se obtuviera un
resultado tan alejado de lo esperado como el actual, en caso de
ser cierta H
0
.








61














PROBLEMA 53: Con el fin de establecer el efecto de la dieta sobre la
reduccin del colesterol, se toman dos muestras de 6 individuos de una
poblacin. A uno de los grupos se le aplica una dieta restringida en
grasas y al otro una dieta normal. Tras un periodo de 3 meses se miden
los niveles de colesterol en ambos grupos. Asmase normalidad de las
variables implicadas, e igualdad de varianzas. Los resultados obtenidos
se encuentran en la siguiente tabla:



Las medias y desviaciones muestrales (s
p
es la desviacin conjunta) son:

1. Plantear el contraste correspondiente para establecer si el
colesterol se reduce con la dieta.
2. Qu conclusiones se obtienen del estudio?
3. Supngase ahora que las dos variables X e Y son datos sobre una
misma muestra, de modo que X es el valor antes de comenzar la
dieta e Y el valor tras 3 meses de dieta. Plantear el contraste,
obtener las conclusiones adecuadas y reflexionar sobre el
resultado.
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
X=NORMAL 150 180 240 190 210 140
Y=DIETA 145 178 230 183 207 132
x y p
x 185; y 179.167; s 37.2827; s 36.7881; s 37.04 = = = = =
d
d 5.8333; s 3.06 = =
62














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






Resultados
1.Plantear el contraste correspondiente para establecer si el
colesterol se reduce con la dieta.
Se debe plantear un contraste unilateral, ya que estamos
interesados tan slo en si el colesterol se reduce con la dieta o
no, dando en este ltimo caso igual que la no reduccin se
corresponda con un aumento o un mantenimiento del
colesterol. Ello har que slo rechacemos la hiptesis nula
cuando encontremos una media de la variable X
significativamente superior a la media de la variable Y, y no en
caso contrario. Como es conocido, un planteamiento unilateral
aumenta la potencia del contraste realizado.






x y d p
x 185; y 179.167; s 37.2827; s 36.7881; d 5.8333; s 3.06;s 37.04 = = = = = = =
0 X y X y
1 X y X y
H : 0
H : 0
= =

> >

63














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






Resultados
2. Qu conclusiones se obtienen del estudio?
En primer lugar, considerando la normalidad de la variable
elegimos el estadstico para el contraste:



Que, si H
0
es cierta sigue distribucin
El valor del estadstico del contraste en la muestra ha sido:


Y por tanto el P valor es:
Que conduce al no rechazo de la hiptesis nula y por tanto a no
rechazar que la dieta pueda no tener efecto sobre el nivel de
colesterol.


x y d
x 185; y 179.167; s 37.2827; s 36.7881; d 5.8333; s 3.06 = = = = = =
( ) ( ) ( )
0 0
2 2
X y
1 x 2 y 2
p
1 2
p p
1 2 1 2
,
X Y
n 1 S n 1 S
X Y
S
n n 2
1 1
sien
1 1
S S
n n n
do
n

+

= =
+
+ +
1 2
n n 2
T
+
185 179.167
0.27
1 1
37.04
6 6

=
+
( )
= > =
10
Pvalor p T 0.27 0.39
64














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






Resultados
1.Supngase ahora que las dos variables X e Y son datos sobre
una misma muestra, de modo que X es el valor antes de
comenzar la dieta e Y el valor tras 3 meses de dieta. Plantear el
contraste, obtener las conclusiones adecuadas y reflexionar
sobre el resultado.
El contraste adecuado ser, , donde D=X-Y, es una
variable normal.

El estadstico del contraste
Que en la muestra toma un valor de

Y por tanto el P valor es que
lleva al rechazo de la hiptesis nula y por tanto a la afirmacin
del efecto de la dieta en la reduccin del colesterol.


x y d
x 185; y 179.167; s 37.2827; s 36.7881; d 5.8333; s 3.06 = = = = = =
0 d
1 d
H : 0
H : 0
=

>

1 0 n
d
, si H es ci
D
T
S n
erta

5.833
4.67
3.06 6
=
( )
5
Pvalor p T 4.67 0.00015 = > =
65














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Datos






Resultados
Es importante observar que el drstico cambio producido en el
resultado al incluir informacin sobre la relacin entre las
muestras de ambas variables, se debe a la eliminacin de la
variabilidad inicial en el nivel de colesterol al considerar los
datos apareados. Formalmente esto se puede representar
mediante










x y d
x 185; y 179.167; s 37.2827; s 36.7881; d 5.8333; s 3.06 = = = = = =
( ) ( ) ( ) ( ) ( ) ( ) ( )
VAR X Y VAR X VAR Y VAR D VAR X VAR Y 2COV X, Y = + >> = +
Si X e Y
independientes
Si X e Y datos
apareados
66














PROBLEMA 57: Se considera una poblacin de peces que se
distinguen por la presencia (M) o no (M
c
) de una mancha ventral; y por
tres tamaos de vejiga natatoria (T
1
, T
2
y T
3
). Se seleccionaron al azar
110 especmenes, obtenindose los siguientes resultados:




Se desea establecer si existe relacin entre la presencia de mancha
ventral y el tamao de la vejiga natatoria.
1. Plantear el correspondiente contraste de hiptesis, discutiendo sobre
el carcter unilateral o bilateral del mismo.
2. Resolver el contraste obteniendo las conclusiones adecuadas.
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
T
1
T
2
T
3

M 15 25 13
M
c
27 10 20
67














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
1.Plantear el correspondiente contraste de hiptesis,
discutiendo sobre el carcter unilateral o bilateral del mismo.
Deseamos contrastar la posible independencia de las variables
relacionadas con el tamao de la vejiga natatoria y con la
existencia o no de mancha ventral. Para realizarlo extraemos de
la suposicin de independencia una implicacin hacia la
igualdad de la funcin de densidad conjunta y el producto
correspondiente de las marginales.


En consecuencia, en caso de ser cierta la hiptesis de
independencia, se tiene:







0 ij i. .j
1 ij i. .j
H : X e Y son independientes i, j;p p p
H : X e Y no son independientes i,j; p p p
=

2
2
2
3
ij
ij
j 1
i 1
i. .j
i.
i.
.j
.j
3 2
2
ij
i 1 j 1
, si X e Y son ind Q
x
x

ependientes
do p ; , p nde


n n

(X nPP )

nPP
=
=
= =

= =

68














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
Se tratar de un contraste unilateral superior, ya que las
discrepancias entre los valores obtenidos y esperados siempre
contribuyen al aumento del valor del estadstico del contraste.

2. Resolver el contraste obteniendo las conclusiones adecuadas.

Completemos las marginales en la tabla de contingencia











T
1
T
2
T
3
Total M
M 15 25 13 53
M
c
27 10 20 57
Total T 42 35 33 110
69














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados





El valor del estadstico del contraste en la muestra es:










Que nos permite rechazar la hiptesis de independencia de ambos
criterios de clasificacin.


T
1
T
2
T
3
Total M
M 15 25 13 53
M
c
27 10 20 57
Total T 42 35 33 110
( )
2 2 2
2 2
2
2
r
53 42 53 35 53 33 57 42
15 25 13 27
110 110 110 110
q
57 35 57 33
10 20
110 110
11.21,
P valor=p 1
esultando
1.21

53 42 53 35 53 33 57 42
110 110 110 110
57 35 57 33
110 110
| | | | | | | |

| | | |
\ . \ . \ . \ .
+ + + =
| | | |

| |
\ . \ .
+ + =
>
=


0.0037 =
70














PROBLEMA 65: En una comarca del norte de la pennsula se cultivan
tres variedades vitivincolas que se propone presentan diferente
contenido de azcares. Se escogen al azar 10 reas de cultivo de cada
una de las variedades y en cada rea se muestrea al azar una cepa y
de ella se recogen una cantidad suficiente de fruto para cuantificar su
contenido en azcares. El anlisis de los datos obtenidos se realiza
mediante ANOVA y se obtiene la siguiente tabla.









El test de homocedasticidad arroja un P valor de 0.78. Las medias
muestrales de los grupos tienen un valor de 61,5, 64,4 y 65,8 para las
variedades de Menca, Godello y Tempranillo respectivamente.
Analcense las diferencias en azucar de los tres tipos de uva,
asumiendo normalidad de las variables implicadas
Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Fuente
Suma de
cuadrados
gl
Cuadrados
medios
F
(Variedades) Entre-grupos 97,554 2 48,777 5,135
(Error) Intra-grupos 256,483 27 9,499
Total 354,037 29
71














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
Se trata de una comparacin de mltiples medias. En primer lugar se
debe comprobar la homocedasticidad de las variables implicadas.



Como el enunciado informa de que en este contraste el estadstico de
Barlett produce un P valor de 0.78, podemos aceptar la igualdad de
varianzas.

Realizamos por tanto el ANOVA para el contraste de medias:



El estadstico del contraste es:
Que toma un valor en la muestra:


2 2 2
0 1 2 3
2 2
1 i j
H :
H : i, j;

= =

0 1 2 3
1 i j
H :
H : i, j;
= =

2 0 ,27
, si H es
MSA
F
M
ci
SE
erta
( )
2,27
y por tanto el P valor
48.777
5.135 p F 5.135 0.013
9.4
s
99
e = > =
72














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
Este P valor induce a rechazar la igualdad de todas las medias y a
afirmar que se han encontrado diferencias significativas. El significado
de este P valor es que si las medias fueran iguales y tomaramos 3
muestras de 10 elementos cada una, la probabilidad de que se obtuviera
un valor del estadstico del contraste tan alto como en nuestro caso sera
de 0.013. En consecuencia no creemos que el estadstico del contraste
siga la distribucin F y afirmamos que ello es debido a que las medias
son diferentes, siendo en tal caso MSA un estimador positivamente
sesgado de la varianza poblacional. Por este motivo el contraste es de
tipo unilateral superior.
Como hemos rechazado la igualdad de todas las medias, debemos
ahora realizar los contrastes a posteriori para establecer entre qu pares
de medias existen diferencias significativas. Utilizaremos para ello el
mtodo LSD. Los contrastes a posteriori sern (para todos los pares i, j):
y el estadstico para cada contraste ser:



0 i j
1 i j
H :
H :
=


i j
27
i
0
j
si H es ciert
X X
T
1 1
MSE
n
a
n

| |
+
|
|
\ .

73














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
El valor que toma el estadstico de prueba en cada contraste y el p valor
consiguiente se muestran a continuacin:









Lo que significa que se encuentran diferencias significativas en el
contenido de azucar entre las variedades Menca y Godello, Menca y
Tempranillo, pero no entre Godello y Tempranillo. La conclusin es que
creemos que Menca posee menos azucar que Godello y Tempranillo, no
observndose entre estas dos variedades diferencias significativas.

( )
( )
0 1 2
27
1 1 2
0 1 3
27
1 1 3
0 2 3
1 2 3
H :
61.5 64.4
-2.1 pvalor 2p T 2.1 0.0452
H :
1 1
9.499
10 10
H :
61.5 65.8
-3.12 pvalor 2p T 3.12 0.0042
H :
1 1
9.499
10 10

H :
64.4 65.8
H :
1 1
9.499
1 1


0

0
=

= = < =


| |
+
|
\ .
=

= = < =


| |
+
|
\ .
=


|
+
\
( )
27
-1.015 pvalor 2p T 1.015 0.32 = = < =
|
|
.
74














PROBLEMA 68: El cuadro siguiente es el de los resultados obtenidos
en un Anlisis de la Regresin (modelo I) realizado mediante una
muestra de tamao 100:








1. Establecer la recta de regresin, discutiendo el significado de sus
parmetros. Cunto aumenta la media de Y cuando X aumenta una
unidad?
2. Qu significado tienen los dos P valores de la tabla?
3. Cul es el valor medio estimado de la variable Y para un valor de X
de 0.9?

Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Parmetro Estimacin
Error
estndar
t P-valor
Interseccin 0.164706 0.0444456 13.7058 0.0123
Pendiente 0.0577179 3.62235E-3 15.9338 0.0000
75














Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM Dpto. Matemtica Aplicada (Biomatemtica) Fac. Biologa UCM
Resultados
1. Establecer la recta de regresin, discutiendo el significado de sus
parmetros. Cunto aumenta la media de Y cuando X aumenta una
unidad?
La recta de regresin estimada es:


El parmetro de la pendiente de la recta representa el incremento
medio de Y cuando X aumenta una unidad. Este aumento es estimado
en 0.0577179.
2. Qu significado tienen los dos P valores de la tabla?
Son los p valores de los contrastes para establecer si los parmetros
son iguales a 0. En caso de que se llegara a la conclusin de que
la pendiente es igual a 0, ello significara que la variable Y no depende
del valor de X y por tanto la regresin lineal carece de sentido.

3. Cul es el valor medio estimado de la variable Y para un valor de
X de 0.9?



y x 0.164706 0.0577179 x = + = +
y

y x 0.164706 0.0577179 0.9 0.2166521 = + = + =

You might also like