You are on page 1of 31

Ejercicios de desviacin estndar:

1. Hallar la desviacin

media,

la

varianza

la

desviacin

tpica de la series de nmeros siguientes:

2, 3, 6, 8, 11.

12, 6, 7, 3, 15, 10, 18, 5.

2, 3, 6, 8, 11. Media

Desviacin tpica

12, 6, 7, 3, 15, 10, 18, 5. Media

Desviacin tpica

2. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de


50 nios de su consulta en el momento de andar por primera vez:

Meses

Nios

10

11

12

16

13

11

14

15

Calcular la desviacin tpica.

xi

fi

Ni

xi fi

x i f i

81

10

40

400

11

14

99

1089

12

16

30

192

2304

13

11

41

143

1 859

14

49

112

1 568

15

50

15

225

50

610

7526

3. El resultado de lanzar dos dados 120 veces viene dado por


la tabla:

Sumas

10

11

12

Veces

11

20

19

16

13

11

Calcular la desviacin tpica.

xi

fi

xi fi

xi2 fi

12

24

72

36

144

11

55

275

20

1 20

720

19

133

931

16

1 28

1024

13

117

1053

10

11

110

1100

11

66

726

12

48

576

1 20

843

6633

4. Calcular la desviacin tpica de una distribucin estadstica que


viene dada por la siguiente tabla:

[10, 15)

[15, 20)

[20, 25)

[25, 30)

[30, 35)

fi

xi

fi

xi fi

xi2 fi

[10, 1 5)

12.5

37.5

468.75

[1 5, 20)

17.5

87.5

1537.3

[20,

22.5

1 57.5

3543.8

25)

[25, 30)

27.5

110

3025

[30, 35)

32.5

65

211 2.5

21

4 57.5

106 81.25

Media

Desviacin tpica

5. Calcular la desviacin tpica de la distribucin de la tabla:

xi

fi

xi fi

xi2 fi

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

1 2 250

[40, 50)

45

405

1 8 225

[50, 60)

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

1 50

11 250

42

1 820

88 050

6. Las alturas de los jugadores de un equipo de baloncesto vienen


dadas por la tabla:

Altura

[170, 175)

[175, 180)

[180, 185)

[185, 190)

[190, 195)

[195, 2.00)

N de jugadores

Calcular la desviacin tpica

xi

fi

Fi

xi fi

xi2 fi

[1.70, 1.75)

1.725

1.725

2.976

[1.75, 1.80)

1.775

5.325

9.4 53

[1.80, 1.85)

1.825

7.3

13.324

[1.85, 1.90)

1.875

16

15

28.128

[1.90, 1.95)

1.925

21

9.6 25

18.53

[1.95, 2.00)

1.975

23

3.95

7.802

23

42.925

80.21 3

Media

Desviacin tpica

EJERCICIO 1 Los miembros de una cooperativa de viviendas tienen las siguientes edades:

42 60 60 38 60 63 21 66 56 57 51 57 44 45 35 30 35 47 53 49 50 49 38 45 28 41 47 42 53 32 54 38 40 63 48 33 35 61 47 41 55 53 27 20 21 42 21 39 39 34 45 39 28 54 33 35 43 48 48 27 53 30 29 53 38 52 54 27 27 43 28 63 41 23 58 56 59 60 40 24

Elabore una tabla de frecuencias. Calcule la media y la desviacin tpica.

SOLUCIN:

Para elaborar una tabla de frecuencias es condicin imprescindible establecer una serie de clases o categoras (intervalos) a las que vamos a adjudicar a cada uno de los ochenta miembros de la cooperativa. El investigador puede seguir diferentes criterios en funcin del objetivo del estudio. Una tabla de frecuencias elaborada a partir de estos datos podra ser la siguiente:

Edad 20-29 30-39 40-49 50-59 60-69


Total

n 14 17 22 18 9
80

Clculo de la media:

Puede calcularse directamente sumando las edades de todos los miembros de la cooperativa y dividiendo por el total que en este caso es ochenta, el resultado es una media de 43,29. Tambin:

Edad

xi

ni

xini

20-29 30-39 40-49 50-59 60-69

25 35 45 55 65

14 17 22 18 9 80

350 595 990 990 585 3510

Total

, por tanto, podemos decir que la media es de casi 44 aos. Clculo de la desviacin tpica:

Edad 20-29 30-39 40-49 50-59 60-69

xi 25 35 45 55 65

ni 14 17 22 18 9 80 -18,875 -8,875 1,125 11,125 21,125 356,2656 78,7656 1,2656 123,7656 446,2656 4987,71875 1339,01563 27,84375 2227,78125 4016,39063 12598,75

Total

Sx = La desviacin tpica es de 12,5 aos

EJERCICIO 2

Explique las similitudes y diferencias de estas distribuciones:

Edad

20-29 30-39 40-49 50-59 60-69 Total

n_

14 17 22 18 9 80

Edad

n__

20-29 30-39 40-49 50-59

43 ---37 80

60-69 Total

SOLUCIN: La media y la desviacin tpica de la primera distribucin, ha sido calculada en el primer ejercicio. Calculamos a continuacin los mismos estadsticos para la segunda distribucin. Clculo de la media:

Edad

xi

ni

xini

20-29 30-39 40-49 50-59 60-69

25 35 45 55 65

43 37

1075

2405

Total

80

3480

Clculo de la desviacin tpica:

Edad 20-29 30-39 40-49 50-59 60-69

xi 25 35 45 55 65

ni 43 37 -18,875 -8,875 1,125 11,125 21,125 356,2656 78,7656 1,2656 123,7656 446.2656 15319,4219 16511,8281

Total

80

31831,25

La similitud de ambas distribuciones radica fundamentalmente en que tienen la misma amplitud y casi el mismo valor medio. La diferencia es que las frecuencias de la segunda se distribuyen en los intervalos extremos dejando vacos los del medio. Ello aparece perfectamente reflejado en la desviacin tpica de 19,9, aproximadamente 20 aos. 43 + 20 hacen 63, aproximadamente la mitad del ltimo intervalo, 43 20 hacen 23, aproximadamente la mitad del primer intervalo.

Recurdese que la desviacin tpica es la raz de la media de las distancias al cuadrado, de cada uno de los elementos de la distribucin respecto de la media aritmtica.
Ejercicios de probabilidades: Problema n 1) De un paquete de 20 cigarrillos se marcan 5 con una cruz. Se los coloca en una caja y se escoge uno al azar. Cul es la probabilidad de que tenga una cruz? Solucin: n = 20 L: lote C: cruz P = {L,C} = {20,5} P(C) = C/L P(C) = 5/20 P(C) = 0,25 Problema n 2) Halle la probabilidad de obtener exactamente una espada en 4 extracciones de una baraja espaola de 40 cartas, cuando las extracciones se hacen: a) con reemplazamiento. b) sin reemplazamiento. Solucin: n = 20 E: espada P(E) = 10/40 = P(E) = 30/40 = Las posibilidades son:
1 2 3 4 E E E E E E E E E E E E E E E E

a) P() = P(E).P(E).P(E).P(E) + P(E).P(E).P(E).P(E) + P(E).P(E).P(E).P(E) + P(E).P(E).P(E).P(E) P() = 4.P(E).P(E) P() = 4..() P() = 108/256 P() = 27/64 b) P() = (10/40).(30/39).(29/38).(28/37) + (30/40).(29/39).(28/38).(10/37) + (30/40).(10/39).(29/38).(28/37) + (30/40).(29/39).(10/38).(28/37) P() = 4.243600/2193360 = 9744400 P() = 4060/9139 Problema n 3) En un pueblo se consumen dos tipos de bebidas alcohlicas: A y G. El 30% de las personas consume al menos la bebida A, el 60% consume al menos la bebida G y se sabe que el 5% consume ambas bebidas. a) Cul es la probabilidad de que elegida una persona al azar tome bebidas alcohlicas? b) Qu probabilidad hay de que una persona elegida al azar no consuma bebidas alcohlicas? c) Cul es la probabilidad de que elegida una persona al azar tome la bebida A solamente? d) Si elegimos dos personas al azar, cul es la probabilidad de que ambas tomen bebidas alcohlicas? e) Se elige una persona al azar y resulta ser consumidora de bebidas alcohlicas, cul es la probabilidad de que tome A?

f) Idem anterior pero determinando la probabilidad de que tome la bebida G. Solucin: A: bebida A. G: bebida G. A: no toman bebida A. G: no toman bebida G. T: toman bebidas. T: no toman bebidas. Armamos la tabla:
A G G 0,05 0,25 0,30 A 0,55 0,15 0,70 0,60 0,40 1

a) P(T) = P(A) + P(G) + P(A G) P(T) = 0,25 + 0,55 + 0,05 P(T) = 0,85 b) P(T) = P(A G) P(T) = 0,15 c) P(A) = 0,25 d) P(T1/T2) = P(T1).P(T2) P(T1/T2) = 0,85.0,85 P(T1/T2) = 0,7225 e) P(T A) = P(T).P(A/T) P(A/T) = P(T A)/P(T) P(A/T) = 0,30/0,85 P(A/T) = 0,35294 f) P(T G) = P(T).P(G/T) P(G/T) = P(T G)/P(T) P(G/T) = 0,60/0,85 P(G/T) = 0,70588 Problema n 5) Sean A y B dos sucesos tales que P(A) = 0,375, P(B) = 0,908 y P(A B) = 0,989. Hallar: a) P(A/B) b) P(B/A) Solucin: P(A B) = P(A) + P(B) - P(A B) P(A B) = P(A) + P(B) - P(A B) P(A B) = 0,375 + 0,908 - 0,989 P(A B) = 0,294 a) P(A B) = P(B).P(A/B) P(A/B) = P(A B)/P(B) P(A/B) = 0,294/0,908 P(A/B) = 0,32379

b) P(B/A) = P(A B)/P(A) P(B/A) = 0,294/0,375 P(B/A) = 0,784 Problema n 6) Halle la probabilidad de obtener exactamente 3 caras en 5 tiradas de una moneda. Solucin: C: cara. C: seca. P(C) = 0,5 P(C) = 0,5 Esto tambin implica obtener dos secas en 5 tiradas, las combinaciones posibles son:
0,5 0,5 0,5 0,5 0,5 1 2 3 4 5 6 7 8 9 10 C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C

P(A) =10. [P(C)].[P(C)] P(A) = 10.0,5.0,5 P(A) = 10.()5 P(A) = 10/32 Problema n 6) El total de la poblacin infantil de un pas se distribuye en tres regiones de la siguiente manera: en la regin A se encuentra el 50% de la poblacin, en la regin B el 30% y en la regin C el 20%. Se sabe que la probabilidad de encontrar un nio con caries en cada una de dichas regiones es, respectivamente, 0,4, 0,5 y 0,6. Si se toma al azar un nio de la poblacin, calcular: a) la probabilidad de que tenga caries. b) la probabilidad de que sea de la regin B. c) la probabilidad de que, teniendo caries, provenga de la regin B. Solucin: X: caries. A = 50% B = 30% C = 20% P(A) = 0,5 P(B) = 0,3 P(C) = 0,2 P(XA) = 0,4 P(XB) = 0,5 P(XC) = 0,6

a) P(X) = P(A).P(XA) + P(B).P(XB) + P(C).P(XC) P(X) = 0,5.0,4 + 0,3.0,5 + 0,2.0,6 P(X) = 0,2 + 0,15 + 0,12 P(X) = 0,47 b) P(B) = 0,3 c) P(B/X) = P(B X)/P(X) P(B/X) = P(B).P(XB)/P(X) P(B/X) = 0,3.0,5/0,47 P(B/X) = 0,31915 Problema n 7) Las tiendas "Montgomery" estn distribuidas en los E.E.U.U. de la siguiente forma:
Poblacin de la ciudad A1: Menos de 20000 habitantes A2: Entre 20000 y 50000 habitantes A3: Entre 50000 y 100000 habitantes A4: Ms de 100000 habitantes Total NE 3 5 29 63 100 SE 5 11 12 12 40 Area geogrfica C NO SO 6 16 3 10 35 5 9 7 4 25 6 9 24 11 50 Total 25 50 75 100 250

a) Diga cul es la notacin simblica para la probabilidad de que una tienda seleccionada al azar se localice: i) En una ciudad al SO con menos de 20000 habitantes. ii) En una ciudad del Centro, con una poblacin de ms de 20000 y menos de 50000 habitantes. iii) En el SE. iv) En una ciudad con menos de 50000 habitantes. v) En el NO, dado que la tienda seleccionada se ubica en una ciudad con una poblacin entre 50000 y 100000 habitantes. b) Determine cada una de las probabilidades del punto anterior. c) Explicite qu tipo de probabilidad se determin en los puntos anteriores. d) Identifique y calcule la distribucin de probabilidades marginales para el tamao de poblacin de la ciudad. e) Identifique y calcule la distribucin de probabilidades condicionales para el rea geogrfica, dado que el tamao de la poblacin de la ciudad es entre 50000 y 100000 habitantes. Solucin: a-i) P(SO,A 1) a-ii) P(C,A 2) a-iii) P(SE) a-iv) P(A1 A2) a-v) P(NO/A 3) b-i) P(SO,A 1) = 0,024 b-ii) P(C,A 2) = 0,064 b-iii) P(SE) = 0,16 b-iv) P(A1 A2) = 0,3 b-v) P(NO/A 3) = 0,09333 c) Probabilidad conjunta: Probabilidad marginal: Probabilidad total: Probabilidad condicional: d) P(A1) = 0,1 P(A2) = 0,2 P(A3) = 0,3 P(A4) = 0,4 e) P(NE/A3) = 0,3867

P(SE/A3) = 0,16 P(C/A3) = 0,04 P(NO/A 3) = 0,0933 P(SO/A 3) = 0,32 Problema n 8) En un banco hay un sistema de alarma. En una noche cualquiera, la probabilidad de que suene la alarma cuando hay un robo es de 0,99; la de que suene si no hay robo es de 0,01; en tanto que la probabilidad de que ocurra un robo es de 0,002. Calcular la probabilidad de que si suena la alarma haya un robo. Solucin: P(S/R) = 0,99 P(S/R) = 0,01 P(R) = 0,002 P(R) = 0,998 P(S R) = P(R).P(S/R) P(S R) = 0,00198 P(S R) = P(R).P(S/R) P(S R) = 0,00998 Cuadro de contingencia:
S R R S 0,002 0,998 1

0,00198 0,00002 0,00998 0,98802 0,01196 0,98804

P(R/S) = P(S R)/P(S) P(R/S) = 0,00198/0,01196 P(R/S) = 0,1655 Problema n 9) Una lavadora de botellas X, perteneciente a una compaa lechera, procesa un 20% de todas las botellas usadas diariamente y rompe un 4% de las que lava, en tanto que otra lavadora Z procesa las restantes y rompe un 2%. a) Cul es la probabilidad de que una botella seleccionada al azar est rota? b) Una botella escogida aleatoriamente se encuentra rota. Cul es la probabilidad de que haya sido lavada en X? Solucin: P(R/X) = 0,04 P(X) = 0,2 P(R/Z) = 0,02 P(Z) = 0,8 P(R X) = P(X).P(R/X) P(R X) = 0,2.0,04 P(R X) = 0,008 P(R Z) = P(Z).P(R/Z) P(R Z) = 0,8.0,02 P(R Z) = 0,016 a) P(R) = P(R X) + P(R Z) P(R) = 0,008 + 0,016 P(R) = 0,024 b) P(X/R) = P(R X)/P(R) P(X/R) = 0,008/0,024 P(X/R) = 1/3

Problema n 10) A continuacin se muestra una tabla probabilstica acerca del nivel de instruccin de productores de una zona y la implementacin de nuevas tcnicas de cultivo. Implementacin de nuevas tcnicas de cultivo No Nivel de instruccin Bajo Alto
0.40 0.10

S
0.20 0.30

Son independientes el nivel de instruccin de los productores de esa zona y la implementacin de nuevas tcnicas de cultivo? Solucin: P(Bajo No) = 0.40; P(Bajo) = 0.40 + 0.20 = 0.60; P(Bajo No) P(Bajo)P(No) Nivel de Instruccin e Implementacin de nuevas tcnicas no son independientes. Problema n 11) Cierto artculo es inspeccionado visualmente por dos inspectores. Cuando aparece un artculo defectuoso, la probabilidad de que no sea detectado por el primer inspector es igual a 0.1. De aquellos no detectados por el primer inspector, el segundo inspector slo detecta 5 de cada 10. Qu fraccin de defectuosos no son detectados por ninguno de los inspectores? Solucin: P(No1No2) = P(No1)P(No2/No1) = (0.1)(0.5) = 0.05. Problema n 12) El 34% de los rboles de un bosque tienen ms de 15 aos. El 54% son de la variedad A. De los de la variedad A, el 7% tiene ms de 15 aos. Si se elige un rbol al azar: a) Cul es la probabilidad de que tenga ms de 15 aos y sea de la variedad A? b) Cul es la probabilidad de que teniendo menos de 15 aos, sea de la variedad A? Solucin: P(X>15) = 0.34; P(A) = 0.54; P(X>15/A) = 0.07; (a) P(X>15 A) = P(A)P(X>15/A) = (0.54)(0.07) = 0.0378; (b) P(A/X > 15) = P(A X > 15)/P(X > 15) = 0,0378/0,34 = 0.1112. Problema n 13) Se echan dos monedas equilibradas; demuestre que el hecho "cara en la primera moneda" y el hecho "las dos monedas quedan igual" son independientes. Solucin: S = {C1C2; C1X2; X1C2; X1X2;}; P(C1) = 0.50; P(las 2 iguales) = P(C1C2 X1X2) = 0.25 + 0.25 = 0.50; P(C1las 2 iguales) = P(C1C2) = 0.25; P(C1las 2 iguales) = P(C1) P(las 2 iguales) son independientes. Problema n 14) Un analista econmico est investigando ciertos indicadores de bienestar referidos a un grupo de pases que han sido clasificados como "altamente desarrollados", "medianamente desarrollados" y "subdesarrollados". El objetivo del trabajo era analizar cierta cantidad de hogares urbanos, observando si los mismos contaban o no con red cloacal. El 10% de los hogares analizados pertenecan a pases con alto nivel de desarrollo y el 50% de los hogares, a pases medianamente desarrollados. Se pudo determinar que el 60% de los hogares estudiados posean red cloacal, pero dicha proporcin era notoriamente ms alta en los hogares estudiados que provenan de pases altamente desarrollados, ya que entre ellos, el 90% posea red cloacal. El 80% de los hogares sin red cloacal provena de pases subdesarrollados. Sobre la base de esta informacin, hallar: a) La probabilidad de que un hogar elegido al azar pertenezca a un pas altamente desarrollado, pero que no tenga red cloacal; b) La probabilidad de que un hogar con red cloacal pertenezca a un pas subdesarrollado; c) La probabilidad de que un hogar no pertenezca a un pas subdesarrollado o no tenga red cloacal; Solucin: Red cloacal S Alto 0.43 Desarrollo Medio 0.08 Bajo
0.09

No
0.01 0.07 0.32

0.10 0.50 0.40

0.60 0.40 1.00 La informacin dada en el enunciado est escrita en negro; lo que est escrito en verde forma parte de la respuesta. (a) 0.01; (b) 0,08/0,60 = 0.13333; (c) P(No Bajo No RC) = P(No Bajo) + P(No RC) - P(No Bajo No RC) = = (0.10+ 0.50) + 0.40 - (0.01 + 0.07) = 0.92. Problema n 15) En una operacin comercial se puede obtener una utilidad de $1000 o sufrir una prdida de $500. Si la probabilidad de una utilidad es de 0.6, demuestre que la utilidad esperada en dicha operacin es de $400. Solucin: (0.6)*($1000) - (0.4)*($500) = $400. Problema n 16) Sea X una variable aleatoria discreta que slo toma los valores 0, 1, 2, 3, 4 y 5 y que tiene la distribucin de probabilidad dada por la siguiente tabla. X 0 1 2 3 4 5

P(X) 0.05 0.30 ? 0.20 0.10 0.05 a) Calcule P(2). b) Calcule y . c) Localice el intervalo [ - 2; + 2] sobre el eje x del histograma. Solucin: (a) P(2) = 1 - 0.05 - 0.30 - 0.20 - 0.10 - 0.05 = 0.30; (b) = 00.05 + 10.30 + 20.30 + 30.20 + 40.10 + 50.05 = 2.15; = 0.05(0 - 2.15) + 0.30(1 - 2.15) + 0.20(2 - 2.15) + ... + 0.05(5 - 2.15) = 1.5275; = ()1/2 = 1,5275 = 1,2359 (c)

[ - 2; + 2] = [2.15 - 21.2359 ; 2.15 + 21.2359] = [-0.3218 ; +4.6218]. Problema n 17) Un vendedor de seguros sabe que la oportunidad de vender una pliza es mayor mientras ms contactos realice con clientes potenciales. Si la probabilidad de que una persona compre una pliza de seguro despus de la visita, es constante e igual a 0.25, y si el conjunto de visitas constituye un conjunto independiente de ensayos, cuntos compradores potenciales debe visitar el vendedor para que la probabilidad de vender por lo menos una pliza sea de 0.80? Solucin: 1 visita: P(vender 1 pliza) = 0.25; 2 visitas: P(vender al menos 1 pliza) = 1 - P(no vender ninguna pliza) = 1 -0.75 = 0.4375; 3 visitas: P(vender al menos 1 pliza) = 1 - P(no vender ninguna pliza) = 1 -0.75 = 0.5781; 4 visitas: P(vender al menos 1 pliza) = 1 - P(no vender ninguna pliza) = 1 -0.754 = 0.6836;

5 visitas: P(vender al menos 1 pliza) = 1 - P(no vender ninguna pliza) = 1 -0.755 = 0.7627; 6 visitas: P(vender al menos 1 pliza) = 1 - P(no vender ninguna pliza) = 1 -0.756 = 0.8220 Problema n 18) Se conoce que la variable frecuencia relativa de abonados en un instante dado en la cola de espera de un servicio en una empresa sigue una distribucin cuya funcin de densidad es f(t) = t - 2t + (5/3). (a) Graficar f(t) y verificar que f(t) es una funcin de densidad. (b) Calcular la media y la variancia de t. (c) Calcular la probabilidad de que en un instante dado haya en la cola de espera al menos un 30% de abonados. Solucin: (a)

f(t) 0 en [0;1] y

(b)

0.417;

= 0.0819

(c) F(t) = P(X > 0.30) = 1 - 0.419 = 0.581.

; luego F(0.30) = 0.419 y

Problema n 19) Sea X una variable aleatoria con distribucin binomial y parmetros n = 8 y p = 0.4. Obtener las probabilidades puntuales de los valores de X. Hacer una grfica de la funcin de probabilidad. Solucin:

P(x) 0.0168 0.0896 0.2090 0.2787 0.2322 0.1238 0.0413 0.0079 0.0007

Problema n 20) Una compaa que produce fertilizantes est preocupada por el contenido de impurezas en sus productos granulados. Se estima que el peso de las impurezas por lote se distribuye segn una normal con media 12.2 gramos y desviacin tpica 2.8 gramos. Se elige un lote al azar. a) Cul es la probabilidad de que contenga menos de 10 gramos de impurezas? b) Cul es la probabilidad de que contenga ms de 15 gramos de impurezas? c) Cul es la probabilidad de que contenga entre 12 y 15 gramos de impurezas? Solucin: = 12.2 g y = 2.8 g; (a) P(X < 10) = P{z < (10 - 12,2)/2,8} P(z < -0.786) = 0.215; (b) P(X > 15) = P{z > (15 - 12,2)/2,8} P(z > 1) = 0.1587; (c) P(X < 15) - P(X < 12) = P(z < 1) - P(z < -0.071) = 0.8413 - 0.4720 = 0.3693. Ejercicios de regresin Problema n 1) En una estacin experimental de Rafaela, Santa Fe se realiz un ensayo para evaluar el efecto del nivel de suplementacin con alimento balanceado (Kg/da/animal) sobre la produccin de leche (Lts/da/animal) en vacas Holando-Argentino. En las siguientes tablas y figuras se resumen los resultados obtenidos de un anlisis de regresin lineal efectuado por los investigadores que condujeron el estudio. Solucin: Anlisis de Regresin Lineal
Variable N R

Leche 9 0.93

Matriz de coeficientes de regresin


Coeficiente Estimado Error LI(95%) LS(95%) Intercepcin Pendiente 17.87 1.45 0.73 0.15 16.14 1.09 19.59 1.81 t p 24.51 < 0.001 9.47 < 0.001

Escriba la ecuacin de regresin lineal ajustada e interprete en trminos agronmicos los estimadores de los parmetros. Indique en el grfico el valor de la ordenada al origen. = 17.87+1.45x bo = 17.87 Para una dosis de balanceado nula, la produccin de leche en un da ser de 17.87 litros (no tiene sentido en trminos del problema) b1 = 1.45 Ante un aumento unitario de dosis de balanceado por da, se obtendr un aumento en la produccin de leche de 1.45. Segn la ecuacin propuesta en (a), qu produccin de leche promedio puede obtenerse con un nivel de suplemento de 5.5 Kg. diarios de balanceado por animal? Si x = 5.5, entonces = 25.845 Especifique y calcule una medida de error para la estimacin realizada en el punto anterior. Residuo para x = 5.5 e = y observado(del grfico) y esperado e = 25.5 25.845 = -0.345 Interprete el valor p < 0.001 de la pendiente en la salida de la matriz de coeficientes de regresin. La pendiente es significativa para un a del 5% H0: b1 = 0 vs. H1: b1 0. Problema n 2) Se quiere conocer la relacin funcional entre la edad al primer parto y la prdida de peso post parto en vacas Jersey. Con este objetivo se toma una muestra al azar de 15 vacas de un tambo, se miden ambas variables y se realiza un anlisis de regresin en planilla de clculo que produce los siguientes resultados Solucin:

Estadsticas de la regresin
Coeficiente de determinacin R Error standard N de observaciones 0.945 0.920 15

Coeficientes Intercepcin 55.2843

Error Estadstico t Probabilidad LI 95% LS 95% standard 0.8378 65.98 8.310-18 53.4742 57.0943

Pendiente

-0.368

0.0246

-14.93

1.510-9

-0.4213 -0.3148

Identifique las variables. X = edad al primer parto Y = prdida de peso post parto Escriba el modelo lineal correspondiente y describa cada parmetro desde el punto de vista del problema. Calcule y grafique la recta de regresin. El modelo bsico puede formalizarse de la siguiente manera: Yi = b0 + b1Xi + ei donde Yi es el valor de la variable respuesta en el i-simo ensayo, b0 y b1 son parmetros, Xi es el valor de la variable independiente en el i-simo ensayo y ei es un trmino de error aleatorio. bo = 55.28 estimador de b0 (ordenada al origen) no tiene sentido en trminos del problema b1 = -0.368 estimador de b1(pendiente)indica cuanto disminuye la prdida de peso post parto ante un aumento unitario de la edad al primer parto = 55.28 0.368.X Pruebe la hiptesis que sostiene: a medida que aumenta la edad de la vaca, la perdida de peso post parto es menor Prueba de hiptesis para b1 El valor p es 1.510-9 por lo tanto rechazo la hiptesis nula y hay regresin. Por lo tanto puedo afirmar que a medida que aumenta la edad de la vaca, la perdida de peso post parto es menor Estime un intervalo de confianza del 95% para cada uno de los parmetros estimados. Lmites de confianza con 1 - a para b0: .b0 t(n - 2;1 - /2) .s(b0) P{b1 - t(1 - /2;n - 2).s(b1) 1 b1 + t(1 - /2;n - 2).s(b1)} = 1 - LI 95% LS 95%
53.4742 57.0943

-0.4213 -0.3148 Estime la varianza poblacional. CME = error tpico2 = 0.8464 Si la vaca Jersey tiene 24 meses al momento de parir, cual sera el peso promedio estimado de perdida? Adems de la estimacin puntual, presente un intervalo de confianza del 90%. Estimacin puntual Si x = 24(24) = 55.28 - 0.368*24 = 46.448 Estimacin por intervalo Datos: CME = 0.8464 n = 15 Sb1 = 0.00060516 Sb0 = 0.70190884 Para calcular S.(b1) = CM E.[1/n + (Xk - X)/(Xi - X)] primero debo despejar S.(b1) = CM E/(Xi - X) = 0,8464/(Xi - X) = 0,00060516 luego (Xi - x) = 1398.6383 debo seguir despejando S.(bo) = CM E.[1/n + X/(Xi - X)] 0,70190884 = 0,8464.[1/15 + X/1398,6383] luego X = 1066.63054 entonces X = 32.6593102 Finalmente s(A) = 0,8464.[1/15 + (24 - 32,659)/1398,6383]

s(A) = 0,1018 s(A) = 0,319 Intervalo de confianza para E(Yk) Un IC de 1 - a para E(Yk) es: k t(n - 2;1 - /2).s(k) 46,448 1,77*0,319 Finalmente el intervalo ser 45.88337 47.01263 Interprete el Coeficiente de Determinacin desde el punto de vista del problema. El 94.5% de las variaciones en y, estn explicadas por las variaciones en x. Problema n 3) Se desea construir una tabla que permita a los productores de una localidad estimar el volumen de madera de una plantacin a travs de observaciones no destructivas, como contar el nmero de rboles y medir el dimetro del tronco. Con ese fin se estudi la relacin entre el dimetro a la altura del pecho (D.A.P.) y el volumen de madera por rbol(VOL), en rboles de 14 a 16 aos de edad de la especie Pinus elliotti, en la localidad de Esquina (Corrientes). Se obtuvieron las siguientes observaciones y se realiz un grfico de dispersin. Solucin: El anlisis de regresin produjo los siguientes resultados:
R = 0.9676 Coeficientes Error standard t Student Probabilidad Intercepcin Pendiente -37.044 3.4754 2.6535 0.1326 -13.9602 1.0204 10-12 26.2090 1.24153 10-18

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.983667767 Coeficiente de determinacin R 0.967602277 R ajustado 0.96619368 Error tpico 3.792909771 Observaciones 25

ANLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados Regresin Residuos Total 1 23 24 9882.2366 330.8817841 10213.11838 F Valor crtico de F 1.2412.10-18

9882.2366 686.926427 14.3861645

Anlisis de los residuales


Observacin Pronstico VOL (dm) (y) Residuos

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

49.49530709 37.3306015 65.13564285 27.25127401 15.78169445 9.525560141 20.64757668 56.79413045 2.921862819 50.88555916 5.354803937 38.02572753 43.5867358 16.47682048 57.48925648 23.0805178 1.531610751 65.13564285

2.74469291 -4.120601497 5.004357147 -1.961274005 -1.181694446 2.224439859 -1.257576683 2.445869554 3.908137181 -0.335559158 2.505196063 -6.955727531 -4.276735802 -3.23682048 0.81074352 -4.410517802 5.578389249 6.424357147

19 20 21 22 23 24 25

27.59883702 33.85497133 42.89160977 2.921862819 17.51950953 23.42808082 5.354803937

-3.898837022 -3.504971327 1.058390232 5.768137181 -2.429509531 -1.878080819 0.975196063

Presente el modelo de regresin lineal estimado para predecir el volumen por rbol en funcin del dimetro del tronco. Identifique los estimadores de los parmetros y las variables explicativa y de respuesta. Yi = 0 + 1Xi + i Con Yi = volumen del arbol (variable respuesta) Xi = dimetro del tronco (variable explicativa) b0 = estimador de ordenada al origen = -37.044 b1 = estimador de pendiente = 3.4754 Proponga hiptesis de inters para poner a prueba y comente los resultados. H0: 1 = 0; H1: 1 0. Dado que el valor p = 1.2412.10-18 la pendiente es significativa. Qu interpretacin biolgica puede darse a una pendiente significativa de 3.475 en este contexto? Que ante un aumento de 1 cm en el dimetro del rbol, se obtendr un aumento de 3.475 dm en el volumen del rbol. Qu indica un coeficiente de determinacin (R) igual a 0.9676? Que el 96.76% de las variaciones en el volumen estn explicadas por las variaciones en el dimetro del rbol. Calcule el valor estimado y el residual de la observacin correspondiente al rbol 16. Y(16)esperado = -37.044+3.4754*17.3 = 23.08042 Y(16)observado = 18.67 e(16) = 18.67 23.08042 = -4.41042 Se puede afirmar, con una probabilidad de error del 5%, que el volumen de madera aumenta significativamente cuando el D.A.P. aumenta? H0: 1 = 0 vs. H1: 1 0. Si H0 es cierta, entonces se estima que no existe asociacin alguna entre X e Y. tc = (b1 - 1)/s(b1) = (3.4754-0)/0.1326 = 26.20 tiene distribucin tn-2 para el modelo que estamos utilizando, luego t tabla = tn-2;/2 = t23;0.025 = 2.068654794 Como t calculado > t tabla rechazo Ho entonces hay regresin. Calcule un IC90 para la pendiente del modelo. P{b1 - t(/2;n - 2).s(b1) 1 b1 + t(/2;n - 2).s(b1)} = 1 - con b = 3.4754 S(b1) = 0.1326 tn-2; /2 = t23;0.025 = 1.713870006

3.24835273

3.70290761

Problema n 4) En el siguiente cuadro se indican las cantidades de nitrgeno en el suelo despus de su tratamiento con compost de residuos urbanos. Para cada uno de los niveles de tratamiento: 0, 4, 12 y 36 tn/ha de compost se realizaron 4 determinaciones. Los resultados fueron los siguientes: Dosis compost
0 4 12 36

Total nitrgeno (ppm)


0.153 0.195 0.195 0.188 0.153 0.185 0.165 0.214 0.152 0.150 0.200 0.204 0.140 0.175 0.175 0.199

Dosis compost
0 4 12 36

Total nitrgeno (ppm)


0.153 0.195 0.195 0.188 0.153 0.185 0.165 0.214 0.152 0.150 0.200 0.204 0.140 0.175 0.175 0.199

Estadsticas de la regresin
Coeficiente de correlacin mltiple Coeficiente de determinacin R R ajustado Error tpico Observaciones 0.73446676 0.53944142 0.50654438 0.0161856 16

Tabla

Grados de libertad Regresin Residuos Total

Suma de cuadrados 1 14 15

Promedio de los cuadrados 0.00429581 0.00366763 0.00796344

F 0.00429581 0.00026197

Valor crtico de F 16.3978702 0.00119459

Coeficientes Intercepcin Compost 0.16243333 0.0011734

Error tpico 0.00552843 0.00028977

Estadstico t 29.3814383 4.04942838

Probabilidad 5.5609.10-14 0.00119459

Inferior 95% 0.15057601 0.0005519

Superior 95% 0.17429065 0.00179489

Observacin

Pronstico Total Nitrgeno

Residuos

1 2 3 4 5 6 7 8 9 10 11 12 13 14

0.16243333 0.16243333 0.16243333 0.16243333 0.16712692 0.16712692 0.16712692 0.16712692 0.1765141 0.1765141 0.1765141 0.1765141 0.20467564 0.20467564

-0.00943333 -0.00943333 -0.01043333 -0.02243333 0.02787308 0.01787308 -0.01712692 0.00787308 0.0184859 -0.0115141 0.0234859 -0.0015141 -0.01667564 0.00932436

15 16

0.20467564 0.20467564

-0.00067564 -0.00567564

Comp. X 0 0 0 0 4 4 4 4 12 12 12 12 36 36 36 36 208

Total Nitrgeno Y 0.153 0.153 0.152 0.140 0.195 0.185 0.150 0.175 0.195 0.165 0.200 0.175 0.188 0.214 0.204 0.199 2.843

Xi-X -13 -13 -13 -13 -9 -9 -9 -9 -1 -1 -1 -1 23 23 23 23 Sumas

Yi- Y -0.025 -0.025 -0.026 -0.038 0.017 0.007 -0.028 -0.003 0.017 -0.013 0.022 -0.003 0.010 0.036 0.026 0.021

(Xi - X)* (Yi- Y) 0.321 0.321 0.334 0.490 -0.156 -0.066 0.249 0.024 -0.017 0.013 -0.022 0.003 0.237 0.835 0.605 0.490 3.661

(Xi - X) 169 169 169 169 81 81 81 81 1 1 1 1 529 529 529 529 3120

Pronstico (Y sombrero) 0.1628 0.1628 0.1628 0.1628 0.1674 0.1674 0.1674 0.1674 0.1768 0.1768 0.1768 0.1768 0.2050 0.2050 0.2050 0.2050

x*y 0 0 0 0 0.78 0.74 0.6 0.7 2.34 1.98 2.4 2.1 6.768 7.704 7.344 7.164 40.62

x 0 0 0 0 16 16 16 16 144 144 144 144 1296 1296 1296 1296 5824

e=y -0.0098 -0.0098 -0.0108 -0.0228 0.0276 0.0176 -0.0174 0.0076 0.0182 -0.0118 0.0232 -0.0018 -0.0170 0.0090 -0.0010 -0.0060 SCE =

(y - ) 0.000095 0.000095 0.000116 0.000518 0.000759 0.000308 0.000304 0.000057 0.000330 0.000140 0.000537 0.000003 0.000289 0.000081 0.000001 0.000036 0.003669

CME = SCE/GLE = SCE/n-2 CME = x 13 Y 0.178 b1 = 3.661/3120 = b0 = 0.178-0.001173*13 = 0.001173 0.162751 0.000262

b1 = (40.62-(208*2.843/16))/(5824(208*208/16)) b1 = 0.00117

b0 = (1/16)*(2.843-0.001173*208) b0 = 0.16244

Identifique las variables. Y = nitrgeno en el suelo (variable independiente) X = dosis de compost de residuos urbanos (variable dependiente o respuesta) b) Realice el grfico de dispersin y comente.

Escriba el modelo lineal correspondiente y describa cada parmetro en trminos del problema. Yi = 0 + 1Xi + i b0 = estimador de ordenada al origen = 0.16243333 b1 = estimador de pendiente = 0.0011734

Calcule y grafique la recta de regresin = 0.16243333 + 0.0011734.x Grfico en b) d) Compruebe la significacin de los parmetros planteando las hiptesis asociadas.
Valor p

Intercepcin

5.5609.10-14

Compost

0.00119459

Los dos valores p son menores que 0,05 entonces ambos parmetros son significativos. e) Estime los parmetros por medio de intervalos de confianza. Para 0
0.15057601 0.17429065

Para 1
0.0005519 0.00179489

Estime la varianza poblacional. Estimador de la varianza poblacional = CME = 0.00026197 Para una dosis de 3 Tn/Ha de compost, cul sera el total de nitrgeno en el suelo? Y para una dosis de 50 Tn/Ha? y(3) = 0.16243333 + 0.0011734*3 = 0.16595353 Si X = 50 entonces fuera de rango Calcule el error para la 5ta observacin. Y(5)esperado = 0.16243333 + 0.0011734*4 = 0.16712693 Y(5)observado = 0.195 e(5) = 0.195 0.16712693 = 0.02787307 Calcule e interprete el coeficiente de determinacin El 53,94% de las variaciones de nitrgeno en el suelo estn explicados por las variaciones en las dosis de compost. Problema n 5) En un estudio sobre el crecimiento de coliflores precoces se contaron los nmeros de hojas en las plantas de coliflor en varias fechas durante dos aos, siendo el tamao muestral de 10 plantas por fecha. Los datos son nmero promedio de hojas (Y) y suma acumulada de temperatura diaria por encima de 0 C, dividido por 100 (X). Por varios trabajos anteriores, se asume que existe una relacin lineal entre el nmero promedio de hojas y la suma acumulada de temperatura diaria por encima de 0 C 1956/7 X1
2.3 4.0 5.1 5.6 7.0 8.7 9.8

1957/8 X2
2.3 4.5 5.1 6.2 7.0 7.6 9.0

Y1
3.8 6.2 7.2 8.7 10.2 13.5 15.0

Y2
6.0 8.5 9.1 12.0 12.6 13.3 15.2

56/57 X = 6.07142857 SOLUCION:

Estadsticas de la regresin
Coeficiente de correlacin mltiple Coeficiente de determinacin R R ajustado Error tpico Observaciones 0.99619291 0.99240032 0.99088038 0.38105917 7

TABLA
Grados de libertad Regresin Residuos Total 1 5 6 Suma de cuadrados 94.8082552 0.72603047 95.5342857 Promedio de los cuadrados 94.8082552 0.14520609 F 652.922015 Valor crtico de F 1.7142.10-06

Coeficientes Intercepcin X1 0.03564668 1.51412878

Error tpico 0.38752684 0.05925598

Estadstico t 0.09198505 25.5523387

Probabilidad 0.93028166 1.7142.10-06

Inferior 95% -0.96052114 1.36180669

Superior 95% 1.0318145 1.66645087

Observacin

Pronstico Y1

Residuos

1 2 3 4 5 6 7

3.51814288 6.09216181 7.75770347 8.51476786 10.6345482 13.2085671 14.8741087

0.28185712 0.10783819 -0.55770347 0.18523214 -0.43454816 0.29143291 0.12589125

57/58 X = 5.95714286 Estadsticas de la regresin


Coeficiente de correlacin mltiple Coeficiente de determinacin R R ajustado Error tpico Observaciones 0.99073884 0.98156344 0.97787613 0.47557246 7

TABLA
Grados de libertad Regresin Residuos Total Suma de cuadrados 1 5 6 Promedio de los cuadrados 60.206297 1.13084583 61.3371429 F 60.206297 0.22616917 Valor crtico de F 266.200287 1.5775.10-5

Coeficientes Intercepcin X2 2.42319342 1.43255746

Error tpico 0.55307726 0.08780268

Estadstico t 4.38129278 16.3156455

Probabilidad 0.00714594 1.5775.10-05

Inferior 95% 1.00146537 1.20685384

Superior 95% 3.84492146 1.65826108

Observacin

Pronstico Y2

Residuos

5.71807557

0.28192443

2 3 4 5 6 7

8.86970199 9.72923646 11.3050497 12.4510956 13.3106301 15.3162106

-0.36970199 -0.62923646 0.69495033 0.14890436 -0.01063011 -0.11621056

Encuentre la ecuacin de regresin lineal del nmero promedio de hojas respecto de la variable X, para cada ao. Modelo 56/57 Y = 0.03564668 + 1.51412878 X Modelo 57/58 Y = 2.42319342+ 1.43255746 X Considerando los intervalos de confianza de los parmetros de cada modelo conteste: ambas fechas difieren en cuanto al nmero promedio de hojas por cada unidad de temperatura diaria acumulada por encima de 0 C? Y en cuanto al nmero de hojas cuando la temperatura acumulada es igual a 0? Modelo 56/57
Inferior 95% Superior 95%

Intercepcin

-0.96052114

1.0318145

X1

1.36180669

1.66645087

Modelo 57/58
Inferior 95% Superior 95%

Intercepcin

1.00146537

3.84492146

X2

1.20685384

1.65826108

Estime la varianza poblacional para ambos modelos Modelo 56/57 CME = 0.14520609 Modelo 57/58 CME = 0.22616917 Calcule el valor estimado y el residual para la 3era observacin del ao 1956/7
Observacin Pronstico Y1 Residuos

7.75770347

-0.55770347

Para X = 6.5 estime el nmero promedio de hojas a partir de un intervalo de confianza del 90 % para cada una de las fechas. Modelo 56/57 Y(6.5) = 0.03564668 + 1.51412878* 6.5 = 9.87748375 S.(k) = CM E.[1/n + (Xk - X)/(Xi - X)] = 0.14520609* [1/7 + (6.5-6.07142857)/ 41.3542857] = 0.02224856 x = 6.07142857
(x-x) (x-x)

-3.77142857 -2.07142857 -0.97142857 -0.47142857 0.92857143 2.62857143 3.72857143

14.2236735 4.29081633 0.94367347 0.2222449 0.8622449 6.90938776 13.9022449

Suma

41.3542857

k tn - 2;1 - /2.S(k) = 9.87748375 2.045*0.1491595 9.57245257 Modelo 57/58 Y (6.5) = 2.42319342+ 1.43255746 *6.5 = 11.73481691 S.(k) = CM E.[1/n + (Xk - X)/(Xi - X)] = 0.22616917* [1/7 + (6.5-5.95714286)/ 29.3371429] = 0.03649494 x = 5.95714286
(x-x) (x-x)

10.1825149

-3.65714286 -1.45714286 -0.85714286 0.24285714 1.04285714 1.64285714 3.04285714

13.3746939 2.12326531 0.73469388 0.05897959 1.08755102 2.69897959 9.25897959

Suma

29.3371429

k tn - 2;1 - /2.S(k) = 11.734816912.045*0.19103648 11.3441473 12.1254865

Problema n 6) En un estudio que trata de identificar los factores que afectan a la produccin en cultivos de soja se midi el rendimiento (en toneladas por ha) y la disponibilidad de agua en el suelo (en mm) en el periodo crtico de formacin del rendimiento varias localidades. Luego de analizados los datos con INFOSTAT se obtuvieron los siguientes resultados: Anlisis de Regresin Lineal
Variable tha - 1 N 7 R 0.95

Matriz de coeficientes de regresin


Coeficiente Intercepcin mm Est. 1.70 0.02 E.E. 0.19 0.00 LI(95%) 1.22 0.01 LS(95%) 2.18 0.02 t 9.12 10.27 p 0.00 0.00

Identifique las variables de estudio Xi = variable independiente = disponibilidad de agua en el suelo (mm) Yi = variable dependiente o respuesta = rendimiento (tn/ha) SOLUCION: Anlisis de Regresin Lineal
Variable tha - 1 N 7 R 0.95

Matriz de coeficientes de regresin


Coeficiente Est. E.E. LI(95%) LS(95%) t p

Intercepcin mm

1.70 0.02

0.19 0.00

1.22 0.01

2.18 0.02

9.12 10.27

0.00 0.00

Identifique las variables de estudio Xi = variable independiente = disponibilidad de agua en el suelo (mm) Yi = variable dependiente o respuesta = rendimiento (tn/ha) El enunciado menciona que los datos provinieron de varias localidades. En cuantas localidades se realiz el estudio? n=7 Escriba el modelo lineal correspondiente y describa cada parmetro utilizado. Yi = 0 + 1Xi + i b0 = estimador de ordenada al origen = 1.7 b1 = estimador de pendiente = 0.02 En la Matriz de Coeficientes de Regresin, a qu se refiere el Coeficiente indicado como mm? Coeficiente de la pendiente Disponibilidad de agua en el suelo Cul seria un nombre mas indicado para ese coeficiente? Indique sus unidades. Disponibilidad de agua en el suelo (mm) Pruebe la hiptesis que sostiene que a medida que la humedad del suelo aumenta el rendimiento de la soja es mayor. p = o entonces es significativo entonces hiptesis verdadera.

You might also like