You are on page 1of 4

PRACTICA DIRIGIDA DE ESTADISTICA II

TEMA: Regresin y correlacin mltiple y modelamiento 10-5 DESTREZAS Y CONCEPTOS BSICOS Conocimientos estadsticos y pensamiento crtico 1. Regresin mltiple. Qu es la regresin mltiple y en qu difiere de la regresin analizada en la seccin 10-3? 2. Coeficiente ajustado de discriminacin. Al comparar diferentes ecuaciones de regresin mltiple, por qu la R2 ajustada es una mejor medida que R2? 3. Prediccin del color de ojos. Un genetista desea desarrollar un mtodo para predecir el color de ojos de un beb, dado el color de ojos de cada uno de los padres. Se pueden emplear los mtodos de esta seccin? Por qu? 4. Variables. Cul es la diferencia entre una variable de respuesta y una variable de prediccin? Interpretacin de resultados de programas de cmputo. En los ejercicios 5 a 8, remtase a los resultados de Minitab que se presentan aqu y responda las preguntas formuladas identifique los elementos indicados. Los resultados de Minitab estn basados en la muestra de 54 osos incluida en el conjunto de datos 6 del apndice B.

5. Mediciones de osos. Identifique la ecuacin de regresin mltiple que expresa el peso en trminos de la longitud de la cabeza, la estatura y el tamao del pecho. 6. Mediciones de osos. Identifique lo siguiente: a. El valor P correspondiente a la significancia general de la ecuacin de regresin mltiple b. El valor del coeficiente mltiple de determinacin R2 c. El valor ajustado de R2 7. Mediciones de osos. Es til la ecuacin de regresin mltiple para predecir el peso de un oso con base en la longitud de su cabeza, la estatura y el tamao del pecho? Por qu? 8. Mediciones de osos. Se encuentra que un oso tiene una longitud de cabeza de 14.0 in, una estatura de 70.0 in y un tamao del pecho de 50.0 in. a. Calcule el peso predicho del oso.

b. El oso en cuestin en realidad pesaba 320 lb. Qu tan exacto es el peso predicho en el inciso a)? Datos de salud: clculo de la mejor ecuacin de regresin mltiple. En los ejercicios 9 a 12, remtase a la siguiente tabla, que se obtuvo utilizando los datos de hombres del conjunto de datos 1 del apndice B. La variable de respuesta (y) es el peso (en libras) y las variables de prediccin (x) son EST (estatura en pulgadas), CINT (circunferencia de la cintura en cm) y COL (colesterol en mg).

9. Si slo se utiliza una variable de prediccin (x) para predecir el peso, cul variable es mejor? Por qu? 10. Si se utilizaran exactamente dos variables de prediccin (x) para predecir el peso, cules dos variables deberan elegirse? Por qu? 11. Cul ecuacin de regresin es mejor para predecir el peso? Por qu? 12. Si un hombre tiene una estatura de 72 in, una circunferencia de cintura de 105 cm y un nivel de colesterol de 250 mg, cul es el mejor valor predicho de su peso? Es posible que ese valor predicho constituya un buen estimado? Es posible que el valor predicho sea muy exacto? 13. Conjunto de datos del apndice B: Prediccin de nicotina en cigarrillos. Remtase al conjunto de datos 3 del apndice B. a. Calcule la ecuacin de regresin que exprese la variable de respuesta (y) de la cantidad de nicotina en trminos de la variable de prediccin (x) de la cantidad de alquitrn. b. Calcule la ecuacin de regresin que exprese la variable de respuesta (y) de la cantidad de nicotina en trminos de la variable de prediccin (x) de la cantidad de monxido de carbono. c. Calcule la ecuacin de regresin que exprese la variable de respuesta (y) de la cantidad de nicotina en trminos de las variables de prediccin (x) de la cantidad de alquitrn y la cantidad de monxido de carbono. d. Para las ecuaciones de regresin calculadas en los incisos a), b) y c), cul es la mejor ecuacin para predecir la cantidad de nicotina? e. La mejor ecuacin de regresin identificada en el inciso es una buena ecuacin para predecir la cantidad de nicotina? Por qu? 14. Conjunto de datos del apndice B: Uso de la basura para predecir el tamao de la poblacin. Remtase al conjunto de datos 16 del apndice B. a. Calcule la ecuacin de regresin que exprese la variable de respuesta (y) del tamao de la familia en trminos de la variable de prediccin del peso de la comida desechada. b. Calcule la ecuacin de regresin que exprese la variable de respuesta (y) del tamao de la familia en trminos de la variable de prediccin (x) del peso del plstico desechado.

c. Calcule la ecuacin de regresin que exprese la variable de respuesta (y) del tamao de la familia en trminos de las variables de prediccin (x) del peso de la comida desechada y del peso del plstico desechado. d. Para las ecuaciones de regresin calculadas en los incisos a), b) y c), cul es la mejor ecuacin para predecir el tamao de la familia? Por qu? e. La mejor ecuacin de regresin identificada en el inciso d) es una buena ecuacin para predecir el tamao de la familia? Por qu? 15. Conjunto de datos del apndice B: Precio de venta de casas. Remtase al conjunto de datos 18 del apndice B y calcule la mejor ecuacin de regresin mltiple con el precio de venta como variable de respuesta (y). Es esta "mejor" ecuacin buena para predecir el precio de venta de una casa? 16. Conjunto de datos del apndice B: Old Faithful. En esta seccin se utilizaron los datos de 8 erupciones del giser Old Faithful, tal como se listan en la tabla 10-1. Remtase al conjunto de datos 11 del apndice B y utilice el conjunto completo de datos de las 40 erupciones. Determine la mejor ecuacin de regresin mltiple que exprese la variable de respuesta (y) del intervalo posterior a una erupcin, en trminos de una o ms de las otras variables. Explique su eleccin.

10-6 DESTREZAS Y CONCEPTOS BSICOS Conocimientos estadsticos y pensamiento crtico 1. Modelo. Qu es un modelo matemtico? 2. R2. De qu manera se emplean los valores de R2 para comparar los diferentes modelos que se estn considerando? 3. Proyecciones. En esta seccin utilizamos los valores poblacionales del ao 1800 al ao 2000, y encontramos que el mejor modelo es el que est descrito por y = 2.77x2 - 6.00x + 10.01, donde el valor poblacional de y est dado en millones. Por qu sera errneo utilizar este modelo para proyectar el tamao de la poblacin para el ao 3000? 4. El mejor modelo. Suponga que utilizamos una muestra con los mtodos de esta seccin para calcular que, de los cinco modelos posibles, el mejor modelo es y = 4x1.2 con R2 = 0.200. Este mejor modelo parece ser un buen modelo? Por qu? Obtencin del mejor modelo. En los ejercicios 5 a 12, construya un diagrama de dispersin e identifique el modelo matemtico que se ajusta mejor a los datos indicados. Suponga que el modelo se va a emplear nicamente para el alcance que tienen los datos y considere slo los modelos lineal, cuadrtico, logartmico, exponencial y potencial.

5.

6.

7.

8.

9. Muertes de manates por barcos. La siguiente tabla lista el nmero de muertes de manates en Florida, relacionadas con encuentros con embarcaciones (segn datos de Florida Fish and Wildlife Conservation).

10. Muertes de manates por causas naturales. La siguiente tabla lista el nmero de muertes de manates en Florida por causas naturales (segn datos de Florida Fish and Wildlife Conservation). El mejor modelo parece ser un modelo razonablemente bueno?;

11. Experimento de fsica. Un experimento para una clase de fsica implica dejar caer una pelota de golf y registrar la distancia (en metros) que cae en diferentes tiempos (en segundos) despus de ser soltada. Los datos se incluyen en la siguiente tabla. Proyecte la distancia para un tiempo de 12 segundos, dado que la pelota de golf se dejo caer de un edificio con una altura de 50 m.

12. Mercado burstil. A continuacin se listan, por rengln, los valores mximos anuales del Promedio Industrial Dow Jones para cada ao a partir de 1980. Cul es el mejor valor predicho para el ao 2004? Dado que el valor real mximo en 2004 fue 10,855, qu tan bueno fue el valor predicho? Qu sugiere el patrn acerca del mercado burstil para fines de inversin? (Actos de terrorismo y malas condiciones econmicas causaron grandes prdidas en el mercado burstil en 2002). 1000 1024 1071 1287 1287 1553 1956 2722 2184 2791 3000 3169 3413 3794 3978 5216 6561 8259 9374 11,568 11,401 11,350 10,635 10,454

You might also like