You are on page 1of 15

8.

- Regresión y Correlación Lineal Simple


– Ejercicios Resueltos –

 Estimación de los parámetros de Modelo de Regresión


 Prueba de Hipótesis e Intervalos de Confianza
 Coeficiente de Determinación (R2)
 Aplicaciones
08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

1. En la producción de herramientas, el método para deformar acero a temperatura normal


mantiene una relación lineal con la dureza del mismo ya que, a medida que la deformación
crece, se ve afectada la dureza del acero. Para investigar esta relación se evaluaron 12
muestras de acero, los resultados obtenidos se muestran a continuación:

Muestra 1 2 3 4 5 6 7 8 9 10 11 12
Deformación (en mm) 6 9 10 11 13 15 18 22 26 28 33 35
Dureza Brinell (en kg/mm2) 68 67 66 53 52 50 48 44 40 37 34 32

Suponiendo validos los supuestos necesarios:


1.1) Interprete la pendiente del modelo de regresión lineal, la cual relaciona la dureza Brinell
con la deformación del acero, en el contexto del problema y estime la dureza Brinell de
las muestras de acero cuando la deformación del acero es 15,5 mm. Justifique su
respuesta
1.2) Estime con 90% de confianza, la dureza Brinell del acero, cuando la deformación del
acero es de 26 mm.

1.1) Solución: Sean: 𝑥 = “Deformación, en mm”; 𝑦 = “Dureza Brinell, en kg/mm2”


𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = 72,407; 𝑏1 = −1,229 → 𝑦̂ = 72,407 − 1,229 𝑥

Respuesta: Pendiente (𝑏1 = −1,229): Cuando la deformación del acero aumenta en un milímetro la
dureza Brinell disminuye en 1,229 kg/mm2.

𝑦̂(𝑥 = 15,5) = 72,407 − 1,229 ∙ 15,5 = 53,3575

Respuesta: La dureza Brinell de las muestras de acero cuando la deformación del acero es 15,5 m,
corresponde a 53,3575 kg/mm2.

1.2) Solución: La fórmula para determinar el intervalo confidencial:


1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝑌)1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √1 + + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 26; 1 − 𝛼 = 0,90; 𝑛 = 12; 𝑆𝑥 = 9,8057; 𝑆𝑦 = 12,6644; 𝑥̅ = 18,8333


Reemplazando, obtenemos:
𝑛−1 12 − 1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (12,66442 − 1,2292 9,80572 ) = 4,0830
𝑛−2 12 − 2

(𝑥 − 𝑥̅ )2 = (26 − 18,8333)2 = 51,3616 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 11 ∙ 9,80572 = 1057,6693

1 51,3616
𝐼𝐶 (𝑌)0,90 = (72,407 − 1,229 ∙ 26 ± 𝑡(10;0,95) ∙ 4,0830√1 + + )
12 1057,6693

𝐶𝑜𝑛 𝑡(10;0,95) = 1,8125; → 𝐼𝐶 (𝑌)0,90 = [32,6012; 48,2742]

Respuesta: El intervalo [32,6012; 48,2742] contiene la dureza Brinell del acero, cuando la
deformación del acero es de 26 mm, con un 90% de confianza.

Página 182 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

2.- Se toma una muestra aleatoria de 10 piezas de plástico, utilizadas en cierta maquinaria. Se
registra la resistencia (Y) a la fractura, en Newton (N) y la concentración (X) de un componente
H, expresada en porcentaje, utilizada en la fabricación de las piezas de plásticos, obteniendo la
siguiente información:

Pieza 1 2 3 4 5 6 7 8 9 10
X (% H) 2,0 2,7 3,6 4,5 5,0 5,7 6,2 6,5 7,0 7,5
Y (Resistencia) 3,04 3,05 3,12 3,57 7,82 8,68 9,71 10,20 11,32 12,3

Suponiendo que existe asociación lineal entre X e Y:


2.1) Interprete la pendiente del modelo de regresión lineal, ajustado mediante el criterio de
los mínimos cuadrados, que relaciona la resistencia con la concentración del
componente H, en el contexto del problema y estime la resistencia a la fractura de las
piezas cuando la concentración del componente H es de 7,2%. Justifique su respuesta
2.2) Estime, con 95% de confianza, la resistencia media a la fractura de las piezas que tienen
5,7% de concentración del componente H

2.1) Solución: Sea: 𝑥 = “Concentración de un componente H, en porcentaje”


𝑦 = “Resistencia a la fractura, en Newton”

𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = −2,4110; 𝑏1 = 1,9116 → 𝑦̂ = −2,4110 + 1,9116𝑥

Respuesta: Pendiente (𝑏1 = 1,9116): Cuando la concentración del componente H aumenta en un 1%,
la resistencia a la fractura de la pieza de plástico aumenta en 1,9116 Newton

𝑦̂(𝑥 = 7,2) = −2,4110 + 1,9116 ∙ 7,2 = 11,3525

Respuesta: La resistencia a la fractura de las piezas cuando la concentración del componente H es


de 7,2%, corresponde a 11,3525 Newton.

2.2) Solución: La fórmula para determinar el intervalo confidencial:


1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝜇𝑦.𝑥 )1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √ + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 5,7; 1 − 𝛼 = 0,95; 𝑛 = 10; 𝑆𝑥 = 1,8524; 𝑆𝑦 = 3,7289; 𝑥̅ = 5,07


Reemplazando, obtenemos:
𝑛−1 10 − 1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (3,72892 − 1,91162 ∙ 1,85242 ) = 1,2395
𝑛−2 10 − 2

(𝑥 − 𝑥̅ )2 = (5,7 − 5,07)2 = 0,3969 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 9 ∙ 1,85242 = 30,8825

1 0,3969
𝐼𝐶(𝜇𝑦.𝑥 )0,95 = (−2,4110 + 1,9116 ∙ 5,7 ± 𝑡(𝑛−2; 1−𝛼) ∙ 1,2395 √ + )
2 10 30,8825

𝐶𝑜𝑛 𝑡(8;0,975) = 2,3060; → 𝐼𝐶(𝜇𝑦.𝑥 )0,95 = [7,5249; 9,4453]

Alejandro González Tapia – Ingeniería Civil en Minas Página 183


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Respuesta: El intervalo [7,5249; 9,4453] contiene la resistencia media a la fractura de las piezas que
tienen un 5,7% de concentración del componente H con una confianza del 95%.

3. Se encontró la siguiente información entre la concentración de cierta sustancia, expresada


en porcentaje, y la lectura en el colorímetro medido en lux, para una muestra aleatoria de
tamaño 6.

CONCENTRACIÓN (X) 4 5 6 7 8 9
LECTURA (Y) 80 170 260 330 390 430

Bajo el supuesto que existe una relación lineal entre las variables
3.1) Encuentre un intervalo con una confianza del 95%, para estimar la lectura en el
colorímetro de todas las sustancias que tengan una concentración de 5.5 por ciento.
3.2) Con  = 0.10 ¿Es posible concluir que la pendiente de la ecuación de regresión es
mayor que 67?

3.1) Solución: Sea: 𝑥 = “Concentración, en porcentaje”; 𝑦 = “Lectura en el colorímetro, en lux”

𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = −183,9048; 𝑏1 = 70,8571 → 𝑦̂ = −183,9048 + 70,8571 𝑥

La fórmula para determinar el intervalo confidencial:

1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝑌)1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √1 + + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 5,5; 1 − 𝛼 = 0,95; 𝑛 = 6; 𝑆𝑥 = 1,8708; 𝑆𝑦 = 133,8158; 𝑥̅ = 6,5


Reemplazando, obtenemos:
𝑛−1 6−1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (133,81582 − 70,85712 1,87082 ) = 20,4529
𝑛−2 6−2

(𝑥 − 𝑥̅ )2 = (5,5 − 6,5)2 = 1 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 5 ∙ 1,87082 = 17,4995

1 1
𝐼𝐶 (𝑌)0,95 = (−183,9048 + 70,8571 ∙ 5,5 ± 𝑡(4;0,975) ∙ 20,4529√1 + + )
6 17,4995

𝐶𝑜𝑛 𝑡(4;0,975) = 2,7764; → 𝐼𝐶 (𝑌)0,95 = [142,9898; 268,6287]

Respuesta: El intervalo [142,9898; 268,6287] contiene la lectura en el colorímetro de las sustancias


que tengan una concentración de 5,5%, con una confianza del 95%.

3.2) Solución: Las hipótesis que nos interesan contrastar son:


𝐻0 : 𝛽1 = 67
𝐻1 : 𝛽1 > 67

Con: 𝑛 = 12; 𝑠𝑦.𝑥 = 20,4529; ∑(𝑥𝑖 − 𝑥̅ )2 = 17,4995

Página 184 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Entonces, el estadístico de prueba es:

𝑏1 − 67 𝑏1 − 67 70,8571 − 67
𝑇= = 𝑠𝑦.𝑥 = 20,4529 = 0,7889
𝑆𝑏1
√∑(𝑥𝑖−𝑥̅ )2 √17,4995
La Región Crítica (Con 𝛼 = 0,10):
𝑅𝐶 = {𝑥 | 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 > 𝑡(10; 0,90) } → 𝑅𝐶 = {𝑥 | 𝑇 > 1,3722}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, no se rechaza la hipótesis nula, es por esto que es posible concluir que la
pendiente de la ecuación de regresión es mayor que 67 con un 10% de significación.

4. Los datos que se presentan a continuación muestran el contenido de carbono (%) y la


resistencia a la tracción de cierto tipo de barra de acero
Barra 1 2 3 4 5 6 7 8 9 10 11 12
Carbono (%) 2,0 2,4 2,2 2,3 2,5 2,8 2,2 2,7 2,4 2,3 2,0 2,2
Resistencia (kg/cm2) 43 46 45 44 45 48 43 47 44 45 42 44

En base a información obtenida, y suponiendo validos los supuestos necesarios:


4.1) Estime la ecuación de regresión lineal que permita predecir la resistencia a la tracción
de las barras de este tipo de acero a partir del contenido de carbono.
4.2) ¿Es posible concluir con 5% de nivel significación que el contenido de carbono de las
barras de este tipo de acero se asocia linealmente con la resistencia a la tracción?
4.3) Encontrar el porcentaje de variación la resistencia a la tracción de las barras de acero
que no es explicada por el contenido de carbono.

4.1) Solución: Sean: 𝑥 = “Contenido de carbono, en porcentaje”;


𝑦 = “Resistencia a la tracción, en kg/cm2”
𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = 29,85; 𝑏1 = 6,35 → 𝑦̂ = 29,85 + 6,35 𝑥

4.2) Solución: Las hipótesis que nos interesan contrastar son:


𝐻0 : 𝜌 = 0
𝐻1 : 𝜌 ≠ 0
Con: 𝑛 = 12; 𝑟 = 0,9071

Entonces, el estadístico de prueba es:


𝑟 √𝑛 − 2 0,9071 √12 − 2
𝑇= → 𝑇= = 6,8149
√1 − 𝑟 2 √1 − 0,90712

La Región Crítica (Con 𝛼 = 0,05):


𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(𝑛−2; 1− 𝛼) ó 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(10; 0,975) ó 𝑇 > 𝑡(10; 0,975) }
2 2

𝑅𝐶 = {𝑥 | 𝑇 < −2,2281 ó 𝑇 > 2,2281}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, se rechaza la hipótesis nula, es decir, con 5% de significación, existe
asociación lineal entre el contenido de carbono de las barras de este tipo y la resistencia a tracción.

Alejandro González Tapia – Ingeniería Civil en Minas Página 185


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

4.3) Solución: 1 − 𝑅2 = 1 − 0,90712 = 0,1772


Respuesta: El 17,72% de variabilidad de la resistencia a la tracción está explicada por otros factores.

5. En la producción de herramientas, el método para deformar acero a temperatura normal


mantiene una relación lineal con la dureza del mismo ya que, a medida que la deformación
crece, se ve afectada la dureza del acero. Para investigar esta relación se evaluaron 12
muestras de acero, los resultados obtenidos se muestran a continuación:

Muestra 1 2 3 4 5 6 7 8 9 10 11 12
Deformación (en mm) 6 9 10 12 14 15 18 22 26 28 33 35
Dureza Brinell (en kg/mm2) 70 68 66 55 52 50 48 44 40 37 35 30

Suponiendo validos los supuestos necesarios


5.1) Interprete el coeficiente de determinación en el contexto del problema. Justifique
5.2) Estime con 95% de confianza, la dureza Brinell media del acero, cuando la deformación
del acero es de 33 mm.
5.3) ¿Es posible concluir que existe una relación lineal inversa entre las variables en
estudio, con un 2,5% de nivel de significación?

5.1) Solución: Sean: 𝑥 = “Deformación, en mm”; 𝑦 = “Dureza Brinell, en kg/mm2”


𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = 74,6589; 𝑏1 = −1,3198 → 𝑦̂ = 74,6589 − 1,3198 𝑥

𝑟 = −0,9624 𝑅2 = (−0,9624)2 = 0,9262

Respuesta: El 92,62% de la variación de la dureza Brinell del acero está determinada por la
deformación.

5.2) Solución: La fórmula para determinar el intervalo confidencial:


1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝜇𝑦.𝑥 )1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √ + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 33; 1 − 𝛼 = 0,95; 𝑛 = 12; 𝑆𝑥 = 9,6859; 𝑆𝑦 = 13,2833; 𝑥̅ = 19


Reemplazando, obtenemos:
𝑛−1 12 − 1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (13,28332 −1,31982 9,68592 ) = 3,7858
𝑛−2 12 − 2

(𝑥 − 𝑥̅ )2 = (33 − 19)2 = 196 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 11 ∙ 9,68592 = 1031,9832

1 196
𝐼𝐶(𝜇𝑦.𝑥 )0,90 = (74,6589 − 1,3198 ∙ 33 ± 𝑡(10;0,975) ∙ 3,7858√ + )
12 1031,9832

𝐶𝑜𝑛 𝑡(10;0,975) = 2,2281; → 𝐼𝐶(𝜇𝑦.𝑥 )0,95 = [26,6961; 35,5149]


Respuesta: El intervalo [26,6961; 35,5149] contiene la dureza Brinell media del acero, cuando la
deformación del acero es de 33 mm, con un 95% de confianza.

Página 186 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

5.3) Solución: Las hipótesis a contrastar para determinar si estas muestras están relacionadas
linealmente:
𝐻0 : 𝜌 ≥ 0
𝐻1 : 𝜌 < 0 𝐶𝑜𝑛: 𝑟 = −0,9624; 𝑛 = 12
Luego, para determinar el estadístico de prueba, tenemos:
𝑟√𝑛 − 2 −0,9624√12 − 2
𝑇= → 𝑇= = −11,2039
√1 − 𝑟 2 √1 − 0,96242
La Región Crítica (𝐶𝑜𝑛 𝛼 = 0,025):
𝑅𝐶 = { 𝑥 |𝑇 < −𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(10; 0,975) } → 𝑅𝐶 = { 𝑥 | 𝑇 < −2,2281}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión hay información suficiente para rechazar la hipótesis nula,
es decir, existe una relación lineal inversa entre las variables en estudio, con 𝛼 = 0,025.

6. Se encontró la siguiente información entre la concentración de cierta sustancia, expresada


en porcentaje, y la lectura en el colorímetro en lux, para una muestra aleatoria de tamaño 8.
CONCENTRACIÓN (X) 4 5 5 6 7 7 8 9
LECTURA (Y) 80 170 200 260 330 334 390 430

Bajo el supuesto que existe una relación lineal entre las variables
6.1) Determinar el modelo de regresión lineal e intérprete el pendiente.
6.2) Encuentre un intervalo con una confianza del 95%, para estimar la lectura en el
colorímetro de todas las sustancias que tengan una concentración de 6.5 por ciento.
6.3) Esboce un gráfico adecuado que muestre la ecuación de regresión estimada

6.1) Solución: Sean: 𝑥 = “Concentración, en porcentaje”; 𝑦 = “Lectura en el colorímetro, en lux”

𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = −168,7925; 𝑏1 = 69,4969 → 𝑦̂ = −168,7925 + 69,4969 𝑥

Respuesta: Pendiente (𝑏1 = 69,4969): Cuando la concentración de la sustancia aumenta en un 1%,


la lectura en el colorímetro aumenta en 69,4969 lux

6.2) Solución: La fórmula para determinar el intervalo confidencial:


1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝑌)1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √1 + + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 6,5; 1 − 𝛼 = 0,95; 𝑛 = 8; 𝑆𝑥 = 1,6850; 𝑆𝑦 = 118,7142; 𝑥̅ = 6,375


Reemplazando, obtenemos:
𝑛−1 8−1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (118,71422 − 69,49692 1,68502 ) = 21,0588
𝑛−2 8−2

(𝑥 − 𝑥̅ )2 = (6,5 − 6,375)2 = 0,0156 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 7 ∙ 1,68502 = 19,8746

1 0,0156
𝐼𝐶 (𝑌)0,95 = (−168,7925 + 69,4969 ∙ 6,5 ± 𝑡(6;0,975) ∙ 21,0588√1 + + )
8 19,8746

Alejandro González Tapia – Ingeniería Civil en Minas Página 187


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

𝐶𝑜𝑛 𝑡(6;0,975) = 2,4469; → 𝐼𝐶 (𝑌)0,95 = [228,2638; 337,6109]


Respuesta: El intervalo [228,2638; 337,6109] contiene la lectura en el colorímetro de todas las
sustancias que tengan una concentración de 6,5%, con una confianza del 95%.

6.3) Solución:

Lectura v/s Concentración


500

400
Lectura del colorimetro (lux)

300

200

100

0
0 2 4 6 8 10
-100

-200

-300
Concentración (%)

7. Se desea estudiar si la resistencia de una mezcla de hormigón es explicada por el número


de días de fragüe de dicha mezcla. Para ello se tomó una muestra de 12 mezclas, obteniéndose
la siguiente información.

Mezcla 1 2 3 4 5 6 7 8 9 10 11 12
Días de fragüe 1 2 3 7 2 3 7 7 3 2 1 10
Resistencia (kg/cm2) 13 21,9 29,8 32,4 24,5 24,2 30,4 34,5 26,2 24,5 13 42,6

Suponiendo validos los supuestos necesarios


7.1) ¿Es posible concluir que existe una relación lineal directa entre las variables en
estudio, con un 5% de nivel de significación?
7.2) Si usted quiere probar que el coeficiente de correlación lineal entre las variables en
estudio difiere de 0.975, con  = 0.01. Determine, evalúe y grafique la región de rechazo
de la hipótesis nula

7.1) Solución: Sean: 𝑥 = “Número de días de fragüe”;


𝑦 = “Resistencia de una mezcla de hormigón, en kg/cm2”

Debemos contrastar las siguientes hipótesis, para determinar si estas muestras están relacionadas
linealmente:
𝐻0 : 𝜌 ≤ 0
𝐻1 : 𝜌 > 0 𝐶𝑜𝑛: 𝑟 = 0,9027; 𝑛 = 12

Página 188 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Luego, para determinar el estadístico de prueba, tenemos:


𝑟√𝑛 − 2 0,9027√12 − 2
𝑇= → 𝑇= = 6,6344
√1 − 𝑟 2 √1 − 0,90272

La Región Crítica (𝐶𝑜𝑛 𝛼 = 0,05):

𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(10; 0,95) } → 𝑅𝐶 = { 𝑥 | 𝑇 > 1,8125}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión hay información suficiente para rechazar la hipótesis nula,
es decir, existe una relación lineal directa entre las variables en estudio, con 𝛼 = 0,05.

7.2) Solución: Las hipótesis que nos interesan contrastar son:

𝐻0 : 𝜌 = 0,95
𝐻1 : 𝜌 ≠ 0,95
La Región Crítica (Con 𝛼 = 0,01):
𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(𝑛−2; 1− 𝛼) ó 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(10; 0,995) ó 𝑇 > 𝑡(10; 0,995) }
2 2

𝑅𝐶 = {𝑥 | 𝑇 < −3,1693 ó 𝑇 > 3,1693}

8. Se desea estudiar si la resistencia de una mezcla de cemento es explicada por el número de


días de fragüe de dicha mezcla. Para ello se tomó una muestra de 10 mezclas, obteniéndose la
siguiente información.
Mezcla 1 2 3 4 5 6 7 8 9 10
Días de fragüe 1 2 3 7 2 3 7 7 3 2
Resistencia (kg/cm2) 20 21,9 29,8 32,4 24,5 24,2 30,4 34,5 26,2 24,5

Suponiendo validos los supuestos necesarios


8.1) Determinar el modelo de regresión lineal e intérprete el intercepto
8.2) ¿Es posible concluir que existe una relación lineal inversa entre las variables en
estudio, con un 5% de nivel de significación?
8.3) Con  = 0.05 ¿Es posible concluir que la pendiente de la ecuación de regresión es igual
a 1,78?

8.1) Solución: Sean: 𝑥 = “Número de días de fragüe”; 𝑦 = “Resistencia, en kg/cm2”

𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = 20,1623; 𝑏1 = 1,8048 → 𝑦̂ = 20,1623 + 1,8048 𝑥

Respuesta: Intercepto (𝑏0 = 20,1623): Cuando la los días de fragüe es igual a cero, la resistencia de
la mezcla de cemento es iguala 20,1623 kg/cm2

8.2) Solución: Las hipótesis a contrastar para determinar si estas muestras están relacionadas
linealmente:
𝐻0 : 𝜌 ≥ 0
𝐻1 : 𝜌 < 0 𝐶𝑜𝑛: 𝑟 = 0,9021; 𝑛 = 10

Alejandro González Tapia – Ingeniería Civil en Minas Página 189


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Luego, para determinar el estadístico de prueba, tenemos:


𝑟√𝑛 − 2 0,9021√10 − 2
𝑇= → 𝑇= = 5,9128
√1 − 𝑟 2 √1 − 0,90212
La Región Crítica (𝐶𝑜𝑛 𝛼 = 0,05):
𝑅𝐶 = { 𝑥 |𝑇 < −𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(8; 0,95) } → 𝑅𝐶 = { 𝑥 | 𝑇 < −1,8595}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión no hay información suficiente para rechazar la hipótesis
nula, es decir, no existe una relación lineal inversa entre las variables en estudio, con 𝛼 = 0,05.

8.3) Solución: Las hipótesis que nos interesan contrastar son:

𝐻0 : 𝛽1 = 1,78
𝐻1 : 𝛽1 ≠ 1,78

Con: 𝑛 = 10; 𝑠𝑦.𝑥 = 2,1609; ∑(𝑥𝑖 − 𝑥̅ )2 = 50,1009


Entonces, el estadístico de prueba es:

𝑏1 − 1,78 𝑏1 − 1,78 1,8048 − 1,78


𝑇= = 𝑠𝑦.𝑥 = 2,1609 = 0,0812
𝑆𝑏1
√∑(𝑥𝑖−𝑥̅ )2 √50,1009
La Región Crítica (Con 𝛼 = 0,05):
𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(𝑛−2; 1− 𝛼) ó 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(8; 0,975) ó 𝑇 > 𝑡(8; 0,975) }
2 2
→ 𝑅𝐶 = {𝑥 | 𝑇 < −2,3060 ó 𝑇 > 2,3060}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, no se rechaza la hipótesis nula, es por esto que es posible concluir que la
pendiente de la ecuación de regresión es igual a 1,78, con un 5% de significación.

9.- Los datos que se presentan a continuación muestran el contenido de carbono (%) y la
resistencia a la tracción de cierto tipo de barra de acero
Barra 1 2 3 4 5 6 7 8 9 10
Carbono (%) 2,4 2,2 2,3 2,5 2,8 2,2 2,7 2,4 2,3 2,0
Resistencia (kg/cm2) 46 45 44 45 48 43 47 44 45 42

En base a información obtenida, y suponiendo validos los supuestos necesarios:


9.1) Estime la ecuación de regresión lineal que permita predecir la resistencia a la tracción
de las barras de este tipo de acero a partir del contenido de carbono.
9.2) ¿Es posible concluir con 10% de nivel significación que el contenido de carbono de las
barras de este tipo de acero se asocia linealmente con la resistencia a la tracción?
9.3) Interprete el coeficiente de determinación en el contexto del problema. Justifique

9.1) Solución: Sean: 𝑥 = “Contenido de carbono, en porcentaje”;


𝑦 = “Resistencia a la tracción, en kg/cm2”

𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = 28,85; 𝑏1 = 6,74 → 𝑦̂ = 28,85 + 6,74 𝑥

Página 190 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

9.2) Solución: Las hipótesis que nos interesan contrastar son:


𝐻0 : 𝜌 = 0
𝐻1 : 𝜌 ≠ 0
Con: 𝑛 = 10; 𝑟 = 0,9012

Entonces, el estadístico de prueba es:

𝑟 √𝑛 − 2 0,9012 √10 − 2
𝑇= → 𝑇= = 5,88
√1 − 𝑟 2 √1 − 0,90122
La Región Crítica (Con 𝛼 = 0,10):
𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(𝑛−2; 1− 𝛼) ó 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 < −𝑡(8; 0,95) ó 𝑇 > 𝑡(8; 0,95) }
2 2

𝑅𝐶 = {𝑥 | 𝑇 < −1,8595 ó 𝑇 > 1,8595}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, se rechaza la hipótesis nula, es decir, con 10% de significación, existe
asociación lineal entre el contenido de carbono de las barras de este tipo y la resistencia a tracción.

9.3) Solución: 𝑟 = 0,9012 𝑅2 = (0,9012)2 = 0,8122

Respuesta: El 81,22% de la variación de la resistencia a la tracción está determinada por el


contenido de carbono de la muestra

10.- El concreto experimenta un marcado incremento característico en la “plasto


deformación”, cuando se calienta por primera vez bajo carga. Se efectuó un experimento en 12
especímenes de concreto, con el fin de investigar el comportamiento ante esfuerzos térmicos
transitorios, en el cual se midió la rapidez del calentamiento, en grados Celsius por minuto y el
nivel de carga, en porcentaje. La información obtenida es:
Rapidez 0.10 0.12 0.14 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.48 0.50
Nivel de carga 0.05 0.01 0.08 0.08 0.10 0.19 0.18 0.23 0.25 0.33 0.35 0.41
Suponiendo válidos los supuestos necesarios:
10.1) Estime, con un 95% de confianza, el nivel de carga promedio que soportan los
especímenes de concreto cuando la rapidez del calentamiento es de 0.18 grados
Celsius por minuto
10.2) Con  = 0.05 ¿Es posible concluir que la pendiente de la ecuación de regresión es
mayor que 0.8?
10.3) ¿Qué porcentaje de la variación del nivel de carga está determinado por la rapidez del
calentamiento? Justifique
10.4) Interprete la pendiente, en el contexto del problema y esboce un gráfico adecuado que
muestre la ecuación de regresión estimada

10.1) Solución: Sea: 𝑥 = “Rapidez de calentamiento, en grados Celsius por minuto”


𝑦 = “Nivel de carga, en porcentaje”

𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = −0,0583; 𝑏1 = 0,8605 → 𝑦̂ = −0,0583 + 0,8605 𝑥

Alejandro González Tapia – Ingeniería Civil en Minas Página 191


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

La fórmula para determinar el intervalo confidencial:


1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝜇𝑦.𝑥 )1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √ + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 0,18; 1 − 𝛼 = 0,95; 𝑛 = 12; 𝑆𝑥 = 0,1472; 𝑆𝑦 = 0,1290; 𝑥̅ = 0,2867


Reemplazando, obtenemos:
𝑛−1 12 − 1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (0,12902 − 0,86052 ∙ 0,14722 ) = 0,0256
𝑛−2 12 − 2

(𝑥 − 𝑥̅ )2 = (0,18 − 0,2867)2 = 0,0114 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 11 ∙ 0,14722 = 0,2383

1 0,0114
𝐼𝐶(𝜇𝑦.𝑥 )0,95 = (−0,0583 + 0,8605 ∙ 0,18 ± 𝑡(𝑛−2; 1− 𝛼) ∙ 0,0256 √ + )
2 12 0,2383

𝐶𝑜𝑛 𝑡(10;0,975) = 2,2281; → 𝐼𝐶(𝜇𝑦.𝑥 )0,95 = [0,0759; 0,1172]

Respuesta: El intervalo [0,0759; 0,1172] contiene el nivel de carga promedio que soportan los
especímenes de concreto cuando la rapidez del calentamiento es de 0.18 grados Celsius por
minutos, con una confianza del 95%.

10.2) Solución: Las hipótesis que nos interesan contrastar son:


𝐻0 : 𝛽1 = 0,8
𝐻1 : 𝛽1 > 0,8

Con: 𝑛 = 12; 𝑠𝑦.𝑥 = 0,0256; ∑(𝑥𝑖 − 𝑥̅ )2 = 0,2383


Entonces, el estadístico de prueba es:

𝑏1 − 0,8 𝑏1 − 0,8 0,8605 − 0,8


𝑇= = 𝑠𝑦.𝑥 = 0,0256 = 1,1537
𝑆𝑏1
√∑(𝑥𝑖 −𝑥̅ )2 √0,2383

La Región Crítica (Con 𝛼 = 0,05):


𝑅𝐶 = {𝑥 | 𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 > 𝑡(10; 0,95) } → 𝑅𝐶 = {𝑥 | 𝑇 > 1,8125}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, no se rechaza la hipótesis nula, es por esto que es posible concluir que la
pendiente de la ecuación de regresión es mayor que 0,8 con un 5% de significación.

10.3) Solución: 𝑅2 = 0,98152 = 0,9633

Respuesta: El porcentaje de la variación del nivel de carga que está determinado por la rapidez del
calentamiento es 96,33%

10.4) Respuesta: La pendiente corresponde a 0,8605, esto significa que por cada grado Celsius que
aumenta la rapidez de calentamiento, el nivel de carga aumente en un 0,8605%

Página 192 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Nivel de carga v/s Rapidez de calentamiento


0,4
Nivel de carga (%)
0,3

0,2

0,1

0
-0,05 0,05 0,15 0,25 0,35 0,45 0,55
-0,1
Rapidez de calentamiento (°C/min)

11.- Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en
pesetas (Y) en la década de los 80 en España fueron registrados por medio de sumatorias, las
cuales se muestran a continuación:

∑ 𝒙𝟐 = 𝟖𝟒𝟔𝟖 ∑ 𝒚𝟐 = 𝟏𝟑𝟐𝟔𝟖 ∑ 𝒙𝒚 = 𝟗𝟕𝟑𝟒


∑ 𝒙 = 𝟐𝟖𝟔 ∑ 𝒚 = 𝟑𝟓𝟒 𝒏 = 𝟏𝟎

11.1) ¿Es posible concluir que existe una relación lineal directa entre las variables en
estudio, con un 10% de nivel de significación?

11.2) Estime con un 90% de confianza el precio medio de la harina, cuando la producción de
trigo es de 18 toneladas
11.3) Encontrar el porcentaje de variación del precio del kilo de harina que no es explicada
por las toneladas producidas por esta

11.1) Solución: Sean: 𝑥 = “Producción de trigo, en toneladas”;


𝑦 = “Precio del kilo de harina, en pesetas”

Lo primero es determinar el coeficiente de correlación, el cual se encuentra dado por la siguiente


fórmula:

𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 10 ∙ 9734 − 286 ∙ 354


𝑟= = = −0,847
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 ][𝑛 ∑ 𝑦 2 − (∑ 𝑦)2 ] √[10 ∙ 8468 − (286)2 ][10 ∙ 13268 − (354)2 ]

Luego, las hipótesis que nos interesan contrastar son:

𝐻0 : 𝜌 ≤ 0
𝐻1 : 𝜌 > 0
Con: 𝑛 = 10; 𝑟 = −0,847

Alejandro González Tapia – Ingeniería Civil en Minas Página 193


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Entonces, el estadístico de prueba es:


𝑟 √𝑛 − 2 −0,847√10 − 2
𝑇= → 𝑇= = −4,507
√1 − 𝑟 2 √1 − (−0,847)2
La Región Crítica (Con 𝛼 = 0,10):
𝑅𝐶 = { 𝑥 |𝑇 > 𝑡(𝑛−2; 1− 𝛼) } → 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(8; 0,90) } → 𝑅𝐶 = { 𝑥 | 𝑇 > 1,8595}

Respuesta: Como 𝑇 ∈ 𝑅𝐶, por lo que no se rechaza la hipótesis nula, es decir, con 10% de
significación, no existe asociación lineal directa entre las variables en estudio.

11.2) Solución: Es necesario determinar los coeficientes de la regresión a partir de las siguientes
fórmulas:
354 ∙ 8468 − 286 ∙ 9734 10 ∙ 9734 − 286 ∙ 354
𝑏0 = = 74,1151 ; 𝑏1 = = −1,3537
10 ∙ 8468 − (286) 2 10 ∙ 8468 − (286)2

Por lo tanto, la regresión queda dada por:


𝑦̂ = 𝑏0 + 𝑏1 𝑥 𝐶𝑜𝑛 𝑏0 = 74,1151; 𝑏1 = −1,3537 → 𝑦̂ = 74,1151 − 1,3537 𝑥

En seguida se calculan las desviaciones estándar y promedios de las muestras:

∑ 𝑥 286 ∑ 𝑦 354
• 𝑥̅ = = = 28,6 ; • 𝑦̅ = = = 35,4
𝑛 10 𝑛 10

2
∑ 𝑥 2 − 𝑛 ∙ 𝑥̅ 2 8468 − 10 ∙ 28,62
• 𝑆𝑥 = = = 32,04
𝑛−1 9
∑ 𝑦 2 − 𝑛 ∙ 𝑦̅ 2 13268 − 10 ∙ 35,42
• 𝑆𝑦 2 = = = 81,8222
𝑛−1 9
La fórmula para determinar el intervalo confidencial:

1 (𝑥 − 𝑥̅ )2
𝐼𝐶(𝜇𝑦.𝑥 )1−𝛼 = (𝑏0 + 𝑏1 𝑥 ± 𝑡(𝑛−2; 1−𝛼) ∙ 𝑠𝑦.𝑥 √ + )
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2

Con: 𝑥 = 18; 1 − 𝛼 = 0,90; 𝑛 = 10; 𝑆𝑥 2 = 32,04; 𝑆𝑦 2 = 81,8222; 𝑥̅ = 28,6


Reemplazando, obtenemos:

𝑛−1 10 − 1
𝑠𝑦.𝑥 = √ (𝑆𝑦 2 − 𝑏1 2 𝑆𝑥 2 ) = √ (81,8222 − (−1,3537)2 ∙ 32,04) = 5,0987
𝑛−2 10 − 2

(𝑥 − 𝑥̅ )2 = (18 − 28,6)2 = 112,36 ; ∑(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 1) 𝑆𝑥 2 = 9 ∙ 32,04 = 288,36

1 112,36
𝐼𝐶(𝜇𝑦.𝑥 )0,90 = (74,1151 − 1,3537 ∙ 18 ± 𝑡(8; 0,95) ∙ 5,0987 √ + )
10 288,36

𝐶𝑜𝑛 𝑡(8;0,95) = 1,8595; → 𝐼𝐶(𝜇𝑦.𝑥 )0,95 = [43,1141; 56,3829]

Página 194 Alejandro González Tapia – Ingeniería Civil en Minas


08. Regresión y correlación lineal simple – Ejercicios Resueltos
ANÁLISIS ESTÁDISTICO

Respuesta: El intervalo [43,1141; 56,3829] contiene el precio medio de la harina cuando la


producción de trigo es de 18 toneladas, con una confianza del 90%

11.3) Solución: 1 − 𝑅2 = 0,2826


Respuesta: El 28,26% de variabilidad del precio del kilo harina están explicadas por otros factores.

Alejandro González Tapia – Ingeniería Civil en Minas Página 195

You might also like