Professional Documents
Culture Documents
2. Dados los siguientes datos correspondientes a las líneas de código (LOC) estimadas y reales
de un conjunto de programas, compruebe la correlación de los datos que se ofrecen y
calcule los parámetros de regresión de los datos históricos.
Entregar un informe con los cálculos e interpretación de los resultados.
Ver: Explicación y fórmulas debajo.
Regresión lineal
Cuando se calcula la correlación de dos variables, se determina el grado en el cual las
variaciones de una coinciden con las variaciones de la otra.
La regresión lineal estima las relaciones presumidas entre una variable y otra expresándola una
en términos de una función lineal de la otra. Esta función puede ser utilizada entonces para
predecir el valor de una variable basado en el valor de la otra.
La regresión lineal es una forma de ir ajustando óptimamente una línea a un conjunto de datos.
Por ejemplo: si se tienen los datos de la anterior tabla, si estimas que un nuevo programa podría
tener 386 LOC de objetos, podrías usando los datos históricos determinar la cantidad más
probable de LOC nuevos y modificados del nuevo programa. El método de regresión lineal
proporciona una forma para hacer esto.
Por ejemplo, usar el método de regresión lineal para estimar el tamaño de un programa
asumiendo que el número de LOC nuevas y modificadas puede ser representado como una
función del número LOC de objetos estimados para ese programa. Donde xk es LOC objetos
estimados y yk es LOC nuevas y modificadas.
yk = β 0 + β 1 * xk
Note que la regresión lineal refiere una relación lineal entre los parámetros β0 y β1. La relación
entre x y y no requiere ser lineal.
β1 = ∑ xi * yi – n * xprom * yprom
_______________________
∑ xi 2 – n * xprom2
β0 = yprom - β1 * xprom
yk = β0 + β1 * xk.
Condiciones.
• Los datos históricos de x e y necesitan demostrar una relación. (Ver correlación)
• Esto se demuestra por correlación significativa.
• Se requiere más de 3 datos, preferible más de 5.
Pasos:
1. Eliminar fueras del conjunto de datos:
2. Con los datos disponibles, calcular β1: β1 = ∑ xi * yi – n * xprom * yprom
_______________________
∑ xi 2 – n * xprom2
3. Calcular β0: β0 = yprom - β1 * xprom
4. Calcular yk: yk = β0 + β1 * xk.
Correlación.
Es una medida del grado en el cual dos variables están relacionadas. Si dos variables están
altamente correlacionadas y si ellas tienen una relación causa y efecto entonces puede usar el
valor de una variable para predecir el valor de la otra.
r(x,y) = n * ∑ xi * yi – ∑ xi * ∑ yi
_______________________________________
√ [n * ∑ xi 2 – (∑ xi ) 2] * [n * ∑ yi 2 – (∑ yi ) 2]
Interpretación:
• Un valor de r cercano a 1 implica una relación lineal positiva alta. Esto es, incremento en x
se asocian con incrementos en y.
• Un valor de r cercano a -1 implica una relación lineal negativa alta. Esto es, incremento en x
se asocian con decrementos en y.
• Un valor de r cercano a 0 implica pequeña relación lineal entre los dos conjuntos de datos.
Usos:
• Cuando r2 >= 0.9 la relación es considerada predictiva y se puede usar con alta confianza
• Cuando r2 >= 0.7 y r2 < 0.9 existe una fuerte correlación que es adecuada para planificar
• Cuando r2 >= 0.5 y r2 < 0.7 existe una correlación apropiada para muchos propósitos. Se
puede usar para planificar pero con cautela.
• Cuando r2 < 0.5 no es fiable para propósitos de planificación