You are on page 1of 11

SEP SEV DGEST DITD

UNIDAD ACADÉMICA DE “TEMPOAL DE SANCHEZ”


NOMBRE DE LA CARRERA
INGENIERIA INDUSTRIAL
CUARTO SEMESTRE
GRUPO
I-I 4

MATERIA
ESTADÍSTICA INFERENCIAL II

TRABAJO
INVESTIGACIÓN DE REGRESIÓN LINEAL MÚLTIPLE

DOCENTE:
ING. JIMENA TREJO CÁRDENAS

PRESENTA:
KAREN EDITH GONZÁLEZ JAIMES 163S0466

Tempoal de Sánchez Ver: a 28 de mayo del 2018.


INTRODUCCIÓN

la Estadística Inferencial nos permite trabajar con una variable a nivel de intervalo o razón, así también
se puede comprender la relación de dos o más variables y nos permitirá relacionar
mediante ecuaciones, una variable en relación de la otra variable llamándose Regresión Lineal y una
variable en relación a otras variables llamándose Regresión múltiple.
Casi constantemente en la práctica de la investigación estadística, se encuentran variables que de
alguna manera están relacionados entre sí, por lo que es posible que una de las variables puedan
relacionarse matemáticamente en función de otra u otras variables.
El análisis de regresión múltiple puede mirarse como una extensión del análisis de regresión simple al
caso en que existan dos o más variables explicativas o independientes. Se analiza lo que estas
variables independientes aportan, en conjunto para explicar una variable respuesta o dependiente en
escala de intervalos continua y con distribución normal. Es decir, es útil para estudiar fenómenos en
que intervienen múltiples factores para describir la relación entre la variable dependiente y las variables
independientes o para predecir el valor de la variable dependiente para los valores conocidos de las
variables independientes. Para cumplir estos objetivos es necesario buscar un modelo que se ajuste
a los datos disponibles.

En muchas situaciones prácticas existen varias variables independientes que se cree que influyen o
están relacionadas con una variable de respuesta Y, y por lo tanto será necesario tomar en cuenta si
se quiere predecir o entender mejor el comportamiento de Y. Por ejemplo, para explicar o predecir el
consumo de electricidad en una casa habitación tal vez sea necesario considerar el tipo de residencia,
el número de personas que la habitan, la temperatura promedio de la zona, etcétera.
1.1 REGRESIÓN LINEAL MÚLTIPLE.

La regresión lineal es una técnica estadística destinada a analizar las causas de por qué pasan las
cosas. A partir de los análisis de regresión lineal múltiple podemos:
 identificar que variables independientes (causas) explican una variable dependiente
(resultado)
 comparar y comprobar modelos causales
 predecir valores de una variable, es decir, a partir de unas características predecir de forma
aproximada un comportamiento o estado.
La regresión lineal múltiple es la gran técnica estadística para comprobar hipótesis y relaciones
causales. Ante de empezar, una serie de condiciones que se deben cumplir para poder aplicar la
regresión lineal múltiple:
La variable dependiente (resultado) debe ser ordinal o escalar, es decir, que las categorías de la
variable tengan orden interno o jerarquía, p.ej. nivel de ingresos, peso, número de hijos, justificación
del aborto en una escala de 1-nunca a 10-siempre.
Las variables independientes (causas) deben ser ordinales o escalares o dummy
Hay otras condiciones como: las variables independientes no puede estar altamente correlacionadas
entre sí, las relaciones entre las causas y el resultado deben ser lineales, todas variables deben seguir
la distribución normal y deben tener varianzas iguales. Estas condiciones no son tan estrictas y hay
maneras de tratar los datos si se incumple.
El Análisis de Regresión Lineal Múltiple nos permite establecer la relación que se produce entre una
variable dependiente Y y un conjunto de variables independientes (X1, X2, ... XK). El análisis de
regresión lineal múltiple, a diferencia del simple, se aproxima más a situaciones de análisis real puesto
que los fenómenos, hechos y procesos sociales, por definición, son complejos y, en consecuencia,
deben ser explicados en la medida de lo posible por la serie de variables que, directa e indirectamente,
participan en su concreción.
Al aplicar el análisis de regresión múltiple lo más frecuente es que tanto la variable dependiente como
las independientes sean variables continúas medidas en escala de intervalo o razón. No obstante,
caben otras posibilidades: (1) también podremos aplicar este análisis cuando relacionemos una
variable dependiente continua con un conjunto de variables categóricas; (2) o bien, también
aplicaremos el análisis de regresión lineal múltiple en el caso de que relacionemos una variable
dependiente nominal con un conjunto de variables continuas.
Aplicación de regresión múltiple
Mediante el siguiente problema podremos ilustrar la aplicación de Regresión Múltiple:
En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se
quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo
cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las
asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.

Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje
reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos,
Base de Datos y Programación.
Se presentará la siguiente ecuación a resolver:

Utilizando las fórmulas de las ecuaciones normales a los datos obtendremos los coeficientes de
regresión o utilizando Regresión de Análisis de datos, en la Hoja de Cálculo de Excel podemos
calcular también los coeficientes de regresión:
Por lo tanto podemos construir la ecuación de regresión que buscamos:

El error Estándar de regresión múltiple


Mediante esta medida de dispersión se hace más preciso el grado de dispersión alrededor del plano
de regresión, se hace más pequeño.
Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error típico y para explicar la relación del aprendizaje de PHP
que se viene desarrollando es de 0.861
El coeficiente de determinación múltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las variables múltiples,
utilizando la siguiente formula:

(Erica Taucher. (1997). Bioestadística. Santiago de Chile: Editorial universitaria.)


1.1.1 PRUEBAS DE HIPÓTESIS EN REGRESIÓN
LINEAL MÚLTIPLE
Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe suficiente
evidencia en una muestra de datos para inferir que cierta condición es válida para toda la población.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población:
-Hipótesis Nula: Por lo general la hipótesis nula es un enunciado de que ¨no hay efecto¨
-Hipótesis Alternativa: Es el enunciado que se desea poder concluir que es verdadero.
Existen diferentes métodos o procedimientos para realizar una Prueba de Hipótesis, dependiendo del
tipo de problema y de la información con que se cuenta. Sin embargo, todos los procedimientos
incluyen los siguientes 5 pasos:
Paso 1:
Plantear Hipótesis Nula e Hipótesis Alternativa.
La Hipótesis Nula se denota normalmente como Ho y la Hipótesis Alternativa como H1
Paso 2:
Determinar Nivel de Significancia.
El nivel de significancia indica la probabilidad de rechazar la hipótesis nula cuando es verdadera y se
denota con la letra griega: a
Paso 3:
Evidencia de la Muestra.
Se refiere al cálculo de la media y la desviación estándar a partir de la muestra.
En caso de Prueba de Hipótesis para Proporciones, entonces se refiere al cálculo e las proporciones
de acuerdo a los datos
Paso 4:
Aplicación de la Distribución de Probabilidad apropiada.
Las dos Distribuciones de Probabilidad que se usan dependiendo de los datos son: Distribución
Normal y Distribución "t" de Student.
La Distribución Normal de usa cuando tenemos una muestra grande (generalmente se considera
muestra grande cuando el tamaño es mayor o igual a 30
Paso 5:
Toma de decisión
Se calculan la Región de Rechazo y Región de No Rechazo de la Hipótesis Nula.
Para calcular las Regiones es importante considerar si el problema es de Una Cola o de Dos Colas.
Medias
Requisitos:
 La muestra es aleatoria simple
 Se conoce el valor de la desviación estándar
 Se desconoce el valor de la desviación estándar
 Es una distribución normal
 El número de muestra es mayor a 30.
Desviación Estándar:
Requisitos:
 La muestra es aleatoria simple
 La población tiene una distribución normal

1.1.2 INTERVALOS DE CONFIANZA Y PREDICCIÓN


EN REGRESIÓN MÚLTIPLE
¿Qué es un intervalo de confianza ?
Es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor
de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que
dos muestras de una población en particular generen intervalos de confianza idénticos.
El intervalo de confianza se determina calculando una estimación de punto y luego determinando su
margen de error.
Estimación de punto
Este valor individual estima un parámetro de población usando los datos de su muestra.
Margen de error
La estimación está sujeta a error de muestreo aleatorio. El margen de error cuantifica este error e
indica la precisión de su estimación.
Ejemplo:
Una encuesta política podría indicar que el nivel de popularidad de un candidato es de 55% con un
margen de error de 5%. Esto significa que el nivel de popularidad real es +/- 5% y, por lo tanto, se
ubica entre 50% y 60%.
I. de C. Bilateral
El margen de error es la distancia desde el estadístico estimado hasta el valor de cada intervalo de
confianza. Cuando un intervalo de confianza es simétrico, el margen de error es la mitad del ancho
del intervalo de confianza.
Ejemplo:
la longitud media estimada de un árbol de levas es 600 mm y el intervalo de confianza oscila entre
599 y 601. El margen de error es 1.
Mientras mayor sea el margen de error, más ancho será el intervalo y menos seguro podrá estar del
valor de la estimación de punto.
Predicción de regresión
Regresión Simple: Se presenta cuando una variable independiente ejerce influencia sobre otra
variable dependiente. Ejemplo: Y = f(x)
Regresión Múltiple: Se presenta cuando dos o más variables independientes influyen sobre una
variable dependiente. Ejemplo: Y = f (x, w,).
La ecuación de Predicción de Regresión Simple permite hacer predicciones de una variable en función
de otra. La posibilidad de predicción aumenta si utilizamos más de una variable predictor. Para resolver
esta cuestión se define la ecuación de Regresión Múltiple (puntuaciones directas):
Y=A + B_1X_1+B_2X2
Xi: Variable predictor (o explicativa).
Bi: Coeficiente de la variable predictor Xi
A: Interceptal o constante
(Richard I. Levin. (2004). Estadística para administradores. México: PEARSON EDUCACION.)

1.1.3 USO DE UN SOFTWARE ESTADÍSTICO

Las nuevas tecnologías han venido a cambiar por completo el panorama tradicional de cómo se
hacían, se veían y se enseñaban las matemáticas. Introducirse en este nuevo panorama implica
realizar profundos cambios en los programas educativos.
Es muy amplia la variedad de aplicaciones informáticas disponibles para estadística y probabilidad:
Excel/Calc
La hoja de cálculo Excel o Calc (Open Office) es un software considerado como estándar en todos los
entornos (educativo, profesional, familiar, etc.), que posee la virtud de presentar una interfaz
agradable, una facilidad de uso digna de elogio y permite realizar análisis estadísticos simples o más
complejos y avanzados.
JavaScript
JavaScript, es un lenguaje de programación de páginas web de lado del cliente, nos permite añadir a
las páginas web efectos y funciones adicionales a los contemplados en el estándar HTML. Gracias a
que se ejecuta en el navegador(localmente), JavaScript, nos permite responder de manera rápida y
eficaz a las acciones del usuario, creando de esta manera aplicaciones interactivas
Apple de Java
El lenguaje Java se puede usar para crear los applets de Java. Un Apple es un elemento más de una
página web, como una imagen o una porción de texto. Cuando el navegador carga la página web, el
Apple insertado en dicha página se carga y se ejecuta.
Proyecto Descartes
Descartes (M.E.C.) es un programa realizado en lenguaje Apple de java que se caracterizan porque
crean "escenas" que se pueden insertar en las páginas web. Descartes no sólo convierte una web en
una web interactiva, sino que, además, es configurable, es decir, que los usuarios (profesores) pueden
"programarlo" para que aparezcan diferentes elementos y distintos tipos de interacción.
Software Libre
"Software Libre" es un asunto de libertad, no de precio. ‘Software Libre'' se refiere a la libertad de los
usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software.
Otros Software estadísticos:
Destacamos para el entorno educativo: SPSS, S-PLUS, MINITAB, STATGRAPHICS.

1.2 REGRESION NO LINEAL

Regresión no lineal es un método para encontrar un modelo no lineal para la relación entre la variable
dependiente y un conjunto de variables independientes. A diferencia de la regresión lineal tradicional,
que está restringida a la estimación de modelos lineales, la regresión no lineal puede estimar modelos
con relaciones arbitrarias entre las variables independientes y las dependientes. Esto se lleva a cabo
usando algoritmos de estimación iterativos. Tenga en cuenta que este procedimiento no es necesario
para los modelos polinómicos simples de la forma Y = A + BX**2. Definiendo W = X**2, obtenemos un
modelo lineal simple, Y = A + BW, que se puede estimar usando métodos tradicionales como el
procedimiento Regresión lineal.
Ejemplo. ¿Puede pronosticarse la población basándose en el tiempo Un diagrama de dispersión
muestra que parece haber una estrecha relación entre la población y el tiempo, pero la relación es no
lineal y por eso exige la utilización de los métodos de estimación especiales del procedimiento
Regresión no lineal? Creando una ecuación adecuada, como la del modelo logístico de crecimiento
poblacional, podemos obtener una buena estimación del modelo, lo que nos permitirá hacer
predicciones sobre la población para épocas que no se han sido medidas.
Estadísticos. Para las iteraciones: estimaciones de los parámetros y suma de cuadrados residual.
Para los modelos: suma de cuadrados para regresión, residual, total corregido y no corregido,
estimaciones de los parámetros, errores estándar asintóticos y matriz de correlaciones asintóticas de
estimaciones de los parámetros.
Regresión no lineal: Consideraciones sobre los datos
Datos. Las variables dependientes e independientes deben ser cuantitativas. Las variables
categóricas, como la religión, la mayoría de edad o el lugar de residencia, han de recodificarse como
variables binarias (dummy) o como otro de los tipos de variables de contraste.
Supuestos. Los resultados son válidos sólo si se ha especificado una función que describa con
precisión la relación entre las variables independientes y las dependientes. Además, la elección de
buenos valores iniciales es muy importante. Incluso si se ha especificado la forma funcional correcta
para el modelo, si no utiliza valores iniciales adecuados, puede que su modelo no logre converger o
puede que obtenga una solución que sea óptima localmente en vez de una que sea óptima
globalmente.
Procedimientos relacionados. Muchos modelos que en un principio parecen ser no lineales pueden
ser transformados en un modelo lineal, el cual pueda ser analizado usando el procedimiento Regresión
lineal. Si no está seguro de cuál es el modelo adecuado, el procedimiento Estimación curvilínea puede
ayudarle a identificar relaciones funcionales útiles que estén presentes en los datos.
Para obtener un análisis de regresión no lineal
Esta característica requiere la opción Regresión.
1. Elija en los menús:
Analizar > Regresión > No lineal...
2. Seleccione una variable numérica dependiente de la lista de variables del conjunto de datos
activo.
3. Para generar una expresión para el modelo, introduzca la expresión en el campo Expresión del
modelo o bien pegue en el campo los componentes (variables, parámetros, funciones).
4. Identifique los parámetros del modelo pulsando en Parámetros.
Un modelo segmentado (uno que adquiere diferentes formas en distintas partes de su dominio) se
debe especificar usando la lógica condicional dentro de la declaración única del modelo.
(Armando L. Pez Zamudio. (2012). Regresión Lineal y No Lineal En Contexto. México: Academia
Española.)
CONCLUSIÓN

La finalidad de este trabajo es tener conocimiento acerca de estos temas ya que son aplicables en la
vida cotidiana. El análisis de regresión lineal es una técnica estadística utilizada para estudiar la
relación entre variables. Se adapta a una amplia variedad de situaciones.
En la investigación social, el análisis de regresión se utiliza para predecir un amplio rango de
fenómenos, desde medidas económicas hasta diferentes aspectos del comportamiento humano. En
el contexto de la investigación de mercados puede utilizarse para determinar en cual de diferentes
medios de comunicación puede resultar más eficaz invertir, o para predecir el número de ventas de
un determinado producto. En física se utiliza para caracterizar la relación entre variables o para calibrar
medidas, etc.
la estadística nos permite tratar de entender, organizar y tomar decisiones que estén de acuerdo con
los análisis efectuados. La estadística juega un papel muy importante en nuestras vidas, ya que
actualmente ésta se ha convertido en un método muy efectivo para describir con mucha precisión los
valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, además, sirve
como herramienta para relacionar y analizar dichos datos.
El trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y tabular los
datos, sino sobre todo en el proceso de interpretación de esa información, ahora tiene un papel
mucho más importante del que tenía en años pasados.

REFERENCIAS

 (Armando L. Pez Zamudio. (2012). Regresión Lineal y No Lineal En Contexto. México:


Academia Española.)
 Daniel A. Robles Fabián. (2014). Regresión múltiple. 26 de mayo del 2018, de Universidad
"Inca Garcilaso de la Vega" Sitio web: http://www.monografias.com/trabajos30/regresion-
multiple/regresion-multiple.shtml#ixzz5GlmSzsGc
 (Erica Taucher. (1997). Bioestadística. Santiago de Chile: Editorial universitaria.)
 Edgar Acuña Fernández. (2002). REGRESIÓN LINEAL MÚLTIPLE. 26 de mayo del 2018, de
Universidad de Puerto Rico Sitio web: http://academic.uprm.edu/eacuna/cap2sl.pdf
 GUILLERMO RIVAS M. (2014). Regresión no lineal. 26 de mayo del 2018, de Universidad
Nacional de Colombia Sitio web: http://www.bdigital.unal.edu.co/15397/1/10003-18133-1-
PB.pdf
 (Richard I. Levin. (2004). Estadística para administradores. México: PEARSON
EDUCACION.)

You might also like