You are on page 1of 18

UNIDAD 2: PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN

DETALLAR Y RELACIONAR VARIABLES DE LA PROBLEMÁTICA


UTILIZANDO MEDIDAS BIVARIANTES.

GERALDINE MARLEDY HERRERA 1006736657


KATHLEEN MICHEL RAMOS 1120387380

GRUPO: 104

TUTORA:
NAHURY YAMILE CASTELLANOS

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA. UNAD


ESTADISTICA DESCRIPTIVA
AGOSTO, 2018
INTRODUCCIÓN

Además de conocer cifras, datos estadísticos que nos muestren la realidad de alguna

situación particular, también es necesario establecer las tendencias de esos datos,

interpretarlas y arrojar ideas que redunden en estrategias que permitan enfocar soluciones a

los problemas que ya están cuantificados.

Se evidencia el diagrama de dispersión de dichas variables (elegidas por los

compañeros de trabajo) y la determinación del tipo de asociación entre las variables también

se encuentra el modelo matemático que permite predecir el efecto de una variable sobre la

otra y la deducción de si es confiable o no lo es, siguiendo a esto se determina el grado de

relación de las dos variables elegidas por cada estudiante y se evidencia la relación que existe

entre la información obtenida con el problema.

Podemos ver que la descripción de la información es detallada, de manera concisa en

cuanto al tema de regresión y correlación lineal. Se hace con el fin de comprender y entender

que los datos son muestra de nuestra realidad. Es de vital importancia saber, conocer y

analizar todo tipo de proceso donde se logre describir de manera correcta y a la vez se logren

crear mejores y más claras estrategias estadísticas.


JUSTIFICACIÓN.

En esta actividad se estudia las medidas de tendencia central que se utilizan para

describir y establecer comparaciones cuantitativas entre distribuciones de frecuencias. Desde

la promulgación de la ley 1696 del 19 de diciembre del 2013, que incrementa las sanciones

económicas y disciplinarias a las personas sorprendidas conduciendo bajo los efectos de

bebidas alcohólicas.

Tomamos ciertos factores donde analizamos diferentes situaciones para calcular los

datos estadísticos son lo que todos somos. Por esto se hace necesario entenderlos, saber

analizarlos y sobre todos, poder describirlos, con el ánimo de generar conciencia, planear

estrategias o simplemente dar una información veraz y sobre todo ajustada a esa realidad que

se nos presenta en forma de datos estadísticos.

Entendemos que esto no es posible sólo con ver la cantidad de cifras de la información

que nos la secretaria de tránsito es muy necesario conocer las tendencias directas o indirectas,

establecer la confiabilidad de estas asociaciones y poder establecer el grado de correlación

de la información representada en las variables estudiadas para después proceder a interpretar

esos datos estadísticos y establecer tendencias claras acerca de lo que realmente está

sucediendo.
OBJETIVOS

Objetivo General.

Reconocer cuales son los procesos para calcular la dispersión y la regresión con

medidas de tendencia central.

Objetivos específicos:

 Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de

asociación entre las variables.

 Encontrar el modelo matemático que permite predecir el efecto de una variable

sobre la otra y deducir si es o no confiable.

 Determinar el grado de relación de las dos variables.

 Relacionar la información obtenida con el problema.


ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS DOS VARIABLES
CUANTITATIVAS SELECCIONADAS.

Kathleen Michel Ramos.

Variables: Número de heridos y Grados de alcohol del conductor.

Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.

Accidentes de tránsito
Diagrama de disperción
04

03
Gra os de alcohol del conductor

03

02

02 y = 0,0012x + 1,0696
R² = 1E-05
01

01

00
0 5 10 15 20
Número de Heridos

NO LINEAL Porque no hay una relación entre ambas variables donde se una aumenta la otra disminuye por lo que no hay una conexión entre ambas .
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

y = 0,0012x + 1,0696
R² = 0,00005 Coeficiente de determinación = 0,005%
Confiabilidad = 0,005% No es nada confiable

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= Coeficiente de correlación R= Raíz cuadrada de 0,00005


R= 0,007% es muy minima

Resultados obtenidos:

Con los resultados obtenidos se puede asegurar que


la ecuación de la recta es de tipo no lineal donde a medida
que aumenta el número de heridos se disminuye o se eleva
el grado de alcohol del conductor.
La correlación entre las dos variables es minima
con un R= 0,007% también es posible afirmar que este modelo
no es recomendable debido a que posee un grado de
confiabilidad muy bajo R² = 0,00005%
Geraldine Herrera
Variables cuantitativas de la situación estudiada que puedan estar relacionadas

Accidentes en Pereira
4,5
4 y = 0,0144x - 0,0788
3,5 R² = 0,0765
Número de muertos

3
2,5
2
1,5
1
0,5
0
0 20 40 60 80 100 120 140 160
Velocidad

Tipo de asociación entre las variables No lineal


El número de muertos no tiene que ver con la velocidad en que conduce el conductor
En algunos accidentes hay muertos en otros casos no los hay y no tiene que ver con la velocidad

Modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
y= 0,0144x - 0,0788
R² = 0,0765
Confiabilidad = R² (100)
Confiabilidad = 7,88 %
Es muy poco confiable

Grado de relación de las dos variables


Coeficiente de correlación = Raiz cuadrada de R²
Coeficiente de correlación = 0,27
Correlación mínima
Resultados obtenidos

Las variables Numero de muertos vs velocidad: nos arroja una gráfica muy dispersa

por lo que no es lineal, según el modelo matemático que permite predecir el efecto de una

variable sobre la otra y= 0,0144x - 0,0788 y R² = 0,0765 obtenemos una confiabilidad de

7,8% es decir muy poco confiable y con el resultado de la correlación de 0,27 podemos

deducir que la relación es mínima

CONCLUSIONES
Los resultados estadísticos obtenidos nos indican que no hay relación entre las

variables Grados de alcohol del conductor vs Número de heridos ni entre las variables

Velocidad vs Número de muertos en la información obtenida en 100 accidentes de tránsito

en la ciudad de Manizales ocurridos durante el año 2017 esto se demuestra mediante gráficas

de dispersión donde los modelos matemáticos nos permiten predecir que el efecto de una

variable sobre la otra no es confiable y que el grado de relación entre variables es mínimo.
BIBLIOGRAFÍA

García, M.S. (2004). Introducción a la estadística económica y empresarial.

Paraninfo. Páginas 74 – 98. Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.

Paginas. 130 – 172. Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México

City: Cengage Learning. Páginas 675 – 686 Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de

mercados. México City: Cengage Learning. Páginas 686 – 695.Recuperado de:


http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

Montero, J.M. (2007). Regresión y Correlación Múltiple. Madrid: Paraninfo.

Páginas 191 – 225. Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

ANEXOS

Laboratorio de regresión y correlación lineal.

Kathleen Ramos

 Ejercicio 1:

El rendimiento del producto de un proceso químico está relacionado con la

temperatura de operación del proceso. Se desea establecer la relación que existe entre la

pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el

condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:


PROCESO QUIMICO

X (% de Hidro carburos) Y (Pureza) A. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
0,99 90,01
1,02 89,05 DIAGRAMA DE DISPERCIÓN
1,15 91,43
1,29 93,74
PROCESO QUIMICO
102
1,46 96,73
1,36 94,45 100
0,87 87,59 98 y = 14,947x + 74,283
1,23 91,77 R² = 0,8774
1,55 99,42 96

(Pu re za )
1,4 93,65 94
1,19 93,54
1,15 92,52 92
Y

0,98 90,56 90
1,01 89,54
1,11 89,85 88

1,2 90,39 86
1,26 93,25 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8
1,32 93,41 X (% de Hidro carburos)
1,43 94,98
0,95 87,33
LINEAL SI AUMENTA UNA MAGNITUD LA OTRA AUMENTA- SI DISMINUYE UNA MAGNITUD LA OTRA TAMBIEN DISMINUYE

B. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?

Y= bx + a De acuerdo al resultado obtenido de


y = 14,947x + 74,283 confiabilidad con un 87,74.
R² = 0,8774 coeficiente de determinación= 87% confiabilidad= 87,70 se asegura con certeza que es confiable

C. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= Coeficiente de correlación R= Raíz cuadrada de 0,8774


R= 0,93% es excelente

D. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


Con los resultados obtenidos se puede asegurar que
Y= Pureza
la ecuación de la recta es de tipo lineal donde si una
X= Hidrocarburo? de las variables % de hidrocarburos y pureza aumenta
Cuando el oxigeno es igual a 91,3 el la otra igual. El R2 afirma además que el modelo explica
Y= 91,3 el 0,84774 % de la información y el valor de R= 0,93%,
91,3 = 14,947x + 74,283
porcentaje del hidrocarburo
será 1,13%. confirma además una correlación muy buena entre las
91,3- 74,283= 14,947x variables X y Y del proceso quimico.
17,02/ 14,947= X

X=1,13 %
 Ejercicio 2:

El número de libras de vapor (y) consumidas mensualmente por una planta química, se

relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron

los siguientes valores de temperatura y consumo anual.

PLANTA QUÍMICA
2014 Registros de
temperatura y consumos de
vapor. A. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Consumo Consumo mensual de vapor y temperatura


Temperatura
Mes
(°F)
de vapor 800 por una planta química
(Lb)
700 y = 9,2087x - 6,3184
Ene. 21 185,79 R² = 0,9999
Feb. 24 214,47 600

Mar. 32 288,03
Temperatura (°F)

500
Abr. 47 424,84 400
May. 50 455
300
Jun. 59 539
Jul. 68 621,55 200
Ago. 74 675,06 100
Sep. 62 562,03
0
Oct. 50 452,93 0 10 20 30 40 50 60 70 80
Nov. 41 369,95 Consumo de vapor (Lb)
Dic. 30 273,98
LINEAL Si aumenta una magnitud la otra aumenta- si disminuye una magnitud la otra también disminuye.
B. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable?

Y= 9,2087x - 6,3184
R² = 0,9999 Coeficiente de determinación = 99%
Confiabilidad = 99,99% es bastante confiable.
Es de tendencia positiva, donde existe una relación
C. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. de tipo lineal entre la temperatura y el consumo de vapor
por lo tanto el número de libras de vapor consumidas
R= Coeficiente de correlación R= Raíz cuadrada de 0,9999 mensualmente por una planta quimica si se relaciona con
R= 0,99% es excelente la temperatura en °F, su relación es excelnte. El R2 con un
resultado de 0,999 afirma que posee un alto grado de
D. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF? confiabilidad con un promedio de 99,99% con base en los
resultados obtenidos por el registro de temperatura y
Y= Consumo del vapor? consumos de vapor de la planta quimica.
X= Temperatura en °F
X= 70° Cuando la temperatura es igual a 70°
el consumo de vapor será de:
y= 9,2087x + 6,3184 650,9%.
y= 9,2087(70) + 6,3184
y = 644,609 + 6,3184
Y = 650,9%

 Ejercicio 3:

Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual

al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor

se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de

sensación de punzada. Obsérvese que ambas, X e Y, son variables aleatorias

LA OBESIDAD Y EL DOLOR

X Y
(porcentaje (umbral de reflejo
de sobrepeso) de flexión nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
A. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

OBESIDA Y RESPUESTA INDIVIDUAL AL


DOLOR

Y (Umbral de Reflejo de flexión nociceptiva)


16
14
12
10 y = -0,0629x + 11,642
R² = 0,1115
8
6
4
2
0
0 20 40 60 80 100
X (porcentaje de sobrepeso)

NO LINEAL PORQUE NO TIENE UNA RELACIÓN ENTRE AMBAS VARIABLES DONDE SI UNA AUMENTA LA OTRA DISMINUYE POR LO QUE NO HAY UNA CONEXIÓN ENTRE AMBAS

B. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable?

y= 0,0629x + 11,642
R² = 0,1115 Coeficiente de determinación = 11,15%
Confiabilidad = 11,15% Es muy poco confiable
Con los resultados obtenidos se puede asegurar que
C. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. la ecuación de la recta es de tipo no lineal donde a medida
que aumenta el % de sobrepeso, disminuye el umbral de reflejo
R= Coeficiente de correlación R= Raíz cuadrada de 0,1115 de reflexión. La correlación entre las dos variables es minima
R= 0,33% es minima con un 0,33%, también es posible afirmar que este modelo
no es recomendable debido a que posee un grado de
D. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso, de 40? confiabilidad muy bajo R² = 11,15%

Y= Umbral de reflejo de reflexión nociceptiva?


X= Porcentaje de sobrepeso
No se calcula porque el umbral de reflejo
X= 40% Sobrepeso de reflexión nociceptivo será muy bajo
Y= 0,0629x + 11,642 ya que el coeficiente de correlación es
minimo.

Geraldine Herrera
Proceso Químico
102

PUREZA DEL OXIGENO PRODUCIDO


100
98 y = 14,947x + 74,283
R² = 0,8774
96
94
92
90
88
86
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8
% de Hidrocarburos

Es Lineal: Cuando aumenta % de hidrocarburos aumenta la pureza del osigeno producido Es decir que es directamente proporcional

Modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable
y= 14,947x + 74,283
R² = Coeficiente de determinación 87% Confiabilidad = 87,74 …Es confiable Coeficiente de correlación = 0,93
Coeficiente de correlación=Raíz cuadrada de R²
Porcentaje de explicación del modelo y el grado de relación de las dos variables.
Coeficiente de correlación = 0,93
Correlación excelente

Porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3? 1,138% de hidrocarburo Y= 91,3
X %hidrocarburos?
y= 14,947x + 74,283

y= 91,3

Reemplazando

91,3=14,947x +74,283
91,3 - 74,283 = 14,947x
17,017=14,947x
17,017/14,947x

X = 1,138

1,138% de hidrocarburo
Planta Química
800
700 y = 9,2087x - 6,3184
R² = 0,9999
600

Consumo de Vapor Lbs 500


400
300
200
100
0
0 10 20 30 40 50 60 70 80
Temperatura °F

Es lineal porque al aumentar la temperatura aumenta el consumo de vapor

Modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable?
y= 9,2087x - 6,3184
R² = 0,9999 = Coeficiente de determinación = 99%
Confiabilidad = 99,99% es muy confiable

Porcentaje de explicación del modelo y el grado de relación de las dos variables.


Coeficiente de correlación=Raíz cuadrada de R²
Coeficiente de correlación = 0,999 Correlación excelente

Cuál es el de consumo de vapor cuando la temperatura es de 70 oF? 638,2906

y= 9,2087x - 6,3184
y= 9,2087(70) - 6,3184
y = 644,609 - 6,3184
y = 638,2906
16
Umbral de Reflejo de flexión nociceptiva

14
y = -0,0629x + 11,642
12 R² = 0,1115

10

0
0 10 20 30 40 50 60 70 80 90 100
Porcentaj e de s obrepes o

No es lineal El porcentaje de sobrepeso no tiene relación con el umbral de reflejo de flexión nociceptiva

Modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable .

y= 0,0629x + 11,642
R² = 0,1115
Confiabilidad = 11,15% 0,1115 x 100
Poco confiable

Porcentaje de explicación del modelo y el grado de relación de las dos variables.


Coeficiente de correlación=Raíz cuadrada de R²
Coeficiente de correlación= 0,333
Correlación mínima

¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso, de 40?
y= 0,0629x + 11,642

No se
calcula
porque el
umbral de
reflejo de
recepción
nociceptivo
es muy bajo
debido a
que el
coeficiente
de
correlacion
es minimo

You might also like