Professional Documents
Culture Documents
ESTADSTCA DESCRIPTIVA
Por
Joel Jos Torres de la Hoz - 1. 129. 579.534
Diego Jos Bueno Renhals 1.129.574.886
Edison Hernando Jimnez - 1.049.615.611
Deisy Galvn Perea 1.045.672.837
Marlon Carrillo Cervera 1.129.491.289
Grupo 100105_270
Presentado a
DANIEL FRANCISCO CHICA
INTRODUCCION
En el presente producto, los integrantes del grupo 270, pretendemos dejar en claro que se
afianzaron los conceptos acerca de regresin lineal simple y regresin lineal mltiple,
aplicndolo en ejercicios propuestos en los respectivos entornos prctico y de orden
colaborativo, inicialmente dejando los aportes individuales, elaborando diagramas de
dispersin y determinando el tipo de asociacin entre variables, aplicando mtodo
matemtico, para definir la influencia de una variable en otra, grado de relacin entre
variables.
Teniendo claros los conceptos entre todos los integrantes del grupo colaborativo
desarrollamos la fase de regresin aplicada al caso trabajado que hace alusin a la base de
datos de la secretaria de transito de Medelln, con respecto a los accidentes en el ao 2015,
de esta manera aplicando los conceptos adquiridos en las anteriores unidades del curso.
JUSTIFICACIN
OBJETIVOS
OBJETIVO GENERAL:
Aplicar conceptos de la unidad 3 del curso para la solucin de anlisis de datos con respecto
a una problemtica estudiada.
OBJETIVOS ESPECFICOS:
X Y
VELOCIDAD NUMERO DE Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionados
MUERTOS
33 1 VARIABLES CUANTITATIVAS x velocidad= independientes
38 1 VELOCIDAD y numero de mueros = dependiente
40 1 NUMERO DE MUERTOS Diagrama de Dispersion-varianbles cuantitativas
40 1 18
45 1 y = 0,1512x - 6,2438
16
45 2 R = 0,7907
14
48 1 determinar el tipo de asociacin entre las variables.
12
50 2
E je Y vel ocidad
10
50 2 La asociacion existente entre ambas variables es directa, ya que segn
8
50 2 la grafica el numero siguiente es mayor al anterior
50 2 6
51 2 4
55 2 Encuentre el modelo matemtico que permite predecir el efecto 2
55 1 de una variable sobre la otra. Es confiable? 0
55 2 -2 0 20 40 60 80 100 120
55 2 y = 0,1512x - 6,2438 -4
Eje X vel oci dad
55 2 R = 0,7907
55 2
60 2
60 2 r=coeficiente de correlacion 0,888819442
60 2 El coeficiente de determinacion nos arroja, que esta operacin es confiable en un 79%
62 2
63 2 Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
65 2 variables.
65 2 el resultado de la correlacion nos arroja como resultado un 0,88%, lo que quiere decir que la relacion entre las dos variables es aceptable
66 2
66 2
66 2
66 2
66 2
67 2
67 3
67 3
68 3
68 3 Relacionar la informacin obtenida con el problema
68 3
68 3 las variables escogidas, nos arrojan como resultado que la una depende de la otra,
68 3 es decir dependiendo de la velocidad se puede determinar la cantidad muertos existentes en el accidente de transito
69 3
5
X Y
No. muertos y Edad
No. Muertos edad
70
1 29
y = 2,1099x + 35,319
1 38
R = 0,0057
1 52 60
1 46
1 21 50
2 18
1 54
40
2 33
EDAD
2 52
2 38 30
2 46
2 29
EJE Y
20
2 17
1 22
2 55 10
2 60
2 33 0
2 32 0 0,5 1 1,5 2 2,5
2 46 No. Muertos
EJE X
2 55
2 19
2 21
2 42 a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables.
2 46 RESPUESTA: LA ASOCIACION ES DE TIPO DIRECTO; SE OBSERVA QUE LAS DOS VARIABLES TANTO X COMO Y VAN EN AUMENTO
2 36 b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?
2 35 RESPUESTA:
2 43 y = 2,1099x + 35,319
2 32 R = 0,0057
2 24 r = 0,0057
coeficiente de correlacin es la
0,0057=0,0754983
2 44
2 31 por lo tanto es confiable en un 87%
3 50 c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
3 30 RESPUESTA:
3 48 correlacion= 0,075 %, segn la tablano hay correlacin cuando 0 < r < 0.30
3 53 por lo tanto no hay corelacin entre las variables.
3 35
Anlisis
Entre el nmero de muertos y la edad no existe ninguna correlacin, sin embargo, las
dos variables van en aumento.
6
NUMERO DE GRADOS DE
ACIDENTE ALCOHOL
1 0,0 0,0 0,3 0,0 0,2 0,6 0,4 0,2 0,6 0,7 0,5
2 0,3 1,4 0,8 0,6 1,0 0,7 0,4 0,6 0,0 0,2 0,7
3 0,0
4 0,2
0,8 0,9 0,7 0,6 0,8 0,9 1,0 0,9 1,2 1,1
5 0,6 0,8 1,2 1,4 0,8 0,9 1,2 1,1 1.0
6 0,4 4,0
7 0,2 y = 0,0301x + 0,0204 0,0 0,3 0,0 0,2 0,6 0,4
3,0 0,2 0,6 0,7 0,5 1,4 0,8
8 0,6 R = 0,8725
0,6 1,0 0,7 0,4 0,6 0,0
9 0,7 2,0
0,2 0,7 0,8 0,9 0,7 0,6
10 0,5 1,0 0,8 0,9 1,0 0,9 1,2 1,1
11 1,4 0,8 1,2 1,4 0,8 0,9 1,2
0,0 1,1 1.0
12 0,8
0 50 100 150
13 0,6
14 1,0
15 0,7
16 0,4 el tipo de asociacion entre variables es directa por que tiene tendencia a que si la variable x tiene a aumentar la variable y hace lo mismo
17 0,6 el modelo matematico para estas variables es y = 0,0301x + 0,0204
18 0,0 R = 0,8725 segn este resultado es confiable un o,8 %
19 0,2 segn el grado de correlacion de estas dos variables es un 0,87 lo que lo posiciona como una relacion de tipo aceptable
20 0,7 segn el problema planteado y el resultado de las variables podemos decir que a mayor grado de alcohol mayor el indice de accidentes
21 0,8
22 0,9
23 0,7
7
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,96353445
Coeficiente de determinacin0,92839864
R^2
R^2 ajustado 0,9270603
Error tpico 0,25510313
Observaciones 110
ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crtico de F
Regresin 2 90,2876961 45,1438481 693,692512 5,4738E-62
Residuos 107 6,96330386 0,06507761
Total 109 97,251
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepcin -0,00225469 0,13635804 -0,01653507 0,98683832 -0,27256859 0,26805922 -0,27256859 0,26805922
Variable X 1 0,00328221 0,00279369 1,1748671 0,24265582 -0,00225595 0,00882038 -0,00225595 0,00882038
Variable X 2 0,02688228 0,001589 16,9176913 5,1695E-32 0,02373227 0,0300323 0,02373227 0,0300323
comparacion:R^2 = 0,9283 lo que quiere decir que si lo multiplicamos por 100 nos da un 92,83 de confiabilidad
lo que indica que la correlacion entre las variables es excelente dado que su valor esta entre el rango de 90 y 1
con lo antertior estadisticamente nos da la relacion de las tres variables de numero de accidentes, velocidad y grados
de alcohol y demuestra que entre mas aumenta el grado de alcohol mas aumenta la velocidad y el numero de
accidente, todo esto se encuentra bajo el modelo matematico y= -0,00225+0,00328 x1+0,02688 x2 con 92,83 grado de
confiabilidad
9
DAISY GALVAN
EJERCICIO 1
X Y Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables
(% de El tipo de asociacion es directa, ya que ambos ejes van en aumento
Hidro (Pureza) Diagrama proceso quimico
carburos) Encuentre el modelo matemtico que permite predecir el efecto
0,99 90,01 de una variable sobre la otra. Es confiable?
105
1,02 89,05
1,15 91,43 y = 14,947x + 74,283
Eje Y pureza
100 y = 14,947x + 74,283
1,29 93,74 R = 0,8774 R = 0,8774
1,46 96,73 95
1,36 94,45 90
0,87 87,59 r=coeficiente de correlacion 0,932737905
1,23 91,77 El coeficiente de determinacion nos arroja, que esta operacin es confiable en un 87% 85
1,55 99,42 0 0,5 1 1,5 2
1,4 93,65 Eje X porcentaje hidrocarburos
1,19 93,54 Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
1,15 92,52 variables.
0,98 90,56 el resultado de la correlacion nos arroja como resultado un 0,93%,
1,01 89,54 lo que quiere decir que la relacion entre las dos variables es excelente
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
10
EJERCICIO 2
X Y
EJERCICIO 3
X y
Diagrama obesidad y respuesta
(porcentaje de sobrepeso) (umbral de reflejo de individual al dolor.
relexion nociceptiva) 16
89 2 14
62 9 4 y = -0,0629x + 11,642
45 13 2
90 15
0
20 14 0 10 20 30 40 50 60 70 80 90 100
EJE X PORCENTAJE DE SOBREPESO
b. Ajuste un modelo matemtico que permita predecir el efecto de una variable sobre la otra. Es confiable?
y = -0,0629x + 11,642
R = 0,1115
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.
EJERCICIO 1
X Y
PROCESO QUMICO
% de Hidrocarburos Pureza
102
0,99 90,01
1,02 89,05
100
1,15 91,43
1,29 93,74
98
1,46 96,73
1,36 94,45
96
0,87 87,59
PUREZA
1,23 91,77
1,55 99,42 94
1,4 93,65
1,19 93,54 92
1,15 92,52
EJE Y
0,98 90,56 90
y = 14,947x + 74,283
1,01 89,54 R = 0,8774
1,11 89,85 88
1,2 90,39
1,26 93,25 86
1,32 93,41 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8
1,43 94,98 PORCENTAJE DE HIDRO CARBUROS
EJE X
0,95 87,33
coeficiente de correlacin
es la 0,87=0,932737905
EJERCICIO 2
X Y
MES TEMPERATURA CONSUMO DE VAPOR
Ene. 21 185,79
T Y CONSUMO DE VAPOR
Feb. 24 214,47 800
CONSUMO DE VAPOR
Mar. 32 288,03 700 y = 9,2087x - 6,3184
Abr. 47 424,84 600
R = 0,9999
May. 50 455 500
Jun. 59 539 400
Jul. 68 621,55
300
Ago. 74 675,06
200
Sep. 62 562,03
EJE Y
100
Oct. 50 452,93
Nov. 41 369,95 0
0 10 20 30 40 50 60 70 80
Dic. 30 273,98
EJE X T
coeficiente
de
correlacin
es la
0,99=0,994
EJERCICIO 3
X Y
Sobrepeso y Umbral de reflejo de flexin
% de Sobrepeso Umbral de reflejo de flexin nociceptiva
89 2
nociceptiva
90 3 16
14
75 4
SOBREPESO
12
30 4,5 10
51 5,5 8
75 7 6
62 9 4
EJE Y
45 13 2
0
90 15
0 20 40 60 80
20 14
c. Cul es el umbral de
reflejo de flexin
nociceptiva, cuando hay un
porcentaje de sobrepeso,
de 50?
RESPUESTA= 5,9
15
EJERCICIO 1
proceso quimico
102
100
y = 14,947x + 74,283
98 R = 0,8774
96
94 Y (Pureza)
92 Lineal (Y (Pureza))
90
88
86
0 0,5 1 1,5 2
el tipo de asociacion entre variables es directa por que tiene tendencia a que si la variable x tiene a aumentar la variable y hace lo mismo
EJERCICIO 2
800
700
600
500
400 Series1
200
y = 9,2087x - 6,3184
100
R = 0,9999
0
0 20 40 60 80
el tipo de asociacion entre variables es directa por que tiene tendencia a que si la variable x tiene a aumentar la variable y hace lo mismo
EJERCICIO 3
x y (umbral
(porcentaje de reflejo
de de flexin
sobrepeso) nociceptiva)
16
89 2
90 3 14
75 4 12
30 4,5 10
8 Series1
51 5,5
75 7 6 Lineal (Series1)
62 9 4
45 13 2
y = -0,0629x + 11,642
90 15 0 R = 0,1115
20 14 0 50 100
el tipo de asociacion entre variables es directa por que tiene tendencia a que si la variable x tiene a aumentar la variable y hace lo mismo
MARLON CARRILLO
y = 14,947x + 74,283
x=(y-74,283)/14,947
18
x=(51,4-74,283)/14,947
x= -1,5309
El porcentaje de hidrocarburo es de -1,5309, cuando la pureza es igual a 51,4.
EJERCICIO 2
Consumo de
Mes Temperatura
vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
EJERCICIO 3
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables.
19
est muy lejano a 1, por lo que se dice que no es confiable el modelo matemtico
porcentaje de peso.
20
siguiente:
y = -0.0629x + 11.642
muy lejos de 1.
y = -0.0629*50 + 11.642
y = 14.787
21
JOEL TORRES
EJERCICIO 1
X Y
% de Hidrocarburos Pureza PROCESO QUMICO
102
0,99 90,01
1,02 89,05
100
1,15 91,43
1,29 93,74
98
1,46 96,73
1,36 94,45
0,87 87,59 96
1,23 91,77
1,55 99,42 PUREZA 94
1,4 93,65
1,19 93,54 92
1,15 92,52
EJE Y
0,98 90,56 90
y = 14,947x + 74,283
1,01 89,54 R = 0,8774
1,11 89,85 88
1,2 90,39
1,26 93,25 86
1,32 93,41 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8
1,43 94,98 PORCENTAJE DE HIDRO CARBUROS
EJE X
0,95 87,33
coeficiente de correlacin
es la 0,87=0,932737905
confiable 87%
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
el grado de relacion es Excelente por la correlacion del 93%
22
EJERCICIO 2
MES TEMPERATURA CONSUMO DE VAPOR
Ene. 21 185,79 T Y CONSUMO DE VAPOR
Feb. 24 214,47 800
CONSUMO DE VAPOR
Mar. 32 288,03 y = 9,2087x - 6,3184
700
Abr. 47 424,84 R = 0,9999
600
May. 50 455 500
Jun. 59 539 400
Jul. 68 621,55
300
Ago. 74 675,06
200
Sep. 62 562,03
100
Oct. 50 452,93
0
EJE Y
Nov. 41 369,95
0 10 20 30 40 50 60 70 80
Dic. 30 273,98
EJE X T
y = 20,87x - 6,3184
R = 0,9999
r = 0,99
coeficiente
de
correlacin
es la
0,99=0,994
CONFIABLE UN 99%
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
LA RELACION ES EXCELENTE POR LA CORRELACION DEL 99%
23
EJERCICIO 3
X Y
Umbral de reflejo Sobrepeso y Umbral de reflejo de
de flexin flexin nociceptiva
% de Sobrepeso nociceptiva 16
89 2 14
SOBREPESO
90 3 12
75 4 10
30 4,5 8
51 5,5 6
75 7
EJE Y
4
62 9
2
45 13
0
90 15 0 20 40 60 80 100
20 14
y = 0,0629x + 11,642
R = 0,1115
R = 0,11
coeficiente de
correlacin es la
0,11=0,3316
CONFIABLE UN 33%
CONCLUSIONES
REFERENCIAS BIBLIOGRAFICAS