Professional Documents
Culture Documents
TUTOR:
ROBERTO MARIO DE LEN
GRUPO: 204040-53
ESTUDIANTES
IBETH IBEZ TORRES
ERLEIDYS ISABEL FLORES
MILEXANDRA LOPEZ
SILVANA MARGARITA ACEVEDO
INTRODUCCIN
Continuas elegidas se disea una tabla de frecuencia para datos agrupados y calculan las
medidas de tendencia central, los cuartiles, deciles 5, 7 y percentiles 50 y 75
Se podr encontrar adems, un segundo punto en el cual el grupo colaborativo realiza
clculos con las variables elegidas Discretas y Continuas, calcula las medidas univariantes
absolutas y relativas de dispersin para variables cuantitativas Discretas y Continuas como son
rango, varianza, desviacin tpica y coeficiente de variacin, igualmente la respectiva
Interpretacin de los resultados obtenidos y asociados con el problema objeto de estudio;
realizando las operaciones, tablas, diagramas, necesarios para llegar a un resultado.
JUSTIFICACIN
La estadstica descriptiva es una herramienta de gran importancia en cualquier proceso
de investigacin, ya sea de tipo cualitativo o cuantitativo, por lo que, la Estadstica Descriptiva
puede definirse como una ciencia que facilita los mtodos precisos para la obtencin de la
informacin numrica de base sino que, adems, proporciona mtodos objetivables de anlisis de
esa informacin recogida y, en general, mtodos de investigacin aplicables al resto de las
Ciencias Garca S. Martha (2005).
Por lo anterior es necesario entender, el concepto Medidas Estadsticas Univariantes, los
diferentes conceptos estudiados en el presente trabajo como son medidas de tendencia central,
medidas de posicin y medidas univariantes, para datos no agrupados y datos agrupados, las
cuales son indispensables para poder calcular datos relacionados con variables cualitativas
Discretas y Continuas, con el fin de poder aplicarlas al problema en estudio de este trabajo.
Igualmente, la aplicacin de estos conceptos en un problema real nos proporciona los
datos necesarios para poder entender determinada situacin en sus causas, efectos, y
probabilidades o alternativas de solucin, pues las medidas de posicin nos ayudan a fijar el
comportamiento de una variable a partir de los valores individuales de una tabla, las medidas de
tendencia central (media, mediana y moda), otras medidas son las de posicin no central
(cuartiles, deciles, percentiles), y las medidas de dispersin (Rango, Varianza, desviacin tpica
o estndar y coeficiente de variacin) determinan la variabilidad existente en los valores de la
variable, de all la importancia de entender y adquirir las destrezas tanto en lo relacionado con
los conceptos anteriores como en saber distinguir entre los datos cualitativos y cuantitativas,
variables discretas y continuas, y los diferentes tipo de medidas, para poder aplicarlos tanto en
nuestra formacin como futuros profesionales.
OBJETIVOS
Adquirir conocimientos relacionados con las Medidas Univariantes como son medidas
de tendencia central, medidas de posicin y de dispersin para variables discretas y continuas,
y aplicar esos conocimientos al problema en estudio.
Apropiarse de las variables discretas y continuas, tablas de frecuencias, mediante grficos
estadsticos descriptivos.
Identificar las medidas de tendencia central, media, mediana, moda, deciles, cuartiles y
percentiles, en las variables discretas y continuas, interpretar los resultados.
Adquirir destrezas y habilidades en lo relacionado con tablas de frecuencia para variables
discretas y continuas, clculo de medidas de tendencia central como media, mediana y moda,
medidas de posicin como cuartiles deciles y percentiles, y medidas univariantes absolutas y
relativas, como rango, varianza, desviacin tpica y coeficiente de variacin; de acuerdo a los
datos estipulados y las variables seleccionadas por cada uno de los integrantes del grupo, lo cual
nos servir en futuro, para aplicarlo en los diversos campos de aplicacin de nuestra profesin.
PRIMER PUNTO
A) A partir de la base de datos, identificamos las siguientes Variables Discretas
dentro del problema en estudio.
VARIABLES
DISCRETA
Nmero de accidentes
Nmero de heridos
Nmero de muertos
VARIABLES
Nmero de muertos
DISCRETA
x
Xi
0
1
fi
47
48
Fr
47/120=0,39
48/120=0,4
F acumulada
47
95
2
3
4
total
21
3
1
120
21/120=0,175
3/120= 0,025
1/120=8,3 x 103
116
119
120
Recopilacin de datos
Poblacin: principales causas que incrementan e (inciden) en el nmero de
accidentes de trnsito ocurridos entre los meses de Enero a Diciembre de 2015, en la
ciudad de Medelln ocasionados por carros, motos, busetas y tracto camiones, cuyos
conductores estn en edades entre 17 y 60 aos, gnero femenino y masculino.
Tamao de la muestra: 120 accidentes de trnsito ocurridos entre Enero y Diciembre
de 2015 en la ciudad de Medelln.
c) Calcular las medidas de tendencia central: media, mediana, moda
SE CALCULAN LAS MEDIDAD DE TENDENCIA CENTRAL ASI:
1. MEDIA
Es un tipo de promedio que se halla al dividir la suma de todos los datos de nmeros
dividido por la cantidad total de nmeros de ese conjunto
MEDIA:
x =
( 47 ) + ( 48 )+ ( 21 )+ ( 3 ) + ( 1 )
120
x=
100
120
La media es:
0,838333333
0,838333333
0,9
Mediana
Moda
1
1
N: 120
Cuartiles: Q1,Q2, Q3
Formula:
KN
,K
4
=1,2,3.
Cuartil 1
N= 120
Q1 =?
kN
=
4
L=
1120
=30
4
Q1: 30
Q1:0
CUARTIL 2
Q2= ?
L=
KN
4
2120
4
= 60
Q2:60
Q2: 1
CUARTIL 3
Q3 = ?
L=
KN
4
3120
4
=90
Q3: 90
Q2: 1
Interpretacin de los resultados: Podemos concluir que en los 120 accidentes de
trnsito ocurridos en la ciudad de Medelln durante el ao 2015; el 25% de los
datos no se presentaron muertos y entre el 75% se presentaron entre 0 y 4
muertos.
Cuartil
Q1
Q2
Q3
POSICIN
30
60
90
VALOR
0
1
1
DECILES: Son los nueve valores que dividen la serie de datos en diez partes iguales.
DECILES 5 y 7
Formula:
KN
,K
10
=1,2,...9
D5= ?
N= 120
L=
KN
10
5120
10
= 60
7120
10
= 84
D5 = 1
D7 =?
L=
KN
10
D7 = 1
DECILES
POSICIN
D5
60
D7
84
Interpretaci del anlisis: El quinto decil, es aquel valor de la
VALOR
1
1
variable que supera al 50%
de las observaciones, es decir que la posicin 60 representa el D5, el cual representa tambin
a la mediana de los datos, por lo cual D5= 1.
El sptimo decil, es aquel valor de la variable que supera al 70% de las observaciones y es
superado por el 30% de las observaciones, es decir que la posicin 84 representa el D7, por
lo cual D7 = 1.
Formula:
KN
,K
10
=1,2,...99
PERCENTILES: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
PERCENTILES 30 y 50
P30 = ?
L=
KN
100
P30 = 0
30120
100
= 36
(Percentil 30)
P50 =?
L=
KN
100
P50 = 1
50120
100
= 60
(Percentil 50)
Percentiles
POSICIN
VALOR
P30
36
0
P50
60
1
Interpretacin de resultados: Podemos concluir que el 30% de los accidentes causados en la
ciudad de Medelln no presenta ningn muerto y el 50% presenta 1 muerto, coincidiendo con los
deciles D5.
El Percentil treinta, es aquel valor de la variable que supera al 30% de las
observaciones, es decir que la posicin 36 representa el P30, por lo cual P30
b) Elegir una variable Continua que sea representativa y siguiendo los lineamientos,
disear una tabla de frecuencia para datos agrupados, calcular las medidas de tendencia
central, los cuartiles, deciles 5, 7 y percentiles 50 y 75
(Interpretar sus resultados).
a) Se eligen las siguientes variables cuantitativas continuas para realizar los clculos solicitados:
VARIABLES
CONTINUA
Velocidad
Edad
LI
LS
[ 33,00 46,00 )
[ 46,00 59,00 )
[ 59,00 72,00 )
[ 72,00 85,00 )
[ 85,00 98,00 )
[ 98,00 111,00 )
[ 111,00124,00 )
[ 124,00137,00 )
[ 137,00 150,00 ]
MC
39,50
52,50
65,50
78,50
91,50
104,50
117,50
130,50
143,50
FA
6
15
39
44
9
3
1
0
3
FAA
6
21
60
104
113
116
117
117
120
c) Se calculan la medida de tendencia central: media, mediana, moda y los cuartiles, deciles
5 y 7, y percentiles 50 y 75, a partir de los siguientes datos
Variable
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
Clase
1
2
3
4
5
6
7
8
9
LI
[ 33,00
[ 46,00
[ 59,00
[ 72,00
[ 85,00
[ 98,00
[ 111,00
[ 124,00
[ 137,00
LS
46,00 )
59,00 )
72,00 )
85,00 )
98,00 )
111,00 )
124,00 )
137,00 )
150,00 ]
MC
39,5
52,5
65,5
78,5
91,5
104,5
117,5
130,5
143,5
FA
6
15
39
44
9
3
1
0
3
FAA
6
21
60
104
113
116
117
117
120
FA * MC
237
787,5
2554,5
3454
823,5
313,5
117,5
0
430,5
8718
8718
fAMC
MEDIA = X=
n
8718
120
=72.65
La media es 72.65
MEDIANA= Linf + a * (
n
FAAi1
2
FAi
1= 72
MODA= Linf + a (
72+13
[ FAiFAi1]
[ FAiFAI 1 ] +[ FAiFAi+1]
[5]
[ 5 ] +[35 ]
[4439]
) = 72+13 [ 4439 ] +[449 ]
Q1 = Linf +a
Ln
FAAi1]
4
[ FAi]
= 59 + 13
[3021]
[39]
= 59+11/3=62.66
= 59 + 13
[6021]
[39 ]
= 59+13(39/39) =72
= 72 + 13
[9060 ]
[44]
= 72+13(30/44)
= 59 + 13
[6021]
[39 ]
= 59+13(39/39)=59+13=72
= 72 + 13
[8460]
[39]
= 72+13(24/39) =72+8=80
= 59 + 13
[ 6021]
[39 ]
= 59+13(39/39) =59+13=72
L= k*n/4 = 2*120/4=60
Q2 = Linf +a
Ln
FAAi1]
4
[ FAi]
L= k*n/4 = 3*120/4=90
Q3 = Linf +a
Ln
FAAi1]
4
[ FAi]
=72+13(0.68181)=72+8,863 = 80,86
DECILES:
L= k*n/10 = 5*120/10=60
D5 = Linf +a
Ln
FAAi1]
10
[ FAi]
DECILES:
L= k*n/10 = 7*120/10=84
D7 = Linf +a
Ln
FAAi1]
10
[ FAi]
PERCENTILES:
L= k*n/100 = 50*120/100=60
P50 = Linf +a
Ln
FAAi1]
10
[ FAi]
L= k*n/100 = 75*120/100=90
P75 = Linf +a
Ln
FAAi1]
10
[ FAi]
= 72 + 13
[ 9060 ]
[44]
= 72+13(30/44)
=72+13(0.681)=80.8636
c) Interpretacin de los resultados para la variable contina velocidad asociados con el
problema objeto de estudio:
La media es =
SEGUNDO PUNTO
Calcular las medidas univariantes absolutas y relativas de dispersin para variables
cuantitativas (Discretas y Continuas).
Con la variable Discreta elegida calcular: rango, varianza, desviacin tpica y
coeficiente de variacin. Interpretar los resultados obtenidos y asociarlos con el problema
objeto de estudio
a) Con la Variable Discreta Nmero De Muertos Hallamos:
Numero
de
muertos
(Xi)
0
1
2
3
4
total
f.A(fi
)
47
48
21
3
1
120
39%
40%
17%
3%
1%
100%
47
95
116
119
120
0
48
42
9
4
103
Porcentaje de frecuencia
17%
3%1%
39%
40%
120
0,0
4,0
Rango: Representa la diferencia entre el valor mximo y el valor mnimo de un conjunto de datos.
Rango: (max min)
Rango: 4,0 0,0 = 4
Varianza: 0,727661064
Desviacin estndar: 0,85303052
b) Con las variables Continuas elegidas calculamos: rango, varianza, desviacin tpica y
coeficiente de variacin
a) Con La Variable Continua VELOCIDAD hallamos: rango, varianza, desviacin tpica y
coeficiente de variacin a partir de los siguientes datos:
Variable
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
Clase
1
2
3
4
5
6
7
8
9
LI
[ 33,00
[ 46,00
[ 59,00
[ 72,00
[ 85,00
[ 98,00
[ 111,00
[ 124,00
[ 137,00
LS
46,00 )
59,00 )
72,00 )
85,00 )
98,00 )
111,00 )
124,00 )
137,00 )
150,00 ]
MC
39,5
52,5
65,5
78,5
91,5
104,5
117,5
130,5
143,5
FA
6
15
39
44
9
3
1
0
3
FAA
6
21
60
104
113
116
117
117
120
FA * MC
237
787,5
2554,5
3454
823,5
313,5
117,5
0
430,5
8718
8718
faimc
n
8718
120
=72.6
Varianza
S2 =
X
MC
* FAi =
2
65.572.6
78.572.6
91.572.6
104.572.6
117.572,6
143,572.6
2
2
2
6(39.572.6) +15 (52.572.6) +39
Desviacin Tpica
= 263.3105833 =16.22684761
Coeficiente de Variacin
CV= / X
= 16.22684761/72.6 =0.2235102977
31597.77
120
REFERENCIAS BIBLIOGRAFICAS
Garca, J. E. , Bachero, J.M, Blasco, O.M. Coll. S. V., Diez G. R.., Ivars. A.E., Madrid
(2005) Anlisis de datos Unidimensionales Estadstica descriptiva y nociones de probabilidad,
pag.25-69.
Llinas S. H., Rojas. . C., Barranquilla Colombia (2005; Estadstica
Descriptiva y nocin de probabilidad.