Professional Documents
Culture Documents
Tema 1
Distribuciones de frecuencias
unidimensionales
1. Conceptos básicos: población, muestra y variable estadística.
3. Representaciones gráficas.
1
02/10/2018
2
02/10/2018
Ordenación y tabulación
Caso 1
Cuando una variable toma pocos valores para un número
pequeño de observaciones no es necesario resumir la
información.
Caso 2
En el caso de una variable que toma pocos valores para un
número grande de observaciones, se procede al recuento de los
mismos y se presentan los datos ordenados en una tabla que
muestra las repeticiones de cada valor de la variable.
Notación
En total tenemos N datos
La variable X puede tomar los valores o modalidades distintas: x1, x2, …,xr.
Siempre que pueda establecerse una relación de orden supondremos las
observaciones ordenadas de forma creciente: xi < xj si i < j
3
02/10/2018
3 6 4 7 5 5 4 7
6 3 5 7 5 5 6 7
4 4 5 3 5 6 4 6
5 6 6 5 6 4 6 5
6 6 4 5 6 6 7 5
Xi ni
3 3
4 7
5 12
6 13
7 5
N=40
4
02/10/2018
5
02/10/2018
6
02/10/2018
Caso 3
7
02/10/2018
Notación
Tomaremos los intervalos abiertos por la izquierda y cerrados por la derecha, (Li-1, Li]
8
02/10/2018
(Li-1, Li] Xi ni
(0 – 4] 2 4
(4 – 8] 6 7
(8 – 12] 10 12
(12 – 16] 14 6
(16 – 20] 18 1
N=30
9
02/10/2018
(Li-1, Li] Xi ni
(0 – 6] 3 6
(6 – 8] 7 5
(8 – 10] 9 7
(10 – 12] 11 5
(12 – 20] 16 7
N=30
Distribuciones de frecuencias
Frecuencia absoluta, ni, es el número de veces que se repite cada
valor de la variable.
10
02/10/2018
11
02/10/2018
xi ni fi fi(%) Ni Fi Fi(%)
3 3 0,075 7,5% 3 0,075 7,5%
4 7 0,175 17,5% 10 0,250 25,0%
5 12 0,300 30,0% 22 0,550 55,0%
6 13 0,325 32,5% 35 0,875 87,5%
7 5 0,125 12,5% 40 1 100%
sumas 40 1 100%
Xi ni fi fi(%)
Marca 1 8 0,2667 26,67%
Marca 2 12 0,4000 40,00%
Marca 3 5 0,1667 16,67%
Marca 4 5 0,1667 16,67%
sumas 30 1 100%
12
02/10/2018
xi ni fi fi(%) Ni Fi Fi(%)
Muy bajo 3 0,12 12% 3 0,12 12%
Bajo 4 0,16 16% 7 0,28 28%
Medio 11 0,44 44% 18 0,72 72%
Alto 2 0,08 8% 20 0,80 80%
Muy Alto 5 0,20 20% 25 1 100%
sumas 25 1 100%
Sin agrupar 4
5,4
1
2
0,0333
0,0667
3,33%
6,67%
4
6
0,1333
0,2000
13,33%
20,00%
6,4 1 0,0333 3,33% 7 0,2333 23,33%
6,6 1 0,0333 3,33% 8 0,2667 26,67%
6,9 2 0,0667 6,67% 10 0,3333 33,33%
7,9 1 0,0333 3,33% 11 0,3667 36,67%
8,2 1 0,0333 3,33% 12 0,4000 40,00%
8,3 1 0,0333 3,33% 13 0,4333 43,33%
8,4 1 0,0333 3,33% 14 0,4667 46,67%
9,3 1 0,0333 3,33% 15 0,5000 50,00%
Falta claridad y síntesis. 9,4 1 0,0333 3,33% 16 0,5333 53,33%
9,5 1 0,0333 3,33% 17 0,5667 56,67%
Muy repetitivo. Es 9,8 1 0,0333 3,33% 18 0,6000 60,00%
conveniente agrupar los 10,1 1 0,0333 3,33% 19 0,6333 63,33%
11,1 1 0,0333 3,33% 20 0,6667 66,67%
datos para resumir la 11,7 1 0,0333 3,33% 21 0,7000 70,00%
información. 11,8 1 0,0333 3,33% 22 0,7333 73,33%
12 1 0,0333 3,33% 23 0,7667 76,67%
12,1 2 0,0667 6,67% 25 0,8333 83,33%
12,6 1 0,0333 3,33% 26 0,8667 86,67%
13,4 1 0,0333 3,33% 27 0,9000 90,00%
14 1 0,0333 3,33% 28 0,9333 93,33%
15,8 1 0,0333 3,33% 29 0,9667 96,67%
19,4 1 0,0333 3,33% 30 1,0000 100,00%
30 Pérez
Antonio Arques 1,0000 100,00%
& Antonio Calvo-Flores Segura – Tema 1 – pág. 26
13
02/10/2018
Igual amplitud
(Li-1, Li] Xi ni fi fi(%) ai di Ni Fi Fi(%)
(0 – 4] 2 4 0,1333 13,33% 4 1 4 0,1333 13,33%
(4 – 8] 6 7 0,2333 23,33% 4 1,75 11 0,3667 36,67%
(8 – 12] 10 12 0,4000 40,00% 4 3 23 0,7667 76,67%
(12 – 16] 14 6 0,2000 20,00% 4 1,5 29 0,9667 96,67%
(16 – 20] 18 1 0,0333 3,33% 4 0,25 30 1 100%
sumas 30 1 100%
Distinta amplitud
(Li-1, Li] Xi ni fi fi(%) ai di Ni Fi Fi(%)
(0 – 6] 3 6 0,2000 20,00% 6 1 6 0,2000 20,00%
(6 – 8] 7 5 0,1667 16,67% 2 2,5 11 0,3667 36,67%
(8 – 10] 9 7 0,2333 23,33% 2 3,5 18 0,6000 60,00%
(10 – 12] 11 5 0,1667 16,67% 2 2,5 23 0,7667 76,67%
(12 – 20] 16 7 0,2333 23,33% 8 0,875 30 1 100%
sumas 30 1 100%
14
02/10/2018
3. Representaciones gráficas.
Diagrama de rectángulos
En este gráfico, la frecuencia de cada modalidad del atributo se
representa mediante un rectángulo cuya altura es dicha
frecuencia. La base del rectángulo debe ser la misma para todas
las modalidades, de forma que la altura de al barra es proporcional
a la frecuencia.
15
02/10/2018
Diagrama de sectores
Pictograma
Este gráfico presenta la frecuencia de cada valor de la variable
mediante una figura cuya altura es dicha frecuencia.
16
02/10/2018
Representaciones gráficas
Para variables no agrupadas en intervalos
- Diagrama de barras
- Poligonal de frecuencias
- Sectores
- Pictogramas
Diagrama de barras
Este gráfico presenta la frecuencia de cada valor de la variable
mediante una barra o segmento cuya altura es dicha frecuencia.
Por tanto, la altura de la barra es proporcional a la frecuencia.
17
02/10/2018
Poligonal de frecuencias
Este gráfico une mediante rectas los puntos superiores de las
barras que representan la frecuencia de cada valor de la variable.
Representaciones gráficas
Para variables agrupadas en intervalos
- Histograma
- Polígono de frecuencias
- Sectores
- Pictogramas
18
02/10/2018
Histograma
Este gráfico se utiliza para variables con valores agrupados en
intervalos. Se representa la frecuencia de cada valor de la variable
mediante un rectángulo cuya superficie es proporcional a la
frecuencia. La base del rectángulo es la amplitud del intervalo y la
altura es la densidad. En el caso de igualdad de amplitudes, la
altura puede ser la frecuencia.
1,5 1,5
1 1
0,5 0,5
0 0
0 4 8 12 16 20 0 6 8 10 12 20
Horas extra Horas extra
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 37
0,3
0,25
0,2
di (o ni)
0,15
0,1
0,05
0
0 4 8 12 16 20
Horas extra
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 38
19
02/10/2018
14 13
12
Xi ni 12
Número de alumnos
10
3 3
8 7
4 7 6 5
4 3
5 12
2
6 13 0
3 4 5 6 7
7 5
Núm ero de asignaturas aprobadas
n=40
Xi ni Diagrama de rectángulos
Marca 1 8 14
Número de consumidores
Marca 2 12 12
Marca 3 5 10
Marca 4 5 8
sumas 30 6
4
2
0
Marca 1 Marca 2 Marca 3 Marca 4
Marca preferida
20
02/10/2018
Xi ni Pictograma
Marca 1 8 14
Número de consumidores
Marca 2 12 12
Marca 3 5 10
Marca 4 5 8
sumas 30 6
4
2
0
Marca 1 Marca 2 Marca 3 Marca 4
Marca preferida
Diagrama de sectores
Xi fi Grados
Marca 1 0,2667 96 Marca preferida
Marca 2 0,4000 144 Marca 4
Marca 3 0,1667 60 17% Marca 1
Marca 4 0,1667 26%
60
sumas 1 360
Marca 3
17%
Marca 2
40%
21
02/10/2018
Diagrama de rectángulos
Xi ni 12
Muy bajo 3
Nº de consumidores
10
Bajo 4
8
Medio 11
6
Alto 2
4
Muy Alto 5
2
sumas 25
0
Muy bajo Bajo Medio Alto Muy alto
Nivel de satisfacción
Diagrama de sectores
xi fi Grados
Muy bajo 0,12 43,2 Grado de satisfacción
Bajo 0,16 57,6 Muy bajo
Muy alto 12%
Medio 0,44 158,4 20%
Alto 0,08 28,8
Bajo
Muy Alto 0,20 72 Alto 16%
sumas 1 360 8%
Medio
44%
22
02/10/2018
di
(8 – 12] 12 3 1,5
(12 – 16] 6 1,5 1
(16 – 20] 1 0,25 0,5
sumas 30 0
0 4 8 12 16 20
Horas extra
4
Polígono de frecuencias (sobre intervalos)
3
di
2
3,5
1 3
0 2,5
0 4 8 12 16 20
Horas extra 2
di
1,5
1
0,5
0
0 4 8 12 16 20
Horas extra
23
02/10/2018
di
2
(8 – 10] 7 2 3,5 1,5
(10 – 12] 5 2 2,5 1
(12 – 20] 7 8 0,875 0,5
0
0 6 8 10 12 20
Horas extra
65 y más
55-64
45-54
35-44
25-34
18-24
0 5 10 15 20 25 30
Porcentaje de lectores del medio
24
02/10/2018
Empleo 43
Agencias de viajes/Vuelos 30
Radio/Tv 30
Inmobiliaria 22
Ropa 20
Automoción 17
Almentación/Supermercado 16
Cosméticos 13
Sexo y contactos 4
Ocio/Cultura/Educación 1
Informática 0
¿Qué tipo de anuncios le gustaría encontrar?
De todo un poco 3
Otro 1
Ninguno 4
Ns/Nc 11
0 60
25
02/10/2018
26
02/10/2018
Medidas de posición
Media aritmética
Es la suma de todos los valores de la variable, es decir, de los
distintos valores multiplicados por sus respectivas frecuencias
absolutas, dividida por el número total de observaciones.
r
x n i i r Ejemplo:
X i 1
xi f i Calcular la renta media de un
N i 1
conjunto de individuos
Media geométrica
Se usa para encontrar el promedio de porcentajes, razones, índice
o tasas. Es la raíz enésima del producto de todos los valores de la
variable, elevado cada uno a su respectiva frecuencia absoluta,
siendo N el número total de observaciones.
Ejemplo:
r Calcular el tipo medio de
G N xi siendo xi 0
ni
interés de una operación
i 1 financiera
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 54
27
02/10/2018
x X n
i
i i 0
yi bxi Y bX
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 55
N1 X 1 N 2 X 2
X
N
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 56
28
02/10/2018
Mediana
Para una distribución ordenada de menor a mayor, se define la
mediana como el punto medio, es decir, el valor que deja a su
izquierda y a su derecha a la mitad de las observaciones.
Caso 1
Para calcular la mediana, si N es impar, la mediana será el valor de
la observación que ocupe el lugar
N 1
1 1 1 1 2 2 3 3 3 4 5 N 11
2
Pero si N es par, la mediana será el valor de la observación que
ocupe el lugar
N N
y 1 1 1 1 2 2 3 3 3 4 5 N 10
2 2
Si son distintos, se dan ambos valores o su media aritmética.
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 57
Mediana
Caso 2
Para una variable presentada en una tabla de frecuencias, con
valores no agrupados en intervalos, la mediana es el primer valor
con frecuencia absoluta acumulada igual o superior a N/2. Si
coincide con N/2, la mediana será la media entre ese valor y el
siguiente (si es admisible para la variable) o ambos valores (si no es
admisible el valor de esa media).
xi ni Ni xi ni Ni
3 3 3 3 3 3
4 7 10 4 7 10
5 12 22 5 10 20
6 13 35 6 15 35
7 5 40 7 5 40
N N
sumas 40 20 sumas 40 20
2 2
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 58
29
02/10/2018
Mediana
Caso 3
(Li-1, Li] ni ai Ni
(0 – 4] 4 4 4
(4 – 8] 7 4 11
(8 – 12] 12 4 23
(12 – 16] 6 4 29
(16 – 20] 1 4 30
N
15 sumas 30
2
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 59
Mediana
Caso 3
(Li-1, Li] fi ai Fi
0,5 Fi 1
Me Li 1 ai (0 – 4] 0,1333 4 0,1333
fi
(4 – 8] 0,2333 4 0,3667
(8 – 12] 0,40000 4 0,7667
0,5 0,3667 (12 – 16] 0,2000 4 0,9667
Me 8 4 9,3
0,4 (16 – 20] 0,0333 4 1
sumas 1
30
02/10/2018
Moda
Es el valor de la observación que aparece con mayor frecuencia, es
decir, el más repetido.
En el caso de distribuciones agrupadas en intervalos hablaremos
de intervalo modal. En el caso de intervalos de la misma amplitud,
será el intervalo con mayor frecuencia absoluta. Si las amplitudes
son distintas será el intervalo con mayor densidad.
Cuantiles
Los cuantiles son los valores de la variable que dividen a la
distribución en partes iguales, es decir, intervalos que contienen
igual número de observaciones.
31
02/10/2018
Cuantiles
Cuartiles
Son los valores que dejan por debajo el 25 %, el 50 % y el 75 % de
las observaciones.
Cuartiles
xi Ni Fi(%) N
3 10 C1 = entre 4 y 5
3 7,5% 4
4 10 25,0% N
5 20 C2 = 5
22 55,0% 2
6 35 87,5% 3N
7 40 100%
30 C3 = 6
4
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 63
Cuantiles
En el caso de distribuciones agrupadas en intervalos, se calculan
los cuartiles aplicando el mismo procedimiento que para la
mediana teniendo en cuenta que las posiciones buscadas son N/4 ;
2N/4 = N/2 ; y 3N/4.
32
02/10/2018
Cuantiles
N
7'5
4
N
15
2
3N
22'5
4
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 65
Deciles Cuantiles
Son los valores que dejan por debajo el 10 %, el 20 %,… y el 90 % de las
observaciones. Se calculan de igual forma que los cuartiles pero para los
niveles N/10 , 2N/10, …….y 9N/10
Percentiles
Son los valores que dejan por debajo el 1 %, el 2 %,… y el 99 % de las
observaciones, o en general el % de la distribución. La mediana es el
percentil del 50%,, el primer cuartil el del 25% o el tercer decil el del 30%.
Así, podríamos hablar únicamente de percentiles, pues todos los
estadísticos de orden son casos particulares de un cierto percentil.
Si queremos calcular el percentil de orden %, con entre 0 y 100,
localizaremos el primer intervalo (Li-1 – Li] con frecuencia absoluta
acumulada igual o superior a N/100
N N i 1 Fi 1
P Li 1 100 ai P Li 1 100 ai
ni fi
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 66
33
02/10/2018
Medidas de dispersión
Las medidas de posición indican en torno a qué valores se sitúa la
distribución pero no dicen nada sobre la extensión de la misma.
Las medidas de dispersión verifican la representatividad de las
medidas de posición y su validez como sintetizadoras de la
información.
N
Cuanto mayor sea la varianza, menos representativa será la media.
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 67
Propiedades de la varianza.
a. La varianza siempre es positiva.
b. La varianza se puede calcular también como:
r
x n 2
i i
S2 i 1
X2
N
c. Efecto de los cambios de origen y escala en la varianza.
34
02/10/2018
x n 2
i i
S S2 i 1
X2
N
Esta medida es de gran utilidad pues viene dada en las mismas
unidades de medida que la media, mientras que la varianza
aparece en unidades al cuadrado. Se puede interpretar como la
desviación media que experimentan las observaciones sobre el
valor central.
Efecto de los cambios de origen y escala en la desviación típica.
Si yi xi a S y S x
Si yi bxi S y b Sx
Si yi a bxi S y b S x
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 69
35
02/10/2018
Sin agrupar
1 1 2,9 4 5,4 5,4 6,4 6,6 6,9 6,9 7,9 8,2 8,3 8,4 9,3
9,4 9,5 9,8 10,1 11,1 11,7 11,8 12 12,1 12,1 12,6 13,4 14 15,8 19,4
r
xi 1 1 2,9 4 5,4 5,4 ···19,4
X 9,11
i 1 N 30
36
02/10/2018
Sin agrupar
1 1 2,9 4 5,4 5,4 6,4 6,6 6,9 6,9 7,9 8,2 8,3 8,4 9,3
9,4 9,5 9,8 10,1 11,1 11,7 11,8 12 12,1 12,1 12,6 13,4 14 15,8 19,4
1 1 2,9 4 5,4 5,4 6,4 6,6 6,9 6,9 7,9 8,2 8,3 8,4 9,3
9,4 9,5 9,8 10,1 11,1 11,7 11,8 12 12,1 12,1 12,6 13,4 14 15,8 19,4
Percentil 60
37
02/10/2018
Sin agrupar
1 1 2,9 4 5,4 5,4 6,4 6,6 6,9 6,9 7,9 8,2 8,3 8,4 9,3
9,4 9,5 9,8 10,1 11,1 11,7 11,8 12 12,1 12,1 12,6 13,4 14 15,8 19,4
S2
30
xi 9,112 30
2
xi
9,1133
2 2993,2
83,0522 16,7211 S 4,089
30
i 1 i 1 30 30
S 4,089
CV 0,4487
x 9,11
Media 9,11
Moda 1; 5,4; 6,9; 12,1
Percentil 60 9,95
Desviación típica 4,089
Coeficiente de variación 0,449
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 76
38
02/10/2018
r
xi ni 2 4 6 7 10 12 14 6 18 1
X 9,067
i 1 N 30
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 77
39
02/10/2018
x n 2
X
i i
9,067 16,73 S 16,73 4,09
2 2968
S2 i 2
N 30
4,09
Cv 0,4511
9,067
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 80
40
02/10/2018
Igual amplitud
3,5
2,5
2
di
1,5
0,5
0
Horas extra
Media 9,067
Moda (8-12]
Percentil 60 10,33
Desviación típica 4,090
Coeficiente de variación 0,451
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 81
r
xi ni 3 6 7 5 9 7 11 5 16 7
X 9,433
i 1 N 30
41
02/10/2018
42
02/10/2018
x n 2
X
i i
9,433 16,779 S 16,779 4,447
2 3263
S2 i 2
N 30
4,447
Cv 0,4715
9,433
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 85
Distinta amplitud
4
3,5
3
2,5
di
2
1,5
1
0,5
0
Horas extra
Media 9,433
Moda (8-10]
Percentil 60 10
Desviación típica 4,447
Coeficiente de variación 0,471
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 86
43
02/10/2018
Resumen
Igual Distinta Sin
amplitud amplitud agrupar
Media 9,067 9,433 9,11
8
Moda (8-12] (8-10] 1; 5,4; 6,9; 12,1
Percentil 60 10,33 10 9,95
Desviación típica 4,090 4,447 4,089
Coeficiente de variación 0,451 0,471 0,449
Datos de la empresa
Datos
sectoriales Salario Nº
empleados
Media 190
(60-90] 6
Moda 145
(90-120] 14
Mediana 150
(120-160] 23
Desviación típica 175
(160-200] 17
Índice de Gini 0’45
(200-250] 6
(250-300] 22
(300-500] 2
44
02/10/2018
Tabla de frecuencias
Li-1 Li ai Xi ni fi Ni Fi Fi% di
60 90 30 75 6 0,086 6 0,086 8,6% 0,2
90 120 30 105 14 0,200 20 0,286 28,6% 0,467
120 160 40 140 23 0,329 43 0,614 61,4% 0,575
160 200 40 180 17 0,243 60 0,857 85,7% 0,425
200 250 50 225 6 0,086 66 0,943 94,3% 0,12
250 300 50 275 2 0,029 68 0,971 97,1% 0,04
300 500 200 400 2 0,029 70 1 100% 0,01
N= 70
45
02/10/2018
Li-1 Li ai Xi ni fi Ni Fi Fi% di
60 90 30 75 6 0,086 6 0,086 9% 0,2
90 120 30 105 14 0,200 20 0,286 29% 0,467
120 160 40 140 23 0,329 43 0,614 61% 0,575
160 200 40 180 17 0,243 60 0,857 86% 0,425
200 250 50 225 6 0,086 66 0,943 94% 0,12
250 300 50 275 2 0,029 68 0,971 97% 0,04
300 500 200 400 2 0,029 70 1 100% 0,01
N= 70
Li-1 Li ai Xi ni fi Ni Fi Fi% di
60 90 30 75 6 0,086 6 0,086 9% 0,2
90 120 30 105 14 0,200 20 0,286 29% 0,467
120 160 40 140 23 0,329 43 0,614 61% 0,575
160 200 40 180 17 0,243 60 0,857 86% 0,425
200 250 50 225 6 0,086 66 0,943 94% 0,12
250 300 50 275 2 0,029 68 0,971 97% 0,04
300 500 200 400 2 0,029 70 1 100% 0,01
N= 70
46
02/10/2018
Sector Empresa
X
i i
155,71 3820,2041 S 3820,2041 61,8078
2 1964700
S
2 i 2
N 70
61,8078
Cv 0,397
155,71
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 94
47
02/10/2018
Sector Empresa
Media 190 Media 155,71
Desv. típica 175 Desv. típica 61,81
Coef. variación 0’921 Coef. variación 0’397
Recorrido intercuartílico
Es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) :
RI= Q3 - Q1
En el RI se distribuye el 50% central de las observaciones.
En conjunción con el Recorrido ayuda a situar la distribución.
Diagrama de Caja (Box Plot): datos atípicos
Es un gráfico que utiliza los cuartiles y el RI para ayudar a estudiar la
simetría de la distribución y la presencia de datos atípicos o extremos
(outliers).
Los datos atípicos son aquellos excesivamente grandes o pequeños en
comparación con el resto de la distribución.
La presencia de datos atípicos puede distorsionar los resultados de los
indicadores que usen todos los datos, como la media o la varianza.
La presencia de datos atípicos requiere un estudio de cada uno de ellos y
de la mejor estrategia para su tratamiento (por ejemplo si resulta
adecuado excluirlos de los análisis)
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 96
48
02/10/2018
extremo
49
02/10/2018
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 100
50
02/10/2018
Pi Fi %
V Valor Frecuencia
Qi i 100 Relativo Relativa
Vr Acumulado Acumulada
xi ni vi fi fi(%) Ni Vi Fi Fi(%)=Pi Qi
x1 n1 v1 f1 f1% N1 V1 F1 p1 q1
x2 n2 v2 f2 f2% N2 V2 F2 p2 q2
· · · · · · · · · ·
· · · · · · · · · ·
xr nr vr fr fr% Nr Vr Fr pr qr
sumas N Vr
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 101
0 Pi
100
El área entre las dos curvas es la diferencia entre la
equidistribución y el reparto actual. Cuanto mayor sea el área
rayada mayor será la concentración de los recursos.
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 102
51
02/10/2018
r 1 r 1
(P Q ) i i Q i
Se define el índice de Gini como: IG i 1
r 1
1 i 1
r 1
P
i 1
i P
i 1
i
0 0
100 Pi 100 Pi
Concentración mínima Concentración máxima
Observar que Pi y Qi se pueden expresar en porcentaje o en tanto por uno
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 103
Tabla de frecuencias
Li-1 Li Xi ni Ni Fi% vi=Xini Vi Qi Pi Pi-Qi
60 90 75 6 6 8,57 450 450 4,13 8,57 4,44
90 120 105 14 20 28,57 1470 1920 17,61 28,57 10,96
120 160 140 23 43 61,43 3220 5140 47,16 61,43 14,27
160 200 180 17 60 85,71 3060 8200 75,23 85,71 10,48
200 250 225 6 66 94,29 1350 9550 87,61 94,29 6,67
250 300 275 2 68 97,14 550 10100 92,66 97,14 4,48
300 500 400 2 70 100 800 10900
N= 70 324,4 375,7 51,3
r 1 r 1
(P Q )i i
51,3 Q i
324,4
IG i 1
r 1
0,137 IG 1 i 1
r 1
1 0,137
P P
375,7 375,7
i i
i 1 i 1 Calvo-Flores Segura –
Antonio Arques Pérez & Antonio Tema 1 – pág.
104
52
02/10/2018
Curva de Lorenz
100
Li-1 Li Qi Pi
60 90 4,13 8,57 80
90 120 17,61 28,57
120 160 47,16 61,43 60
qi
160 200 75,23 85,71 40
200 250 87,61 94,29
250 300 92,66 97,14 20
300 500 100 100 0 pi
0 20 40 60 80 100
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 105
Sector Empresa
Antonio Arques Pérez & Antonio Calvo-Flores Segura – Tema 1 – pág. 106
53