Professional Documents
Culture Documents
Mtodos Estadsticos
Karl Pearson
(1857-1936)
Captulo I:
Conceptos
Descriptiva
1.
2.
3.
4.
Generales
Estadstica
1. Conceptos Bsicos
Poblacin (N)
Es el conjunto de todos los elementos que se desean analizar y que presentan una
o varias caractersticas en comn.
Ejemplo:
Las familias del distrito de San Borja.
Muestra (n)
Es un subconjunto representativo de elementos provenientes de una poblacin.
Ejemplo:
30 familias del distrito de San Borja.
Unidad elemental
Es cada una de las personas, animales, cosas o entidades que conforman la
poblacin en estudio.
Ejemplo:
Una familia del distrito de San Borja.
Variable (X,Y,Z,..):
Es toda caracterstica que se desea observar, medir o evaluar
de las unidades elementales.
Las variables se pueden clasificar en cuantitativas o
cualitativas.
Nominal
Cualitativa
Ordinal
Variable
Discreta
Cuantitativa
Continua
1. Conceptos Bsicos
Variables Cualitativas
Proporcionan datos que dan como resultado una categora.
Pueden ser de tipo nominal u ordinal.
Nominales
Ordinales
1. Conceptos Bsicos
Variables Cuantitativas
Son aquellas cuyos valores pueden ser expresados en forma numrica.
Pueden ser discretas o continuas.
Discretas
Son aquellas que tienen un nmero finito o infinito numerable de valores
posibles. Por lo geneneral se obtienen mediante conteo.
Ejemplo:
Nmero de accidentes de trnsito al mes en el distrito de San Borja.
Continuas
Son aquellas que tienen una cantidad infinita no numerable de valores
posibles. Por lo genera se pueden obtener mediante instrumentos de
medicin.
Ejemplo:
Peso (en Kg.) de una persona.
1. Conceptos Bsicos
Otra forma de clasificacin de las variables es segn su
escala de medida. De esta manera la clasificacin seria:
Nominal:
Ordinal:
Intervalo:
Razn:
Observacin
Es el dato registrado producto de la medicin o apreciacin de una
caracterstica en una unidad elemental.
Ejemplo:
El ingreso mensual de la familia Prez es de 6500 soles.
Parmetro (,,,)
Es una medida que resume los datos provenientes de la poblacin.
Es decir es una funcin de todas las observaciones de una poblacin.
Ejemplo:
Luego de realizar un censo a las familias del distrito de San Borja se
obtuvo que el ingreso familiar promedio mensual es 6850.3 soles.
Estadstica
Es una medida que resume los datos provenientes de la muestra.
Ejemplo:
Luego de realizar un muestreo a 30 familias del distrito de San
Borja se obtuvo que el ingreso promedio familiar mensual es
6450.3 soles.
1. Conceptos Bsicos
Representacin usual en la mayora de programas estadsticos
Unidad
Elemental
V1
V2 . . . Vp
x11
x
21
xn 1
x12
X1
x22
xn 2
Variables
x1 p
x2 p
xnp
Observacin
Estadstica
Descriptiva
Inferencial
Categoras de
la variable
fi
hi
pi
Atributo 1
f1
h1
p1
Atributo 2
f2
h2
p2
Atributo k
fk
n
hk
pk
100%
Total
Fuente:
4. Estadstica Descriptiva
4.1 Organizacin de datos
Datos Cualitativos: Grficos
400
big
med
small
Femenino
Masculino
Clase
100
20
200
40
60
300
80
SanLuis
SanIsidro
SanBorja
acc
good
unacc
vgood
Clase
Valores de X
fi
hi
pi
x1
f1
h1
p1
x2
f2
h2
p2
xk
fk
hk
pk
Total
100%
Fuente:
En R con la funcin table
40
30
20
10
4
Numero de pisos
Rango: r= Xmax-Xmin
Nmero de intervalos de clase
k=1+3.32log10(n) (redondeo simple)
Tamao del ancho del intervalo de
clase:
w= r/k (redondeo por exceso) a la
cantidad de decimales de los datos.
10
Intervalos
de clase
Marca
de
clase
[LI1-LS1[
X1
[LI2-LS2[
X2
[LI3-LS3[
X3
[LIk-LSk]
Xk
Total
fi
hi
pi
Fi
Hi
Pi
f1
f2
f3
h1
h2
h3
p1
p2
p3
F1
H1
P1 %
F2
H2
P2 %
F3
H3
P3 %
fk
n
hk
pk
Fk
100%
100%
Fuente:
25
25.00%
25.00%
20
20.84%
20.00%
15
14.58%
15.00%
14.58%
10
12.50%
10.00%
6.25%
6.25%
5.00%
159.85
189.35
218.85
248.35
277.85
307.35
336.85
Pago de impuestos
0.00%
130.35
159.85
189.35
218.85
248.35
277.85
307.35
336.85
366.35
11
4. Estadstica Descriptiva
4.1 Organizacin de datos
N
Gnero
Servicio
Opinin
Gnero
Servicio
Opinin
cajeros
regular
11
24 horas
bueno
cajeros
bueno
12
24 horas
regular
crdito
malo
13
crdito
malo
cajeros
bueno
14
crdito
muy bueno
cajeros
regular
15
24 horas
muy bueno
crdito
regular
16
crdito
muy bueno
cajeros
malo
17
crdito
muy bueno
cajeros
muy bueno
18
cajeros
muy bueno
cajeros
bueno
19
cajeros
regular
10
crdito
muy bueno
20
crdito
bueno
12
Resultados
Cuadro N 1: Nuevo servicio deseado por los clientes
N de
categora
Nuevo servicio
deseado
fi
hi
pi
Cajeros Automticos
0.45
45.0%
Servicio 24 horas
0.15
15.0%
Crdito
0.40
40.0%
Total
20
1.00
100.0%
Servicio 24 horas
Crdito
Servicio
Resultados
Cuadro N 2: Calidad de atencin al cliente
N de
categora
Calidad de atencin al
cliente
fi hi
pi
Muy bueno
0.35
35.0%
Bueno
0.25
25.0%
Regular
0.25
25.0%
Malo
0.15
15.0%
Total
20
1.00
100.0%
Muy bueno
Bueno
Regular
Malo
25%
25%
13
X1
X2
X1
X2
X1
X2
X1
X2
145.1
13
216.3
25
252.5
37
303.6
151.0
14
225.9
26
257.1
38
305.8
159.0
15
227.1
27
259.2
39
315.4
195.6
16
231.2
28
262.5
40
315.5
196.9
17
234.8
29
265.2
41
317.2
202.6
18
238.4
30
271.0
42
320.2
204.9
19
239.9
31
286.7
43
324.8
206.1
20
241.1
32
288.1
44
331.1
206.5
21
242.9
33
289.1
45
331.7
10
208.0
22
244.0
34
291.0
46
344.6
11
208.0
23
247.7
35
291.9
47
346.7
12
209.3
24
249.5
36
294.5
48
351.1
14
Resultados
Cuadro N1: Nmero de pisos que tiene la vivienda
N
de
clase
Nmero
de pisos
fi
hi
pi
22
0.458
45.8%
18
0.375
37.5%
0.167
16.7%
48
1.000
100.0%
Total
50
40
30
20
10
4
Numero de pisos
r 206
29.429 29.5
k
7
15
Resultados
Cuadro N2: Pago de impuestos municipales del ao 2015
N de
clase
X`i fi
Pago de
impuestos
hi
pi
F i Hi
Pi
[145.1,174.6]
159.85
0.0625
6.25%
0.0625
6.25%
]174.6,204.1]
189.35
0.0625
6.25%
0.1250
12.50%
]204.1,233.6]
218.85
10
0.2084
20.84%
16
0.3334
33.34%
]233.6,263.1]
248.35
12
0.2500
25.00%
28
0.5834
58.34%
]263.1,292.6]
277.85
0.1458
14.58%
35
0.7292
72.92%
]292.6,322.1]
307.35
0.1458
14.58%
42
0.8750
87.50%
]322.1,351.6]
336.85
0.1250
12.50%
48
1.0000
100.00%
48
1.0000
100.00%
Total
Fuente: Oficina de Rentas Municipalidad de Los Olivos
20
15
10
159.85
189.35
218.85
248.35
277.85
307.35
336.85
Pago de impuestos
25.00%
25.00%
20.84%
20.00%
14.58%
15.00%
14.58%
12.50%
10.00%
6.25%
6.25%
5.00%
0.00%
130.35
159.85
189.35
218.85
248.35
277.85
307.35
336.85
366.35
16
4. Estadstica Descriptiva
4.2 Medidas de resumen
La media aritmtica
N
Media o promedio poblacional
xi
i 1
donde N es el tamao de la poblacin. N
Media o promedio muestral:
donde n es tamao de la muestra.
x
i 1
4. Estadstica Descriptiva
4.2 Medidas de resumen
Caractersticas de la media
17
4. Estadstica Descriptiva
4.2 Medidas de resumen
50% de datos
me x n 1
Si n es par
x n x n
me
1
2
4. Estadstica Descriptiva
4.2 Medidas de resumen
Caractersticas de la mediana
Es el percentil 50 (P50).
No se ve afectada por valores extremos.
Se calcula para variables medidas en
escala ordinal, intervalo o razn.
No olvidar que para su clculo los datos
deben ser previamente ordenados.
En R con la funcin median
18
4. Estadstica Descriptiva
4.2 Medidas de resumen
La moda
4. Estadstica Descriptiva
4.2 Medidas de resumen
Caractersticas de la moda:
19
4. Estadstica Descriptiva
4.2 Medidas de resumen
(1-p)% de datos
Percentil p
Deciles y cuartiles son casos especiales.
4. Estadstica Descriptiva
4.2 Medidas de resumen
Ordene los datos de manera ascendente. Calcule
la posicin p del percentil
Pp x n1 x E .d
p
100
p es el percentil
observaciones
es
la
cantidad
de
x E.d x E 0.d x E 1 x E
En R con la funcin quantile, la cual presenta varios
algoritmos.
20
4. Estadstica Descriptiva
4.2 Medidas de resumen
r xmax xmin
Las desventajas del rango:
Est afectado por valores extremos.
No mide la variabilidad de los datos
intermedios.
En R la funcin range no permite obtener el rango
pero si el mximo y el mnimo
4. Estadstica Descriptiva
4.2 Medidas de resumen
21
4. Estadstica Descriptiva
4.2 Medidas de resumen
La varianza de un conjunto de observaciones est
definida por:
N
N
2
Varianza Poblacional:
xi xi2 N 2
2
N
N
Varianza Muestral:
S
2
i 1
x
i 1
i 1
N
N
n 1
x
i 1
2
i
nx 2
n 1
4. Estadstica Descriptiva
4.2 Medidas de resumen
x
i 1
2
i
i 1
N2
N
x x
i 1
n 1
x
i 1
2
i
nx 2
n 1
22
4. Estadstica Descriptiva
4.2 Medidas de resumen
c.v.
100%
S
100%
x
4. Estadstica Descriptiva
4.2 Medidas de resumen
El coeficiente de asimetra de Pearson de un
conjunto de observaciones se define como:
3 Me
Si el conjunto de observaciones es la poblacin: As
Si el conjunto de observaciones es una muestra: as 3 x me
S
Observaciones:
Si as=0 entonces la distribucin es simtrica.
Si as<0 entonces la distribucin es asimtrica
negativa.
Si as>0 entonces la distribucin es asimtrica
positiva.
23
4. Estadstica Descriptiva
4.2 Medidas de resumen
La frmula para hallar la simetra en datos sin agrupar
n
es:
3
xi x
3
n
xi x
n
n
i 1
As
s n 1n 2
n 1n 2
s3
i 1
x
n
As
i 1
ns 3
4. Estadstica Descriptiva
4.2 Medidas de resumen
Distribucin Simtrica
Distribucin simtrica
Me Mo simtrica
Para una poblacin: Distribucin
Para una muestra:
x me mo
Distribucion Asimtrica
Positiva
Distribucin
asimtrica
Distribucin asimtrica
Distribucin sesgo
asimtrica
Distribucin asimtrica
a la izquierda
sesgo a la derecha
sesgo a la izquierda
sesgo a la derecha
Para una poblacin: Me Mo
Distribucin simtrica
x me mo
Para una muestra:
Distribucion Asimtrica Negativa
Distribucin asimtrica
Para una poblacin: Me Mo Distribucin asimtrica
sesgo a la izquierda
sesgo a la derecha
x me mo
Para una muestra:
Media= Mediana = Moda
Media= Mediana = Moda
Media
Media
Mediana Moda
Mediana Moda
Media
Mediana Moda
24
4. Estadstica Descriptiva
4.2 Medidas de resumen
La curtosis es el grado de concentracin de un conjunto de
datos, con relacin a la media aritmtica:
Si el conjunto de observaciones es la poblacin:
1
Q3 Q1
K2
D9 D1
1
q3 q1
2
k
d9 d1
4. Estadstica Descriptiva
4.2 Medidas de resumen
Distribucin Platicrtica
K < 0.25
Distribucin Mesocrtica
K 0.25
Distribucin Leptocrtica
K > 0.25
25