Professional Documents
Culture Documents
60 MATEMÁTICAS
Parámetros estadísticos.
Cálculo, significado y propiedades.
24-13852-13
Temario 1993
tema 60
matemáticas
1. Parámetros estadísticos
1.1. Conceptos generales
2.3. Momentos
3
tema 60
matemáticas
INTRODUCCIÓN
Vamos a recordar, en primer lugar, unas definiciones básicas e imprescindibles para el de-
sarrollo posterior del tema.
Se llama Estadística a la ciencia que tiene por objeto el tratamiento y análisis de la infor-
mación obtenida en una serie de observaciones.
Los objetivos de la Estadística son:
a) Indicar los métodos de recogida y agrupamiento de datos.
b) El análisis de dichos datos, para obtener conclusiones o leyes aplicables en la práctica.
El campo de aplicación de la Estadística se ha ido ensanchando con el tiempo, y actualmen-
te está presente en todas las ramas de la ciencia y de la técnica.
5
tema 60
matemáticas
1 Parámetros estadísticos
En un estudio estadístico, además de los gráficos y tablas que permiten visualizar
y resumir los datos observados, es preciso utilizar valores numéricos o medidas
que describan de forma objetiva los datos recogidos. Estas medidas son los pará-
metros estadísticos. Vamos a recordar, en primer lugar, unas definiciones básicas
e imprescindibles para el desarrollo posterior del tema.
Población
Llamaremos población a todo conjunto homogéneo de objetos de cualquier
naturaleza que tienen unas características comunes. La población debe estar
definida con precisión para que dado un objeto no haya dudas sobre si pertenece
o no a ella. No siempre es posible analizar cada elemento de una población (por
razones económicas, de falta de tiempo, personal disponible…) por lo que, en
estos casos, se estudia una parte de la población.
Muestra
Recibe el nombre de muestra todo subconjunto de una población. Ejemplos de
población pueden ser los habitantes de Madrid censados en 2007 o las piezas
fabricadas por una máquina en un mes. Una muestra de la primera población
la forman los habitantes de Madrid menores de 30 años, y una muestra de la
segunda, los tornillos fabricados en una semana por la máquina citada. La ope-
ración de tomar una muestra se llama muestreo.
Carácter
Llamamos carácter a una cualidad de los elementos de una población que sea
observable, que posea varias modalidades (o valores) y tal que cada elemento
de la población presente una y sólo una modalidad.
El sexo es un carácter que presenta dos modalidades: varón y hembra. La esta-
tura es un carácter cuyas modalidades son las distintas tallas.
Los caracteres de los elementos de la población se dividen en cualitativos o
atributos y cuantitativos o variables.
−− Un carácter se llama cualitativo o atributo cuando sus distintas modalida-
des no son medibles numéricamente (por ejemplo: el sexo, estado civil, ...).
−− Se llama cuantitativo o variable si sus distintas modalidades son medibles
numéricamente (por ejemplo, la talla, el peso, ...)
6
tema 60
matemáticas
Datos u observaciones
Los resultados que se obtienen tras la observación de atributos y variables se
denominan datos u observaciones. En el caso de las variables se les suele llamar
valores.
Distinguimos dos tipos de variables:
Variable discreta
Una variable estadística se dice discreta cuando sus posibles valores son finitos
o numerables. Son variables estadísticas discretas: el número de hijos de una
familia, el número de tornillos fabricados por una máquina en una hora, ...
Variable continua
Una variable estadística se dice continua si sus valores posibles son un número
infinito, o bien, si entre dos valores de la variable, ésta puede tomar todos los
intermedios. son variables estadísticas continuas: la talla, la edad de una perso-
na, la medida del diámetro de una pieza, etc.
Por extensión de la noción de variable estadística continua, una magnitud que
pueda tomar un gran número de valores, aunque sean aislados, se considera
como continua. Por ejemplo, el salario mensual de una persona.
Los valores que toma una variable estadística se presentan en tablas estadísticas
para facilitar su manejo y mediante gráficos para visualizar mejor el conjunto de
la muestra.
Las tablas estadísticas y la representación gráfica nos dan una idea cualitativa de
conjunto de una distribución de frecuencias que no es suficiente, por ejemplo, para
comparar dos distribuciones.
Con el fin de obtener un resumen cuantitativo se sustituye el conjunto de valores
por números llamados parámetros estadísticos o medidas descriptivas de los
datos, que son unos números que nos permitirán, con objetividad y precisión,
tener una visión más completa del fenómeno estudiado, comparar distintas distri-
buciones de frecuencias y valorar con números sus distintas características.
Los parámetros estadísticos se clasifican en diversos tipos:
Medidas de posición o centralización.
Medidas de dispersión.
Medidas de asimetría y curtosis.
7
tema 60
matemáticas
Las medidas de posición o centralización son valores que están medidos en las
mismas unidades que las observaciones y que nos indican en torno a qué posición
se distribuyen las observaciones de que disponemos, es decir, cómo se agrupan
los datos observados.
En la medida en que dichos valores nos orienten sobre la posición de una parte
cualquiera previamente determinada de la distribución o sobre el lugar central de
la misma, se clasifican en medidas de posición no central (cuartiles, deciles y
percentiles) y medidas de posición central (medias, mediana y moda).
Es obvio que todas ellas han de verificar que su valor esté comprendido entre el
menor y el mayor valor de los datos disponibles.
Parece bastante natural pensar como modelo de la posición central de una distri-
bución, en aquel valor que actuase como su centro de gravedad en el sentido de
compensar las desviaciones con respecto de él de los valores de la variable, en un
sentido o en otro.
−− Datos simples: se llama media aritmética de una serie de valores xi, x2, ..., xn
de una variable estadística X, a la suma de ellos dividida por el número total
de valores. Se designa por x y viene dada por:
x1 + + xn
N
∑x
1
x= = i
N N i =1
−− Datos agrupados: si los valores x1, ..., xk están afectados por sus correspon-
dientes frecuencias f1, ..., fk, la media aritmética se define:
k k
∑ ∑xn
1
x = x1 ⋅ f1 + + xk ⋅ f k = xi f i = i i
i =1
N i =1
8
tema 60
matemáticas
En efecto, llamando desviaciones a los valores xi – x queda:
k k k
∑ ∑ ∑ xn = x − x = 0
1 1 1
( xi − x )ni = xi ni − i
N i =1
N i =1
N i =1
ya que ∑n i
=1
N
1
k k k k
∑ ∑ ∑ ∑ x n =
1 1
y= ⋅ yi ni = ⋅ ( xi − x0 ) ⋅ ni = xi ni − 0 i
N i =1
N i =1
N i =1 i =1
k k
∑ ∑x n = x−x
1 1
= xi ni − 0 i 0
N i =1
N i =1
y despejando: x = y + x0 que permite calcular x a partir de y y de x0.
∑ ∑xn = c
1 1 1 1 x
u= ⋅ xi ni = ⋅ ⋅ i i
N i =1
c c N i =1
de donde x = c u
9
tema 60
matemáticas
xi − x 0
k k k
∑ ∑ ∑ ( x − x )n =
1 1 1 1
u= ⋅ xi ni = ⋅ ni = ⋅ i 0 i
N i =1
N i =1
0 c N i =1
1 k k
∑ ∑ x n = c ( x − x ).
1 1 1
= ⋅ xi ni − ⋅ 0 i 0
c N i =1
N i =1
1
O sea, u = ( x − x0 ), y despejando:
c
x = u c + x0
∑xn =∑x f
1
x= ⋅ i i i i
N i =1 i =1
Suponiendo que todas la clases tienen una amplitud constante c, se demuestra que
haciendo el cambio:
x − x0
ui = i
c
los ui resultan números enteros pequeños. En este caso x0 es una de las marcas de
clase del centro de la muestra.
Es evidente que ahora se puede proceder como hemos explicado en el apartado
anterior para el cálculo abreviado de la media.
En la tabla estadística de variable continua se añadirán dos nuevas columnas para
facilitar el cálculo, una con la variable ui, y otra con los productos ni · ui.
Para la media aritmética, podemos encontrar las siguientes ventajas e inconve-
nientes como medida de posición central:
Ventajas:
Está perfectamente determinada de forma objetiva, y es única.
Tiene un significado interpretativo muy claro.
Es sencilla de calcular.
Se utilizan para el cálculo todos los valores de que se dispone en la distribu-
ción.
10
tema 60
matemáticas
Inconvenientes:
Los valores extremos muy dispares influyen de manera notable en su valor a causa
de lo cual puede perder valor representativo.
No obstante, a pesar del inconveniente que acabamos de mencionar, podemos
decir que es, sin lugar a dudas, la medida de posición central más utilizada.
Cuando es conocido que los valores de la variable no tienen todos la misma im-
portancia con respecto al tratamiento que deben dárseles, suele ser bastante útil
utilizar una variante de la media aritmética que vamos a ver a continuación.
XX Media ponderada
∑w ⋅x i i
xp = i =1
k
∑w i =1
i
En general, y esto es importante, los pesos wi pueden ser números reales positivos
cualesquiera.
11
tema 60
matemáticas
Datos agrupados:
Sean los valores de la variable o las marcas de clase x1, ..., xk y sus frecuencias
absolutas n1, ..., nk respectivamente. Se define la media geométrica como:
G= N
x1n1 ⋅ x2n2 ⋅ ⋅ xknk con n1 + n2 + ... + nk = N (2)
Su cálculo se hace posible mediante logaritmos. Aplicándolos en (1) queda:
Datos simples
La media armónica de una serie de N valores x1, ..., xN es el recíproco de la
media de los recíprocos de los valores. Es decir:
N N
H = = N
1 1 1
∑x
+ ++ 1
x1 x2 xN
i =1 i
Datos agrupados
La media armónica de k valores x1, ..., xk con frecuencias absolutas n1, ..., nk
se define como:
N N
H = = k
; con n1 + + nk = N y xi ≠ 0, ∀i
n1 n2 nk
∑
+ ++ 1
x1 x2 xk xi
i =1
12
tema 60
matemáticas
Proposición
Para una serie de valores x1, x2, ..., xN de una variable estadística X, la media arit-
mética, geométrica y armónica (siempre que existan) verifican que:
H≤G≤x
Demostración:
Veamos primero que H ≤ G para el caso particular de dos valores x1 y x2:
2 2 x1 x2
H≤G ↔ ≤ x1 x2 ↔ ≤ x1 x2 ↔ 2 x1 x2 ≤ x1 x2 ( x1 + x2 ) ↔
1 1
+ x1 + x2
x1 x2
↔ 4 x12 x 22 ≤ x1 x2 ( x1 + x2 ) ↔ 4 x1 x2 ≤ ( x1 + x2 )
2 2
↔ 4 x1 x2 ≤ x12 + 2 x1 x2 + x 22 ↔
↔ 0 ≤ ( x1 − x2 )
2
↔ 0 ≤ x12 − 2 x1 x2 + x 22
Que es una desigualdad que se verifica por lo que H ≤ G
Veamos ahora que G ≤ x :
x1 + x2
↔ 4 x1 x2 ≤ ( x1 + x2 ) ↔ 0 ≤ ( x1 − x2 )
2 2
G≤x ↔ x1 x2 ≤
2
2.1.5. Mediana
13
tema 60
matemáticas
Como la mediana deja a un lado y a otro un número de datos iguales, las frecuen-
cias a uno y otro lado también son iguales.
1
Puede suceder que la recta y =tenga un segmento de puntos comunes, entonces
2
se toma como mediana el punto medio del segmento.
14
tema 60
matemáticas
EB EM − BM
y, por tanto, 0 M = 0 N + AB = 0 N + ⋅ AC = 0 N + ⋅ AC
DC DC
Luego 0M es fácil de calcular, pues ON es la abscisa del extremo inferior del in-
1
tervalo que contiene a M, EM = , BM = AN es la frecuencia relativa acumulada
2
del intervalo anterior, DC es la frecuencia relativa del intervalo en que está la
∑f
1
− j
2 j =1
M = ai −1 + ei
fi
con ei = ai - ai-1
Si multiplicamos y dividimos por N (número total de datos) la fracción, queda:
i −1
∑n
N
− j
2 j =1
M = ai −1 + ei
ni
Veamos qué le sucede al valor de la mediana si tenemos que llevar a cabo un cam-
bio de origen y escala.
x − x0
Si realizamos el cambio ui = i y llamamos M (u) a la mediana de la nueva
c
distribución transformada, entonces se verifica que M = c M (u) + x0 como puede
demostrarse sin dificultad.
15
tema 60
matemáticas
Entre las ventajas de la mediana como medida de posición central podemos des-
tacar las siguientes:
Es sencilla de calcular.
No influyen en ella más que los datos centrales de la distribución, por lo que se
puede calcular aún cuando no se conozcan los valores extremos de la distribu-
ción, siempre claro está, que tengamos suficiente información respecto de sus
frecuencias.
Es de fácil interpretación al ser siempre un valor propio de la variable.
Inconvenientes
No puede expresarse mediante una fórmula matemática sencilla a efectos de rea-
lizar con ella grandes desarrollos algebraicos.
2.1.6. Moda
16
tema 60
matemáticas
17
tema 60
matemáticas
Ventajas:
Cálculo sencillo.
Fácil interpretación.
Por otro lado la obtención de las modas de una distribución tiene una importancia
propia derivada del hecho de que sirve para detectar posibles fusiones (mixturas)
de distintas poblaciones unidimensionales en la masa de datos. A veces la moda
nos avisa de la necesidad de dividir dicha masa de datos en partes distintas para
que el fenómeno que estamos tratando se estudie mejor.
Al igual que hemos hecho ya anteriormente con otras medidas, la moda, si se
efectúa un cambio de escala y traslación, toma la forma:
M0 = c M0(u) + x0
2.1.7. Percentiles
Pr = ai −1 + ⋅ ei
ni
2.1.8. Relación entre media, mediana y moda
desviada a la derecha
o más raramente:
desviada a la izquierda
18
tema 60
matemáticas
Tienen por objeto dar una idea de la mayor o menor concentración de los valores
de una distribución alrededor de los valores centrales.
2.2.1. Recorrido
2.2.2. Desviaciones
XX Desviación media
∑ x −C
1
D= ⋅ i
N i =1
∑ x −C ⋅n
1
D= ⋅ i i
N i =1
XX Varianza
∑ ( x − x)
1
σ2 = ⋅ i
2
N i =1
19
tema 60
matemáticas
∑ ( x − x)
1
σ2 = ⋅ i
2
⋅ ni
N i =1
u
siendo x la media aritmética de la distribución de valores x1, ..., xk y de las fre-
cuencias n1, ..., nk.
A la raíz cuadrada positiva de la varianza se llama desviación típica:
k
∑ ( x − x)
1
σ= ⋅ i
2
⋅ ni
N i =1
∑ ∑ (x
1 1
σ = ⋅
2
( xi − x ) ⋅ ni = ⋅
2 2
i + x 2 − 2 xxi )ni =
N i =1
N i =1
k k k k
∑ ∑ ∑ ∑nx
1 1 1 1
= ni xi2 + x 2 ni − 2 x ⋅ ni xi = 2
i i + x 2 − 2x x =
N i =1
N i =1
N i =1
N i =1
∑nx
1
= 2
i i −x
N i =1
luego:
k
∑nx
1
σ2 = 2
i i − x2
N i =1
xi ni ni xi ni x2i
x1 n1 n1x1 n1 x21
· · · ·
· · · ·
· · · ·
xi ni ni xi ni x2i
· · · ·
· · · ·
· · · ·
xk nk nk xk nk xk2
N = Σni Σni xi Σni x2i
20
tema 60
matemáticas
u u
En el caso general se hace xi = ui c + x0, x = u c + x0, entonces:
u u u
xi – x = (uic + x0) – (u c + x0) = c(ui – u)
∑ ( x − x ) n = N ⋅ ∑ c (u − u) n = c ∑ (u − u) n = c σ
1 1 1
σ2 = ⋅ i
2
i
2
i
2
i
2
⋅ i
2
i
2 2
u
N N
donde σu2 es la varianza de la variable u.
Finalmente σ2 = c2 · σ2u
Los cálculos se disponen en una tabla como sigue:
∑
1
Se aplica primero σ u2 = ⋅ ni ui2 − u 2 , y luego σ2 = c2 σu2
N
Marcas Frecuencias xi – x0
Intervalos ui = ———– ui uin2i
de clase absolutas ni c
[a0, a1) x1 n1 u1 u1n1 u1n21
[ai–1, ai) xi ni ui uini uin2i
[ak–1, ak) xk nk uk uk nk uk nk2
Σn1 Σu1 Σu1n1 Σu1n21
∑ ( x − x) = 0; −2∑ x + 2∑ x = 0; ∑ x = ∑ x = Nx
dl
= −2 i i i
dx
de donde:
x=
∑x i
= x, y como
d 2l
=2 ∑ 1 = 2N > 0
N dx 2
u
el valor mínimo corresponde a las desviaciones respecto a x.
4. Puede comprobarse que si se realiza un cambio de escala y traslación:
σ = c σ(u)
21
tema 60
matemáticas
2.3. Momentos
∑ (x − C)
1
mr = ⋅ i
r
N i =1
∑ (x − C)
1
mr = ⋅ i
r
⋅ ni
N i =1
∑x
1
mr = ⋅ r
i
N i =1
∑x
1
mr = r
i ⋅ ni
N i =1
u
Haciendo C = x se obtienen los momentos centrales o respecto a la media.
Para datos no agrupados:
N
∑ ( x − x)
1
mr = µr = ⋅ i
r
N i =1
∑ ( x − x)
1
µr = ⋅ i
r
⋅ ni
N i =1
22
tema 60
matemáticas
∑ ∑ f (x − m )
1
µr = ( xi − x ) r ni = i i 1
r
N i =1 i =1
r r r
= mr − m1mr −1 + + ( −1) r m1
r r
Para r = 2, 3 y 4 da:
µ2 = m2 – m12 (teorema de König)
µ3 = m3 − 3m2 m1 + 2m13
µ4 = m4 − 4 m3 m1 + 6 m12 m2 − 3m14
que dan los momentos centrales en función de los no centrales.
k k
Como mr = 1 ⋅
∑ ∑ f [( x − m ) + m ]
r
xir ni = i i 1 1
N i =1 i =1
desarrollando queda:
k
r r r
mr = ∑⋅f
i =1
i ( xi − m1 ) + ( x1 − m1 ) m1 + + m1 =
r
1
r −1
r
r r
= µr + m1 µr −1 + + m1r
r r
Hemos visto hasta ahora las medidas de centralización o posición y las medidas de
dispersión y, por tanto, tenemos una idea de la «forma» que tiene la distribución
objeto de nuestro estudio. Ahora bien, es necesario definir otra serie de medidas
23
tema 60
matemáticas
24
tema 60
matemáticas
Hay otros que son incluso más generales como el de Fisher que vale:
k
∑ ( x − x)
1
⋅ i
3
⋅ ni
N
g1 = i =1
σ3
Análogamente a como ocurría con el de Pearson:
Si g1 = 0, distribución simétrica
Si g1 > 0, asimetría a la derecha
Si g1 < 0, asimetría a la izquierda
XX Coeficiente de curtosis
Tiene el valor:
k
∑ ( x − x)
1
⋅ i
4
⋅ ni
N
g2 = i =1
−3
σ4
Si g2 = 0, tenemos una distribución mesocúrtica o asimilable a la distribución
normal de Gauss.
25
tema 60
matemáticas
26
tema 60
matemáticas
BIBLIOGRAFÍA
CALOT, G.: Curso básico de estadística descriptiva. Ed. Paraninfo.
FIDALGO RODRÍGUEZ, M.: Parámetros Estadísticos. Autor Editor.
G. BARBANCHO, A.: Estadística Elemental Moderna. Editorial Ariel.
GLASS, G.; STANLEY, G.: Métodos estadísticos aplicados a las Ciencias Sociales. Prentice Hall.
RIOS, S.: Métodos estadísticos. Ed. del Castillo.
27
tema 60
matemáticas
RESUMEN
Parámetros estadísticos.
Cálculo, significado y propiedades.
1.
1 Parámetros estadísticos
En un estudio estadístico es preciso utilizar valores numéricos o medidas que describan de
forma objetiva los datos recogidos. Estas medidas son los parámetros estadísticos.
2.
2 Cálculo, significado y propiedades
29
tema 60
matemáticas
2.1.5. Mediana
Se define el concepto de mediana y cómo se calcula en los casos discreto y continuo.
2.1.6. Moda
Se define el concepto de moda y cómo se calcula en los casos discreto y continuo.
2.1.7. Percentiles
2.2.1. Recorrido
2.2.2. Desviaciones
Se define el concepto de desviación y el de desviación media.
2.3. Momentos
La media y la varianza son un caso particular de unos parámetros llamados momentos. Se
distinguen entre momentos centrales y momentos respecto al origen.
30