You are on page 1of 17

Universidad Nacional

“Santiago Antúnez de Mayolo”

Facultad de Ingeniería Ambiental


Escuela profesional de Ingeniería Ambiental

MS.c. Emerson D. Norabuena Figueroa

1
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
UNIDAD III: MEDIDAS DE DISPERSIÓN

3.1. OBJETIVOS
 Desarrollar destrezas para calcular medidas de dispersión.
 Interpretar y utilizar las medidas de dispersión.
 Comparar las medidas de dispersión y seleccionar la mas útil para un
determina aplicación.

3.2. CONTENIDOS
 Rango, recorrido o amplitud
 Varianza
 Desviación típica o estándar
 Coeficiente de variación

2
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
UNIDAD III: MEDIDAS DE DISPERSIÓN

3.3. INSTRODUCCIÓN
Las medidas de dispersión están encaminadas a cuantificar lo próximos o
alejados que están los datos de la muestra de un punto central. Estas
medidas indicaran por un lado el grado de variabilidad que hay en la
muestra y, por otro, la representatividad de dicho punto central, ya que si
se obtiene un valor pequeño, eso significara que los valores se
concentran entorno a ese centro (por lo que habrá poca variabilidad y el
centro representara bien a todos). En cambio, si se obtiene un valor
grande, significara que los valores no están concentrados, sino dispersos
(por lo que habrá mucha variabilidad y el centro no será muy
representativo).

3
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
3.3. DEFINICIÓN
Las medidas de dispersión o variabilidad son números que miden el grado de
separación de los datos con respecto a un valor central, que generalmente es
la media aritmética.

Las principales medidas de dispersión son:


 El rango
 El rango intercuartil
 La varianza
 La desviación estándar
 El coeficiente de variación

3.3.1 Rango o recorrido


El rango es una medida de dispersión muy fácilmente calculable, pero es
muy inestable, ya que depende únicamente de los dos valores extremos. Su
valor puede cambiar grandemente si se añade o elimina un solo dato. Por
tanto su uso es muy limitado.

4
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
3.3.2 Varianza
La varianza, es una medida que cuantifica el grado de dispersión o de variación
de los valores de una variable cuantitativa con respecto a su media aritmética. Si
los valores tienden a concentrarse alrededor de su media, la varianza será
pequeña. Si los valores tienden a distribuirse lejos de la media, la varianza será
grande.

La varianza calculada a partir de una muestra será denotada por s2 y referida a


una población se denotará por 𝜎 2. Conocida también como la media aritmética
de los cuadrados de las diferencias de los datos con respecto a su media
aritmética.
La varianza es una medida de dispersión con unidades de medición al cuadrado
por ejemplo, $2, Km2, etc.

3.3.3 Desviación estándar

Es la raíz cuadrada positiva de la varianza, calculada a partir de una muestra se


denotara por s y referida a la población por 𝜎. Esto es, s = 𝑠 2 , 𝜎 2

5
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
3.4 CALCULO DE LA VARIANZA

3.4.1 Varianza de datos no tabulados


La varianza de n valores x1, x2,….. ,xn de alguna variable cuantitativa X cuya
media es 𝑥,ҧ es el número:
𝒏


෍ 𝒙𝒊 − 𝒙 2

𝒊 =1
2
𝑠 =
n

Es fácil verificar que: σ𝑛𝑖=𝑙(𝑥𝑖 − 𝑥)ҧ 2 = σ𝑛𝑖=𝑙(𝑥 2 𝑖 − 𝑛𝑥)ҧ 2


Por lo tanto,

σ𝑛𝑖=𝑙 𝑥 2 𝑖
𝑠2 = − 𝑥ҧ 2
𝑛

6
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
CASO 01:

El área de RR.HH de la UNASAM,2018, pretende analizar el ingresos


quincenales($) de la plana de docente de la institución, para incentivar
al docente a la capacitación permanente, para ello se recopiló los
siguientes datos:

63 89 36 49 56 64
43 53 70 57 62 43
64 72 52 51 62 60
59 60 67 57 67 61
53 64 76 44 73

7
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
3.4.1 Varianza de datos tabulados

3.4.1.1. Varianza para variable discreta


La varianza de n valores de una variable estadística discreta X que se
clasifican en k valores distintos x1, x2, …, xk con frecuencias absolutas
respectivas f1, f2, …, fk, y cuya media aritmética es 𝑥ҧ se calcula utilizando
la fórmula:
σ𝑘 2
𝑖=1 𝑓𝑖 (𝑥 𝑖 − 𝑥)
ҧ
𝑠2 =
𝑛

Se verifica que σ𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥)ҧ 2 = σ𝑘𝑖=1 𝑓𝑖 𝑥 2 𝑖 − 𝑛𝑥)ҧ 2


Por lo tanto,
2
σ𝑘𝑖=1 𝑓𝑖 𝑥 2 𝑖
𝑠 = − 𝑥ҧ 2
𝑛

8
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
CASO 02:

CN Consultores s.a., investigo el derrame de solución de cianuro en


relación a la responsabilidad del personal involucrado en el turno
(número de veces que acudió al área de investigación turno:
mañana/tarde/noche) de la mina Gold Internacional s.a.-2018, para lo
cual obtuvo los siguientes datos:
3 0 1 2 4 5
5 1 1 1 3 4
4 2 2 2 3 4
4 2 3 4 5 3
2 3 3 5 4 2

9
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
3.4.1.1. Varianza para variable cuantitativa

La varianza de n valores de alguna variable X, tabulados en k intervalos,


con marcas de clases m1, m2,…, mk, frecuencias absolutas respectivas f1,
f2, …, fk y con media 𝑥ҧ es el numero:

σ𝑘 ′ 2
𝑖=1 𝑓𝑖 (𝑥 𝑖 − 𝑥)
ҧ
𝑠2 =
𝑛

Se puede verificar que:


𝑘 𝑘
෍ 𝑓𝑖 (𝑥𝑖′ − 𝑥)ҧ 2 =෍ 𝑓𝑖 (𝑥𝑖′ )2 −𝑛𝑥ҧ 2
𝑖=1 𝑖=1
Por lo tanto,
σ𝑘 ′ 2
2 𝑖=1 𝑓𝑖 (𝑥𝑖 )
𝑠 = − 𝑥ҧ 2 .
𝑛

10
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
 Varianza para variable cuantitativa por frecuencia relativas

La varianza de n valores de alguna variable X, tabulados en k intervalos,


con marcas de clases m1, m2,…, mk, frecuencias absolutas respectivas f1,
f2, …, fk y con media 𝑥ҧ es el numero:
𝑘

𝑠 2 = ෍ ℎ𝑖 (𝑥𝑖′ )2 − 𝑥ҧ 2
𝑖=1

𝑑𝑜𝑛𝑑𝑒
𝑘

𝑥ҧ = ෍ ℎ𝑖 𝑥𝑖′
𝑖=1

 Varianza Poblacional
𝑁
σ𝑖=1 𝑥𝑖 − 𝜇
2 σ𝑁 2
𝑖=1 𝑥𝑖
𝜎2 = = − 𝜇2
𝑁 𝑁

11
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
Si formamos todas las muestras posibles de tamaño n y calculamos sus
varianzas utilizando la formula 𝑠 2 = σ 𝑥𝑖 − 𝑥ҧ 2 /𝑛, resulta que la media de
todas estas varianzas vale:
𝑛−1 2
𝜎
𝑛
Para que la media de todas las varianzas sea igual a 𝜎 2 , basta multiplicar a 𝑠 2
por 𝑛/ 𝑛 − 1 . Por esta razón, algunos autores definen la varianza (en
estadística descriptiva) con denominador 𝑛 − 1. Estas 2 varianzas se tratan en
el capítulo 9 de estimación de parámetros.

12
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
CASO 03:

13
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
4. COEFICIENTE DE VARIACIÓN

El coeficiente de variación C.V es una medida de dispersión relativa (libre de


unidades de medidas), que se define como la desviación estándar dividido por
la media aritmética. Esto es:
𝑠
𝐶. 𝑉. = , 𝑜 𝑒𝑛 %
𝑥ҧ
El coeficiente de variación se utiliza para comparar la variabilidad de dos o
más series de datos que tengan medias iguales o diferentes o que tengan
unidades de medida iguales o diferentes (por decir, una serie en kilogramos o
otra serie en metros)

14
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
Propiedades:

Si dos secciones H1 y H2 de matemática I, tienen la misma desviación


estándar igual a 14, no podemos concluir que los dos horarios tienen la
misma variabilidad. Así mismo, si las desviaciones estándares de HI y
H2 son iguales a 2 y 4 respectivamente no podemos concluir que las
notas de H2 son mas dispersas que las de H1. La variabilidad depende
de las medias de los dos grupos.
Si la media del horario H1 es 16 y la media del horario H2 es 11. Los
coeficientes de variación respectivos son:
𝑆1 14
𝐶. 𝑉1 . = = = 0.875, 𝑜 87.5%,
𝑋ത1 16
𝑆2 14
𝐶. 𝑉2 = = = 1.27 𝑜 127%
𝑋ത2 11
Es decir, las calificaciones obtenidas en H1 son mas homogéneas o
tienen menor variabilidad que las calificaciones del horario H2.

15
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
Uso de las medidas de dispersión:

La varianza viene expresada en unidades cuadráticas en las que vienen expresados los
datos. La desviación estándar viene expresada en las mismas unidades en las que vienen
expresados los datos. El coeficiente de variación viene expresada en números
abstractos(suprimiendo las unidades en las que vienen expresadas los datos).

 Si dos o más seres de datos (observados en el mismo tipo de medición) tienen medias
aritméticas iguales (o casi iguales) es más dispersa la serie que tiene mayor medida de
variabilidad:

 Si dos o más series de datos, no tienen medias iguales(o casi iguales), o no tienen las
mismas unidades de medición, entonces, es más dispersa la serie que tenga mayor
coeficiente de variación.

NOTA: (Valores estandarizados)

Cuando se necesiten comparar valores observados que pertenecen a diferentes


distribuciones de datos, las que difieren en su medida aritmética o en su varianza, o
difieren en el tipo de unidad de medida, entonces se usa el valor estándar Z que se define:
𝑋−𝑋ത
Z= (media = 0 , varianza = 1)
𝑆

16
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias
Propiedades

 La varianza es un número real no negativo y viene expresada en unidades cuadráticas.


Mientras, que la desviación estándar viene expresada en las mismas unidades en las
que vienen expresados los datos.

 Dadas, la media 𝑥ҧ y la varianza 𝑠𝑥2 de n datos de una variable X, la suma total de los
cuadrados de los valores es igual a n(𝑠𝑥2 + 𝑥ҧ 2 ). Para datos no tabulados se tiene por
ejemplo,

σ𝑛𝑖=1 𝑥𝑖2 = n(𝑠𝑥2 + 𝑥ҧ 2 )


 Si cada uno n de los valores 𝑥𝑖 es estandarizado en 𝑦𝑖 = 𝑎𝑥𝑖 + 𝑏, entonces, la varianza
de los n valores 𝑦𝑖 es, 𝑠𝑦2 = 𝑎2 𝑠𝑥2

Consiguientemente

17
Alvaron Robles Dennis Gabriela
MS.c. Emerson D. Norabuena Figueroa
Estadística Facultad
Minaya Carrión Christian Oscar e Informática de Ciencias

You might also like