You are on page 1of 33

1

NUCLEO TEMTICO I
INTRODUCCIN
La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran
cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la
estadstica interviene cuando se quiere conocer el estado sanitario de un pas, el consumo de ciertos
productos alimenticios, el rendimiento estudiantil, entre otros, a travs de ciertos parmetros como la
tasa de mortalidad de la poblacin, existencia de productos, promedios de notas, respectivamente. En
este caso, la estadstica describe la muestra en trminos de datos organizados y resumidos, y luego
infiere conclusiones respecto a la poblacin.

LA ESTADISTICA
La Estadstica, se puede definir como el conjunto de mtodos, normas, reglas y principios que tienen
como propsito por parte del investigador llevar a cabo las acciones de observar, agrupar, describir,
cuantificar y analizar el comportamiento de un grupo o poblacin en estudio. Es as como podemos
clasificar a la estadstica en dos grandes grupos:

CONCEPTOS ASOCIADOS A LA ESTADSTICA


En trminos generales, el estudio de la Estadstica supone el conocimiento y manejo de una serie de
trminos que nos permitirn comprender mejor el comportamiento de los datos en estudio y realizar
en forma adecuada el anlisis e interpretacin de la informacin.
POBLACIN: Es el conjunto general de todos los individuos (personas, objetos, mediciones) sobre los
cuales se desea estudiar un fenmeno y que poseen una caracterstica
particular en comn. Puede ser Finita (cuando el nmero de elementos
pueden ser contabilizados) o Infinita (cuando una poblacin tiene un tamao
tan grande que no es posible para el investigador someter todos los
elementos a medicin).
2

MUESTRA: Es un subconjunto de elementos que se extrae de la poblacin de estudio. Debe tener


como caractersticas: la aleatoriedad, homogeneidad y representatividad con respecto a la poblacin.
De la calidad de la muestra depende en gran medida la veracidad y objetividad del estudio.

TIPOS DE MUESTREO
Las muestras pueden ser elegidas mediante diversas tcnicas o
procedimientos. Estas tcnicas se clasifican segn el segn como sean
elegidos los individuos.
Se dividen en dos grandes grupos:
Muestreo probabilstico (o muestreo aleatorio): proceso de seleccin de individuos de manera que
cada sujeto tiene probabilidad positiva e independiente de ser seleccionado.
Muestreo aleatorio simple: 1) todos los individuos tienen la misma probabilidad de ser elegidos,
2) las observaciones se realizan con reemplazamiento, de forma que la poblacin es igual en todas
las extracciones.
Muestreo aleatorio estratificado: los individuos se dividen en grupos o estratos. La muestra se
elige escogiendo en cada estrato un nmero representativo de individuos.
Muestreo aleatorio sistemtico: se utiliza en muestras ordenadas. Consiste en seleccionar al azar
un elemento y a partir de l, incrementando un intervalo fijo, seleccionar toda la muestra.
Muestreo aleatorio por conglomerados: la poblacin est dividida en conglomerados naturales
(provincias, ciudades,etc.). Se seleccionan algunos conglomerados y se toman en representacin de
toda la poblacin.
Muestreo no probabilstico (o muestreo no aleatorio): la seleccin de los individuos se basa en el
criterio del investigador. No se conoce la probabilidad de que cada individuo sea elegido en la muestra.
Muestreo por cuotas: se basa en seleccionar la muestra despus de dividir la poblacin en grupos
o estratos. Los sujetos dentro de cada grupo se eligen por mtodos no probabilsticos.
Muestreo por conveniencia: consiste en seleccionar a los individuos que convienen al investigador
para la muestra. Esta conveniencia se produce porque al investigador le resulta ms fcil examinar a
estos sujetos, ya sea por proximidad geogrfica, por ser sus amigos, etc.
Muestreo de bola de nieve (o muestreo por referidos): se realiza sobre poblaciones en las que no
se conoce a sus individuos o es muy difcil acceder a ellos. Se llama muestreo de bola de nieve porque
cada sujeto estudiado propone a otros, produciendo un efecto acumulativo parecido a una bola de
nieve.
Muestreo casual o accidental: los individuos son elegidos de manera casual, sin ningn juicio
previo. Las personas que realizan el estudio eligen un lugar o un medio, y desde ahi realizan el estudio
a los individuos de la poblacin que accidentalmente se encuentren a su disposicin.
Muestreo discrecional (o muestreo por juicio): los sujetos se seleccionan a base del conocimiento
y juicio del investigador
3

VARIABLE
Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de
una poblacin.

ESCALA DE LOS NIVELES DE MEDICIN


Hay cuatro tipos de mediciones o escalas de medicin en estadstica y estos tienen diferentes grados
de uso en la investigacin estadstica. Los cuatro tipos de niveles de medicin:

ANLISIS DE ESCALA MAYORMENTE UTILIZADAS EN LOS TEST, ESCALAS Y


CUESTIONARIOS PSICOLGICOS
ESCALAS DE ORDENACIN
En las escalas de ordenacin, tambin denominadas escalas de arbitrarias o estimacin, cada
individuo ordena, por orden de preferencia, objetos o individuos en relacin con una caracterstica.
Esta disposicin puede hacerse por tres procedimientos principales: por escalas de puntos, de
clasificaciones directas y de combinaciones binarias.
1. En las escalas de puntos el sujeto debe puntuar segn su aceptacin o rechazo palabras entre las
presentadas.
4

2. En la escala de ordenacin, o de clasificacin directa, se pide al sujeto que ordene las palabras o
conceptos de mayor a menor agrado.

3. En las escalas de comparaciones binarias se ofrece al sujeto parejas de palabras y se le pide que
selecciona cul de las dos prefiere.

ESCALA VALORATIVA SUMATORIA


Una variacin de la anterior es la escala valorativa sumatoria. Es til para obtener una jerarqua de
objetos, personas, grupos, procesos, roles, ocupaciones, valores, etc. en una cierta propiedad o
variable. Esa propiedad o variable puede ser el prestigio, la simpata, la eficacia, etc.
El procedimiento es sencillo, se presentan al encuestado una serie de objetos, grupos, etc. a
jerarquizar y se le pide que punte a cada uno de ellos con un nmero (del 1 al 5 o del 0 a 10) su valor
en determinada caracterstica o propiedad.
Ejemplo:

La jerarqua puede obtenerse por diferentes procedimientos. El ms sencillo es calcular la media de


todas las puntuaciones para cada categora.
5

ESCALAS DE INTENSIDAD
Las escalas de intensidad o de apreciacin estructuran las opiniones bajo formas de respuesta en
abanico, segn la evolucin o grados de un continuum de actitud. Por ejemplo:
Una variacin es trazar una lnea graduada del 1 al 10, por ejemplo, y pedir que marque su grado de
acuerdo grficamente.

EL ESCALOGRAMA DE GUTTMAN

En el escalograma de Guttman se le presenta al sujeto una serie de cuestiones jerarquizadas de mayor


a menor y se pide su veracidad en cada caso. Parte de la idea de que las actitudes son escalables y
se trata de saber hasta dnde llega el encuestado en esa escala.
De esta forma, si un sujeto sujeto acepta una proposicin se supone que tambin lo hace en las
inferiores a l. Por ejemplo, se pregunta su tienen estudios universitarios, si tiene estudios medios,
primarios, etc. Se entiende que si tiene estudios universitarios tendr todos los dems. Aqu, frente a
las escalas valorativas, es objetivo es ordenar a las personas encuestadas, no a los objetos de estudio
Un ejemplo sobre el grado de compromiso poltica puede ser el siguiente:

Lo importante en esta tcnica es que las preguntas estn convenientemente jerarquizadas. Para ello
ha de hacerse un estudio piloto previo.

ESCALAS DE DISTANCIA SOCIAL


Variaciones a esta tcnica son las llamadas escalas de distancia social. Tienen como objetivo
establecer relaciones de distancia entre grupos. La ms extendida es la escala de Bogardus que
6

pretenda medir la intensidad de prejuicios nacionales y raciales. Bsicamente se trata de hacer


preguntas indirectas sobre la distancia del sujeto a una minora tnica o cultural, o una determinada
nacionalidad, etc.
Una de las diferencias es que en este tipo de escalas las preguntas suelen ir en orden decreciente,
para no influir en las respuestas de los sujetos.
Un ejemplo clsico para medir el grado de racismo es:

Escalas anlogas son las de Dood, que mide actitudes respecto a grupos nacionales, sociales o
religiosos, o la de Crespi.

ESCALA DE LIKERT
En este tipo de escalas se ofrece una afirmacin al sujeto y se pide que la califique del 0 al 4 segn
su grado de acuerdo con la misma. Estas afirmaciones pueden reflejar actitudes positivas hacia algo
o negativas.
Las primeras se llaman favorables y las segundas desfavorables. Es muy importante que las
afirmaciones sean claramente positivas o negativas, toda afirmacin neutra debe ser eliminada.

EL DIFERENCIAL SEMNTICO
El diferencial semntico es un procedimiento destinado a medir la significacin que tienen ciertos
objetos, hechos, situaciones o personas para los encuestados. Concretamente se mide esa
significacin a partir de la situacin del concepto del objeto analizado en un espacio semntico de
dimensiones valorativas. As, por ejemplo, el concepto de concierto de rock puede tener dos
7

significados diferentes para dos personas, A y B, en un espacio semntico definido por las
coordenadas: culturalidad y agresividad:
Para establecer el diferencial semntico de un objeto, situacin, hecho o persona, se proponen pares
de adjetivos contrapuestos, y se pide al encuestado que sita la cercana a cada extremo del par en
una escala de 7 grados.
Un ejemplo de pregunta sera:

La construccin del diferencial semntico comienza con la eleccin del o los conceptos o cuestiones
que se quiera analizar. Como siempre, la eleccin viene determinada por los objetivos de la
investigacin. El siguiente paso consiste en buscar los pares de adjetivos polares que se van a utilizar,
los cuales han de ser claramente enfrentados. Por ltimo se escoge la escala utilizada. Lo habitual es
5 o 7 grados. Los pares de adjetivos deben estar situados con distintas polaridades, se trata de evitar
que el encuestado piense que uno de los lados es el bueno y tienda a l. Aplicando esta tcnica se
obtiene una serie de puntuaciones o posiciones espaciales para cada sujeto, es el significado de ese
concepto para cada persona. A partir de esta informacin se puede localizar grupos de personas con
anlogos perfiles, y relacionarlo que determinadas caractersticas sociales o personales, o con las
respuestas a otras cuestiones.

DATOS ESTADSTICOS
Son nmeros que pueden ser comparados, analizados e interpretados.
El campo del cual son tomados los datos estadsticos se identifica como poblacin o universo.
Resmenes de datos:
Cualitativos
Distribucin de frecuencias
Grficas de barra y pastel
Cuantitativos
Distribucin de frecuencias
Grfica de puntos
Histogramas, Diagrama acumulativo
Diagrama de tallo y hojas
8

Mtodos para datos cualitativos.


a) Organizacin de los datos cualitativos: Tablas
Categoras de la variable: modalidades de la variable.
Frecuencia absoluta ("f"): n de veces que aparece una modalidad de una variable.
Frecuencia relativa ("fr") o proporcin ("p"): razn entre la frecuencia absoluta y el n de casos
total. fr= f/n
Porcentaje ("P"): tanto por ciento correspondiente a una modalidad de la variable.
% = fr= f/n x 100%

Ejemplo: Tabla correspondiente a la variable sexo.

Ejemplo: Representacin grfica de la variable sexo

Mtodos para datos cuantitativos.

Organizacin de los datos cuantitativos:

Distribucin de frecuencias.

Distribucin de frecuencias: intervalos y sus correspondientes frecuencias.


9

Intervalo: n de valores numricos de la variable englobados en una clase.


Intervalo simple o datos sin agrupar: una unidad de medida en cada intervalo.
Intervalo compuesto o datos agrupados: dos o ms unidades de medida en cada intervalo.
Lmites:
Lmites aparentes: puntuaciones del instrumento de medida.
Lmites reales: lmitesuperior ("l.s") - lmite inferior ("l.i.").
Punto medio del intervalo (Xm): Xm = (l.r.s + l.r.i) /2
Amplitud del intervalo ("i") o Intervalo Total: magnitud del segmento de valores que incluye.

It = l.s - l.i.

FRECUENCIAS
Frecuencia absoluta:
La frecuencia absoluta de una variable estadstica es el nmero de veces que
aparece en la muestra dicho valor de la variable, la representaremos por n i
Frecuencia Absoluta Acumulada:
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de
ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta
frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que
ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por N i
Frecuencia relativa:
La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el
tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea
una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia
relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos
por f i

Donde N = Tamao de la muestra


10

Frecuencia Relativa Acumulada:


Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada
dividido por el tamao de la muestra, y la denotaremos por Fi

PORCENTAJE
Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre
en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la
frecuencia relativa por 100. La denotaremos por p i

Porcentaje Acumulado:
Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar pori P como la frecuencia
relativa acumulada por 100.

Ejm. Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.

Ejemplo.
En funcin de los pesos de la seccin de estadstica, representar los resultados grficamente y
analizar.
Datos fabi
11

68,3 2

68,6 3

68,9 5

70,2 2

70,5 1

70,9 1

71,6 2

72,7 3

72,9 _ 1_

. 20

1) Intervalo total= lmite superior ("ls") - lmite inferior ("l.i.").


It = Ls Li It = 72,9 68,3 = 4,6

2) Intervalo de clase ( Ic ) Ic. =

Ic. = = 0.89= 0.9

3)Nmero de clases ( Nc)


12

4) Distribucin de la frecuencia

fi= cantidad de datos que hay en cada lmite de clase

Representacin grfica

NUCLEO
TEMTICO
II
13

Medidas descriptivas de datos estadsticos


Introduccin
Las medidas descriptivas son valores numricos calculados a partir
de la muestra y que nos resumen la informacin contenida en ella.

Medidas de centralizacin
Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones
en un conjunto de datos. Por orden de importancia, son:
Media aritmtica

MEDIA: (media aritmtica o simplemente media). Es el promedio aritmtico de las observaciones, es


decir, el cociente entre la suma de todos los datos y el nmero de ellos. Si xi es el valor de la variable
y ni su frecuencia, tenemos que:

Para datos no Agrupados


El nmero de das necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de
iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media,
mediana, moda, varianza y desviacin tpica.
SOLUCIN:
14

La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los
que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad
por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores
que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores
nos dar a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

Para Datos Agrupados:

Media Aritmtica

Calificaciones Frecuencia Xi fabi

Xi fabi
13 2 26
14 1 14
15 0 0
16 1 16
17 1 17
18 0 0
19 1 19
Total = 6 92
15

Mediana

(Me): es el valor que separa por la mitad las observaciones ordenadas de menor a
mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50%
son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es
par tomaremos como mediana la media aritmtica de los dos valores centrales.

Para datos agrupados sera utilizando la siguiente frmula:

Donde:

Me es mediana.

L es Lmite inferior de la clase mediana.

nes Tamao de muestra.

FA es Frecuencia Acumulada precedente a la clase mediana.

f es Frecuencia absoluta de la clase mediana.

c es amplitud del intervalo de clase.

De la tabla anterior se han tomado los valores necesarios para sustituir en la frmula y obtener el
valor de la Mediana:

L = 15.7

n = 90

FA = 31

f = 24

c=4
16

Al sustituir en la formula queda la siguiente expresin:

MODA (M0)

Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es
mayor. No tiene por qu ser nica.

Moda (datos agrupados)

Donde :
L = Limite inferior de la clase modal.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior.
C = Intervalo de clase.

Para su clculo, se determina la mayor frecuencia absoluta: 24 y luego aplicar la formula.

La clase es: 15,7 19,7


Entonces:

= 18,75= 18,8
17

Medidas de posicin

Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos,
que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los
percentiles.

PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y
por encima queda el 85%
CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
iguales, son un caso particular de los percentiles:

El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos
El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos
El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes
iguales, son tambin un caso particular de los percentiles.

Representacin grfica: en una escala que va del 0 al 100.

Cuartil 1:

Cuartil 2:

Cuartil 3:
18

Cuartil 4:

Ejemplo:

Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.

xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n=100

Solucin:

1. Primer cuartil:

2. Segundo cuartil:

3. Tercer cuartil:

En el siguiente ejercicio se muestran los clculos de lo Percentiles, Deciles y Cuartiles para Datos,
tanto No Agrupados como Agrupados
19

Calcular el percentil 35 y 60 de la distribucin de la tabla de datos agrupados:

Percentil 35

Percentil 60

Deciles

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

D5coincide con la mediana.

Clculo de los Deciles

En primer lugar buscamos la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.


20

Li es el lmite inferior de la clase donde se encuentra la mediana.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

Clculo del primer decil

Clculo del segundo decil

Clculo del tercer decil

Clculo del cuarto decil

Clculo del quinto decil

Clculo del sexto decil

Clculo del sptimo decil


21

Clculo del octavo decil

Clculo del noveno decil

Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados
en cuatro partes iguales.
Q1, Q2 y Q3determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Q2 coincide con la mediana.

Clculo de los cuartiles


1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa cada cuartil mediante la expresin:

Nmero impar de datos


2, 5, 3, 6, 7, 4, 9
22

Nmero par de datos


2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados


En primer lugar buscamos la clase donde se encuentra,

en la tabla de las frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra la mediana.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

Calcular los cuartiles de la distribucin de la tabla de datos agrupados:

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil


23

Medidas de dispersin
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin nos dicen hasta qu punto estas medidas de tendencia
central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Se
distingue entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras
y las relativas que nos permitirn comparar varias muestras.

Medidas de dispersin absolutas


VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media
aritmtica del conjunto de observaciones.

Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:

Si los datos estn agrupados utilizamos las marcas de clase en lugar de Xi.
DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al
cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica
que se define como la raz cuadrada positiva de la varianza

Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la
frmula (cuasi desviacin tpica):
24

RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones


mayor y el menor. Re = xmax - xmin

Medidas de dispersin relativas


COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin
de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales
se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin
tpica y el valor absoluto de la media aritmtica

CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo
tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

En el siguiente cuadro, calcular las medidas de Dispersin para Datos no Agrupados:

Calificaciones Frecuencia Xi fi
Xi fi

13 2 26

14 1 14

15 0 0

16 1 16

17 1 17

18 0 0

19 1 19

Total = 6 92

a) Rango o amplitud
25

La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada
puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el
nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre
las observaciones que tienen el mayor y el menor valor numrico en el mismo.
R = Ls LiR = 19 13 = 6

b) Desviacin semi-intercuartlica (DSC)


Es la mitad de la distancia entre el Tercer cuartil (C3) y el Primer Cuartil (C1), su frmula viene dada
por:

De este ejemplo se puede deducir que la diferencia entre C3 y el C1 siempre va a ser el 50% de las
observaciones, lo que vara es la distancia en unidades de acuerdo con las caractersticas de la
distribucin. Es decir, cuando los datos se concentren en el centro de la distribucin, la DSC ser
pequea, pero cuando los datos estn muy dispersos, la DSC ser grande.

c) Desviacin media
Es la media de los valores absolutos de la diferencia entre las variantes y la media aritmtica.

Calificaciones x-X
Xi

13 13 - 15 =2

14 14 - 15 =1
26

16 16 - 15 =1

17 17 - 15 =2

19 19 - 15 =4

Total = 10

Este valor indica que cada calificacin difiere de la media en un promedio de 1,67 ptos.

d) Desviacin estndar o tpica


Es considerada como la ms importante dentro de las medidas de dispersin y se utiliza para obtener
informacin del grado en que un dato se aparta de la media aritmtica, de la mediana o de la moda de
una distribucin normal y del grado en que se aparta de todos los dems datos de la misma
distribucin. En un sentido ms amplio, mide la desviacin promedio de cada variable respecto a la
media aritmtica.
Su frmula es

alificaciones x-X 2
Xi

13 13 - 15 2= 4

14 14 - 15 2= 1

16 16 - 15 2= 1

17 17 - 15 2= 4

19 19 - 15 2= 16

Total = 26
27

sto indica que en promedio cada calificacin difiere de la media aritmtica en 2,28 ptos.

e) Varianza.
Al cuadrado de la desviacin estndar se le denomina varianza. Igualmente se le conoce como el
promedio de los cuadrados de los desvos con respecto a la media.

S2 = DM = V(X) = S2 = ( 2,28) 2 = 5,2

Dentro de las relativas:


Coeficiente de variacin

La medida de dispersin relativa se expresa en porcentaje y se calcula;

Datos Agrupados.
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones
respecto a la media.
Desviacin media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media
es:

Varianza
La desviacin tpica es la raz cuadrada de la varianza.
La desviacin tpica se representa por .
28

Desviacin tpica para datos agrupados

Desviacin tpica para datos agrupados

Coeficiente de variacin
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media.%

Calcular medidas de dispersin


29

Medidas de forma
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de
barras de la distribucin, con la distribucin normal.

Medida de asimetra
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es
el Coeficiente de Asimetra de Pearson:
30

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y
negativo cuando existe asimetra a la izquierda.

Medida de apuntamiento o curtosis


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de
distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores
centrales de la variable.
Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores
centrales de la variable.

1. Mesocrtica, Normal K = 3

2. Plarticrtica, Menor apuntalamiento K< 3

3. Leptocrtica, Mayor apuntalamiento K > 3


(se encuentra entre -3 y 3).

Calcular las medidas de asimetra de Pearson y Bowley :

Nc LsLc Li fabi Fac xi

1 68,3 69,2 10 10 68,8


31

2 69,3 70,2 2 12 69,8

3 70,3 71,2 2 14 70,8

4 71,3 72,2 2 16 71,8

5 72,3 73,2 4 20 72,8

20

X = 70,2
Md = 69,3
Mo = 69,3
= 1,62

M.A Pearson en funcin de la Moda

Sustituyendo los valores:

M.A Pearson en funcin de la Mediana

Sustituyendo los valores:

M. A Bowley

Sustituyendo los valores


32

Curtosis: Al comparar cun aguda es una distribucin en relacin con la Distribucin Normal, se
pueden presentar diferentes grados de apuntalamiento.

1. Mesocrtica, Normal K = 3

2. Plarticrtica, Menor apuntalamiento K< 3

3. Leptocrtica, Mayor apuntalamiento K > 3


(se encuentra entre -3 y 3).

Una medida del apuntalamiento o curtosis( Kurtosis) de la distribucin est basada en los cuartiles y
percentiles, y est dada por el coeficiente de KurtosisPercentlico

Medida basada en Cuartiles y Percentiles

Calcular La Medida de Asimetra de Kurtosis


Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:

Calculando el cuartil uno se obtiene:


Q1= 9
Calculando el cuartil tres se obtiene:
Q3= 13.5
33

Calculando el percentil 90 se tiene:


P90= 16
Calculando el percentil 10 se tiene:
P10= 6

Calculando el coeficiente percentil de Kurtosis se obtiene:

Como la distribucin es platicrtica

Bibliografa

Pazos, C. (2017). Ncleo temtico I. Recuperado de:


http://campusvirtualuba.net.ve/aula2/mod/imscp/view.php?id=5789

Pazos, C. (2017). Ncleo temtico II. Recuperado de:


http://campusvirtualuba.net.ve/aula2/mod/imscp/view.php?id=5791

You might also like