You are on page 1of 270

UNIVERSIDAD TCNICA DEL NORTE

FACULTAD DE CIENCIAS ADMINISTRATIVAS Y ECONMICAS

INTERAPRENDIZAJE DE ESTADSTICA BSICA

AUTORES:
Mgs. Mario O. Surez I.
Msc. Fausto A. Tapia Z.

IBARRA - ECUADOR
2014

AUTORIDADES DE LA UNIVERSIDAD TCNICA DEL NORTE


Dr. Miguel Naranjo
RECTOR
Dra. Mara de la Portilla
VICERRECTORA ACADMICA
Ing. Ney Mora
VICERRECTOR ADMINISTRATIVO
Msc. Soraya Rhea
DECANA FACAE
Ing. Edgar Monteros
SUBDECANO FACAE

DERECHOS RESERVADOS DEL AUTOR:


Instituto Ecuatoriano de la Propiedad Intelectual
Direccin Nacional de Derecho de Autor y Derechos Conexos
Derecho de Autor N 038383
ISBN: 978-9942-11-239-2

Coordinacin de publicacin:
Universidad Tcnica del Norte

Segunda Edicin
Esta obra no puede ser reproducida total ni parcialmente por ningn medio sin expreso consentimiento
previo y por escrito de los autores.

Pedidos a: Mario: 062632166; 0985619601 mosuarez@utn.edu.ec; mgsmariosuarez@gmail.com


Fausto: 093754382, fatapia@utn.edu.ec; tapiafausto@gmail.com

Interaprendizaje de Estadstica Bsica

DEDICATORIA

Mario
Con infinito amor en expansin
a mi esposa Dyanita Rivera, a mis hijos Emily Monserrath y Mathas Josu,
por ser mi fuente de inspiracin y mi ms anhelado sueo hecho realidad,
y a mis padres Bertha Ibujs y Segundo Surez por su ejemplo de sacrificio y lucha constante.

Fausto
Con especial afecto a mi familia
por la paciencia y apoyo brindado para la realizacin de este trabajo.

Interaprendizaje de Estadstica Bsica

AGRADECIMIENTO

Nuestra gratitud y reconocimiento a las Autoridades


de la Universidad Tcnica del Norte y de la Facultad de Ciencias
Administrativas y Econmicas por el incondicional apoyo brindado
para la realizacin de la presente obra.

Interaprendizaje de Estadstica Bsica

CONTENIDOS
Pg.
1
3
4
5
9
10

CONTRAPORTADA
DEDICATORIA
AGRADECIMIENTO
CONTENIDOS
PRESENTACIN
EVALUACIN DIAGNSTICA
CAPTULO I
DESCRIPCIN Y PRESENTACIN DE LA INFORMACIN ESTADSTICA
1.1 Qu es la Estadstica?
A Historia
B Definicin
C Aplicaciones
D Fines
E Objetivos
F Mtodos
G Clasificacin de la Estadstica
i Estadstica Descriptiva o Deductiva
ii Estadstica Inferencial o Inductiva
1.2 Conceptos y Definiciones Bsicas
A Poblacin
B Muestra
C Elemento o Individuo
D Datos Estadsticos
E Censo
F Encuesta
G Variable
i Clasificacin
ii Niveles de Medicin
1.3 Tablas o Cuadros Estadsticos
1.4 Distribucin de Frecuencias
A Para datos sin Agrupar
B Para datos Agrupados en Clases o Intervalos
1.5 Grficos Estadsticos Bsicos
A Diagramas de Barras
B Histogramas
C Polgono de Frecuencias
i Polgono de Frecuencias Acumuladas u Ojiva
ii Polgono de Frecuencias Relativas Acumuladas Porcentuales
D Diagrama de Tallo y Hojas
E Diagrama de Sectores
F Pictogramas
CAPTULO II
MEDIDAS DE TENDENCIA CENTRAL
2.1 Media Aritmtica
A Media Aritmtica Simple
i Definicin
ii Mtodos de Clculo
a Para Datos No Agrupados
b Para Datos Agrupados en Tablas de Frecuencias
Interaprendizaje de Estadstica Bsica

11
12

13

14

15
16

18

21
23
28
36
47
54
59
60
61
66

75
76

c Para Datos Agrupados en Intervalos


B Media Aritmtica Ponderada
2.2 Media Geomtrica
A Propiedades
B Mtodos de Clculo
i Para Datos No Agrupados
ii Para Datos Agrupados en Tablas de Frecuencias
iii Para Datos Agrupados en Intervalos
2.3 Media Armnica
A Propiedades
B Mtodos de Clculo
i Para Datos No Agrupados
ii Para Datos Agrupados en Tablas de Frecuencias
iii Para Datos Agrupados en Intervalos
2.4 La Mediana
A Propiedades
B Mtodos de Clculo
i Para Datos No Agrupados
ii Para Datos Agrupados en Tablas de Frecuencias
iii Para Datos Agrupados en Intervalos
2.5 Medidas de Posicin
A Cuartiles
i Propiedades
ii Mtodos de Clculo
iii Diagrama de caja y bigotes
B Deciles
i Definicin
ii Mtodos de Clculo
C Percentiles o Centiles
i Definicin
ii Mtodos de Clculo
2.6 Moda
A Propiedades
B Mtodos de Clculo
i Para Datos No Agrupados
ii Para Datos Agrupados en Tablas de Frecuencias
iii Para Datos Agrupados en Intervalos
CAPTULO III
MEDIDAS DE DISPERSIN
3.1 Desviacin Media o Desviacin Promedio
A Propiedades
B Mtodos de Clculo
i Para Datos No Agrupados
ii Para Datos Agrupados en Tablas de Frecuencia
iii Para Datos Agrupados en Intervalos
3.2 Varianza y Desviacin Estndar
A Propiedades
B Mtodos de Clculo
i Para Datos No agrupados
ii Para Datos Agrupados en Tablas de Frecuencia
iii Para Datos Agrupados en Intervalos
3.3 Otras Medidas de Dispersin
A Rango, Amplitud Total o Recorrido
Interaprendizaje de Estadstica Bsica

81
84

87
88
89

91
94

97
98
102

108
117

118

121

124

127
128

130
131
134
135
140
142
145
6

B Amplitud Intercuartlica
C Rango Semi-intercuartil o Desviacin Cuartlica
D Rango Percentil o Amplitud Cuartlica
3.4 Dispersin Relativa o Coeficiente de Variacin
A Propiedades
B Mtodos de Clculo
CAPTULO IV
MEDIDAS DE FORMA
4.1 Asimetra
A Tipos de Asimetra
i Asimetra Negativa o a la Izquierda
ii Simtrica
iii Asimetra Positiva o a la Derecha
B Medidas de Asimetra
i Coeficiente de Pearson
ii Medida de Yule Bowley o Medida Cuartlica
iii Medida de Fisher
4.2 Curtosis o Apuntamiento
A Tipos de Curtosis
i Leptocrtica
ii Mesocrtica
iii Platicrtica
B Medidas de Curtosis
i Medida de Fisher
ii Medida basada en Cuartiles y Percentiles
CAPTULO V
CORRELACIN Y REGRESIN
5.1 Anlisis de Correlacin
A Diagrama de Dispersin
B Clasificacin de la Correlacin
i Segn la relacin entre variables
ii Segn el nmero de variables
iii Segn el valor cuantitativo
C Coeficientes de Correlacin
i Coeficiente de Correlacin de Karl Pearson
ii Coeficiente de Correlacin por Rangos de Spearman
D Coeficiente de Determinacin
5.2 Anlisis de Regresin
A Principio de los Mnimos Cuadrados
i La Recta de los Mnimos Cuadrados
ii La Parbola de los Mnimos Cuadrados
iii Regresin Exponencial
iv Regresin Potencial
B Error Estndar de Estimacin
CAPTULO VI
SERIES CRONOLGICAS
6.1 Definicin
6.2 Movimientos o Componentes
A Tendencia Secular
B Movimientos Estacionales
C Movimientos Cclicos

146

147

153
154

155

159

160

163
164

165
166
185
192
195

204
211
216
223

227
228

Interaprendizaje de Estadstica Bsica

233
7 234

D Movimientos Irregulares o Aleatorios


6.3 Modelos de Series de Tiempo
A Modelo Multiplicativo
B Modelo Aditivo
6.4 Mtodos de Suavizamiento y Pronstico
A Mtodo de los Promedios Mviles
B Suavizacin Exponencial
6.5 Anlisis de Tendencia
A Mtodo de los Mnimos Cuadrados
B Mtodo de los Semipromedios
6.6 Anlisis de Movimientos Estacionales
A Clculo del ndice Estacional por el Mtodo del Porcentaje Medio
B Desestacionalizacin de los Datos
6.7 Anlisis de Movimientos Cclicos e Irregulares

235

236
240
246
251
258

262

REFERENCIAS BIBLIOGRFICAS

Interaprendizaje de Estadstica Bsica

267

PRESENTACIN

La Estadstica es tan antigua como la humanidad y desde su origen ha tomado un carcter importante y
estratgico, aportando al desarrollo socio-econmico y poltico, por eso algunos estudiosos la llaman la
ciencia del Estado. Los historiadores afirman que las primeras formas de la Estadstica fueron los censos
de poblacin o bienes, organizados por el poder poltico con fines militares o fiscales. La Estadstica
hoy en da es considerada como una disciplina esencial en todos los campos del saber humano. Su
utilizacin es decisiva en la planeacin y programacin de las actividades de cualquier ndole, ayuda a
manejar informacin para resolver problemas, predecir o pronosticar hacia el futuro, y en definitiva, para
obtener conclusiones y tomar las decisiones ms adecuadas.

Conocedores que muchas personas por una u otra razn tienen cierto desinters a las asignaturas con base
matemtica como es la Estadstica, aun cuando estamos conscientes que los clculos matemticos
desempean un rol importante en nuestras vidas, se pone a disposicin del pblico la presente segunda
edicin con ejemplos ilustrativos que han sido cuidadosamente seleccionados y resueltos didcticamente
empleando un lenguaje matemtico sencillo de manera manual y recurriendo al uso de los programas de
fcil comprensin como son el Excel, el Graph y el GeoGebra. En cada captulo constan los resultados
de aprendizaje que se espera que los lectores sean capaces de alcanzar, los contenidos a tratar y las tareas
de interaprendizaje. Los contenidos y las tareas de interaprendizaje se han organizado de manera
secuencial e interrelacionadas entre s para afianzar y concatenar los resultados de aprendizaje que se van
logrando en el desarrollo de cada captulo del presente texto. En general, los lectores, dispondrn de los
elementos bsicos sobre esta fascinante disciplina, que les permitir aclarar juicios y ordenar ideas
orientadas al trabajo autnomo, reflexivo y creador durante el proceso de interaprendizaje de la misma.

Los contenidos y procesos didcticos de interaprendizaje de la presente obra ya fueron puestos en prctica
con las y los estudiantes en la primera edicin del mismo, obtenindose resultados ptimos, por lo que
estamos seguros que la presente segunda edicin tendr la acogida por parte de la comunidad acadmica
y seguir contribuyendo a mejorar significativamente la compresin de esta hermosa ciencia.

Seguros de que ninguna obra humana es perfecta, sern ustedes estimados lectores los que con sus
sugerencias nos seguirn ayudando a mejorar la presente propuesta.

Los Autores

Interaprendizaje de Estadstica Bsica

EVALUACIN DIAGNSTICA

Lea cuidadosamente cada una de las siguientes interrogantes y conteste segn sus conocimientos previos,
no importa si se equivoca. La presente evaluacin puede ser resuelta de manera grupal o individual.
Siempre trabaje con disciplina, honradez y buena voluntad. Recuerde que el xito se refleja en nuestro
trabajo y hay que lograrlo, tarea tras tarea, y merecer ese logro. Los Autores
Segn la naturaleza de los siguientes enunciados, escriba en el parntesis la letra V si es verdadero o la
F si es falso. Si su respuesta es F escriba el por qu? de su respuesta.
1)

La Estadstica se encarga del estudio de las caractersticas cualitativas del fenmeno.

( )

2)

A la Estadstica le interesan los fenmenos de tipo cuantitativo.

( )

3)

A la Estadstica solamente le interesa la recopilacin de datos.

( )

4)

Los fines de la estadstica son conocer las caractersticas de los fenmenos, analizarlos y
predecir lo que suceder en el futuro.

( )

Los objetivos de la Estadstica son recopilar, organizar, tabular y presentar grficamente


los datos, proporcionando una visin cuantitativa de los fenmenos observados.

( )

Los mtodos de la Estadstica son recopilar, clasificar, tabular y presentar datos para la
toma de decisiones y solucin de problemas.

( )

La estadstica descriptiva busca obtener informacin sobre la poblacin basndose en el


estudio de los datos de una muestra tomada a partir de ella.

( )

La estadstica inferencial se preocupa de llegar a conclusiones basados en la muestra y


luego hacerlos vlidos para toda la poblacin.

( )

La muestra es el conjunto de todos los elementos que tienen una caracterstica comn

( )

10) Las partes de una tabla o cuadro estadstico son: ttulo, conceptos o columna Matriz y
cuerpo del cuadro.

( )

5)

6)

7)

8)

9)

Conteste a las siguientes preguntas


11) Sugiera 5 referentes de informacin que usted suponga son de tipo estadstico.
12) Qu piensa usted que es la Estadstica?
13) Para qu sirven los censos poblacionales o de alguna otra ndole?
14) Redacte un pensamiento que indique la importancia de la Estadstica.
15) Para qu sirven los grficos estadsticos?. Enumere los que usted conoce.
16) Qu son las medidas de tendencia central?. Enumere las que usted conoce.
17) Defina con sus propias palabras lo que entiende por medidas de dispersin. Enumere las que usted
conoce.
18) Qu entiende por medidas de forma?
19) En qu se diferencian la correlacin y la regresin?
20) Cul es la aplicacin principal de las series cronolgicas?

Interaprendizaje de Estadstica Bsica

10

CAPTULO I

DESCRIPCIN Y PRESENTACIN DE LA INFORMACIN ESTADSTICA

RESULTADOS DE APRENDIZAJE:
Describe con sus propias palabras conceptos bsicos de Estadstica y su aplicacin.
Recopila informacin estadstica utilizando encuestas.
Organiza, interpreta y presenta la informacin estadstica en tablas y grficos de manera manual y
empleando Excel.

CONTENIDOS:

Qu es la Estadstica?
Conceptos y Definiciones Bsicas.
Tablas o Cuadros Estadsticos.
Distribucin de Frecuencias.
Grficos Estadsticos.

Descripcin y Presentacin de la Informacin Estadstica

11

1.1) QU ES LA ESTADSTICA?
A) HISTORIA
Establecer con absoluta claridad y precisin el proceso de desarrollo de esta ciencia que actualmente se
llama Estadstica, es una tarea difcil ya que la informacin que se dispone es fragmentada, parcial y
aislada.
Es seguro que desde la antigedad se realizaron inventarios de habitantes, bienes, productos, etc. Estos
inventarios o censos (palabra derivada del latn cencere que significa valuar o tasar) se realizaron con
fines catastrales, tributarios y militares.
En Egipto ya en el ao 3050 a. c se tiene noticias de estadsticas destinadas a fines semejantes a los
sealados y especialmente en la construccin de las pirmides.
En China en el ao 2000 a. c. se conocen estudios similares. El nacimiento de Cristo coincide con la
realizacin de un censo poblacional en gran escala en el Imperio Romano. Durante mucho tiempo se
entenda por estadstica la informacin relacionada con el gobierno, la palabra misma se deriva del
latn statisticus o estatus que significa del estado.
Ya en nuestra era, en el ao 727, los rabes realizaron estadsticas similares en lo que hoy es Espaa. En
Inglaterra en el ao 1083 y 1662 y el Alemania en 1741, se llevaron a cabo censos referentes a
defunciones, nacimientos, enfermedades, posesin de bienes, migraciones y otros problemas y los datos
obtenidos se utilizaron en la previsin y planificacin. En Amrica se realizaron encuestas mediante el
sistema de quipus.
El desarrollo cientfico de la estadstica comienza recin en el siglo XVII, con la introduccin en el
pensum de estudio de las universidades en Alemania.
A comienzos del siglo XX, una nueva aportacin de la escuela inglesa, preocupada por problemas de
ndole agropecuaria y biomtrica coloca a la estadstica en el tramo final de su establecimiento como
ciencia.
En general las primeras aplicaciones de la estadstica tuvieron que ver directamente con las actividades del
estado. Se cree que la primera persona que hizo uso de la palabra estadstica fue Godofredo Achenwall
(1719-1772), profesor y economista alemn, escribi sobre el descubrimiento de una nueva ciencia que
llam estadstica (palabra derivada de Staat que significa gobierno) y que defini como el conocimiento
profundo de la situacin respectiva y comparativa de cada estado.

B) DEFINICIN
Existen muchas definiciones de Estadstica, pero en sntesis la podemos definir como la ciencia rama de
la Matemtica que se ocupa de recolectar, organizar, presentar, analizar e interpretar informacin
cuantitativa para obtener conclusiones vlidas, solucionar problemas, predecir fenmenos y ayudar a una
toma de decisiones ms efectivas.

Descripcin y Presentacin de la Informacin Estadstica

12

C) APLICACIONES
La Estadstica anteriormente slo se aplicaba a los asuntos del Estado, pero en la actualidad la utilizan
las compaas de seguros, empresarios, comerciantes, educadores, etc. No hay campo de la actividad
humana que no requiera del auxilio de esta ciencia, as por ejemplo:
- El educador mediante la estadstica podr conocer si un estudiante lee muy bien o regular, si la
asistencia es normal o irregular, si la estatura est en relacin con la edad, media aritmtica de
rendimiento escolar en un perodo determinado, etc.
- El hombre de negocios realiza encuestas estadsticas para determinar la reaccin de los consumidores
frente a los actuales productos de la empresa y en el lanzamiento de los nuevos.
- El economista emplea una amplia gama de estadsticas para estudiar los planes de los consumidores y
efectuar pronsticos sobre las tendencias de las actividades econmicas
- El gerente de una empresa elctrica proporciona un buen servicio a la comunidad mediante la variacin
estacional de las necesidades de carga
- El socilogo trata de auscultar la opinin pblica mediante encuestas, para determinar su preferencia
por un candidato presidencial, o su posicin frente a determinados problemas econmicos, polticos o
sociales
- El gelogo utiliza mtodos estadsticos para determinar las edades de las rocas
- El Genetista determina las semejanzas entre los resultados observados y esperados en una experiencia
gentica se determina estadsticamente

D) FINES
- Conocer las caractersticas de un grupo de casos de estudio.
- Comparar entre los resultados actuales y los obtenidos en experiencias pasadas para determinar las
causas que han influenciado en los cambios.
- Predecir lo que pude ocurrir en el futuro de un fenmeno.

E) OBJETIVOS
- Describir numricamente las caractersticas de los conjuntos de observaciones. Esta etapa consiste en
recopilar, organizar, tabular y presentar grficamente los datos, proporcionando una visin cuantitativa
de los fenmenos observados.
- Analizar los datos de manera objetiva con el fin de disponer de un concepto claro de universo o
poblacin y adoptar decisiones basadas en la informacin proporcionada por los datos de la muestra.
- Estimar o predecir lo que suceder en el futuro con un fenmeno de una manera relativamente
aceptable, as por ejemplo, podemos estimar cul ser la poblacin del pas dentro de un determinado
nmero de aos conociendo la actual.
Descripcin y Presentacin de la Informacin Estadstica

13

F) MTODOS
- Recopilacin.- Consiste en la obtencin de datos relacionados con el problema motivo de estudio,
utilizando instrumentos, tales como: cuestionarios, entrevistas, informes, memorias, etc.
- Organizacin.- Consiste en realizar una crtica, correccin, clasificacin y tabulacin de los datos
obtenidos en el paso anterior.
- Presentacin.- Consiste en mostrar datos de manera significativa y descriptiva. Los datos deben
colocarse en un orden lgico que revele rpida y fcilmente el mensaje que contienen. La presentacin
se la puede hacer a travs de grficos estadsticos.
- Anlisis.- Consiste en descomponer el fenmeno en partes y luego examinar cada una de ellas con el
objetivo de lograr una explicacin, haciendo uso, en su mayora, de los clculos matemticos.
- Interpretacin.- Consiste en un proceso mental, mediante el cual se encuentra un significado ms
amplio de los datos estadsticos con el objetivo de llegar a conclusiones para la toma de decisiones y
solucin de problemas.
G) CLASIFICACIN DE LA ESTADSTICA
i) Estadstica Descriptiva o Deductiva
Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal
que describa fcil y rpidamente las caractersticas esenciales de dichos datos mediante el empleo de
mtodos grficos, tabulares o numricos, as por ejemplo:
Supngase que un docente de Matemtica calcula la calificacin promedio de uno de sus cursos a su
cargo. Como solo se est describiendo el desempeo del curso pero no hace ninguna generalizacin
acerca de los diferentes cursos, en este caso el maestro est haciendo uso de la Estadstica Descriptiva.
ii) Estadstica Inferencial o Inductiva
Llamada tambin inferencia estadstica, la cual consiste en llegar a obtener conclusiones o
generalizaciones que sobrepasan los lmites de los conocimientos aportados por un conjunto de datos.
Busca obtener informacin sobre la poblacin basndose en el estudio de los datos de una muestra
tomada a partir de ella, as por ejemplo:
Supngase ahora que el docente de Matemtica utiliza el promedio de calificaciones obtenidas por uno
de sus cursos para estimar la calificacin promedio de los 5 cursos a su cargo. Como se est realizando
una generalizacin acerca los diferentes cursos, en este caso el maestro usa la Estadstica Inferencial.
1.2) CONCEPTOS Y DEFINICIONES BSICAS
A) POBLACIN
Llamado tambin universo o colectivo es el conjunto de todos los elementos que tienen una caracterstica
comn.
Una poblacin puede ser finita o infinita. Es poblacin finita cuando est delimitada y conocemos el
nmero que la integran, as por ejemplo: Estudiantes de la Universidad UTN. Es poblacin infinita
cuando a pesar de estar delimitada en el espacio, no se conoce el nmero de elementos que la integran,
as por ejemplo: Todos los profesionales universitarios que estn ejerciendo su carrera.
Descripcin y Presentacin de la Informacin Estadstica

14

B) MUESTRA
Es un subconjunto de la poblacin. Ejemplo: Estudiantes de 2do Semestre de la Universidad UTN.
Sus principales caractersticas son:
Representativa.- Se refiere a que todos y cada uno de los elementos de la poblacin tengan la misma
oportunidad de ser tomados en cuenta para formar dicha muestra.
Adecuada y vlida.- Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer
un mnimo de error posible respecto de la poblacin.
Para que una muestra sea fiable, es necesario que su tamao sea obtenido mediante procesos matemticos
que eliminen la incidencia del error.
Para calcular el tamao de la muestra suele utilizarse la siguiente frmula:
2 2
=
( 1) 2 + 2 2
Donde:
n = el tamao de la muestra.
N = tamao de la poblacin.
= Desviacin estndar de la poblacin que, generalmente cuando no se tiene su valor, suele utilizarse
un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se
lo toma en relacin al 95% de confianza equivale a 1,96 (como ms usual) o en relacin al 99% de
confianza equivale 2,58, valor que queda a criterio del encuestador.
e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un
valor que vara entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

Ejemplo ilustrativo: Calcular el tamao de la muestra de una poblacin de 1000 elementos.


Solucin:
Se tiene N=1000, y como no se tiene los dems valores se tomar = 0,5, Z = 1,96 y e = 0,05.
Reemplazando valores en la frmula se obtiene:
2 2
1000 0,52 1,962
1000 0,25 3,8416
=
=
=
( 1) 2 + 2 2 (1000 1) 0,052 + 0,52 1,962 (999) 0,0025 + 0,25 3,8416
=

960,4
960,4
=
= 277,74 = 278
2,4975 + 0,9604 3,4579

Descripcin y Presentacin de la Informacin Estadstica

15

Estos clculos realizados en Excel se muestran en la siguiente figura:

C) ELEMENTO O INDIVIDUO
Unidad mnima que compone una poblacin. El elemento puede ser una entidad simple (una persona) o
una entidad compleja (una familia), y se denomina unidad investigativa.

D) DATOS ESTADSTICOS
Son medidas, valores o caractersticas susceptibles de ser observados y contados. Como por ejemplo, la
edad de los estudiantes de la Universidad UTN.
Los datos estadsticos pueden ser clasificados en cualitativos (la diferencia entre ellos es de clase y no
de cantidad), cuantitativos (representan magnitudes), cronolgicos (difieren en instantes o perodos de
tiempo) y geogrficos (referidos a una localidad).
Los datos estadsticos se obtienen de fuentes primarias (obtenidos directamente sin intermediarios
valindose de observaciones, encuestas, entrevistas y sondeos de opinin) y fuentes secundarias
(obtenidos a travs de intermediarios valindose de textos, revistas, documentos, publicaciones de
prensa, y dems trabajos hechos por personas o entidades).

E) CENSO
Es una tcnica de recoleccin de datos estadsticos que se realiza a toda la poblacin

F) ENCUESTA
Es la tcnica que nos permite recolectar datos estadsticos que se realiza una muestra de la poblacin.
Se clasifica en:
- Descriptiva.- Cuando registra datos referentes a las caractersticas de los elementos o individuos.
- Explicativa.- Cuando averigua las causas o razones que originan los fenmenos.
- Mixtas.- Cuando es descriptiva y explicativa.
- Por muestreo.- Cuando recolecta informacin de grupos representativos de la poblacin.

Descripcin y Presentacin de la Informacin Estadstica

16

Su estructura es:
- Nombre de la institucin que auspicia la encuesta.
- Tema de la encuesta.
- Objetivos de la encuesta.
- Datos informativos: Lugar, fecha, y otros datos que se considere necesario segn la naturaleza de la
informacin estadstica a encuestarse.
- Instrucciones para el encuestado para que sepa la forma de llenar la encuesta.
- Cuestionario o listado de preguntas (cerradas, abiertas, o ambas a la vez) sobre los diferentes aspectos
motivo de estudio.
- Frase de agradecimiento al encuestado, como por ejemplo, Gracias por su colaboracin!

Las diferentes tipos de preguntas pueden ser:


- Abiertas.- Son aquellas en la cual el encuestado construye la respuesta de manera libre segn su opinin
y de la manera que l desea. Ejemplo: Qu piensa usted sobre la poltica educativa del actual gobierno?
- Cerradas o dicotmicas.- Slo pueden ser contestadas por un s o por un no. Ejemplo: Est usted
de acuerdo con la poltica educativa del actual gobierno?
Si
No

( )
( )

Como es obvio, la respuesta ser forzosamente una de las alternativas planteadas: Las preguntas cerradas
son fciles de tabular y facilitan la cuantificacin mediante la asignacin de puntuaciones.
- Preguntas de eleccin mltiple o categorizada: Se trata en cierto modo de preguntas cerradas que,
dentro de los extremos de una escala permiten una serie de alternativas de respuestas cuyos matices son
fijados de antemano. Presentan dos formas: En abanico y de estimacin
- Preguntas con respuesta en abanico: Estas preguntas permiten contestar sealando una o varias
respuestas presentadas junto con la pregunta. Por ejemplo: Indique otras alternativas que considere
importantes para mejorar la educacin en nuestro pas.
- Preguntas de Estimacin: Son preguntas cuantitativas que introducen diversos grados de intensidad
creciente o decreciente para un mismo tem. Ejemplos:
-Cmo calificara la poltica educativa del gobierno actual?
Excelente ( )

Muy Buena ( )

Regular ( )

Deficiente ( )

-En qu porcentaje est de acuerdo con la poltica educativa del gobierno actual?
100% ( )

75% ( )

50% ( )

25% ( )

Descripcin y Presentacin de la Informacin Estadstica

0% ( )
17

- Le interesa conocer el modelo educativo vigente en el Ecuador?


Nada ( )

Poco ( )

Algo ( )

Mucho ( )

Piensa culminar sus estudios superiores?


S ( )

Probablemente S ( )

No ( )

An no decido ( )

G) VARIABLE
Son caracteres susceptibles a cambio y pueden tener diferentes valores en cada elemento o individuo.

i) Clasificacin
- Variable Cualitativa
Son atributos que se expresan mediante palabras no numricas. Como por ejemplo, profesin, religin,
marca de automvil, estado civil, sexo, raza, etc.

- Variable Cuantitativa
Es toda magnitud representada por nmeros. Como por ejemplo, peso, estatura, nmero de habitantes,
etc.

- Variable Discreta
Es una caracterstica cuantitativa representada por nmeros enteros o exactos, que generalmente resultan
del proceso de conteo, como por ejemplo: nmero de estudiantes de la promocin del ao anterior.

- Variable Continua
Es una caracterstica cuantitativa que puede tomar cualquier valor representado por un nmero racional,
que generalmente resultan del proceso de medicin, como por ejemplo, tiempo destinado a estudiar
Estadstica

ii) Niveles de medicin

- Nivel Nominal
Cuando los datos slo pueden contarse y clasificados en categoras, no existe un orden especfico entre
las clases. Como por ejemplo, se cuentan cuntos hombres y cuntas mujeres asisten a determinado
evento.

Descripcin y Presentacin de la Informacin Estadstica

18

- Nivel Ordinal
Cuando se ordenan los datos por jerarquas, una categora es mayor que otra. Como por ejemplo,
excelente es mejor que bueno o bueno es mejor que regular. Otro ejemplo: Una persona puede tener
mucho o poco dinero.

- Nivel de Intervalos
Cuando se incluye todas las caractersticas del nivel ordinal, pero la diferencia entre los valores tiene un
significado medido en unidades iguales que son comunes y constantes, que permiten asignar nmeros
reales a todos los miembros de la clase ordenada, facilitando el establecimiento de diferencias en grados
de propiedad y entre objetos sobre la base de una medida. Como por ejemplo: La diferencia entre 70
kilogramos y 60 kilogramos, es de 10 kilogramos. Otro ejemplo: Si la temperatura de hoy es de 20 grados
centgrados y la de ayer fue de 25 grados centgrados, se sabe que la de hoy es 5 grados centgrados ms
baja que la de ayer.

- Nivel de Razn o Cociente


Este es el nivel de medicin ms alto, tiene todas las caractersticas del nivel de intervalos y adems
en este nivel de medicin el cero tiene significado (as si se tiene 0 dlares, entonces no se poseen fondos),
y la razn (o cociente) entre dos nmeros tambin es significativa (Un estudiante obtiene una calificacin
de 3/10 y otro 6/10, el segundo estudiante obtiene el doble que el primero).

TAREA DE INTERAPRENDIZAJE N 1
1) Realice un organizador grfico (cuadro sinptico, mapa conceptual, mentefacto, etc.) sobre la
historia de la Estadstica.
2) Etimolgicamente resuma qu significa la Estadstica
3) Defina con sus propias palabras lo que entiende por Estadstica.
4) Proponga 3 aplicaciones de la Estadstica en su vida cotidiana.
5) Realice un organizador grfico sobre los fines de la Estadstica.
6) Realice un organizador grfico sobre los objetivos de la Estadstica.
7) Realice un organizador grfico sobre los mtodos de la Estadstica.
8) Defina con sus propias palabras lo que entiende por Estadstica Descriptiva y Estadstica Inferencial.
Ilustre con un ejemplo cada definicin.
9) Proponga 3 ejemplos de poblacin, muestra y elemento.
10) Calcule el tamao de la muestra para una poblacin de 5000 con un error de muestreo del 5% y nivel
de confianza del 95%. Realice los clculos de manera manual y empleando Excel.
357
11) Consulte en la biblioteca o en el internet sobre los tipos de muestreo. Presente la consulta en un
organizador grfico.
Descripcin y Presentacin de la Informacin Estadstica

19

12) Realice un organizador grfico sobre los datos estadsticos.


13) Escriba una semejanza y una diferencia entre censo y encuesta.
14) Elabore una encuesta mixta con 10 preguntas sobre cualquier tema de su preferencia. Y aplique la
encuesta empleando los conocimientos del tamao de la muestra.
15) Segn el tipo de variable, escriba en el parntesis la letra D si es Discreta o la C si es Continua.
Escriba el por qu? de su respuesta.
15.1)

Nmero de aulas de una universidad.

( )

15.2)

Nmero de goles recibidos por un equipo de ftbol.

( )

15.3)

Estatura de los compaeros del curso de Estadstica.

( )

15.4)

Peso del contenido de una caja de cereal.

( )

15.5)

Nmero de libros ledos el ao pasado.

( )

15.6)

Dimetro de un cojn.

( )

15.7)

Nmero de artculos defectuosos producidos por una mquina.

( )

15.8)

Volumen de aire en un aula.

( )

15.9)

Nmero de individuos de un sector que reciben el bono solidario.

( )

15.10) Temperatura ambiente en una ciudad.

( )
D, D, C, C, D, C, D, C, D, C

16) Segn el nivel de medicin de las variables, escriba en el parntesis la letra N si es Nominal, La O si
es Ordinal, la I si es de Intervalos o la R si es de Razn. Escriba el por qu? de su respuesta.
16.1)

Nivel de riesgo sobre catstrofes naturales en una ciudad.

( )

16.2)

Salarios de los miembros de una familia.

( )

16.3)

El nmero de aos que cada empleado ha trabajado.

( )

16.4)

Un sistema para medir las preferencias de los clientes respecto a los vehculos con base
en su estilo.

( )

16.5)

Un sistema para identificar las ciudades de nacimiento de los alumnos.

( )

16.6)

Un sistema para evaluar a los empleados con base en el nmero de das que faltan al
trabajo.

( )

16.7)

Un sistema para medir las edades de los alumnos.

( )

16.8)

Un sistema para medir la calificacin de un examen especial de ingreso a la


Universidad.

( )

Descripcin y Presentacin de la Informacin Estadstica

20

16.9)

Determinar la cantidad de dinero gastado en ropa en el mes pasado.

( )

16.10) Determinar el nmero de abrigos de mujer para el invierno.

( )

16.11) Un sistema para medir volmenes de lquidos.

( )

16.12) Indicar el estado civil de los compaeros de trabajo.

( )

16.13) Determinar el tiempo utilizado para estudiar en el mes pasado.

( )

16.14) Promedio de calificacin de los estudiantes.

( )

16.15) Calificaciones de los estudiantes en la primera prueba de Estadstica.

( )

16.16) Determinar el nmero de pantalones utilizados la semana pasada.

( )

16.17) Ponderacin de las calificaciones obtenidas por un estudiante en un colegio.

( )

16.18) Nmero de trabajos terminados, en el ltimo ao, de los empleados de una fbrica.

( )

16.19) Determinar si a un grupo de personas les gustan o no un determinado producto.

( )

16.20) Las distancias entre las casas de un sector.

( )

O, R, N, N, N, O, I, O, O, N, I, N, O, I, I, N, N, O, N, R
17) Proponga 3 ejemplos de cada una de los tipos de variables y 3 ejemplos de cada uno de los niveles
de medicin.

1.3) TABLAS O CUADROS ESTADSTICOS


Son representaciones tabulares que sirven para ordenar la informacin estadstica, las cuales estn
formadas de filas (horizontales) y columnas (verticales).
Sus partes son:
- Nmero.- Es necesario sobre todo cuando existen varios cuadros
- Ttulo.- Consiste en la descripcin del contenido en forma entendible. Responde a las interrogantes:
qu?, cmo?, dnde?, cundo? y cunto?
- Encabezado.- Son los ttulos de la parte superior de las columnas
- Conceptos.- Son descripciones que van en las filas del cuadro y son clasificaciones de los encabezados.
- Columna Matriz.- Se conforma de los diferentes conceptos.
- Cuerpo.- Constituye el contenido mismo del cuadro.
- Fuente.- Se pone cuando los datos han sido sacados de documentos o fuentes secundarias. Se ubica
debajo del cuadro.
Descripcin y Presentacin de la Informacin Estadstica

21

- Nota de Encabezado.- Sirven para clarificar partes del cuadro que no han sido incluidas en el ttulo. Se
ubica despus del ttulo entre parntesis. No siempre est presente en un cuadro.
- Nota de Pie.- Sirven para clarificar algunas partes del cuadro que no son explicadas en ninguna parte.
Se ubica despus de la fuente. No siempre est presente en un cuadro.

A continuacin se presenta un ejemplo ilustrativo de cuadro identificando sus partes:


Cuadro N
Ttulo
INSCRIPCIONES EN INSTITUCIONES DE EDUCACIN SUPERIOR, POR TIPO Y POR
GNERO 2010-2011
Nota de encabezado

(en miles)

Columna matriz

TIPO DE INSTITUCIN
Universidades
Escuelas Politcnicas
Institutos Tecnolgicos
Institutos Militares

Encabezados

Hombres

2010
Mujeres

TOTAL
.
.
.
.

2011
Hombres Mujeres TOTAL

Conceptos

Cuerpo

Fuente: Departamento de Estadstica del SENECYT


Nota de pie: Inscripciones de estudiantes regulares slo del primer semestre.

Descripcin y Presentacin de la Informacin Estadstica

22

TAREA DE INTERAPRENDIZAJE N 2
1) Elabore un cuadro sobre cualquier informacin de su preferencia e identifique sus partes.
2) El Colegio D & M en el ao lectivo 2010-2011 tiene 800 alumnos y para su funcionamiento dispone
del siguiente personal por estamento: directivo: un rector y un vicerrector; de control: un inspector
general y 3 inspectores; docente: 80 maestros; psiclogos: 2; de administracin: 4, y mantenimiento: 10.
Llene la siguiente tabla o cuadro:
Cuadro N 1
PERSONAL DEL COLEGIO D & M POR ESTAMENTO Y ALUMNOS POR CADA UNO EN
EL AO LECTIVO 2010-2011
Estamento N de personas Alumnos por cada uno
Directivo
2
400

Totales
Fuente: Departamento Administrativo del Colegio D & M
3) Investigue el consumo de energa elctrica de su domicilio durante cada uno de los 6 ltimos meses.
Elabore un cuadro o tabla con los datos investigados, calculando el porcentaje de consumo de cada mes
sobre el total.
4) Investigue sobre cualquier tema de su inters y elabore una tabla.

1.4) DISTRIBUCIN DE FRECUENCIAS


Son tablas que resumen los datos originales en frecuencias.

A) PARA DATOS SIN AGRUPAR


Los tipos de frecuencia pueden ser:

- Frecuencia Absoluta ()
Es el nmero de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre
al total de datos observados.

- Frecuencia Relativa ()
Indica la proporcin con que se repite un valor. Es el cociente entre la frecuencia absoluta y el nmero
total de datos. La suma de las frecuencias relativas es siempre 1

Descripcin y Presentacin de la Informacin Estadstica

23

- Frecuencia Acumulada ()
Indica el nmero de valores que son menores o iguales que el valor dado. Al sumar las frecuencias
absolutas desde el menor puntaje hacia arriba tenemos la frecuencia acumulada, es decir, es la suma de
la frecuencia absoluta primera con la segunda, este valor con la tercera, y as sucesivamente.

- Frecuencia Porcentual (%)


Llamada tambin frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia relativa por 100.
La suma de las frecuencias porcentuales es siempre 100%. Se calcula as:
% = 100
- Frecuencia Relativa Acumulada ()
Es la suma de la frecuencia relativa primera con la segunda, este valor con la tercera, y as sucesivamente.

- Frecuencia Relativa Acumulada Porcentual (%)


Indica el nmero de valores que son menores o iguales que el valor dado. Se obtiene multiplicando la
frecuencia relativa acumulada por 100. Se calcula as:
% = 100

Ejemplo ilustrativo:
Calcular las diferentes frecuencias de las siguientes calificaciones evaluadas sobre 10 obtenidas de 40
estudiantes en la asignatura de Estadstica sin agrupar en clases:
10
6
6
8
8

8
7
5
10
10

9
10
6
9
7

8
9
8
7
8

7
8
10
6
5

8
8
5
7
9

9
10
9
7
8

10
8
9
6
5

Solucin:
El ejercicio resuelto se muestra en la tabla:
Calificacin
5
6
7
8
9
10
Total

4
5
6
11
7
7
40

4/40 = 0,1
5/40 = 0,125
6/40 = 0,15
11/40 = 0,275
7/40 = 0,175
7/40 = 0,175
1

4
4+5 = 9
9+6 = 15
15+ 11 = 26
26+7 = 33
33+7 = 40

%
0,1100 =10
0,125100 = 12,5
0,15100 = 15
0,275100 = 27,5
0,175100 = 17,5
0,175100 = 17,5
100

0,1
0,1+0,125 = 0,225
0,225+0,15 = 0,375
0,375+0,275 = 0,65
0,65+0,175 = 0,825
0,825+0,175 = 1

Descripcin y Presentacin de la Informacin Estadstica

%
0,1100 =10
0,225100 = 22,5
0,375100 = 37,5
0,65100 = 65
0,825100 = 82,5
1100 = 100

24

En Excel se calcula de la siguiente manera:


a) Digite los datos en una hoja de clculo. Pulse en B8 y seleccione insertar funcin. Clic en insertar
funcin (). En el rea seleccionar una categora, seleccione Estadsticas. En el rea seleccionar una
funcin elija la funcin CONTAR SI.

b) Pulse en Aceptar para que se abra el cuadro de Argumentos de la funcin. Coloque el cursor en el
recuadro Rango y arrastre el ratn por la hoja seleccionando el rango A1:H5

Descripcin y Presentacin de la Informacin Estadstica

25

c) Dentro del recuadro Rango, seleccione A1:H5 y pulse la tecla F4 con la finalidad de que el rango
permanezca fijo.

d) Coloque el cursor en el recuadro Criterio y pulse la celda A8.

Descripcin y Presentacin de la Informacin Estadstica

26

e) Clic en Aceptar para obtener la frecuencia absoluta de la calificacin de 5

f) Para calcular las frecuencias absolutas de las otras calificaciones, pulse la esquina inferior derecha de
la celda B8, hasta que aparezca una cruz, luego arrastre el curso hacia abajo.

Descripcin y Presentacin de la Informacin Estadstica

27

g) Los clculos de las dems frecuencias se muestran en la siguiente figura:

B) PARA DATOS AGRUPADOS EN CLASES O INTERVALOS


Cuando los datos contienen una gran cantidad de elementos, para facilitar los clculos es necesario
agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es una serie de nmeros incluidos
entre dos extremos, as por ejemplo, el intervalo 40 45 est formado por 40, 41, 42, 43, 44 y 45, siendo
40 el lmite inferior, 45 el lmite superior, 39,5 lmite real inferior (lmite inferior disminuido en 5
dcimas) y 40,5 el lmite real superior (lmite superior aumentado en 5 dcimas).
Las reglas generales para formas distribuciones de frecuencias para datos agrupados en clases son:
- Calcule el Rango (R).- Tambin se llama recorrido o amplitud total. Es la diferencia entre el valor
mayor y el menor de los datos.
=
- Seleccione el Nmero de Intervalos de Clase ( ).- No debe ser menor de 5 y mayor de 12, ya que un
nmero mayor o menor de clases podra oscurecer el comportamiento de los datos. Para calcular el
nmero de intervalos se aplica la regla de Sturges, propuesta por Herberth Sturges en 1926:
= 1 + 3,32 ()
Siendo n el tamao de la muestra.
- Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el nmero de intervalos

Cuando el valor de no es exacto, se debe redondear al valor superior ms cercano. Esto altera el valor
de rango por lo que es necesario efectuar un ajuste as:
=

Descripcin y Presentacin de la Informacin Estadstica

28

Por ejemplo:
Si una distribucin de 40 datos el valor mayor es 41 y el menor es 20 se tiene:

Calculando el Rango se obtiene:


= = 41 20 = 21
Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 40 = 6,32 = 6
Calculando el ancho se obtiene:
21
= =
= 3,5

6
Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene:
= = 6 4 = 24
El exceso de 3 que se tiene en este caso se distribuye entre y . Por lo general se agrega al mayor
y se quita al menor. Como por ejemplo, se podra agregar 2 al valor mayor y quitar 1 al valor menor,
obtenindose los siguientes nuevos valores:
= 41 + 2 = 43
= 20 1 = 19
O tambin se podra agregar 1 al valor mayor y quitar 2 al valor menor, obtenindose los siguientes
nuevos valores:
= 41 + 1 = 42
= 20 2 = 18
- Forme los Intervalos de Clase agregando al lmite inferior de cada clase, comenzando por el
del rango.
- Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
- Calcule la Marca de Clase ( ).- Es el valor medio de cada clase, se obtiene sumando los lmites
superior ( ) e inferior ( ) del intervalo y dividiendo sta suma entre 2
=

+
2

- Calcule las Frecuencias


Ejemplo ilustrativo:
A 40 estudiantes se les pidi que estimen el nmero de horas que habran dedicado a estudiar la semana
pasada (tanto en clase como fuera de ella), obtenindose los siguientes resultados:
36
54
32
58
58

30
35
35
50
50

47
45
56
65
47

60
52
48
35
58

32
48
30
56
55

35
58
55
47
39

40
60
49
37
58

Descripcin y Presentacin de la Informacin Estadstica

50
38
39
56
45

29

Solucin:
1) Calculando el Rango se obtiene:
= = 65 30 = 35
2) Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 40 = 6,32 = 6
3) Calculando el ancho se obtiene:
35
= =
= 5,83

6
Redondeando se obtiene: i = 6, por lo que es necesario realizar un ajuste al rango.

Los clculos realizados en Excel se muestran en la siguiente figura:

4) Calculando el nuevo rango se obtiene:


= = 6 6 = 36
El exceso de 1 que se tiene en este caso se distribuye entre y . En este ejemplo, se podra
agregar 1 al valor mayor y no quitar nada al valor menor, o no agregar nada al mayor y quitar 1 al menor.
Al elegir la primera opcin se obtiene:
= 65 + 1 = 66
= 30 0 = 30
5) Formando los intervalos de clase agregando 1 (6-1=5) al lmite inferior de cada clase, comenzando
por el del rango se obtiene:
30+5 = 35; 36+5 = 41; 42+5 = 47; 48+5 = 53; 54+5 = 59; 60+5 = 65
Descripcin y Presentacin de la Informacin Estadstica

30

6) Realizando el conteo de datos que cae dentro de cada clase, calculando la marca de clase y las
frecuencias se obtiene:
Clases
30-35
36-41
42-47
48-53
54-59
60-65
Total

8
6
5
7
11
3
40

(30+35)/2 = 32,5
(36+41)/2 = 38,5
(42+47)/2 = 44,5
(48+53)/2 = 50,5
(54+59)/2 = 56,5
(60+65)/2 = 62,5

0,2
0,15
0,125
0,175
0,275
0,075
1

%
8
14
19
26
37
40

20
15
12,5
17,5
27,5
7,5
100

%
0,2
0,35
0,475
0,65
0,925
1

20
35
47,5
65
92,5
100

A continuacin se presenta algunas interpretaciones de la tabla:


El valor de f = 8: Significa que 8 estudiantes dedicaron a estudiar la semana pasada entre 30 y 35 horas.
El valor de = 50,5: Significa que 7 estudiantes dedicaron en promedio a estudiar la semana pasada
50,5 horas.
El valor de = 0,15 y % = 15%: Significa que el 0,15 o el 15% de los estudiantes dedicaron a estudiar
la semana pasada entre 36 y 41 horas.
El valor de = 26: Significa que 26 estudiantes dedicaron a estudiar la semana pasada entre 30 y 53
horas.
El valor de = 0,65 y % = 65%: Significa que el 0,65 o el 65% de los estudiantes dedicaron a
estudiar la semana pasado entre 30 y 53 horas.

Para realizar los clculos de la frecuencia absoluta empleando Excel se procede de la siguiente manera:
a) Digite los datos, las clases y lmites superiores de las clases.

Descripcin y Presentacin de la Informacin Estadstica

31

b) Seleccione C8:C13 donde las frecuencias absolutas deben ser calculadas.

c) Insertar funcin. En Seleccionar una categora, elija Estadsticas. En Seleccionar una funcin, elija
FRECUENCIA

Descripcin y Presentacin de la Informacin Estadstica

32

d) Clic en Aceptar para que aparezca la ventana Argumentos de funcin. En la casilla datos, seleccionar
los datos desde A1:H5, y en la casilla Grupos, seleccionar los datos desde B8:B13.

e) Presione CTRL+SHIFT+ENTER

Descripcin y Presentacin de la Informacin Estadstica

33

f) Los clculos de la marca de clase y de las frecuencias empleando Excel se muestran en la siguiente
figura:

TAREA DE INTERAPRENDIZAJE N 3
1) Defina con sus propias palabras lo que entiende por distribucin de frecuencias.
2) Realice un organizador grfico sobre los tipos de frecuencias
3) Dadas las siguientes calificaciones evaluadas sobre 10 obtenidas de 40 estudiantes en la asignatura de
Estadstica:
9
7
8
7
6
9
7
8
8
9
7
8
8
9
8
7
7
10
6
9
9
9
6
8
6
5
10
5
5
10
9
8
5
5
8
8
7
8
9
7
3.1) Terminar de llenar de manera manual la siguiente tabla:

Calificacin
5

0,125

4
7

11

12,5
0,225

20
28

0,225
3
40

12,5

0,2

9
Total

0,7

42,5
70

100

22,5
40

100

3.2) Realice la interpretacin de un valor cualquiera de , , , %, y % de la tabla anterior.


3.3) Calcular la frecuencia absoluta empleando Excel.
3.4) Calcular , , %, y % empleando Excel.
4) Crear y resolver un ejercicio similar al anterior sobre cualquier tema de su preferencia.
Descripcin y Presentacin de la Informacin Estadstica

34

5) Consulte sobre biografa de Herberth Arthur Sturges y elabore un organizador grfico de la misma.
6) A 40 docentes que laboran en la Universidad UTN se les pregunt su edad, obtenindose los siguientes
resultados:
32
50
52
40
45
38
58
58
54
44
48
38
49
55
58
48
42
55
46
38
54
44
47
43
48
40
57
55
46
57
47
46
48
54
57
48
51
59
54
55
6.1) Calcule el rango, nmero de intervalos y el ancho de la clase de manera manual y empleando Excel.
= 27; = 6; = 5
6.2) Calcule el nuevo rango
30
6.3) Calcule los nuevos y
61 y 31 60 y 30
6.4) Forme los intervalos de clase comenzando por = 31. Luego realice el conteo de datos que cae
dentro de cada clase de manera manual y empleando Excel, indicando cada uno los procesos seguidos.
Clases
31-35
36-40
41-45
46-50
51-55
56-60
Total

1
5
5
12
10
7
40

6.5) Calcule la marca de clase y las dems frecuencias de manera manual y empleando Excel, indicando
cada uno los procesos seguidos.
Clases

31-35
36-40
41-45
46-50
51-55
56-60
Total

1
5
5
12
10
7
40

33
38
43
48
53
58

0,025
0,125
0,125
0,300
0,250
0,175
1

1
6
11
23
33
40

2,5
12,5
12,5
30,0
25,0
17,5
100

0,025
0,150
0,275
0,575
0,825
1

2,50
15,0
27,5
57,5
82,5
100

6.6) Realice la interpretacin de un valor cualquiera de , , . , %, , % de la tabla anterior.


7) Cree y resuelva un ejercicio similar al anterior sobre cualquier tema de su preferencia.

Descripcin y Presentacin de la Informacin Estadstica

35

1.5) GRFICOS ESTADSTICOS BSICOS


Las empresas, industrias, instituciones, etc. emplean diversos grficos estadsticas para presentar
informaciones sobre diversos asuntos relativos a ellas.
Las representaciones grficas deben conseguir que un simple anlisis visual ofrezca la mayor
informacin posible. Segn el tipo del carcter que estemos estudiando, usaremos una representacin
grfica u otra.
A continuacin se presenta los diagramas ms empleados:

A) DIAGRAMAS DE BARRAS
Es un grfico bidimensional en el que los objetos grficos elementales son rectngulos de igual base cuya
altura sea proporcional a sus frecuencias. Si en el eje horizontal se ubican las etiquetas con los nombres
de las categoras, y en el eje vertical la frecuencia absoluta, la relativa o la frecuencia porcentual, toma
el nombre de diagrama de barras vertical, y si se intercambian las ubicaciones de las categoras y las
frecuencias, toma el nombre de diagrama de barras horizontal.

Ejemplo ilustrativo:
Empleando los datos de la siguiente tabla sobre las siguientes calificaciones obtenidas en una evaluacin
por 40 estudiantes en la asignatura de Estadstica:
Calificacin
5
4
6
5
7
6
8
11
9
7
10
7
Total
40
1) Elaborar un diagrama de barras verticales en 2 dimensiones (2D) y 3 dimensiones (3D).
2) Elaborar un diagrama de barras horizontales en 2 dimensiones (2D) y 3 dimensiones (3D).

Descripcin y Presentacin de la Informacin Estadstica

36

Solucin:
En Excel se elabora de la siguiente manera:
1) Barras verticales
a) Seleccionar las celdas B2:B7 y luego clic en Insertar Columna en 2-D.

b) Hacer clic en la primera opcin de Columna en 2-D

Descripcin y Presentacin de la Informacin Estadstica

37

c) Clic en Seleccionar datos para que aparezca la venta origen de datos.

d) En Etiquetas de eje horizontal (categora) seleccionar Editar para que aparezca la ventana Rtulos del
eje. En rango de rtulos del eje seleccionar A2:A7. Clic en Aceptar

Descripcin y Presentacin de la Informacin Estadstica

38

e) Clic en Aceptar

f) En Diseos de grfico seleccionar Diseo 9.

Descripcin y Presentacin de la Informacin Estadstica

39

g) Borrar Series 1. En ttulo del grfico escribir Calificaciones en Estadstica. En ttulo del eje vertical
escribir frecuencia absoluta. En ttulo del eje horizontal escribir calificacin.

h) Clic derecho en el grfico.

Descripcin y Presentacin de la Informacin Estadstica

40

i) Clic en Agregar etiquetas de datos y queda elaborado el diagrama de barras verticales en 2D

j) Para cambiar de color a las barras. Clic derecho en las barras.

Descripcin y Presentacin de la Informacin Estadstica

41

k) Clic en Relleno.

l) Clic en Degradado. Clic en Ms degradados

Descripcin y Presentacin de la Informacin Estadstica

42

m) Seleccionar Relleno con degradado

n) Seleccionar Tipo Radial. En Puntos de degradado seleccionar los colores de su preferencia.

Descripcin y Presentacin de la Informacin Estadstica

43

o) Cerrar la ventana de Formato de datos

p) Para elaborar el diagrama de barras verticales en 3D, hacer clic en Columna.

Descripcin y Presentacin de la Informacin Estadstica

44

q) Clic en la primera opcin Columna en 3-D

2) Barras horizontales
Utilizando el grfico de barras verticales en 2D
a) Clic en Barra

Descripcin y Presentacin de la Informacin Estadstica

45

b) Clic en la primera opcin y queda elaborado el diagrama de barras horizontales en 2D

c) A partir del grfico anterior, para elaborar el diagrama de barras horizontales en 3D, hacer clic en
Barras. Escoger la primera opcin de Barra en 3-D

Descripcin y Presentacin de la Informacin Estadstica

46

B) HISTOGRAMAS
Se utiliza para datos agrupados en intervalos de clase, representando en el eje horizontal los intervalos
de clase o la marca de clase, y en el eje vertical se elabora rectngulos contiguos de base el ancho del
intervalo y de altura proporcional a las frecuencias representadas.
Ejemplo ilustrativo
A 40 docentes que laboran en la Universidad UTN se les pregunt su edad, obtenindose los siguientes
resultados:
Clases % %
31-35
36-40
41-45
46-50
51-55
56-60
Total

1
5
5
12
10
7
40

33
38
43
48
53
58

0,025
0,125
0,125
0,300
0,250
0,175
1

1
6
11
23
33
40

2,5
12,5
12,5
30,0
25,0
17,5
100

0,025
0,150
0,275
0,575
0,825
1

2,50
15,0
27,5
57,5
82,5
100

1) Elaborar un histograma para


2) Elaborar un histograma para %
3) Elaborar un histograma para %

Solucin:
En Excel se realiza de la siguiente manera:
1) Histograma para
a) Seleccionar B2:B7. Insertar Columna. En diseos de grfico seleccionar Diseo 8.

Descripcin y Presentacin de la Informacin Estadstica

47

b) Clic en Seleccionar datos para que aparezca la venta Seleccionar origen de datos. En Etiquetas de eje
horizontal (categora) seleccionar Editar para que aparezca la ventana Rtulos del eje. En rango de rtulos
del eje seleccionar A2:A7. Clic en Aceptar.

c) Clic en Aceptar

Descripcin y Presentacin de la Informacin Estadstica

48

d) Escribir Edad de Docentes de la Universidad UTN en ttulo del grfico, Clases o Intervalos en Ttulo
del eje horizontal y f en Ttulo del eje vertical.

e) Clic derecho en el grfico. Clic en Agregar etiquetas de datos.

Descripcin y Presentacin de la Informacin Estadstica

49

f) Clic derecho en el grfico.

g) Seleccionar Contorno. Escoger un color diferente al de las barras.

Descripcin y Presentacin de la Informacin Estadstica

50

h) Para aadir imagen al Histograma. Clic derecho en el grfico.

i) Seleccionar Imagen

Descripcin y Presentacin de la Informacin Estadstica

51

j) Clic en examinar. Buscar una imagen en el computador

k) Clic en Insertar

Descripcin y Presentacin de la Informacin Estadstica

52

2) Histograma para f%
Utilizando el grfico anterior, calcular f%. Borrar la columna de fa y escribir la columna de f%. En eje
vertical escribir f%.

Cambiando de color

Descripcin y Presentacin de la Informacin Estadstica

53

3) Histograma para fra%


Utilizando el grfico anterior, borrar la columna de f% y escribir la columna de fra%. En eje vertical
escribir fra%.

C) POLGONO DE FRECUENCIAS
Son grficos lineales que se realizan uniendo:

- Los puntos medios de las bases superiores de los rectngulos en un diagrama de barras.

Descripcin y Presentacin de la Informacin Estadstica

54

- Los puntos medios (marcas de clase) de las bases superiores en el histograma.

Sin las barras, empleando Excel se elabora de la siguiente manera:


a) Seleccionar A2:A7. Clic en Insertar Lnea.

Descripcin y Presentacin de la Informacin Estadstica

55

b) Escoger la tercera opcin de Lnea 2D

c) Clic en Seleccionar datos para que aparezca la ventana Seleccionar origen de datos. En entradas de
leyenda (Series), clic en Editar, luego en nombre de serie escribir Calificaciones y clic en Aceptar. En
Etiquetas de eje horizontal (categora), clic en Editar, luego en rango de rtulos de eje seleccionar A2:A7
y clic en Aceptar.

Descripcin y Presentacin de la Informacin Estadstica

56

d) Clic en Aceptar

e) Seleccionar Diseo 1 en diseo de grfico

Descripcin y Presentacin de la Informacin Estadstica

57

f) Borrar Serie 1. En ttulo del grfico escribir Calificaciones en Estadstica. En ttulo del eje vertical
escribir frecuencia absoluta. Clic derecho en el grfico y luego agregar etiqueta de datos.

g) Para elaborar un polgono de frecuencias en tres dimensiones (3D), empleando el grfico anterior
hacer clic en Lnea.

Descripcin y Presentacin de la Informacin Estadstica

58

h) Clic Lneas 3D

i) Polgono de Frecuencias Acumuladas u Ojiva.- Un grfico que recoja las frecuencias acumuladas
por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera se llama un
polgono de frecuencias acumuladas u ojiva.
Empleando polgono de frecuencias en 2D anterior, borrando la columna de la frecuencia absoluta y
escribiendo la columna de la frecuencia acumulada del ejemplo del clculo de las frecuencias sobre las
siguientes calificaciones obtenidas por 40 estudiantes en una evaluacin de la asignatura de Estadstica
se obtiene la siguiente figura que representa a una Ojiva:

Descripcin y Presentacin de la Informacin Estadstica

59

A partir del grfico anterior, haciendo clic en Lnea y luego en Lneas 3D se obtiene una Ojiva en 3D
como muestra la siguiente figura:

ii) Polgono de Frecuencias Relativas Acumuladas Porcentuales.- Si se usan frecuencias fra% para
realizar un polgono de frecuencias, este recibe el nombre de polgono de frecuencias relativas
acumuladas porcentuales, o tambin llamado ojiva de porcentajes.
A continuacin se presenta una ojiva de porcentajes elaborada en Excel empleando los datos del ejemplo
de la Edad de 40 Docentes de la Universidad UTN:

Descripcin y Presentacin de la Informacin Estadstica

60

La ojiva de porcentajes anterior elaborada en 3D se muestra en la siguiente figura:

D) DIAGRAMA DE TALLO Y HOJAS


En el diagrama de tallo y hojas cada dato representa su valor y, a la vez, ocupa un espacio de forma que
se obtiene simultneamente la presentacin de los datos y distribucin grfica.
En este diagrama cada valor se descompone en 2 partes: el primero o primeros dgitos (el tallo) y el dgito
que sigue a los utilizados en el tallo (las hojas).Por ejemplo, el valor 32 puede descomponerse en un tallo
de 3 y una hoja de 2; el valor 325 puede descomponerse en un tallo de 32 y una hoja de 5; el valor 3256
puede descomponerse en un tallo de 325 y una hoja de 6. Cada tallo puede ocupar una o ms filas. Si un
tallo ocupa una sola fila, sus hojas contendrn dgitos del 0 al 9; si ocupa dos filas, la primera fila
contendr dgitos del 0 al 4 y la segunda fila del 5 al 9.
La ventaja de este diagrama es que refleja a primera vista las mismas impresiones grficas que el
histograma sin necesidad de elaborar el grfico. Tambin tiene la ventaja de conservar los valores
originales de los datos.

Ejemplo ilustrativo:
A 40 estudiantes se les pidi que estimen el nmero de horas que habran dedicado a estudiar la semana
pasada (tanto en clase como fuera de ella), obtenindose los siguientes resultados:
30
36
47
50
58

30
37
47
52
58

32
38
47
54
58

32
39
48
55
58

35
39
48
55
58

35
40
49
56
60

35
45
50
56
60

35
45
50
56
65

Elaborar un diagrama de tallo y hojas.

Descripcin y Presentacin de la Informacin Estadstica

61

Solucin:
A fin de elaborar el diagrama de tallo y hojas se ordena los datos con los dgitos iniciales de cada uno,
las decenas (tallos) a la izquierda de una lnea vertical, y a la derecha de esa recta el ltimo dgito de cada
dato, en este caso la unidad, conforme recorren los datos en el orden en que fueron anotados.
3
4
5
6

0022555567899
055777889
000245566688888
005

Interpretaciones: Hay 13 estudiantes que dedican entre 30 y 39 horas semanales a estudiar, 9 estudiantes
que dedican entre 40 y 49 horas semanales a estudiar, 15 estudiantes que dedican entre 50 y 59 horas
semanales a estudiar y existen 3 estudiantes que se dedican entre 60 y 65 horas semanales a estudiar.
En GeoGebra se elabora de la siguiente manera:
a) En Entrada se escribe las primeras letras de diagrama

Descripcin y Presentacin de la Informacin Estadstica

62

b) Se selecciona la opcin DiagramaTalloHojas[<Lista>]. Se escribe los datos

c) Enter

Descripcin y Presentacin de la Informacin Estadstica

63

d) Para editar. Clic derecho en el diagrama

e) Seleccionar Propiedades de Objeto para visualizar la ventana de Preferencias

Descripcin y Presentacin de la Informacin Estadstica

64

f) Seleccionar Texto. Escoger Mediano

g) En color seleccione el que desee

Descripcin y Presentacin de la Informacin Estadstica

65

h) Cerrar la ventana de Preferencias

E) DIAGRAMA DE SECTORES
Llamado tambin diagrama circular o de pastel. Es un grfico en el que a cada valor o modalidad se
asigna un sector circular de rea proporcional a la frecuencia que representan.
Ejemplo ilustrativo: Con los datos de la siguiente tabla sobre las calificaciones obtenidas por 40
estudiantes en una evaluacin de Estadstica, presentar la informacin a travs de un diagrama de
sectores:
Calificacin
5
4
6
5
7
6
8
11
9
7
10
7
Total
40
Solucin:
a) Se calcula la frecuencia relativa y el nmero de grados que representa cada calificacin. El nmero de
grados se calcula multiplicando la frecuencia relativa con 3600, as:
= 3600

Descripcin y Presentacin de la Informacin Estadstica

66

Estos clculos se muestran en la siguiente tabla:

Calificacin
5
6
7
8
9
10
Total

4
5
6
11
7
7
40

Grados
0,100
36
0,125
45
0,150
54
0,275
99
0,175
63
0,175
63
1
360

b) Se dibuja una circunferencia tomando para cada calificacin tantos grados como indica la tabla anterior
como se muestra en la siguiente figura:

En Excel se elabora de la siguiente manera:


a) Digitar los datos. Seleccionar A2:A7. Clic en Insertar Grfico Circular

Descripcin y Presentacin de la Informacin Estadstica

67

b) Clic en la primera opcin de grfico Circular 2D

c) En Diseo Rpido, seleccione Diseo 1. En Estilo de diseo, seleccione Estilo 5

Descripcin y Presentacin de la Informacin Estadstica

68

d) Clic en Seleccionar datos para que aparezca la ventana Seleccionar origen de datos. En Etiquetas de
eje horizontal (categora), clic en Editar, luego en rango de rtulos de eje seleccionar A2:A7 y clic en
Aceptar. En ttulo del grfico escribir Calificaciones en Estadstica.

e) Para elaborar un diagrama de sectores en 3 dimensiones se procede de la siguiente manera: Clic en el


grfico anterior. Seleccionar Insertar Grfico Circular. Escoger la opcin 2 de Grfico circular 3D. Se
obtiene la siguiente figura:

Descripcin y Presentacin de la Informacin Estadstica

69

F) PICTOGRAMAS
Son dibujos, figuras o signos llamativos alusivos al carcter que se est estudiando cuyo tamao es
proporcional a la frecuencia que representa los datos.
Ejemplo ilustrativo: Un equipo de ftbol en su trayectoria tiene 120 partidos ganados, 60 perdidos y 30
empatados. Al representar estos datos mediante pictogramas se obtiene:
Partidos Ganados

120

Partidos Perdidos

60

Partidos Empatados

30

Otra forma de representar los datos mediante pictogramas se muestra en la siguiente figura:

Partidos Ganados

Partidos Perdidos

Partidos Empatados

120

60

30

TAREA DE INTERAPRENDIZAJE N 4
1) Presentar la informacin obtenida en la encuesta de la tarea de interaprendizaje N 1 mediante tablas
y grficos estadsticos. Una tabla y un grfico (de su preferencia) por cada pregunta.
2) Las calificaciones obtenidas por 40 estudiantes en una evaluacin de Matemtica son:
4
8
4
10
10

6
8
7
5
4

6
7
9
10
3

8
7
7
6
3

10
9
9
8
3

10
8
10
4
8

6
4
8
5
7

8
8
9
7
8

2.1) Elaborar un diagrama de barras verticales en 2D con la frecuencia absoluta de manera manual y
empleando Excel.

Descripcin y Presentacin de la Informacin Estadstica

70

2.2) Elaborar un diagrama de barras verticales en 3D con la frecuencia relativa empleando Excel.

2.3) Elaborar un diagrama de barras horizontales en 3D con la frecuencia porcentual empleando Excel.

2.4) Elaborar un poligono de frecuencias en 2D con la frecuencia relativa acumulada de manera manual
y empleando Excel.

2.5) Elaborar una ojiva en 2D de manera manual y empleando Excel.

Descripcin y Presentacin de la Informacin Estadstica

71

2.6) Elaborar una ojiva de porcentajes en 3D empleando Excel.

3) Elaborar un diagrama de sectores en 2D de manera manual y un diagrama de sectores en 3D


empleando Excel con los siguientes datos corresponde a las edades en aos de un grupo de personas:
Nombre Mario Dyana Mathas Segundo Bertha Alberto Victoria Emily Fausto
Edad
35
36
5
63
65
64
63
0,5
58

4) Elaborar un diagrama de sectores en 2D y 3D con las edades de 10 familiares suyos empleando Excel.

5) En una encuesta efectuada a los estudiantes de Segundo Semestre de la Universidad UTN sobre la
edad de sus padres, se obtuvieron los siguientes resultados:
40
45
56
60
62
48
56
52
54
44
43
58
49
54
46
57
40
45
56
48
44
48
57
53
48
50
47
45
56
47
47
56
58
44
47
58
41
59
55
60

5.1) Terminar de llenar la siguiente tabla de manera manual y empleando Excel.

Clases

39-42
43-46
47-50
51-54
55-58
59-62

0,075

7,5

44,5

0,275

10

21

25

0,1
11
40

0,625

62,5

100

56,5
0,1
1

40

10
100

Descripcin y Presentacin de la Informacin Estadstica

72

5.2) Elaborar un histograma para la frecuencia absoluta de manera manual y empleando Excel, ubicando
la clases en el eje horizontal del grfico.

5.3) Elaborar un histograma para la fra% de manera manual y empleando Excel, ubicando las marcas de
clase en el eje horizontal del grfico.

5.4) Elaborar un diagrama de sectores en 2D para la frecuencia absoluta de manera manual y empleando
Excel.

6) En el siguiente diagrama de sectores est representada la composicin de una bebida


Composicin de una bebida

50%

20%

Extracto de naranja = 20%


30%

Estracto de uva = 30%


Estracto de manzana = 50%

Calcule la cantidad de extracto de naranja que se necesita para preparar 10 litros de bebida
2 litros
7) Cree y resuelva un ejercicio similar al anterior

Descripcin y Presentacin de la Informacin Estadstica

73

8) Una empresa reporta sus prdidas y ganancias desde 2008 hasta el 2013, mostrando el siguiente
comportamiento, segn el grfico. Los dos aos consecutivos donde se da el mayor cambio de ingresos
totales son

Ingreso total de la empresa


5

Ingreso total millones $

4
3
2
1
0
2008

2009

2010

2011

2012

2013

-1
-2
-3

Aos

2011 y 2012 con un ingreso total de 4 millones de dlares

9) Cree y resuelva un ejercicio similar al anterior


10) Elabore de manera manual un polgono de frecuencias uniendo los puntos medios de las bases
superiores de los rectngulos en un diagrama de barras creado por usted con datos de cualquier tema de
su inters.
11) Elabore de manera manual un polgono de frecuencias uniendo los puntos medios (marcas de clase)
de las bases superiores en un histograma creado por usted con datos de cualquier tema de su inters.
12) Investigue sobre un tema que a usted le interese y elabore un diagrama de su predileccin de manera
manual y empleando Excel.
13) Investigue sobre un tema de su gusto y elabore un diagrama de tallos y hojas en forma manual y
empleando GeoGebra.
14) Elabore un pictograma sobre un tema de su agrado.
15) Consulte en la biblioteca o en el internet 3 grficos estadsticos diferentes a los presentados en esta
tarea de interaprendizaje. Presente los grficos elaborados con algn medio tecnolgico.

Descripcin y Presentacin de la Informacin Estadstica

74

CAPTULO II

MEDIDAS DE TENDENCIA CENTRAL

RESULTADOS DE APRENDIZAJE:
Interpreta las caractersticas y propiedades de las medidas de tendencia central, y comprende sus
aplicaciones.
Emplea algoritmos matemticos para calcular medidas de tendencia central de manera manual y
empleando Excel.
Realiza diagramas de caja y bigotes de manera manual y empleando GeoGebra.
Crea y resuelve ejercicios de aplicacin sobre las medidas de tendencia central de forma manual y
empleando Excel.

CONTENIDOS:
Media Aritmtica
Media Geomtrica
Media Armnica
La Mediana
Medidas de Posicin: Cuartiles, Deciles y Percentiles
Moda

2.1) MEDIA ARITMTICA


75
Medidas de Tendencia Central

Las medidas de tendencia central son medidas representativas que tienden a ubicarse hacia el centro del
conjunto de datos, es decir, una medida de tendencia central identifica el valor del dato central alrededor
de cual se centran los dems datos, siendo la media aritmtica una de aquellas medidas.
La medida aritmtica, al igual que cualquier otra medida de datos estadsticos, cuando se calcula a nivel
de toda la poblacin, se denominan parmetro, como por ejemplo, la calificacin promedio en el examen
de admisin de todos los estudiantes que ingresan a la Universidad UTN al primer semestre del presente
ao lectivo. Pero si se calcula basada en muestras, se denomina estadgrafo o estadstico, como por
ejemplo, la calificacin promedio en el examen de admisin de estudiantes de colegios fiscales que
ingresan a la Universidad UTN al primer semestre del presente ao lectivo.

A) MEDIA ARITMTICA SIMPLE


i) Definicin
Es la medida de tendencia central ms utilizada por lo general se ubica hacia el centro de distribucin
estadstica.
ii) Mtodos de Clculo
a) Para Datos sin Agrupar
La media de una poblacin es el parmetro (que se lee miu). Si hay N observaciones en el conjunto
de datos de la poblacin, la media se calcula as:
=

1 + 2 + 3 + +
=

La media de una muestra es un estadstico (que se lee x barra). Con n observaciones en el conjunto
de datos de la muestra (1 , 2 , ), la media se determina as:
=

1 + 2 + 3 + +
=

b) Para Datos Agrupados en Tablas de Frecuencias.- Cuando una serie se la agrupa en serie simple
con frecuencias para obtener la media aritmtica, se multiplica la variable por la frecuencia respectiva
(f), luego se obtiene la suma de todos estos productos y luego a este valor se lo divide para el nmero de
elementos (n). Todo esto puede representarse mediante una frmula matemtica, as:
=

1 1 + 2 2 + 3 3 + +
=
=

1 + 2 + 3 +

Donde = es la frecuencia total (o sea, el nmero total de casos)


c) Para Datos Agrupados en Intervalos.- Cuando una serie se la agrupa en intervalos para obtener la
media aritmtica, se multiplica la marca de clase de intervalo () por la frecuencia respectiva (), luego
se obtiene la suma de todos estos productos y luego a este valor se lo divide para el nmero de elementos.
Todo esto se representa mediante la siguiente frmula matemtica:
=

1 1 + 2 2 + 3 3 +
=
=

1 + 2 + 3 +

Ejemplo ilustrativo

76
Medidas de Tendencia Central

Calcular la media aritmtica de las siguientes calificaciones de Estadstica tomadas de una muestra de
20, sin agrupar, agrupando en tablas de frecuencias y agrupando en intervalos.
4, 8, 10, 10, 5, 10, 9, 8, 6, 8, 10, 8, 5, 7, 4, 4, 8, 8, 6 y 6

Solucin:
1) Sin agrupar

4 + 8 + 10 + 10 + 5 + 10 + 9 + 8 + 6 + 8 + 10 + 8 + 5 + 7 + 4 + 4 + 8 + 8 + 6 + 6
=
20
144
=
= 7,2
20
=

En Excel se calcula as:

a) Se escriben los nmeros, clic en Autosuma

b) Clic en Promedio. Seleccione los datos (Rango A1:D5)

c) Enter

77
Medidas de Tendencia Central

2) Agrupando en tablas de frecuencias

4
5
6
7
8
9
10
Total

3
2
3
1
6
1
4
20

3 4 + 2 5 + 3 6 + 1 7 + 6 8 + 1 9 + 4 10 144
=
=
= 7,2
3+2+3+1+6+1+4
20
=

En Excel
a) Se calcula la frecuencia absoluta. Luego se inserta la funcin SUMAPRODUCTO como se muestra
en la siguiente figura:

b) Enter

78
Medidas de Tendencia Central

3) Agrupando en intervalos
Intervalos
4- 5
6 -7
8- 9
10-11

5
4
7
4

5 4,5 + 4 6,5 + 7 8,5 + 4 10,5 150


=
= 7,5
5+4+7+4
20

4,5
6,5
8,5
10,5

Nota: Cuando se agrupa en intervalos los clculos son slo aproximaciones

En Excel
Se calcula el valor mximo( Xmx ),el valor mnimo( Xmn ),el Rango( R), el nmero de intervalos (ni ), el
ancho de los intervalos() , la marca del clase(), la frecuencia absoluta() y el nmero total de datos
() . Luego se inserta la funcin: SUMAPRODUCTO como se muestra en la siguiente figura:

79
Medidas de Tendencia Central

Nota: La principal propiedad de la media aritmtica es:


La suma algebraica de las desviaciones de un conjunto de datos respecto de su media aritmtica es cero
Si x es un dato, su desviacin respecto a es la diferencia x- . La suma de estas diferencias es 0.
Para datos sin agrupar:( ) = 0
Para datos agrupados en tablas de frecuencias: ( ) = 0
Para datos agrupados en intervalos: ( ) = 0
Empleando los datos del ejemplo anterior se comprueba la principal propiedad de la media aritmtica:

4 5
6 7
8 9
10 11

5
4
7
4

4,5
6,5
8,5
10,5
Suma

( )
5(4,5-7,5) = -15
4(6,5-7,5) = -4
7(8,5-7,5) = 7
4(10,5-7,5) =12
0

80
Medidas de Tendencia Central

B) MEDIA ARITMTICA PONDERADA


Cuando los nmeros 1 , 2 , 3 , se les asocian ciertos factores peso (o pesos) 1 , 2 , 3 , ,
dependientes de la relevancia asignada a cada nmero, en tal caso se requiere calcular la media aritmtica
ponderada, la cual se calcula as:
=

1 1 + 2 2 + 3 3 +
=

1 + 2 + 3 +

Ejemplo ilustrativo: Se tiene una informacin acerca de las utilidades por pan y cantidades vendidas de
panes de tres tiendas. Calcular la media aritmtica promedio de la utilidad por pan.
Tienda Utilidad/pan Cantidad vendida
1
1
2000
2
0,8
1800
3
0,9
2100

Solucin:
1 1 + 2 2 + 3 3 +
=
=

1 + 2 + 3 +

2000 1 + 1800 0,8 + 2100 0,9 5330


=
= 0,90339
2000 + 1800 + 2100
5900

En Excel:
Se inserta la funcin SUMAPRODUCTO como se muestra en la siguiente figura:

TAREA DE INTERAPRENDIZAJE N 5
1) Defina con sus propias palabras lo que entiende por medidas de tendencia central
2) Cul es la diferencia entre parmetro y estadgrafo?. Mediante un ejemplo ilustre su respuesta.
3) Qu entiende por media aritmtica simple?
Medidas de Tendencia Central

81

4) Qu entiende por media aritmtica ponderada?


5) Calcule la media aritmtica de las siguientes calificaciones de Estadstica tomadas de una muestra en
forma manual y empleando Excel.
10
8
9
7
6
5
4
8
6
3
8
3
6
9
10
8
10
10
9
8
5.1) Sin agrupar.
7,35
5.2) Agrupando en frecuencias.
7,35
6) Compruebe la propiedad principal de la media aritmtica con los datos del ejercicio anterior sin
agrupar y con los datos agrupados en frecuencias de manera manual y empleando Excel.
7) Presente los datos del ejercicio 5 en un diagrama de barras verticales en 3D empleando Excel, en un
polgono de frecuencias para f% en 3D empleando Excel, y en una ojiva de porcentajes en 2D elaborada
en forma manual y empleando Excel.

8) Calcule la media aritmtica de las siguientes calificaciones de Matemtica tomadas de una muestra en
forma manual y empleando Excel.
10
8
9
7
6
3
7
10
6
5
4
8
8
3
4
8
9
5
8
3
8
9
10
5
9
8
4
8
10
10
9
8
6
10
7
3
8.1) Sin agrupar.
7,0833
8.2) Agrupando en frecuencias.
7,0833
8.3) Agrupando en intervalos de ancho 2.
7
9) Compruebe la propiedad principal de la media aritmtica con los datos del ejercicio anterior agrupados
en intervalos de manera manual y empleando Excel.
10) Presente los datos del ejercicio 8 en un diagrama de barras verticales e histograma en 3D elaborados
empleando Excel.

82
Medidas de Tendencia Central

11) Cree y resuelva un ejercicio similar al N 8 con datos de cualquier tema de su inters.
12) Para construir un edificio se contrataron 30 obreros con un sueldo mensual de $ 300 cada uno. Calcule
el sueldo promedio.
$ 300
13) En una investigacin sobre la poblacin en 4 barrios de la ciudad de Ibarra, se encontr que el nmero
de habitantes es: 2000, 3000, 4500, 5000. Se supone que en 10 aos la poblacin se duplicar. Calcule la
poblacin promedio dentro de 10 aos.
7250 habitantes
14) Cuatro personas ganan mensualmente: $400, $300, $500, $700. Calcule el salario promedio si a cada
uno le aumentan $80.
$555
15) Un grupo de estudiantes obtuvieron las siguientes calificaciones evaluadas sobre 10 como se indica
en la siguiente tabla:
Asignatura
Calificacin
Matemtica 7
8
6
6
5
10
Estadstica
8
9
6
4
10
8
Ingls
9 10
8
8
7
6
Calcule la calificacin promedio del grupo
7,5
16) Un estudiante en la asignatura de Estadstica tiene las siguientes calificaciones: 8, 6 y 8. Cunto
debe obtener en el cuarto aporte para que su promedio exacto sea 8?
10
17) A un estudiante le han realizado 5 evaluaciones en Estadstica y su media aritmtica es 8. Si en
otras dos evaluaciones obtiene 7 y 9, calcular la nueva media aritmtica.
8
18) Los aportes de un estudiante en la asignatura de Matemtica son: el primer aporte es el doble del
segundo, y ste es cuatro unidades menos que el tercer aporte, y el cuarto aporte es 2 unidades ms que
el tercer aporte. Si el promedio exacto es 5, cules fueron los aportes?
1 = 4, 2 = 2, 3 = 6 4 = 8
19) Cree y resuelva un ejercicio similar anterior.
20) Si el examen final de Estadstica cuenta tres veces ms que una evaluacin parcial, y un estudiante
tiene 8 en el examen final, 7 y 9 en las dos parciales. Calcule la calificacin media en forma manual y
empleando Excel.
8
21) Crear un ejercicio de aplicacin sobre la media aritmtica ponderada y resulvalo forma manual y
empleando Excel.

22) Consulte en la biblioteca o en el internet sobre las propiedades de la media aritmtica. Presente la
consulta a travs de un organizador grfico

83
Medidas de Tendencia Central

2.2) MEDIA GEOMTRICA


A) PROPIEDADES
- La media geomtrica proporciona una medida precisa de un cambio porcentual promedio en una serie
de nmeros.
- Se utiliza con ms frecuencia para calcular la tasa de crecimiento porcentual promedio de series de
datos, a travs del tiempo.
- Es una medida de tendencia central por lo general menor que la media aritmtica salvo en el extrao
caso en que todos los incrementos porcentuales sean iguales, entonces las dos medias sern iguales.
- Se le define como la raz ensima del producto de n valores. Cuando los datos son bastantes o
cantidades grandes, para facilitar el clculo se lo debe simplificar pero sin alterar su naturaleza, para lo
cual se puede utilizar los logaritmos de base 10.
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
Se emplea la ecuacin:
= 1 2 3

O aplicando logaritmos la ecuacin:


=

log 1 + log 2 + log 3 + log

Ejemplo ilustrativo N 1
La media geomtrica es til en el clculo de tasas de crecimiento; por ejemplo, si el crecimiento de las
ventas en un pequeo negocio son 3%, 4%,8%,9% y 10%, hallar la media de crecimiento.
Solucin:
= 1 2 3
5
= 3 4 8 9 10 = 6,128
Respuesta: 6,128%
O utilizando logaritmos:
log 1 + log 2 + log 3 + log
=

log 3 + log 4 + log 8 + log 9 + log 10


=
5
0,4771 + 0,6021 + 0,9031 + 0,9542 +1
=
5
3,9365
=
5
= 0,7873
= 0,7873
= 6,128
Medidas de Tendencia Central

84

Empleando Excel se calcula de la siguiente manera:


a) Insertar la funcin Media Geomtrica y pulsar en Aceptar.

b) Seleccionar las celdas (Rango A1:A5)

85
Medidas de Tendencia Central

c) Pulsar en Aceptar.

Ejemplo ilustrativo N 2
Calcular la tasa de crecimiento promedio a la que ha variado las ventas de cierto producto con base a la
siguiente tabla:
Mes
Enero Febrero Marzo Abril Mayo Junio
Ventas 500
550
600
700
800
850
Solucin:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los obtenidos el
mes anterior.
Mes
Ventas Porcentaje del
mes anterior
Enero
500
Febrero 550
550/500=1,100
Marzo 600
600/550=1,091
Abril
700
700/600=1,167
Mayo
800
800/700=1,143
Junio
850
850/800=1,063
Calculando la media geomtrica se obtiene:
= 1 2 3
5

= 1,100 1,091 1,167 1,143 1,063


= 1,112
Restando 1 para convertirlo a un incremento mensual promedio da 1,112 - 1 = 0,112, o un incremento
promedio de 11,2% para el perodo de 6 meses.
Comprobacin:
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio

Ventas
500
550
600
700
800
850

Ventas calculadas con G


500x1,112=556,000
556x1,112=618,272
618,272x1,112=687,518
687,518x1,112=764,52
764,52x1,112=850,146

Se puede observar que el valor de 850,146 calculado con la media geomtrica es semejante al valor de
venta real de 850, por lo tanto el valor calculado para la media geomtrica est correcto.
86

Medidas de Tendencia Central

ii) Para Datos Agrupados en Tablas de Frecuencias


Se emplea la siguiente ecuacin:
log =

log

Donde:
=
Ejemplo ilustrativo N 3
Calcular la media geomtrica para las siguientes calificaciones de Estadstica:

4
6
8
9
10

5
8
9
10
8

Solucin:
Se llena la siguiente tabla, realizando los clculos respectivos:

4
6
8
9
10
Total

5
8
9
10
8
40

log
0,602
0,778
0,903
0,954
1,000

log
3,010
6,225
8,128
9,542
8,000
34,906

Se aplica la siguiente ecuacin para obtener la respuesta.


log
log =

34,906
log =
= 0,873
40
G = anti log 0,873 = 7,458
Los clculos en Excel se muestran en la siguiente figura:

87
Medidas de Tendencia Central

iii) Para Datos Agrupados en Intervalos


Se emplea la ecuacin:
log =

log

Donde:
xm =

TAREA DE INTERAPRENDIZAJE N 6
1) Realice un organizador grfico sobre la media geomtrica
2) Cree y resuelva un problema similar al ejemplo ilustrativo N 2 para el clculo de la media geomtrica
con datos sin agrupar. Resuelva manualmente empleando las dos ecuaciones presentadas y empleando
Excel

3) Calcular la media geomtrica para las siguientes calificaciones de Estadstica de manera manual y con
Excel

1
2
3
4
5
6
7
8
9
10

3
5
8
8
7
6
8
9
6
10
G = 5,23

4) Cree y resuelva un ejercicio similar al anterior.


5) Dado los siguientes datos:
19, 20, 21, 20, 19, 20, 21, 22, 22, 23, 24, 25, 26, 27, 28, 28, 29, 30, 31 y 33
5.1) Agrupe en intervalos de ancho 3.
5.2) Calcule la media geomtrica manera manual y empleando Excel.
G = 24,15
6) Cree y resuelva un ejercicio similar al anterior.

7) Consulte en la biblioteca o en internet 2 ejercicios de aplicacin de la media geomtrica y resulvalos


empleando Excel

88
Medidas de Tendencia Central

2.3) MEDIA ARMNICA


La media armnica de una serie de nmeros es el recproco, o inverso, de la media aritmtica de los
recprocos de dichos nmeros, entendindose como recproco al nmero que multiplicado por este nos
da la unidad.
A) PROPIEDADES
- Es un promedio que se utiliza para el clculo del costo promedio y todo tipo de variables expresadas en
tasas o porcentajes.
- La media armnica no est definida en el caso de la existencia en el conjunto de valores nulos.
- Cuando la unidad constante o unidad de evaluacin es igual a la unidad del numerador de una razn, se
usa el promedio armnico, y si es igual a la unidad del denominador se usa el promedio aritmtico.
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
Sean los nmeros 1 , 2 , .La media armnica H se obtiene con la siguiente ecuacin:

=
=
1
1
1
1
=1
+
+

1 2

O con la siguiente ecuacin:


=

1
1 1
1
1
(1 + 2 + )

Ejemplo ilustrativo: La velocidad de produccin de azcar de tres mquinas procesadoras son 0,5, 0,3
y 0,4 minutos por kilogramo. Hallar el tiempo promedio de produccin despus de una jornada de 4800
minutos del proceso.
Solucin:
Como en la razn minutos/kilogramos (min/kg) cada mquina trabaja 4800 min, la razn contante es el
tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador, por lo tanto se debe
emplear el promedio armnico.

3
=
=
=
= 0,383
1
1
1
1
1
1
1
=1
1 + 2 + 0,5 + 0,3 + 0,4
O empleando la otra ecuacin:
1
1
=
=
= 0,383
1 1
1
1
1 1
1
1
(
+
+

)
(
+
+
)
1 2

3 0,5 0,3 0,4

El tiempo promedio de produccin es 0,383 minutos por kilogramo de azcar.

89
Medidas de Tendencia Central

Empleando Excel se calcula de la siguiente manera:


a) Insertar la funcin MEDIA.ARMO. Clic en Aceptar.

b) Seleccionar las celdas (Rango A1:A3).

c) Clic en Aceptar.

90
Medidas de Tendencia Central

ii) Para Datos Agrupados en Tablas de Frecuencias


Se emplea cualquiera de las siguientes ecuaciones:
=

=1

1 2

+
+

1 2

1 1 2
(
+
+

1 2
)

Ejemplo ilustrativo: En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran
en realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en realizar
la obra un obrero tipo (un obrero promedio).
Tiempo Obreros
4
4
5
5
6
7
7
2
9
2

Solucin:

20
20
2520
=
=
=
=
=
= 5,44

1 2
4 5 7 2 2 463
463
=1
+
+
+
+
+
+

1 2
4 5 6 7 9 126
En Excel se calcula de la siguiente manera:
Insertar la funcin = SUMA(B2:B6)/SUMAPRODUCTO((1/A2:A6);B2:B6) como se muestra en la
siguiente figura:

iii) Para Datos Agrupados en Intervalos


Se emplea la siguiente ecuacin:
=

=1

1
2

1 + 2 +
91

Medidas de Tendencia Central

Ejemplo ilustrativo: En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se
demoran para resolver una prueba de Estadstica determinados estudiantes. Calcular el tiempo promedio
que se demora en resolver la prueba un estudiante tipo.
Tiempo
[40-50)
[50-60)
[60-70)
[70-80)
[80-90]

Estudiantes
4
8
10
7
11

Solucin:
Realizando los clculos respectivos se obtiene:

[40-50)
[50-60)
[60-70)
[70-80)
[80-90]
Total

4
8
10
7
11
40

45
55
65
75
85

/
0,089
0,145
0,154
0,093
0,129
0,611

Aplicado la ecuacin se obtiene:


=

=1

1
2

+
+

1 2

40
= 65,47
0,611

En Excel se calcula insertando la siguiente funcin:


= SUMA(C2:C6)/SUMAPRODUCTO(1/(D2:D6);C2:C6), como se muestra en la siguiente figura:

TAREA DE INTERAPRENDIZAJE N 7
1) Realice un organizador grfico sobre la media armnica.
2) Calcule la media armnica de manera manual y empleando Excel de los siguientes nmeros:
2, 4, 6, 8, 9 y 10
H= 4,789
3) Cree y resuelva un ejercicio similar al anterior.
92
Medidas de Tendencia Central

4) En una empresa se ha controlado el tiempo que tardan tres obreros en realizar una obra. Uno demora
8 horas, el otro 6 horas y un tercero 4 horas.
4.1) Halle de manera manual y empleando Excel el rendimiento de un obrero tipo (obrero promedio).
H= 5,534
4.2) Para qu le servira a la empresa saber el rendimiento promedio de un obrero tipo?
5) Cree y resuelva un ejercicio similar al anterior.
6) Cree y resuelva dos ejercicios similares al ejemplo resuelto para el clculo de la media armnica con
datos agrupados en tablas de frecuencias.
7) En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran para resolver
una prueba de Estadstica determinados estudiantes.
Intervalo
N de
de tiempo estudiantes
[45-50)
2
[50-55)
2
[55-60)
7
[60-65)
4
[65-70)
5
[75-80)
7
[85-90]
13
7.1) Calcule el tiempo promedio que se demora en resolver la prueba un estudiante tipo. Resolver de
manera manual y empleando Excel.
H= 69,096
7.2) Para qu le servira al profesor saber el tiempo promedio que se demora en realizar la prueba un
estudiante tipo?
8) Cree y resuelva un ejercicio similar al anterior
8.1) Realice los clculos de manera manual y empleando Excel
8.2) Compruebe a travs de un ejercicio que la media geomtrica es menor o igual que la media
aritmtica, y mayor o igual que la media armnica, es decir, en smbolos:

9) En qu caso ocurrira que la media geomtrica sea igual a la media aritmtica e igual a la media
armnica?. Ponga un ejemplo y resulvalo manera manual y empleando Excel.
10) Consulte en la biblioteca o en internet 2 ejercicios de aplicacin de la media armnica y resulvalos
empleando Excel

93
Medidas de Tendencia Central

2.4) LA MEDIANA
La mediana, llamada algunas veces media posicional, es el valor del trmino medio que divide una
distribucin de datos ordenados en dos partes iguales, es decir, el 50% de los datos se ubican sobre la
mediana o hacia los puntajes altos y el 50% restante hacia los puntajes bajos.

A) PROPIEDADES
-La Mediana no tiene propiedades que le permite intervenir en desarrollos algebraicos como la media
aritmtica, sin embargo, posee propiedades que ponen en evidencia ciertas cualidades de un conjunto de
datos, lo cual no ocurre con la media aritmtica que promedia todos los valores y suprime sus
individualidades. En cambio, la mediana destaca los valores individuales.
- Tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores
que toma la variable, sino del orden de las mismas.
-Para el clculo de la mediana interesa que los valores estn ordenados de menor a mayor.
- Su aplicacin se ve limitada, ya que solo considera el orden jerrquico de los datos y no alguna
propiedad propia de los datos, como en el caso de la media aritmtica.

B) MTODOS DE CLCULO
i) Para Datos No Agrupados
a) Si el nmero n de datos es impar, la mediana es el dato que se encuentra a la mitad de la lista. Para
calcular su posicin se aplica la siguiente ecuacin:
= +1 = +1
2 2

Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadstica evaluadas sobre diez: 10, 8,
6, 4, 9, 7, 10, 9 y 6
Solucin:
1) Se ordena los datos de menor a mayor:
4 6 6 7 8 9 9 10 10
1 2 3 4 5 6 7 8 9
2) Se aplica la ecuacin:
= +1
2

= 9+1 = = 5
2

La mediana es el valor de x5 (quinto dato), es decir, Md=8

94
Medidas de Tendencia Central

En Excel se calcula as:


1) Se escriben los datos. Se inserta funcin. Se selecciona la categora Estadsticas. Se selecciona
MEDIANA

2) Clic en Aceptar para visualizar la ventana Argumentos de funcin. En la casilla Nmero1 seleccionar
los datos (Rango A1:H1)

95
Medidas de Tendencia Central

3) Pulsar en Aceptar

En GeoGebra se calcula as:


1) Ingresar al GeoGebra. En Entrada escribir las primeras letras de Mediana.

2) Seleccionar Mediana[ <Lista de Datos en Bruto> ]

96
Medidas de Tendencia Central

3) Escribir los datos: Mediana[ 10,8,6,4,9,7,10,6 ]. Enter

b) Si el nmero n de datos es par, la mediana es la media aritmtica de los dos datos que se encuentran
a la mitad de la lista. Para calcular su posicin se aplica la siguiente ecuacin:
=

+ +1
2

Ejemplo ilustrativo: Calcular la mediana de las siguientes calificaciones del curso de Matemtica
evaluadas sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solucin:
1) Se ordena los datos de menor a mayor:
4 6 7 8 8 9 9 9 10 10
1 2 3 4 5 6 7 8 9 10
2) Se aplica la ecuacin
=

+ +1
2

5 + 6 8 + 9
=
= 8,5
2
2

ii) Para Datos Agrupados en Tablas de Frecuencia


Para calcular la posicin de la mediana se aplica la siguiente ecuacin:
=

+1
2

Ejemplo ilustrativo:
Dados los siguientes 20 nmeros: 1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6, 4, 4, 4 ,4, 5, 5, 5, 5
1) Agrupar los datos en tabla de frecuencia.
Solucin:

1
2
3
4
5
6
Total

1
3
2
4
8
2
20
97

Medidas de Tendencia Central

2) Calcular la mediana.
Solucin:
Calculando la posicin de la mediana se obtiene:
=

+ 1 20 + 1
=
= 10,5
2
2

Como la posicin de la mediana es 10,5, su valor es el promedio de los datos dcimo y undcimo. Para
observar con claridad cules son los datos dcimo y undcimo se aconseja calcular la frecuencia
acumulada.


1
1 1
2
3 4
3
2 6
4
4 10
5
8 18
6
2 20
Total 20
Se observa que el dcimo dato es 4 y el undcimo es 5, por lo tanto:
=

4+5
= 4,5
2

iii) Para Datos Agrupados en Intervalos


a) Por interpolacin
Ejemplo ilustrativo: Calcular la mediana de los pesos de un grupo de 50 personas que se distribuyen de
la siguiente manera:
Intervalos
[ 45,55)
6
[ 55, 65) 10
[ 65, 75) 19
[ 75, 85) 11
[ 85, 95)
4
Solucin:
Primero se calcula n/2 y despus se averigua el intervalo en el que est la mediana, este intervalo recibe
el nombre de intervalo o clase de la mediana. Para averiguar el intervalo en el que est la mediana se
aconseja calcular la frecuencia acumulada.
50
=
= 25
2
2
Intervalos
[ 45, 55)
6
[ 55, 65) 10
[ 65, 75) 19
[ 75, 85) 11
[ 85, 95)
4

6
16
35
46
50

Medidas de Tendencia Central

98

En este ejemplo el intervalo de la media es [65,75).Se observa que 16 valores estn por debajo del valor
65. Los 9 que faltan para llegar a 25 se interpolan en el ancho del intervalo de la mediana que en este
ejemplo es 10.
19 corresponde a 10
9
9 10 90
=
= 4,737
19
19
Por lo tanto la Mediana es igual 65+4,737= 69,737
=

b) Empleando la ecuacin


= + (2
)

En donde:
= Lmite inferior del intervalo de clase de la mediana
= Nmero total de datos
=Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase de la mediana.
= Frecuencia absoluta del intervalo de clase de la mediana
= Ancho del intervalo
Ejemplo ilustrativo: Calcular la mediana del ejemplo anterior y representarla mediante un histograma
de frecuencias acumuladas.
Se calcula la frecuencia acumulada como se muestra en la siguiente tabla:
Intervalos

[ 45,55)
6
[ 55, 65) 10
[ 65, 75) 19
[ 75, 85) 11
[ 85, 95)
4

6
16
35
46
50

Solucin:
Se calcula la posicin de la mediana de la siguiente manera:
50
=
= 25
2
2
Por lo tanto el intervalo o clase de la mediana es [65,75).

Al aplicar la ecuacin respectiva se obtiene:

50

16
9
90
2
= + (
) = 65 + ( 2
) 10 = 65 + ( ) 10 = 65 +
= 69,737

19
19
19

99
Medidas de Tendencia Central

c) Resolviendo de manera grfica


A continuacin se presenta un histograma para la frecuencia acumulada.

Observando el grfico se determina que Md = 65+AE


Los tringulos ABC y AED son semejantes, por lo que se cumple:

=

75 65

10
=

=
35 16 25 16
19
9
Despejando AE se obtiene:
10
90
9 = =
= 4,737
19
19
Entonces, Md = 65+AE = 65+4,737= Md = 69,737

TAREA DE INTERAPRENDIZAJE N 8
1) Escriba 3 diferencias entre media aritmtica y mediana.
2) Realice un organizador grfico sobre la mediana.
3) Calcule la mediana de los nmeros 6, 6, 5, 2, 3, 4, 4, 5, 5, de manera manual, empleando Excel y con
GeoGebra.
Md= 5
4) Cree y resuelva un ejercicio similar al anterior
5) Calcule la mediana de los nmeros 11, 12, 9, 10, 7, 8, de manera manual y empleando Excel y con
GeoGebra.
Md= 9,5
6) Cree y resuelva un ejercicio similar al anterior.
100
Medidas de Tendencia Central

7) Dados los siguientes 35 nmeros:


2, 2, 2, 2, 2, 4, 4, 4, 4, 6, 6, 6, 6, 6, 4, 4, 4, 4, 8, 8, 8, 6, 6, 6, 6, 6, 10, 10, 10, 8, 8, 8, 10, 10 y 10
7.1) Calcule la mediana sin agrupar los datos de manera manual y empleando Excel.
Md=6
7.2) Calcule la mediana agrupando los datos en una tabla de frecuencias.
Md=6
8) Cree y resuelva un ejercicio similar al anterior.
9) Calcule la mediana de las siguientes edades de personas y representarla mediante un histograma para
la frecuencia acumulada.
Intervalos

[ 60, 63)
5
[ 63, 66) 18
[ 66, 69) 42
[ 69, 72) 27
[ 72, 75)
8
Md= 67,93
10) Cree y resuelva un ejercicio similar al anterior.
11) Dados los siguientes nmeros:
50, 55, 59, 60, 69, 65, 66, 69, 63, 64, 70, 72, 77, 78, 79, 79, 77, 78, 71, 72, 73, 75, 77, 74, 73, 73, 74, 77,
80, 82, 85, 88, 89, 89, 85, 81, 82, 83, 82, 81, 90, 91, 92, 93, 94, 95, 96, 99, 100 y 109
11.1) Agrupe los datos en intervalos de ancho 10.
11.2) Calcule la media aritmtica de manera manual y empleando Excel.
78,7
11.3) Calcule la media geomtrica de manera manual y empleando Excel.
77,77
11.4) Calcule la media armnica de manera manual y empleando Excel.
76,81
11.5) Calcule la mediana por interpolacin, empleando la ecuacin y empleando un histograma para la
frecuencia acumulada.
78,33
12) Cree y resuelva un ejercicio similar al anterior consultando en la biblioteca o en el internet

101
Medidas de Tendencia Central

2.5) MEDIDAS DE POSICIN


Son similares a la mediana en que tambin subdividen una distribucin de mediciones de acuerdo con la
proporcin de frecuencias observadas. Mientas que la mediana divide a una distribucin en mitades, los
cuartiles (Q) la dividen en cuartos, los deciles (D) la dividen en dcimos y los puntos percentiles (P) la
dividen en centsimos.
Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles. Puesto que sirven para ubicar
datos particulares dentro de ciertas porciones de una distribucin de datos, toman el nombre de medidas
de posicin.
A) CUARTILES.- Son cada uno de los 3 valores 1 , 2 , 3 que dividen a la distribucin de los datos en
4 partes iguales.
i) Propiedades
Los cuartiles son un caso particular de los percentiles. Hay 3 cuartiles:
Primer cuartil: 1 = 25 , segundo cuartil: 2 = 5 = 50 = Mediana, tercer cuartil: 3 = 75
ii) Mtodos de Clculo
a) Para Datos No Agrupados
La posicin o ubicacin de los cuartiles se encuentra aplicando la siguiente ecuacin:
=
[

1
+ ]
2

= +2
[

Donde:
n = nmero total de datos
k = nmero del cuartil
Ejemplo ilustrativo:
Encuentre los cuartiles dada la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los cuartiles se ordena los datos de menor a mayor
6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el cuartil uno se obtiene:
= +2
[

1 = [+2] = [8+2]= [10]= 2,5


4

Como la posicin del cuartil 1 es 2,5, su valor es el promedio de los datos segundo y tercero
2 + 3 9 + 9
1 = 2,5=
=
=9
2
2
O tambin la posicin 2,5 dice que el cuartil 1 est ubicado al 50% del trayecto comprendido entre el
segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1= 9+0,5(9-9) = 9
Interpretacin: Este resultado indica que el 25% de los datos es inferior a 9
Medidas de Tendencia Central

102

En Excel se calcula de la siguiente manera:


a) Se inserta la funcin CUARTIL.INC.

b) Pulse en Aceptar para visualizar la ventana Argumentos de Funcin. En la casilla Matriz seleccione
los datos (Rango A1:A8)

103
Medidas de Tendencia Central

c) Escribir 1 en la opcin Cuartil en la ventana de los argumentos la funcin.

d) Pulsar en Aceptar.

En GeoGebra se calcula de la siguiente manera:


a) Ingresar a GeoGebra. En Entrada escribir Q1

104
Medidas de Tendencia Central

b) Seleccionar Q1[<Lista de datos en Bruto>]

c) Escribir los datos: Q1[6,9,9,12,12,12,15,17]

d) Enter

105
Medidas de Tendencia Central

Aplicando la ecuacin para el cuartil dos se obtiene:


= +2
[

2 = [2+2] = [2+2]= [28+2]= [16+2]= 4,5=


4

4 + 5 12 + 12
=
= 12
2
2

O tambin la posicin 4,5 dice que el cuartil 2 est ubicado al 50% del trayecto comprendido entre el
cuarto dato, que es 12 y el quinto dato que tambin es 12, es decir,
2 = 12 + 0,5(12 12) = 12
Interpretacin: Este resultado indica que el 50% de los datos es inferior a 12
En Excel se calcula de la siguiente manera:
Repetir los pasos para el cuartil 1, y en la opcin de cuartil, escribir 2

En GeoGebra se calcula de la siguiente manera:


Para calcular el cuartil 2 se repite los pasos para calcular la Mediana:

Aplicando la ecuacin para el cuartil tres se obtiene:


= +2
[

3 = [3+2]= [38+2]= [24+2]= 26 = 6,5=


4

6 + 7 12 + 15
=
= 13,5
2
2

O tambin la posicin 6,5 dice que el cuartil 2 est ubicado al 50% del trayecto comprendido entre el
doceavo dato, que es 12 y el quinceavo dato que es 15, es decir, 3 = 12+0,5(15-12)
3 = 12+0,5(3)=12+1,5=13,5

106
Medidas de Tendencia Central

Interpretacin: Este resultado indica que el 75% de los datos es inferior a 13,5
En GeoGebra se calcula de la siguiente manera:

En Excel se calcula de la siguiente manera:


Repetir los pasos para el cuartil 1, y en la opcin de cuartil escribir 3.

Notas importantes:
-Los clculos en Excel para un nmero impar de datos coinciden con los clculos realizados con las
ecuaciones.
-Para un nmero par de datos, aunque en ciertas ocasiones coinciden, suele existir diferencias en los
clculos del Q1 y Q3 realizados con Excel. Este error de clculo es: e = 0,25d, en donde d es la distancia
de separacin de los datos
-Para el Q1 se resta el error al valor obtenido con Excel
-Para el Q3 se suma el error al valor obtenido con Excel
En nuestro ejemplo = 0,25(7 6 ) = 0,25(15 12) = 0,25(3) = 0,75. Al sumar el error al valor
3 inicialmente calculado con Excel se obtiene el valor correcto como se muestra en la siguiente figura:

107
Medidas de Tendencia Central

b) Para Datos Agrupados en Tablas de Frecuencias


Se aplica la misma ecuacin empleada para el clculo en los datos no agrupados
Ejemplo ilustrativo: Dada la siguiente tabla:

6
9
12
15
17

1
2
3
1
1

1) Calcular el cuartil 2
2) Representar los cuartiles en un histograma para la (%) (Frecuencia relativa acumulada medida en
porcentajes). Determinar grficamente el valor de los cuartiles
Solucin:
1) Clculo del cuartil 2
Aplicando la primera ecuacin para el cuartil dos se obtiene:
= +2
[

2 =

]
4
[2+2]
4

= 2(+1) [+1]= [8+1]= [9]= 4,5


[

]=

Como la posicin del cuartil 2 es 4,5, su valor es el promedio de los datos cuarto y quinto
Para observar con claridad cules son los datos
acumulada

6
9
12
15
17

cuarto y quinto se aconseja calcular la frecuencia

1
2
3
1
1

1
3
6
7
8

Se observa que el cuarto dato es 12 y el quinto dato es 12, por lo tanto


4 + 5 12 + 12
2 = 4,5=
=
= 12
2
2
2) Representando los cuartiles en un histograma para la (%)
Calculando la (%) se obtiene:

6
9
12
15
17
n

1
2
3
1
1
8

1
3
6
7
8

0,125
0,25
0,375
0,125
0,125

(%)
0,125 12,5
0,375 37,5
0,75
75
0,875 87,5
1
100

108
Medidas de Tendencia Central

A continuacin se presenta el grfico solicitado elaborado en Excel y Paint:


Histograma para la fra(%)

Observando en el grfico anterior se observa que 1 = 9, 2 = 12 3 = (12 + 5)/2 = 13,


c) Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin:
nk
Fa
Qk = LiQ + ( 4
)
fQ
Donde:
= Lmite inferior del intervalo de clase del cuartil
= Nmero total de datos
= Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del cuartil
= Frecuencia absoluta del intervalo de clase del cuartil
= Ancho del intervalo de clase del cuartil
Ejemplo ilustrativo: Dado los siguientes datos sobre pesos de un grupo de 50 personas:
Intervalos
45- 55
55- 65
65- 75
75- 85
85- 95

6
10
19
11
4

1) Calcular los cuartiles empleando la ecuacin


2) Calcular los cuartiles empleando un histograma para (%) (Frecuencia relativa acumulada mediada
en porcentajes)

109
Medidas de Tendencia Central

Solucin:
1) Clculo de los cuartiles empleando la ecuacin
1.1) Clculo del primer cuartil
Primero se calcula nk/4 y despus se averigua el intervalo en el que est el cuartil, este intervalo recibe
el nombre de intervalo o clase del primer cuartil. Para averiguar el intervalo en el que estn los cuartiles
se aconseja calcular la frecuencia acumulada
50 1
=
= 12,5
4
4
Intervalos
45 - 55
55 - 65
65 - 75
75 - 85
85 - 95
n

6
10
19
11
4
50

6
16
35
46
50

Por lo tanto en este ejemplo:


El intervalo del segundo cuartil es 55-65.
El nmero total de datos es n =10
Se observa que 6 valores estn por debajo del valor 55, es decir Fa = 6.
La frecuencia absoluta del intervalo del cuartil es 10
El ancho del intervalo del cuartil es c = 65-55 =10.
Al aplicar la ecuacin se obtiene:
nk
Fa
Qk = LiQ + ( 4
)c
fQ
50 1
50
6
6
13
4
Q1 = 55 + (
) 10 = 55 + ( 4
) 10 = 55 + ( ) 10 = 55 + 6,5
10
10
20
Q1 = 61,5
1.2) Clculo del segundo cuartil
Primero se calcula nk/4 y despus se averigua el intervalo en el que est el cuartil, este intervalo recibe
el nombre de intervalo o clase del cuartil.
2 50 2
=
= 25
4
4
Por lo tanto para el segundo cuartil se tiene:
Intervalo: 65-75
n=10
Fa=16
fQ =19
c =75-65 =10
110
Medidas de Tendencia Central

Al aplicar la ecuacin se obtiene:


nk
Fa
Qk = LiQ + ( 4
)c
fQ
50 2
100
16
16
9
4
Q2 = 65 + (
) 10 = 65 + ( 4
) 10 = 65 + ( ) 10 = 65 + 4,737
19
19
19
Q2 = 69,737
1.3) Clculo del tercer cuartil
Primero se calcula nk/4 y despus se averigua el intervalo en el que est el cuartil, este intervalo recibe
el nombre de intervalo o clase del cuartil.
3 50 3
=
= 37,5
4
4
Por lo tanto para el segundo cuartil se tiene:
Intervalo: 75-85
= 10
= 35
= 11
= 85 75 = 10
Al aplicar la ecuacin se obtiene:
nk
Fa
Qk = LiQ + ( 4
)c
fQ
50 3
150
35
35
5
4
Q3 = 75 + (
) 10 = 75 + ( 4
) 10 = 75 + ( ) 10 = 75 + 2,273
11
11
22
Q3 = 77,273
2) Clculo de los cuartiles empleando un histograma para (%)
2.1) Calculando la (%) se obtiene:
Intervalos
45 - 55
55 - 65
65 - 75
75 - 85
85 - 95
n

6
10
19
11
4
50

6
16
35
46
50

0,12
0,20
0,38
0,22
0,08

(%)
12
32
70
92
100

111
Medidas de Tendencia Central

2.2) Elaborando el histograma en Excel y en Paint se obtiene la siguiente figura:


Histograma para la (%)

2.3) Clculo del primer cuartil


Observando en grfico tenemos que el Q1 = 55 + AE
Los tringulos ABC y AED son semejantes, por lo que se cumple:

=

65 55

10
=

=
32 12 25 12
20 13
Despejando AE se obtiene:
10
13 = = 6,5
20
Entonces, Q1 = 55 + 6,5 = 61,5
2.3) Clculo del segundo cuartil
Observando en grfico tenemos que el Q2 = 65 + CI
Los tringulos CFG y CIH son semejantes, por lo que se cumple:

=

75 65

10
=

=
70 32 50 32
38 18
112
Medidas de Tendencia Central

Despejando CI se obtiene:
10
18 = = 4,737
38
Entonces, Q2 = 65 + 4,737 = 69,737

2.3) Clculo del tercer cuartil


Observando en grfico tenemos que el Q3 = 75 + GM
Los tringulos GJK y GML son semejantes, por lo que se cumple:

=

85 75

10
=

=
92 70 75 70
22
5
Despejando CI se obtiene:
10
5 = = 2,273
22
Entonces, 3 = 75 + 2,273 = 77,273
iii) Diagrama de caja y bigotes
Un diagrama de caja y bigotes es una representacin grfica que ayuda a visualizar una distribucin de
datos: caja desde 1 a 3 (50% de los datos), y bigotes el recorrido (distancia desde valor mnimo hasta
el valor mximo).
Para elaborar un diagrama de caja se procede de la siguiente manera:
a) Se marca los valores de la serie de datos sobre el eje horizontal o vertical.
b) Se ubica sobre el eje el valor mnimo, primer cuartil, mediana o segundo cuartil, tercer cuartil y el
valor mximo.
c) Se construye un rectngulo (caja) paralelo al eje, de longitud desde Q1 a Q3 y anchura arbitraria.
De acuerdo al ejemplo ilustrativo del clculo de cuartiles para datos sin agrupar de la distribucin de
datos 6, 9, 9, 12, 12, 12, 15 y 17 se obtienen:
Valor mnimo = 6
1 = 9
2 = 12
3 = 13,5
Valor mximo = 17
Por lo tanto el diagrama de caja y bigotes es:

113
Medidas de Tendencia Central

El diagrama de caja y bigotes en GeoGebra se elabora de la siguiente manera:


a) Ingrese al programa

b) En la casilla Entrada escriba las primeras letras de DiagramaCaja

114
Medidas de Tendencia Central

c) Seleccione DiagramaCaja[ <Offset_y>, <Escala_y>, <Lista de Datos en Bruto> ] y dicha opcin


escriba DiagramaCaja[ 2,1,{6,9,9,12,12,12,15,17}].

Para escribir las llaves, en Vista seleccione Teclado. En el teclado virtual seleccione

115
Medidas de Tendencia Central

d) Enter

e) Editando el diagrama de caja y bigotes se obtiene:

116
Medidas de Tendencia Central

B) DECILES
i) Definicin
Son cada uno de los 9 valores 1 , 2 , 3 , 4 , 5 , 6 , 7 , 9 que dividen a la distribucin de los datos en
10 partes iguales.
El primer decil es igual al dcimo percentil (1 = 1 ), el segundo decil es igual al veinteavo percentil
(2 = 20 ), y as sucesivamente.
ii) Mtodos de Clculo
a) Para Datos No Agrupados
La posicin o ubicacin de los deciles se encuentra aplicando la siguiente ecuacin:
= 1 = +5
[

+ ]
10 2

10

Donde:
n = nmero total de datos.
k = nmero del decil.
Ejemplo ilustrativo:
Calcular el quinto decil de la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los deciles se ordena los datos de menor a mayor.
6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el quinto decil se obtiene:
= +5
[

10

5 = 5+5 = 5+5 58+10 40+5 4,5=


[

10

10

]= [

10

]= [

10

]=

4 + 5 12 + 12
=
= 12
2
2

O tambin la posicin 4,5 dice que el decil 5 est ubicado al 50% del trayecto comprendido entre el
cuarto dato, que es 12 y el quinto dato que tambin es 12, es decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:
Como D5 es igual a P50 se introduce la funcin PERCENTIL.INC(A1:A8;0,5) como se muestra en la
siguiente figura:

117
Medidas de Tendencia Central

b) Para Datos Agrupados en Tablas de Frecuencia


Se emplea la misma ecuacin utilizada en el clculo de los deciles para datos sin agrupar.
c) Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuacin:
nk
Fa
Dk = LiD + (10
)
fD
Donde:
= Lmite inferior del intervalo de clase del decil.
= nmero total de datos.
= Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del decil.
= Frecuencia absoluta del intervalo de clase del decil.
= Ancho del intervalo de clase del decil.

C) PERCENTILES O CENTILES
i) Definicin
Son cada uno de los 99 valores P1, P2, P3,..P99 que dividen atribucin de los datos en 100 partes
iguales.
ii) Mtodos de Clculo
a) Para Datos No Agrupados
La posicin o ubicacin de los percentiles se encuentra aplicando la siguiente ecuacin:
= 1 = +50
[

+ ]
100 2

100

Donde:
n = nmero total de datos
k = nmero del percentil
Ejemplo ilustrativo:
Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en kg)
80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solucin:
Se ordena los datos de menor a mayor se tiene:
65 65 67 68 70 72 72 73 78 80
1 2 3 4 5 6 7 8 9 10
1) Clculo del percentil de orden 20 se obtiene:
= +50
[

100

20 = 20+50 1020+50 250 2,5=


[

100

]= [

100

]= [

]=
100

2 + 3 65 + 67
=
= 66
2
2

118
Medidas de Tendencia Central

En Excel se obtiene un valor aproximado insertando la funcin PERCENTIL.INC(A1:A10:0,2) como se


muestra en la siguiente figura:

2) Clculo del percentil de orden 33 se obtiene:


= +50
[

100

33 = 33+50 1033+50 [380]= 3,8=


[

100

]= [

100

]=

100

3 + 4 67 + 68
=
= 67,5 = 68
2
2

En Excel se obtiene un valor aproximado insertando la funcin PERCENTIL.INC(A1:A10:0,33) como


se muestra en la siguiente figura:

b) Para Datos Agrupados en Tablas de Frecuencia


Se emplea la misma ecuacin utilizada en el clculo de los percentiles para datos sin agrupar.
c) Para Datos Agrupados en Intervalos
Se emplea la ecuacin:
nk
Fa
100
Pk = LiP + (
)c
fP
119
Medidas de Tendencia Central

Donde:
=Lmite inferior del intervalo de clase del percentil.
= nmero total de datos.
= Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del percentil.
= Frecuencia absoluta del intervalo de clase del percentil.
= Ancho del intervalo de clase del percentil.

TAREA DE INTERAPRENDIZAJE N 9
1) El valor de la mediana con qu valor del cuartil, decil y del percentil coincide?. Plantee y resuelva
un ejercicio para ilustrar su respuesta.
2) Por qu a los cuartiles, deciles y percentiles se les considera como medidas de posicin?
3) Realice un organizador grfico sobre las medidas de posicin.
4) Calcule los 3 cuartiles de las siguientes distribuciones de datos de manera manual, empleando Excel
y GeoGebra. Realice los diagramas de caja y bigotes de manera manual y empleando GeoGebra.
4.1) 5, 2, 6, 4, 1 y 3
1 = 2; 2 = 3; 3 = 5
4.2) 5, 2, 8, 4, 1, 6, 7 y 3
1 = 2,5; 2 = 4,5; 3 = 6,5
4.3) 9, 2, 8, 4, 5, 6, 7, 3 y 1
1 = 3; 2 = 5; 3 = 7
4.4) 36, 8, 12, 32, 24, 28, 16 y 4
1 = 10; 2 = 20; 3 = 30
4.5) 80, 70, 40, 60, 50, 30, 20 y 10
1 = 25; 2 = 45; 3 = 65
5) Dada la siguiente tabla:
6 9 12 15 17
1 2 3 1 1
5.1) Calcule el primero y tercer cuartil.
Q1=9; Q3=13,5
5.2) Calcule el segundo cuartil empleando un histograma para la frecuencia absoluta acumulada.
Q2=12
6) Cree y resuelva un ejercicio similar al presentado en el clculo de los cuartiles para datos agrupados
en intervalos.

7) Emplee los datos del ejercicio anterior y calcular los cuartiles empleando un histograma para la
frecuencia absoluta acumulada.
8) Calcule el quinto decil de 1, 3, 6, 9, 12, 15, 18 y 21 de manera manual y empleando Excel.
D5=10,5
9) Cree y resuelva un ejercicio sobre el clculo del decil 3 y del decil 7 para datos agrupados en tablas
de frecuencias.
120
Medidas de Tendencia Central

10) Cree y resuelva un ejercicio sobre el clculo de los deciles de orden 4 y 8 para datos agrupados en
intervalos empleando las ecuaciones y a travs de un histograma para la (%).
11) Calcule el percentil de orden 25 de 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 y 22 de manera manual y
empleando Excel.
P25=6
12) Calcule el percentil de orden 75 de 10, 20, 40, 50, 60, 70, 80, 90, 100, 120 y 140.
P75=95
13) Plantee y resuelva un ejercicio sobre el clculo de los percentiles 35 y 60 para datos agrupados en
intervalos empleando la frmula y a travs de un histograma para la (%).

14) Consulte en la biblioteca o en el internet sobre las aplicaciones de las medidas de posicin en la vida
diaria. Presente la consulta a travs de un organizador grfico.
2.6) MODA
La moda de un conjunto de datos es el valor que aparece con mayor frecuencia.

A) PROPIEDADES
- No es afectada por valores muy altos o muy bajos.
- La moda, al igual que la mediana, no se presta para tratamientos algebraicos como la media aritmtica.
- La moda puede no existir, e incluso no ser nica en caso de existir.
- Cuando en un conjunto de datos hay tres o ms datos diferentes con la misma frecuencia mayor, esta
informacin a menudo no resulta til (demasiadas modas tienden a distorsionar el significado de moda).
Por lo que en estos casos se considera que el conjunto de datos no tiene moda.
Para un conjunto de datos unimodales existe la siguiente relacin emprica:
Media aritmtica moda = 3 (media aritmtica mediana)
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
Se observa el dato que tiene mayor frecuencia

Ejemplo ilustrativo N 1
Determinar la moda del conjunto de datos 2, 4, 6, 8, 8 y 10
Solucin:
Mo = 8, porque es el dato que ocurre con mayor frecuencia. A este conjunto de datos se le llama unimodal

121
Medidas de Tendencia Central

En Excel se calcula de la siguiente manera:


a) Se inserta la funcin MODA. UNO y luego Pulse en Aceptar.

b) Seleccionar las celdas (Rango A1:A6).

c) Pulsar en Aceptar.

122
Medidas de Tendencia Central

Ejemplo ilustrativo N 2
Determinar la moda del conjunto de datos: 2, 4, 6, 8 y 10
Solucin:
Este conjunto de datos no tiene moda, porque todos los datos tienen la misma frecuencia.
En Excel se calcula de la siguiente manera:
Se inserta la funcin MODA.UNO, se selecciona las celdas respectivas y se pulsa en Aceptar.

Ejemplo ilustrativo N 3
Determinar la moda del conjunto de datos: 8, 4, 6, 6, 8, 2 y 10
Solucin:
Este conjunto de datos tiene dos modas, 8 y 6, y se llama bimodal.
En Excel se calcula de la siguiente manera:
Se inserta la funcin MODA.VARIOS, la cual debe especificarse como frmula de matriz, para lo cual
se selecciona las celdas donde aparecer la respuesta (B9:B10). Luego se inserta la funcin MODA
.VARIOS, se selecciona las celdas respectivas (A1:A7)

123
Medidas de Tendencia Central

Finalmente, se presiona Ctrl+Blog Mays+Enter.

ii) Para Datos Agrupados en Tablas de Frecuencia


Se observa el dato tiene mayor frecuencia
Ejemplo ilustrativo: Calcule la moda o modas (si las hay) de los siguientes datos:

2
4
6
8
10

f
1
2
3
1
1

Solucin:
Se observa que el dato con mayor frecuencia es 6, por lo tanto Mo = 6

iii) Para Datos Agrupados en Intervalos


Se halla en el intervalo o clase que tenga la frecuencia ms alta, llamada intervalo o clase modal. Se
emplea la siguiente ecuacin:

= + (
)
+
0= Lmite inferior de la clase modal.
= Diferencia entre la frecuencia absoluta de la clase modal y la clase que la antecede.
= Diferencia entre la frecuencia absoluta de la clase modal y la clase que le sigue.
= ancho de la clase modal.
Ejemplo ilustrativo: Calcule la moda o modas (si las hay) de los siguientes datos:
Intervalo o Clase
10-19
20-29
30-39
40-49
50-59

3
7
15
12
8
124

Medidas de Tendencia Central

Solucin:
Se observa que la clase modal es 30-39, ya que es el intervalo con la mayor frecuencia.
Aplicando la ecuacin

= + (
)
+
Se tiene:
15 7
8
80
= 30 + (
) 10 = 30 + (
) 10 = 30 +
= 37,27
(15 7) + (15 12)
8+3
11

Grficamente empleando un histograma se calcula la moda de la siguiente manera:

La clase modal es 30-39, ya que es el intervalo con la mayor frecuencia


Observando el histograma se tiene que Mo = 30 + FB

Los tringulos ABC y EBD son semejantes, por lo que se cumple:



=

Donde:
AC = Diferencia entre la frecuencia absoluta de la clase modal y la clase que la antecede.
BG es igual al ancho del intervalo 30-39 menos FB.
DE = Diferencia entre la frecuencia absoluta de la clase modal y la clase que le sigue.
Reemplazando valores y despejando FB se tiene:

10
10
=

=
3 = 8(10 ) 3 = 80 8
15 7 15 12
8
3
3 + 8 = 80 11 = 80 =

80
= 7,27
11

Por lo tanto Mo = 30 + FB = 30+7,27 = 37,27


Medidas de Tendencia Central

125

TAREA DE INTERAPRENDIZAJE N 10
1) Realice un organizador grfico sobre la moda.
2) Para una tienda de modas o para un diseador de autos, de qu le servira saber el valor de la moda?.
3) Se est estudiando el ingreso diario de un grupo de personas y se tiene los siguientes valores en dlares:
350, 400, 500, 350, 550, 1500 y 2000.
3.1) Calcule manualmente y empleando Excel la media aritmtica, la mediana y la moda.
= $ 807,14; Md = $ 500; Mo= $ 350
3.2) Qu valor es ms representativo del ingreso promedio?. Argumente su respuesta.
4) Plantee y resuelva un ejercicio con datos sin agrupar y comprueba la relacin emprica entre la media
aritmtica, mediana y moda.
5) Averige a 30 compaeros de su clase sobre el nmero de hermanas y hermanos.
5.1) Elabore una tabla de frecuencias.
5.2) Calcule la media aritmtica, mediana y moda.
6) Dados los siguientes datos: 50, 52, 59, 60, 60, 63, 64, 65, 69, 69, 70, 70, 72, 72, 74, 74, 75, 75, 76, 75,
74, 70, 77, 78, 78, 79, 79, 75, 80, 80, 81, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 98, 99,
100 y 109
6.1) Calcule manualmente y empleando Excel la media aritmtica, la mediana y la moda con los datos
sin agrupar.
= 78,42; Md=78; Mo=75
6.2) Agrupe los datos en intervalos de ancho 10. Complete la siguiente tabla:
Intervalo
50-59

70-79
12
90-99
2
6.3) A partir de la tabla anterior calcule media aritmtica, la mediana y la moda.
= 78,7; = 78,33; = 76,47
6.4) Calcule la media aritmtica empleando Excel.
= 78,7
6.5) Calcule la moda empleando un histograma.
= 76,47
6.6) Calcule la mediana a travs de un histograma para la fra(%)
= 78,33
6.7) Por qu varan los resultados de los datos sin agrupar con los datos agrupados en intervalos?
7) Plantee y resuelva un ejercicio similar al anterior.
126
Medidas de Tendencia Central

CAPTULO III

MEDIDAS DE DISPERSIN

RESULTADOS DE APRENDIZAJE:

Interpreta las caractersticas y propiedades de las medidas de dispersin, y comprende sus


aplicaciones.
Emplea algoritmos matemticos para calcular medidas de dispersin de manera manual y empleando
Excel.
Crea y resuelve ejercicios de aplicacin sobre las medidas de dispersin de manera manual y
empleando Excel.

CONTENIDOS:

Desviacin Media o Desviacin Promedio


Varianza y Desviacin Estndar
Otras Medidas de Dispersin
Dispersin Relativa o Coeficiente de Variacin

127
Medidas de Dispersin

MEDIDAS DE DISPERSIN
Las medias de tendencia central o posicin nos indican donde se sita un dato dentro de una distribucin
de datos, se ubican generalmente hacia el centro de una distribucin estadstica y son medidas
representativas de un grupo de datos. Las medidas de dispersin, variabilidad o variacin nos indican si
esos datos estn prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se encuentran
los datos. Estas medidas de dispersin nos permiten apreciar la distancia que existe entre los datos a un
cierto valor central e identificar la concentracin de los mismos en un cierto sector de la distribucin, es
decir, permiten estimar informacin acerca de cmo se alejan o dispersan los datos con relacin al
promedio.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo
la media aritmtica el dato central ms utilizado. Cuando existe una dispersin pequea se dice que los
datos estn dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central
es un valor muy representativo. En el caso que la dispersin sea grande el valor central no es muy
confiable. Cuando una distribucin de datos tiene poca dispersin toma el nombre de distribucin
homognea y si su dispersin es alta se llama heterognea.

3.1) DESVIACIN MEDIA O DESVIACIN PROMEDIO


La desviacin media o desviacin promedio es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media aritmtica.

A) PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente
sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la
distancia que induce la desviacin media en el espacio de observaciones no es la natural (no permite
definir ngulos entre dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella
a la hora de hacer inferencia a la poblacin.
Cuando mayor sea el valor de la desviacin media, mayor es la dispersin de los datos. Sin embargo, no
proporciona una relacin matemtica precisa entre su magnitud y la posicin de un dato dentro de una
distribucin.
La desviacin media al tomar los valores absolutos mide una observacin sin mostrar si la misma est
por encima o por debajo de la media aritmtica.

B) MTODOS DE CLCULO
i) Para Datos No Agrupados
Se emplea la frmula:
DM =

|x x|
n

128
Medidas de Dispersin

Ejemplo ilustrativo:
Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18
Solucin:
Se calcula la media aritmtica.
3 + 8 + 8 + 8 + 9 + 9 + 9 + 18
=
=9

8
Se calcula la desviacin media.
=

DM =

|x x|
n

DM =

|3 9| + |8 9| + |8 9| + |8 9| + |9 9| + |9 9| + |9 9| + |18 9|
8

DM =

6 + 1 + 1 + 1 + 0 + 0 + 0 + 9 18
=
= 2,25
8
8

Empleando Excel se calcula de la siguiente manera:


a) Se inserta la funcin DESVPROM como se muestra en la siguiente figura:

129
Medidas de Dispersin

b) Pulsar en Aceptar y seleccionar las celdas.

c) Pulsar en Aceptar.

ii) Para Datos Agrupados en Tablas de Frecuencia


Se emplea la frmula:
=

| |

130
Medidas de Dispersin

Ejemplo ilustrativo: Calcular la desviacin media en base a la siguiente tabla sobre las calificaciones
de un estudiante en 12 asignaturas evaluadas sobre 10.
Calificacin Cantidad de asignaturas
6
4
7
2
8
3
9
2
10
1
Total
12
Solucin:
Se calcula la media aritmtica.
=

4 6 + 2 7 + 3 8 + 2 9 + 1 10 24 + 14 + 24 + 18 + 10 90
=
=
=
= 7,5

12
12
12

Se llena la siguiente tabla:

| | | |
6
4
1,5
6
7
2
0,5
1
8
3
0,5
1,5
9
2
1,5
3
10
1
2,5
2,5
Total 12
14

Se emplea la ecuacin de la desviacin media.


=

| | 14
=
= 1,167

12

iii) Para Datos Agrupados en Intervalos


Se emplea la frmula:
=

| |

Donde es la marca de clase.

131
Medidas de Dispersin

Ejemplo ilustrativo:
Calcular la desviacin media de un curso de 40 estudiantes en la asignatura de Estadstica en base a la
siguiente tabla:
Calificacin Cantidad de estudiantes
2-4
6
4-6
8
6-8
16
8-10
10
Total
40
Solucin:
Para calcular la media aritmtica se llena la siguiente tabla:
Intervalo
2-4
6
3
18
4-6
8
5
40
6-8
16 7
112
8-10
10 9
90
Total
40
260
Calculando la media aritmtica se obtiene:
260
=
=
= 6,5

40
Para calcular la desviacin media se llena la siguiente tabla:
Intervalo
2-4
4-6
6-8
8-10
Total
=

6
8
16
10
40

3
5
7
9

| |
3,5
2,5
0,5
2,5

| |
21
12
8
25
66

66
= 1,65
40

TAREA DE INTERAPRENDIZAJE N 11
1) Conteste a las siguientes preguntas.
1.1) Cul es la diferencia entre medidas de tendencia central y medidas de dispersin?
1.2) Qu permiten o que se logra con las medidas de dispersin?
1.3) En qu caso una distribucin de datos toma el nombre de homognea?. Explique con un ejemplo.
1.4) En qu caso una distribucin de datos toma el nombre de heterognea?. Explique con un ejemplo.
132
Medidas de Dispersin

2) Realice un organizador grfico sobre la desviacin media.


3) Calcule la desviacin media de las siguientes distribuciones empleando la ecuacin y mediante Excel.
3.1) 6, 8, 7, 2, 4, 5, 8 y 9
MD= 1,875
3.2) 10, 4, 8, 9, 6, 10, 8 y10
MD= 1,625
4) Crear y resolver un ejercicio similar al anterior.
5) Calcule la desviacin media empleando los datos de la siguiente tabla:

20
19
18
17
16
15
14
Total

2
2
3
4
6
3
3
23
DM = 1,46

6) Cree y resuelva un ejercicio similar al ejemplo presentado en el clculo de la desviacin media para
datos agrupados en tablas de frecuencias.
7) La siguiente tabla muestra la cantidad de dinero que se gasta por semana un grupo de 50 personas.
Calcular la desviacin media.
Intervalo
10-20
20-30
30-40
40-50
Total

8
15
12
15
50
DM= 9,456

8) Cree y resuelva un ejercicio con datos agrupados en intervalos y calcular


8.1) La media geomtrica.
8.2) La media armnica.
8.3) La mediana.
8.4) El cuartil N1 y el cuartil N3 empleando las ecuaciones y mediante un histograma para la fra(%).
8.5) La Moda empleando la ecuacin y mediante un histograma.
8.6) La desviacin media.
133
Medidas de Dispersin

3.2) VARIANZA Y DESVIACIN ESTNDAR


La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica,
es decir, es el promedio de las desviaciones de la media elevadas al cuadrado. La desviacin estndar o
desviacin tpica es la raz de la varianza.
La varianza y la desviacin estndar proporcionan una medida sobre el punto hasta el cual se dispersan
las observaciones alrededor de su media aritmtica.

A) PROPIEDADES
- La varianza y desviacin estndar (o cualquier otra medida de dispersin) indican el grado en que estn
dispersos los datos en una distribucin. A mayor medida, mayor dispersin.
- La varianza es un nmero muy grande con respecto a las observaciones, por lo que con frecuencia se
vuelve difcil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza siempre se expresa en trminos
de los datos originales elevados al cuadrado, se obtiene unidades de medida de los datos que no tiene
sentido o interpretacin lgica. Por ejemplo, si se calcula la varianza de una distribucin de datos
medidos en metros, segundos, dlares, etc., se obtendr una varianza mediada en metros cuadrados,
segundos cuadrados, dlares cuadrados, respectivamente, unidades de medida que no tienen significado
lgico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la raz cuadrada de la misma,
es decir, se calcula la desviacin estndar, la cual es un nmero pequeo expresado en unidades de los
datos originales y que tiene un significado lgico respeto a los mismos.
A pesar de lo anterior, es difcil describir exactamente qu es lo que mide la desviacin estndar. Sin
embargo, hay un resultado til, que lleva el nombre del matemtico ruso Pafnuty Lvovich Chebyshev, y
se aplica a todos los conjuntos de datos. Este teorema de Chebyshev establece que para todo conjunto de
datos, por lo menos 1 1/ 2 de las observaciones estn dentro de k desviaciones estndar de la media,
en donde k es cualquier nmero mayor que 1. Este teorema se expresa de la siguiente manera:
1

1
2

As por ejemplo, si se forma una distribucin de datos con k =3 desviaciones estndar por debajo de la
media hasta 3 desviaciones estndar por encima de la media, entonces por lo menos
1
1 91 8
1 2 =1 =
= = 0,8889 = 88,89%
3
9
9
9
Interpretacin: El 88,89% de todas las observaciones estarn dentro 3 desviaciones de la media.

134
Medidas de Dispersin

B) MTODOS DE CLCULO
i) Para Datos No Agrupados
La varianza para una poblacin se calcula con:
2 =

(xi )2
N

Donde:
=
= media aritmtica poblacional
=

La desviacin estndar poblacional se calcula con:

= 2 =

(xi )2
N

La varianza de la muestra se calcula con:


(xi x)2
s =
n1
2

Donde:
=
x =
=

La desviacin estndar de una muestra se calcul con:

= 2 =

(xi x)2
n1

Notas:
1) Para el clculo de la varianza de una muestra se divide por n-1 en lugar de N, debido a que se tiene n1 grados de libertad en la muestra. Otra razn por la que se divide por n-1 es debido a que una muestra
generalmente est un poco menos dispersa que la poblacin de la cual se tom. Al dividir para n-1 en
lugar de N se cumple con la tendencia y sentido lgico de que la varianza y desviacin estndar de la
muestra deben tener un valor ms pequeo que la varianza y desviacin estndar de la poblacin.
2) En la realidad, salvo indicacin expresa, no se calcula la varianza y la desviacin estndar de la
poblacin, ya que para ahorrar tiempo, esfuerzo, dinero, etc. es mejor trabajar con datos que representan
a la muestra.

135
Medidas de Dispersin

Ejemplo ilustrativo N 1

Considere que los siguientes datos corresponden al sueldo de una poblacin: $350, $400, $500, $700 y
$1000
1) Calcular la desviacin estndar.
2) Cul es el intervalo que est dentro de k = 2 desviaciones estndar de la media?. Qu porcentaje de
las observaciones se encuentran dentro de ese intervalo?

Solucin:
1) Para la calcular la desviacin estndar se sigue los siguientes pasos:
a) Se calcula la media aritmtica.
=

xi 350 + 400 + 500 + 700 + 1000 2950


=
=
= $ 590
N
5
5

2950
5

= $ 590

b) Se aplica la respectiva frmula para calcular la varianza


(xi )2
=
N
(350
590)2 + (400 590)2 + (500 590)2 + (700 590)2 + (1000 590)2
2 =
5
57600
+
36100
+
8100
+
12100
+
168100
2 =
5
2

2 =

282000
5

2 = $2 56400

c) Se calcula la desviacin estndar.


= 2
= $2 56400
= $237,4868

136
Medidas de Dispersin

Empleando Excel se calcula de la siguiente manera:


a) Se inserta la funcin DESVEST.P. Clic en Aceptar

b) Pulsar en Aceptar y seleccionar las celdas.

137
Medidas de Dispersin

c) Pulsar en Aceptar.

2) Clculo del intervalo de k = 2 desviaciones estndar de la media.


Se transportan 2 desviaciones estndar (2 x $ 237,4868) = $ 474,97 por encima y por debajo de la media
= $590
Por lo tanto se tiene un intervalo desde $ 590 - $474,97 = $ 115,03 hasta $ 590 + $474,97 = $ 1064,97
Aplicando el Teorema de Chebyshev
1

1
1
1 41 3
=1 2 =1 =
= = 0,75 = 75%
2

2
4
4
4

Interpretacin: Se puede afirmar de que por lo menos el 75% los sueldos estn entre $ 115,03 y
1064,97

Ejemplo ilustrativo N 2
Dos empresas, A y B, venden sobres de caf instantneo de 350 gramos. Se seleccionaron al azar en los
mercados cinco sobres de cada una de las compaas y se pesaron cuidadosamente sus contenidos. Los
resultados fueron los siguientes.
A
350,14
350,18
349,98
349,99
350,12

B
350,09
350,12
350,20
349,88
349,95

1) Qu empresa proporciona ms caf en sus sobres?


2) Qu empresa llena sus sobres de manera ms consistente?

138
Medidas de Dispersin

Solucin:
a) Se calcula las medias aritmticas.
xA =

xi 350,14 + 350,18 + 349,98 + 349,99 + 350,12


=
n
5

xA =

1750,41
= 350,082
5

xB =

xi 350,09 + 350,12 + 350,20 + 349,88 + 349,95 1750,24


=
=
= 350,048
n
5
5

xB =

1750,24
= 350,048
5

Interpretacin: Como la media aritmtica de la empresa A es mayor que la de la empresa B, por lo tanto
la empresa A proporciona ms caf en sus sobres.
b) Se calcula las desviaciones estndar.
(xi x)2

=
n1
A
350,14
350,18
349,98
349,99
350,12
Total


0,058
0,098
-0,102
-0,092
0,038

(xi x)2
0,003364
0,009604
0,010404
0,008464
0,001444
0,03328

B

350,09 0,042
350,12 0,072
350,20 0,152
349,88 -0,168
349,95 -0,098

(xi x)2
0,001764
0,005184
0,023104
0,028224
0,009604
0,06788

0,03328
0,03328
=
=
= 0,0912
51
4

0,06788
0,06788
=
= 0,13
51
4

Interpretacin: Como la desviacin estndar de la empresa A es menor a la desviacin estndar de la


empresa B, por lo tanto la empresa A es ms consistente al llenar los sobres de caf.

139
Medidas de Dispersin

Empleando Excel se calcula de la siguiente manera:


Se sigue los pasos para el clculo de la desviacin estndar de una poblacin pero utilizando la funcin
DESVEST.M como se muestra en las siguientes figuras:

ii) Para Datos Agrupados en Tablas de Frecuencia


La varianza para una poblacin se calcula con:
( )2
=

Donde:
f = frecuencia absoluta.

La desviacin estndar poblacional se calcula con:

= 2 =

( )2

La varianza de la muestra se calcula con:


( )2
=
1
2

La desviacin estndar de una muestra se calcula con:


( )2
= 2 =
1
140
Medidas de Dispersin

Ejemplo ilustrativo
Calcular la desviacin estndar de los siguientes datos correspondientes a una muestra.
Calificaciones
4
5
6
7
8
10
Total

3
6
4
13
7
6
39

Solucin:
a) Se llena la siguiente tabla:
Calificaciones
4
5
6
7
8
10
Total

3
6
4
13
7
6
39

12
30
24
91
56
60
273

b) Se calcula la media aritmtica.


=

273
=
=7

39

c) Se llena la siguiente tabla:


Calificaciones
4
5
6
7
8
10
Total

3
6
4
13
7
6
39

12
30
24
91
56
60
273


-3
-2
-1
0
1
3

( )2
9
4
1
0
1
9

( )2
27
24
4
0
7
54
116

d) Se calcula la desviacin estndar


116
116
=
=
= 3,0526 = 1,747
39 1
38
141
Medidas de Dispersin

iii) Para Datos Agrupados en Intervalos


La varianza para una poblacin se calcula con:
2 =
Donde:
=
=

( )2

La desviacin estndar poblacional se calcula con:


( )2
= 2 =

La varianza de la muestra se calcula con:


2 =

( )2
1

La desviacin estndar de una muestra se calcula con:

= 2 =

( )2
1

Ejemplo ilustrativo
Calcular la desviacin estndar de los siguientes datos correspondientes a una muestra.
Intervalo
60-65
5
65-70
20
70-75
40
80-85
27
85-90
8
Total 100
Solucin:
a) Se llena la siguiente tabla:
Intervalo
60-65
65-70
70-75
80-85
85-90
Total

5
20
40
27
8
100

62,5
67,5
72,5
82,5
87,5


312,5
1350
2900
2227,5
700
7490
142

Medidas de Dispersin

b) Se calcula la media aritmtica.


=

7490
=
= 74,9

100

c) Se llena la siguiente tabla:


Intervalo
60-65
65-70
70-75
80-85
85-90
Total

5
20
40
27
8
100

62,5
67,5
72,5
82,5
87,5


312,5
1350
2900
2227,5
700
7490

(xmi x)2 f(xmi x)2


-12,4
153,76
768,8
-7,4
54,76
1095,2
-2,4
5,76
230,4
7,6
57,76
1559,52
12,6
158,76
1270,08
4924

d) Se calcula la desviacin estndar.


4924
=
100 1
4924
=
99
= 49,737
= 7,052

TAREA DE INTERAPRENDIZAJE N 12
1) Elabore un organizador grfico sobre la varianza y desviacin estndar.
2) Consulte sobre la biografa de Pafnuty Lvovich Chebyshev y elabore un organizador grfico sobre la
misma.
3) Calcule la desviacin estndar de las siguientes distribuciones correspondientes a una poblacin
empleando la ecuacin y mediante Excel.
3.1) 10, 12, 14, 16, 18, 20 y 40
9,3
3.2) 30, 20, 50, 40, 60, 80 y 90
23,73
4) Cree y resuelva un ejercicio similar al anterior.
5) Cree y resuelva un ejercicio similar al ejemplo presentado para el clculo de la desviacin estndar de
una muestra para datos sin agrupar.

143
Medidas de Dispersin

6) Calcule la desviacin estndar de una muestra dada la siguiente tabla:

14
15
18
20
30
40

6
5
4
12
7
6
8,903

7) El atraso diario al trabajo en la empresa D & M en el ao pasado tuvo un promedio de 78 empleados


con una desviacin estndar de 13. Se recolect una muestra de datos para el ao en curso y se ubicaron
en la siguiente tabla:
Nmero de empleados
atrasados
50 59
60 69
70 79
80 89
90 99
Total

Das en los que ese nmero


estuvo atrasado
2
4
5
6
3
20

7.1) Calcule la media aritmtica.


76,5
7.2) Calcule la mediana empleando la frmula y mediante un histograma para la (%)
78
7.3) Calcule la moda utilizando la frmula y mediante un histograma para la frecuencia absoluta.
82,5
7.4) Calcule la desviacin estndar.
12,4
8) Cree y resuelva un ejercicio similar al anterior.

9) Consulte en la biblioteca o en el internet sobre las propiedades de la desviacin estndar. Presente


cada propiedad con un ejemplo ilustrativo.
10) Consulte en la biblioteca o en el internet sobre las aplicaciones de la desviacin estndar en la vida
cotidiana. Presente la consulta a travs de un organizador grfico.

144
Medidas de Dispersin

3.3) OTRAS MEDIDAS DE DISPERSIN

A) RANGO, AMPLITUD TOTAL O RECORRIDO


Dada una serie de valores 1 , 2 , . , su recorrido es la diferencia aritmtica entre el mximo y el
mnimo de estos valores.
=
Es la medida de dispersin ms sencilla y tambin, por tanto, la que proporciona menos informacin.
Adems, esta informacin puede ser errnea, pues el hecho de que no influyan ms de dos valores del
total de la serie puede provocar una deformacin de la realidad.

Ejemplo ilustrativo:
Calcula el rango de las siguientes distribuciones:
1) 4, 6, 8, 10, 12, 14, 16
2) 5, 10, 13, 13, 14, 15, 17
Solucin:
1 = 16 4 = 12
2 = 17 5 = 12
En Excel se inserta la funcin MAX(Celdas) MIN(Celdas) como muestra la siguiente figura:

Ambas series tienen rango 12, pero estn desigualmente distribuidas, pues mientras la primera se
distribuye uniformemente a lo largo de todo el recorrido, la segunda tiene una mayor concentracin en
el centro.
La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio
las siguientes desventajas:
- En su clculo slo intervienen dos elementos del conjunto.
- Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la
amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la
variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.
Nota: Cuando los datos estn agrupados en intervalos se calcula la amplitud sacando la diferencia entre
la marca de clase mayor y la marca de clase menor.
145
Medidas de Dispersin

B) AMPLITUD INTERCUARTLICA
La amplitud intercuartlica es la distancia entre el tercer cuartil 3 y el primer cuartil 1.
Amplitud intercuartlica = tercer cuartil - primer cuartil = 3 1
C) RANGO SEMI-INTERCUARTIL O DESVIACIN CUARTLICA
La desviacin cuartlica es la mitad de la distancia entre el tercer cuartil y el primero
=

3 1
2

Ejemplo ilustrativo:
Si el tercer cuartil = 24 y el primer cuartil = 10. Cul es la desviacin cuartlica?

Solucin:
La amplitud intercuartlica es 24 - 10 = 14;
Por lo tanto, la desviacin cuartlica es:
=

14
2

D) RANGO PERCENTIL O AMPLITUD CUARTLICA


Cada conjunto de datos tiene 99 percentiles, que dividen el conjunto en 100 partes iguales.
La amplitud cuartlica es la distancia entre dos percentiles establecidos.
El rango percentil o amplitud cuartlica 10 a 90 es la distancia entre el 10 y 90 percentiles, definida por
10 90 = 90 10

TAREA DE INTERAPRENDIZAJE N 13
1) Realice un organizador grfico sobre las otras medidas de dispersin.
2) Plantee una distribucin de dados sin agrupar y calcule el rango, la amplitud intercuartlica, el rango
semi-intercuartil y el rango percentil de manera manual y empleando Excel.
3) Plantee una distribucin de datos agrupados en tablas de frecuencia y calcule el rango, la amplitud
intercuartlica, el rango semi-intercuartil y el rango percentil.
4) Plantee una distribucin de datos agrupados en intervalos y calcule el rango, la amplitud
intercuartlica, el rango semi-intercuartil y el rango percentil.
146
Medidas de Dispersin

3.4) DISPERSIN RELATIVA O COEFICIENTE DE VARIACIN


Las medidas de dispersin anteriores son todas medidas de variacin absolutas. Una medida de dispersin
relativa de los datos, que toma en cuenta su magnitud, est dada por el coeficiente de variacin.
El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se
obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa
generalmente en trminos porcentuales.

A) PROPIEDADES
- Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es
una medida independiente de las unidades de medicin.
- Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos
conjuntos de datos.

B) MTODOS DE CLCULO
Para una poblacin se emplea la siguiente frmula:
=

100%

Donde:
=
=
=

Para una muestra se emplea la siguiente frmula:


=

100%

Donde:
=
=
=

Ejemplo ilustrativo N 1
Mathas, un estudiante universitario, tiene las siguientes calificaciones en las 10 asignaturas que recibe
en su carrera: 8, 7, 10, 9, 8, 7, 8, 10, 9 y 10. Josu, un compaero de Mathas, tiene las siguientes
calificaciones: 8, 9, 8, 7, 8, 9, 10, 7, 8 y 10. Cul estudiante tiene menor variabilidad en sus
calificaciones?

147
Medidas de Dispersin

Solucin:
Como se est tomando en cuenta todas las asignaturas, se debe calcular el coeficiente de variacin
poblacional.
Sin agrupar los datos empleando Excel se calcula el coeficiente de variacin tal como se muestra en la
siguiente figura:

Agrupando los datos en tablas de frecuencias se calcula as:


a) Se agrupa las calificaciones y se realiza el clculo la media aritmtica
Para Mathas se obtiene:

Calificaciones ( )
7
8
9
10
Total

2
3
2
3
10

14
24
18
30
86

Calificaciones ( )
7
8
9
10
Total

2
4
2
2
10

14
32
18
20
84

86
=
= 8,6

10

Para Josu se obtiene:

84
=
= 8,4

10
148
Medidas de Dispersin

b) Se calcula la desviacin estndar


Para Mathas se obtiene:
Calificaciones ( )
7
8
9
10
Total

2
3
2
3
10

14
24
18
30
86

( )2
2,56
0,36
0,16
1,96

( )2
5,12
1,08
0,32
5,88
12,4

( )2
12,4
=
= 1,1136

10

Para Josu se obtiene:


Calificaciones ( )
7
8
9
10
Total

2
4
2
2
10

14
32
18
20
84

( )2
1,96
0,16
0,36
2,56

( )2
3,92
0,64
0,72
5,12
10,4

( )2
10,4
=
= 1,0198

10

c) Se calcula el coeficiente de variacin


Para Mathas se obtiene:
=

1,1136
=
= 0,129 = 12,9%

8,6

Empleando Excel es como muestra la siguiente figura:

149
Medidas de Dispersin

Para Josu se obtiene:


=

1,0198
=
= 0,121 = 12,1%

8,4

Empleando Excel es como muestra la siguiente figura:

Interpretacin: Por lo tanto, Josu tiene menor variabilidad en sus calificaciones

Ejemplo ilustrativo N 2
Se saca una muestra de un curso de la Universidad UTN sobre las calificaciones en las asignaturas de
Matemtica y Estadstica, resultados que se presentan en las siguientes tablas. En qu asignatura existe
mayor variabilidad?. Realice los clculos empleando Excel
Matemtica
Intervalos
f
2-4
8
5-7
12
8 - 10
20
Total
40

Estadstica
f
Intervalos
8
24
14
57
18
8 - 10
40
Total

150
Medidas de Dispersin

Solucin:
Los clculos para la asignatura de Matemtica empleando Excel se muestran en la siguiente figura:

Los clculos para la asignatura de Estadstica empleando Excel se muestran en la siguiente figura:

Interpretacin: Por lo tanto el curso presenta mayor variabilidad en la asignatura de Matemtica.

TAREA DE INTERAPRENDIZAJE N 14
1) Calcule el coeficiente de variacin de las siguientes distribuciones de datos referentes a poblaciones.
Realice los clculos empleando la frmula respectiva y utilizando Excel.
1.1) 6, 8, 10, 4, 7, 8, 9, 8, 4 y 6
27,105 %
1.1) 6, 6, 8, 8, 8, 8, 9, 9, 5 y 7
17,31 %

151
Medidas de Dispersin

2) Calcule el coeficiente de variacin de las siguientes distribuciones de datos referentes a muestras.


Realice los clculos empleando la frmula respectiva y utilizando Excel.
2.1) 6, 8, 10, 9, 8, 7, 8, 10, 9 y 10
15,93 %
2.2) 6, 6, 8, 10, 8, 10, 9, 9, 5 y 7
22,45 %
3) Calcule el coeficiente de variacin de manera manual y empleando Excel empleando los datos de la
siguiente tabla correspondientes a una poblacin.

7
8
9
10
Total

4
8
12
6
30
10,88%

4) Cree y resuelva un ejercicio similar al presentado en el ejemplo 1 con datos sin agrupar y agrupando
en tablas de frecuencias. Resolver de manera manual y empleando Excel.

5) Calcule el coeficiente de variacin de manera manual y empleando Excel utilizando los datos de la
siguiente tabla correspondientes a una muestra.
Intervalos
24
57
8 - 10
Total

10
8
22
40

37,1 %
6) Cree y resuelva un ejercicio similar al presentado en el ejemplo 2. Resuelva de manera manual y
empleando Excel.

7) Consulte en la biblioteca o el internet sobre un ejercicio de aplicacin del coeficiente de variacin.


Presente el ejercicio resuelto de manera manual y empleando Excel.

152
Medidas de Dispersin

CAPTULO IV

MEDIDAS DE FORMA

RESULTADOS DE APRENDIZAJE:

Interpreta las caractersticas y tipos de asimetra y curtosis.


Emplea algoritmos matemticos para calcular medidas de asimetra y curtosis en forma manual y
empleando Excel.
Crea y resuelve ejercicios de aplicacin sobre el clculo de medidas de asimetra y curtosis en forma
manual y empleando Excel.

CONTENIDOS:

Asimetra: Tipos de Asimetra y Medidas de Asimetra


Curtosis o Apuntamiento: Tipos de Curtosis y Medidas de Curtosis.

153
Medidas de Forma

4.1) ASIMETRA
Es una medida de forma de una distribucin que permite identificar y describir la manera como los datos
tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite
identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico.

A) TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:
i) Asimetra Negativa o a la Izquierda
Se da cuando en una distribucin la minora de los datos est en la parte izquierda de la media. Este tipo
de distribucin presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los datos
tiene a la izquierda una cola ms larga que a la derecha.
Tambin se dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando el valor
de la media aritmtica es menor que la mediana y ste valor de la mediana a su vez es menor que la moda,
en smbolos < < .
Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la simetra.
ii) Simtrica
Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los datos a ambos
lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una curva normal en forma
de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o tambin conocida como de
Laplace (1749-1827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica, su
mediana y su moda son iguales, en smbolos = =

iii) Asimetra Positiva o a la Derecha


Se da cuando en una distribucin la minora de los datos est en la parte derecha de la media aritmtica.
Este tipo de distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la distribucin de
los datos tiene a la derecha una cola ms larga que a la izquierda.
Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor de
la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que la moda,
en smbolos > > .

154
Medidas de Forma

B) MEDIDAS DE ASIMETRA
i) Coeficiente de Karl Pearson
=

3( )

Donde:
= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.
Nota:
El Coeficiente de Pearson vara entre -3 y 3
Si As < 0 la distribucin ser asimtrica negativa.
Si As = 0 la distribucin ser simtrica.
Si As > 0 la distribucin ser asimtrica positiva.
ii) Medida de Yule Bowley o Medida Cuartlica
=

1 + 3 22
3 1

Donde:
1 = Cuartil uno; 2 = Cuartil dos = Mediana; 3 = Cuartil tres.
Nota:
La Medida de Bowley vara entre -1 y 1
Si As < 0 la distribucin ser asimtrica negativa.
Si As = 0 la distribucin ser simtrica.
Si As > 0 la distribucin ser asimtrica positiva.

iii) Medida de Fisher


Para datos sin agrupar se emplea la siguiente frmula:
( )3
=
3
Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:
( )3
=
3
Para datos agrupados en intervalos se emplea la siguiente frmula:
( )3
=
3
Donde:
xi = cada uno de los valores
n = nmero de datos
x = media aritmtica
= frecuencia absoluta
3 = cubo de la desviacin estndar poblacional
= marca de clase
155
Medidas de Forma

Nota:
Si As < 0 Indica que existe presencia de la minora de datos en la parte izquierda de la media, aunque
en algunos casos no necesariamente indicar que la distribucin sea asimtrica negativa
Si As = 0 la distribucin ser simtrica
Si As > 0 Indica que existe presencia de la minora de datos en la parte derecha de la media, aunque
en algunos casos no necesariamente indicar que la distribucin sea asimtrica positiva

Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la siguiente
distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Calculando la media aritmtica se obtiene:
=

6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
=
=
= 11,5

8
8

Para calcular los cuartiles se ordena los datos de menor a mayor


6
1

9
2

9
3

12 12 12 15 17
4 5 6 7 8

Calculando el cuartil uno se obtiene:


= +2
[

1 = [+2] = [8+2]= [10]= 2,5 =


4

2 + 3 9 + 9
=
=9
2
2

Calculando el cuartil dos se obtiene:


= +2
[

2 = [2+2] = [2+2]= [28+2]= [16+2]= 4,5=


4

4 + 5 12 + 12
=
= 12
2
2

Calculando el cuartil tres se obtiene:


= +2
[

3 = [3+2]= [38+2]= [24+2]= 26 = 6,5=


4

6 + 7 12 + 15
=
= 13,5
2
2

Calculando la desviacin estndar muestral se obtiene:


(xi x)2
=
n1
(6 11,5)2 + (9 11,5)2 + (9 11,5)2 + (12 11,5)2 + (12 11,5)2 +(12 11,5)2 + (15 11,5)2 + (17 11,5)2
=
81

= 3,505

156
Medidas de Forma

Calculando el Coeficiente de Pearson se obtiene:


=

3( ) 3(11,5 12) 1,5


=
=
= 0,428

3,505
3,505

Calculando la Medida de Bowley se obtiene


=

1 + 3 22 9 + 13,5 2 12
=
= 0,333
3 1
13,5 9

Calculando la desviacin estndar poblacional se obtiene:

(xi )2
N

(6 11,5)2 + (9 11,5)2 + (9 11,5)2 + (12 11,5)2 + (12 11,5)2 +(12 11,5)2 + (15 11,5)2 + (17 11,5)2
8

= 3,279
Calculando la Medida de Fisher se obtiene
Datos (xi x)3
6
-166,375
9
-15,625
9
-15,625
12
0,125
12
0,125
12
0,125
15
42,875
17
166,375
Total 12
( )3
12
=
=
= 0,035
3
8(3,279)3

157
Medidas de Forma

Los clculos en Excel se muestran en la siguiente figura:

Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la


Medida de Fisher

TAREA DE INTERAPRENDIZAJE N 15
1) Realice un organizador grfico sobre la asimetra.
2) Consulte y realice un organizador grfico para cada una de las biografas de Gauss, Laplace, Pearson,
Bowley y Fisher.
3) Calcule empleando las frmulas y mediante Excel el Coeficiente de Pearson, Medida de Bowley y la
Medida de Fisher dadas las siguientes distribuciones.
3.1) 4, 4, 8, 14, 14, 16, 18 y 20
-0,85; -0,45; -0,31
3.1) 6, 8, 10, 12, 14, 16, 18 y 20
0
4) Cree y resuelva un ejercicio para el clculo del Coeficiente de Pearson, Medida de Bowley y la Medida
de Fisher para datos agrupados en tablas de frecuencias, y otro ejercicio para datos agrupados en
intervalos. Emplee los conocimientos adquiridos en los anteriores captulos.
158
Medidas de Forma

4.2) CURTOSIS O APUNTAMIENTO


La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la distribucin
normal, es decir, mide cun puntiaguda es una distribucin.
A) TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la regin central de la
distribucin. As puede ser:
i) Leptocrtica.- Existe una gran concentracin.
ii) Mesocrtica.- Existe una concentracin normal.
iii) Platicrtica.- Existe una baja concentracin.

B) MEDIDAS DE CURTOSIS
i) Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:
( )4
=
4
Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:
( )4
=
4
Para datos agrupados en intervalos se emplea la siguiente frmula:
( )4
=
4
Donde:
= cada uno de los valores
= nmero de datos
= media aritmtica
4 = Cudruplo de la desviacin estndar poblacional
= frecuencia absoluta
= marca de clase
Nota:
Si < 3 la distribucin es platicrtica
Si = 3 la distribucin es normal o mesocrtica
Si > 3 la distribucin es leptocrtica

159
Medidas de Forma

ii) Medida basada en Cuartiles y Percentiles


Q 3 Q1
Desviacin cuartlica
Q 3 Q1
2
=
=
=
Amplitud cuartlica
P90 P10 2(P90 P10 )
(letra griega minscula kappa) = Coeficiente percentil de curtosis
Nota:
Si < 0,263 la distribucin es platicrtica
Si = 0,263 la distribucin es normal o mesocrtica
Si > 0,263 la distribucin es leptocrtica
Esta medida no es muy utilizada.

Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9, 9, 12, 12, 12,
15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solucin:
Calculando la media aritmtica se obtiene
6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
=
=
=
= 11,5

8
8
Calculando la desviacin estndar poblacional se obtiene:

(xi x)2
n

(6 11,5)2 + (9 11,5)2 + (9 11,5)2 + (12 11,5)2 + (12 11,5)2 +(12 11,5)2 + (15 11,5)2 + (17 11,5)2
=
8

= 3,279
Calculando la Medida de Fisher se obtiene:

Datos
6
9
9
12
12
12
15
17
Total
=

( )4
915,0625
39,0625
39,0625
0,0625
0,0625
0,0625
150,0625
915,0625
2058,5

(xi x)4
2058,5
=
= 2,23
4
n
8 (3,279)4

160
Medidas de Forma

Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6
1

9
2

9
3

12 12 12 15 17
4 5 6 7 8

Calculando el cuartil uno se obtiene:


= +2
[

1 = [+2] = [8+2]= [10]= 2,5 =


4

2 + 3 9 + 9
=
=9
2
2

Calculando el cuartil tres se obtiene:


= +2
[

3 = [3+2]= [38+2]= [24+2]= 26 = 6,5=


4

6 + 7 12 + 15
=
= 13,5
2
2

Calculando el percentil 90 se tiene:


= +50
[

100

90 = 90+50 890+50 [770]= 7,7=


[

]= [

100

100

]=

100

7 + 8 15 + 17
=
= 16
2
2

Calculando el percentil 10 se tiene:


= +50
[

100

10 = 10+50 810+50 [130]= 1,3= 1 = 6


[

100

]= [

100

]=

100

Calculando el coeficiente percentil de curtosis se obtiene:


=

Q 3 Q1
13,5 9
=
= 0,225
2(P90 P10 ) 2(16 6)

Como = 2,23 y = 0,225, la distribucin es platicrtica

161
Medidas de Forma

Los clculos en Excel se muestran en la siguiente figura:

TAREA DE INTERAPRENDIZAJE N 16
1) Realice un organizador grfico sobre la curtosis.
2) Cree y resuelva un ejercicio similar al presentado para el clculo de las medidas de curtosis con datos
sin agrupar.
3) Resuelva el ejercicio anterior empleando Excel.
4) Cree y resuelva un ejercicio para el clculo de las medidas de curtosis con datos agrupados en tablas
de frecuencia, y otro ejercicio con datos agrupados en intervalos. Emplee los conocimientos adquiridos
en los anteriores captulos.

162
Medidas de Forma

CAPTULO V

CORRELACIN Y RELACIN

RESULTADOS DE APRENDIZAJE:
Describe con sus propias palabras el significado de correlacin y regresin.
Emplea algoritmos matemticos para resolver ejercicios de aplicacin sobre correlacin y regresin
de manera manual y empleando Excel.
Elabora diagramas de dispersin y lneas de regresin de manera manual, empleando Excel, Graph y
GeoGebra
Crea y resuelve correctamente ejercicios de aplicacin sobre correlacin y regresin de manera
manual, empleando Excel, Graph y GeoGebra.

CONTENIDOS:
Anlisis de Correlacin: Diagrama de Dispersin, Clasificacin de la Correlacin, Coeficientes de
Correlacin y Coeficiente de Determinacin.
Anlisis de Regresin: Principio de los Mnimos Cuadrados y Error Estndar de Estimacin.

Correlacin y Regresin

163

CORRELACIN Y REGRESIN
Cuando se estudian en forma conjunta dos caractersticas (variables estadsticas) de una poblacin o
muestra, se dice que estamos analizando una variable estadstica bidimensional. La correlacin es el
grado de relacin que existe entre ambas caractersticas, y la regresin es la forma de expresar
matemticamente dicha relacin.

5.1) ANLISIS DE CORRELACIN


Dado dos variables, la correlacin permite hacer estimaciones del valor de una de ellas conociendo el
valor de la otra variable.
A) DIAGRAMA DE DISPERSIN
Los diagramas de dispersin son planos cartesianos en los que se marcan los puntos correspondientes a
los pares ordenados (X,Y) de los valores de las variables.
B) CLASIFICACIN DE LA CORRELACIN
i) Segn la relacin entre variables
- Correlacin lineal: Se representa mediante una lnea recta.
- Correlacin no lineal: Se representa con una lnea curva.
ii) Segn el nmero de variables
- Correlacin simple: La variable dependiente acta sobre la variable independiente.
- Correlacin mltiple: Cuando la variable dependiente acta sobre varias variables independientes.
- Correlacin parcial: Cuando la relacin que existe entre una variable dependiente y una independiente
es de tal forma que los dems factores permanezcan constantes.
iii) Segn el valor cuantitativo
- Correlacin perfecta: El valor del coeficiente de correlacin es 1
- Correlacin imperfecta: El coeficiente de correlacin es menor a 1 sea en sentido positivo o negativo.
- Correlacin nula: El coeficiente de correlacin es 0. No existe correlacin entre las variables. Ejemplo:
Nmero de calzado de una persona y su cociente intelectual.

iv) Segn el signo


- Correlacin positiva.- Dos variables tiene correlacin positiva cuando al aumentar o disminuir el
valor de una de ellas entonces el valor correspondiente a la otra aumentar o disminuir
respectivamente, es decir, cuando las dos variables aumentan en el mismo sentido. Ejemplo: Peso de
una persona y su talla.
- Correlacin negativa.- Dos variables tiene correlacin negativa cuando al aumentar o disminuir el
valor de una de ellas entonces el valor de la otra disminuir o aumentar respectivamente, es decir, una
variable aumenta y otra disminuye o viceversa. Ejemplo: Nmero de partidos ganados por un equipo en
una temporada y su posicin final en la tabla.

Correlacin y Regresin

164

C) COEFICIENTES DE CORRELACIN
Los coeficientes de correlacin son medidas que indican la situacin relativa de los mismos sucesos
respecto a las dos variables, es decir, son la expresin numrica que nos indica el grado de relacin
existente entre las 2 variables y en qu medida se relacionan. Son nmeros que varan entre los lmites
+1 y -1. Su magnitud indica el grado de asociacin entre las variables; el valor r = 0 indica que no existe
relacin entre las variables; los valores 1 son indicadores de una correlacin perfecta positiva (al crecer
o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).

No hay correlacin

Correlacin Positiva

Correlacin Negativa

Correlacin y Regresin

165

Para interpretar el coeficiente de correlacin utilizamos la siguiente escala:

Valor
-1
-0,9 a -0,99
-0,7 a -0,89
-0,4 a -0,69
-0,2 a -0,39
-0,01 a -0,19
0
0,01 a 0,19
0,2 a 0,39
0,4 a 0,69
0,7 a 0,89
0,9 a 0,99
1

Significado
Correlacin negativa grande y perfecta
Correlacin negativa muy alta
Correlacin negativa alta
Correlacin negativa moderada
Correlacin negativa baja
Correlacin negativa muy baja
Correlacin nula
Correlacin positiva muy baja
Correlacin positiva baja
Correlacin positiva moderada
Correlacin positiva alta
Correlacin positiva muy alta
Correlacin positiva grande y perfecta

i) COEFICIENTE DE CORRELACIN DE KARL PEARSON


Llamando tambin coeficiente de correlacin producto-momento.
a) Para datos no agrupados se calcula aplicando la siguiente ecuacin:

=
( 2 )( 2 )
r = Coeficiente producto-momento de correlacin lineal
= ; =
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos das diferentes en una ciudad, determinar el tipo de
correlacin que existe entre ellas mediante el coeficiente de PEARSON.
X 18 17 15 16 14 12 9 15 16 14 16 18 X =180
Y 13 15 14 13 9 10 8 13 12 13 10 8 Y= 138

Solucin:
Se calcula la media aritmtica

=

Para X:
180
=
= 15
12
Para Y:
138
=
= 11,5
12

Correlacin y Regresin

166

Se llena la siguiente tabla:

18
17
15
16
14
12
9
15
16
14
16
18
180

=
3
2
0
1
-1
-3
-6
0
1
-1
1
3

13
15
14
13
9
10
8
13
12
13
10
8
138

=
1,5
3,5
2,5
1,5
-2,5
-1,5
-3,5
1,5
0,5
1,5
-1,5
-3,5

9
4
0
1
1
9
36
0
1
1
1
9
72

4,5
7
0
1,5
2,5
4,5
21
0
0,5
-1,5
-1,5
-10,5
28

2,25
12,25
6,25
2,25
6,25
2,25
12,25
2,25
0,25
2,25
2,25
12,25
63

Se aplica la frmula:
=


( 2 )( 2 )

28
(72)(63)

= 0,416

Existe una correlacin moderada

En Excel se calcula de la siguiente manera:


a) Se inserta la funcin COEF.DE.CORREL y pulsar en Aceptar.

Correlacin y Regresin

167

b) En el cuadro de argumentos de la funcin, en el recuadro de la Matriz 1 seleccionar las celdas de X, y


en el recuadro de la Matriz 2 seleccionar las celdas de Y.

c) Pulsar en Aceptar.

Correlacin y Regresin

168

En GeoGebra se calcula de la siguiente manera:


a) Escribir en Entrada Pearson.

b) Seleccione la opcin Pearson[ <Lista de Coordenadas x>, <Lista de Coordenadas y> ]

Correlacin y Regresin

169

c) Escribir los datos de X y los datos de Y. Para escribir las llaves utilizar el teclado virtual:
Pearson[ {18, 17, 15, 16, 14, 12, 9, 15, 16, 14, 16, 18}, {13, 15, 14, 13, 9, 10, 8, 13, 12, 13, 10, 8}]

d) Enter

Correlacin y Regresin

170

El diagrama de dispersin en Excel se realiza de la siguiente manera:


a) Seleccionar los datos e insertar diagrama de dispersin.

b) En diagrama dispersin, escoger el primero.

Correlacin y Regresin

171

c) Para que ver las coordenadas escoger el diseo N 7.

d) Borrar Serie 1, las lneas horizontales y verticales (haciendo clic y suprimir en cada objeto).

Correlacin y Regresin

172

e) En ttulo del grfico escribir Diagrama de dispersin.

f) Clic en el eje x, y luego clic derecho para dar formato al eje.

Correlacin y Regresin

173

g) Poner 2 en la casilla unidad mayor para ver los nmeros de 2 en 2 en el eje x.

h) Clic en Cerrar para culminar la elaboracin del diagrama de dispersin, aunque se le puede seguir
haciendo ms mejoras.

Correlacin y Regresin

174

Para realizar el diagrama de dispersin en el programa Graph se procede de la siguiente manera:


a) Clic en Funcin.

b) Clic en Insertar serie de puntos.

Correlacin y Regresin

175

c) Escribir los puntos, y en estilo de lnea, escoger sin lnea. En rtulos poner en ver coordenadas a la
derecha. Pulsar en Aceptar.

d) Para editar los ejes, hacer clic en Editar y luego en Ejes.

Correlacin y Regresin

176

e) Llenar las casillas del Eje X de acuerdo a los datos del ejercicio.

f) Llenar las casillas del Eje Y de acuerdo a los datos del ejercicio.

Correlacin y Regresin

177

g) Pulsar en Aceptar para dar por culminado la elaboracin del diagrama de dispersin, el cual se
presenta en la siguiente figura:

Correlacin y Regresin

178

b) Para datos agrupados, el coeficiente de Correlacin de Pearson se calcula aplicando la siguiente


frmula:
=

( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]

Donde:
= nmero de datos.
= frecuencia de celda.
= frecuencia de la variable X.
= frecuencia de la variable Y.
= valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda = 0, para que se hagan ms fciles los clculos.
= valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda = 0, para que se hagan ms fciles los clculos.
Ejemplo ilustrativo:
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones en una prueba de
conocimiento (Y) de 50 estudiantes:
N de
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

76
77
78
79
79
80
80
80
82
82
83
83
83
83
84
84
84
85
85
86
86
86
86
87
88

28
24
18
41
43
45
34
18
40
35
30
21
22
23
25
11
15
31
35
26
30
24
16
20
36

N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

1) Elaborar una tabla de dos variables


2) Calcular el coeficiente de correlacin
Correlacin y Regresin

88
88
88
88
89
89
90
90
90
91
92
92
93
93
93
94
96
97
98
99
100
101
101
102
102

40
31
35
26
30
24
18
11
15
38
34
31
33
35
24
40
35
36
40
33
51
54
55
41
45

179

Solucin:
1) En la tabla de frecuencias de dos variables, cada recuadro de esta tabla se llama una celda y
corresponde a un par de intervalos, y el nmero indicado en cada celda se llama frecuencia de celda.
Todos los totales indicados en la ltima fila y en la ltima columna se llaman totales marginales o
frecuencias marginales, y corresponden, respectivamente, a las frecuencias de intervalo de las
distribuciones de frecuencia separadas de la variable X y Y.

Para elaborar la tabla se recomienda:


- Agrupar las variables X y Y en un igual nmero de intervalos.
- Los intervalos de la variable X se ubican en la parte superior de manera horizontal (fila) y en orden
ascendente.
- Los intervalos de la variable Y se ubican en la parte izquierda de manera vertical (columna) y en orden
descendente.

Para elaborar los intervalos se procede a realizar los clculos respectivos:

En la variable X:
Calculando el Rango se obtiene:
= = 102 76 = 26
Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 50 = 6,6 = 7
Calculando el ancho se obtiene:

26
= =
= 3,93 = 4
6,6
En la variable Y:
Calculando el Rango se obtiene:
= = 55 11 = 44
Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 50 = 6,64 = 7
Calculando el ancho se obtiene:

44
= =
= 6,62 = 7
6,64
Nota: Para la variable X se tomar un ancho de intervalo igual a 4 y para la variable Y un ancho de
intervalo igual a 7. Debe quedar igual nmero de intervalos para cada variable, que en este ejemplo es
igual a 7.
Correlacin y Regresin

180

Calificaciones (Y)

Contando las frecuencias de celda para cada par de intervalos de las variables X y Y se obtiene la
siguiente tabla de frecuencias de dos variables:
Coeficientes Intelectuales (X)
76-79 80-83 84-87 88-91 92-95 96-99 100-103
2
1
2
2
1
1
1
2
2
1
3
3
3
1
1
4
3
1
2
4
2
2
1
3
2
5
9
10
11
6
4
5

53-59
46-52
39-45
32-38
25-31
18-24
11-17

2
1
9
12
10
11
5
50

Interpretacin:
- El nmero 2 es la frecuencia de la celda correspondiente al par de intervalos 76-79 en Coeficiente
Intelectual y 39-45 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 5 en la fila de es el total marginal o frecuencia marginal del intervalo 76-79 en Coeficiente
Intelectual.
- El nmero 2 en la columna de es el total marginal o frecuencia marginal del intervalo 53-59 en
Calificacin obtenida en la prueba de conocimiento.
- El nmero 50 es total de frecuencias marginales y representa al nmero total de estudiantes.
2) Realizando los clculos respectivos se obtiene la siguiente tabla:
Coeficientes Intelectuales (X)
76-79 80-83 84-87 88-91 92-95 96-99 100-103

53-59

Calificaciones (Y)

46-52
39-45
32-38
25-31
18-24
11-17

-3

-2

-1

3
2
18

1
6

2
-6

1
-4

2
1

-2

2
4

12

3
0

3
0

-1
1

-2

2
9

9
-18
36
14

4
3

5
-15
45
9

16

-3

0
-1

10
-10
10
17

0
11
0
0
0

6
6
6
-2

4
8
16
2

5
15
45
30

18

18

-1

12

10

-10

10

11

-22

44

30

-15

45

50
-14
158
70

-30

130

70

Nota:
Los nmeros de las esquinas de cada celda en la anterior tabla representan el producto
, as por ejemplo, para obtener el nmero el nmero -6 de los intervalos 76-79 en X y 39-45 en
Correlacin y Regresin

181

Y se obtiene multiplicando 2(-3)1 = -6. Para obtener el nmero 18 de los intervalos 100-103 en X y 5359 en Y se obtiene multiplicando 233 = 18
Los nmeros de la ltima columna (18, 6, -1, 0, 8, 30 y 9) se obtienen sumando los nmeros de las
esquinas en cada fila, as por ejemplo, para obtener el nmero -1 se suma (-6) + (-4) + 0 + 1 +2 + 6 = -1
Los nmeros de la ltima fila (9, 14, 17, 0, -2, 2 y 30) se obtienen sumando los nmeros de las esquinas
en cada columna, as por ejemplo, para obtener el nmero 9 se suma (-6) + 3 + 12 = 9.
Para obtener el nmero -30 de la antepenlmina columna se obtiene sumando los resultados de ,
es decir, representa la
Para obtener el nmero -14 de la antepenlmina fila se obtiene sumando los resultados de , es
decir, representa la
Para obtener el nmero 130 de la penltima columna se obtiene sumando los resultados de 2 , es
decir, representa 2
Para obtener el nmero 158 de la penltima fila se obtiene sumando los resultados de 2 , es decir,
representa 2
Para obtener ltimo nmero 70 de la ltima columna se obtiene sumando los resultados de la ltima
columna 18 +6 +(-1) +0 + 8 + 30 +9 = 70, es decir, representa
Para obtener ltimo nmero 70 de la ltima fila se obtiene sumando los resultados de la ltima fila
9
+ 14 + 17 + 0 +(-2) +2 + 30 = 70 , es decir, representa . Por lo tanto tiene que ser igual al
ltimo nmero de la ltima columna como comprobacin que los clculos de la tabla han sido correctos.
Observando los datos en la tabla anterior se reemplaza los valores en la ecuacin del Coeficiente de
Correlacin de Pearson para datos agrupados, obtenindose:

( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]
50 70 (14)(30)
[50 158 (14)2 ][50 130 (30)2 ]
3080
43142400

3500 420
[7900 196][6500 900]

3080
[7704][5600]

3080
= 0,469
6568,287448

Existe una correlacin positiva moderada

Correlacin y Regresin

182

TAREA DE INTERAPRENDIZAJE N 17
1) Elabore un organizador grfico de los tipos de correlacin.
2) Con los datos de la siguiente tabla sobre las temperaturas del da X y del da Y en determinadas horas
en una ciudad
X 9 10 12 14 16 18 20 22 24 26 28 30
Y 12 14 15 16 17 20 22 23 26 28 31 32
2.1) Calcule el coeficiente de correlacin de Pearson empleando la frmula y mediante Excel.
0,99
2.2) Elabore el diagrama de dispersin de manera manual.
2.3) Elabore el diagrama de dispersin empleando Excel.
2.4) Elabore el diagrama de dispersin empleando el programa Graph.
3) Cree y resuelva un ejercicio similar al anterior.
4) Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre las calificaciones obtenidos
en un curso de 50 estudiantes en la asignatura de Matemtica (X) y en la asignatura de Estadstica (Y),
determinar el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson.

1-2 3-4 5-6 7-8 9-10


9-10
7
8
15
7-8
6
6
5-6
3
4
7

3-4
5
5
1
11
1-2
7
4
11
12
9
4
17
8
50

Correlacin positiva muy alta de 0,91


5) Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre los pesos en kilogramos
en dos barrios diferentes en una ciudad, determinar el tipo de correlacin que existe entre ellas mediante
el coeficiente de Pearson.

40-49 50-59 60-69 70-79 80-89 90-99


90-99
3
3
4
10
80-89
8
2
2
4
16
70-79
5
10
8
1
24

60-69
8
1
2
5
2
18
50-59
3
10
6
2
21
40-49
4
6
1
11
15
17
22
22
15
9
100

Correlacin positiva moderada de 0,688


6) Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre las calificaciones obtenidos
en un curso de 100 estudiantes en la asignatura de Matemtica (X) y en la asignatura de Estadstica (Y),
Correlacin y Regresin

183

determinar el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson para datos
agrupados.
N de
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

40
41
42
43
44
45
45
45
45
48
49
50
50
56
56
56
56
56
57
57
57
57
57
57
57

60
50
55
59
40
42
49
60
62
66
69
50
52
54
56
59
59
40
45
47
48
49
80
70
72

94-102 3
2
1
0
-1
-2
40-48 -3

N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

X Y
57
58
60
61
62
63
64
64
65
65
66
66
66
66
67
68
68
68
69
69
69
69
70
70
70

73
78
79
60
61
62
63
64
65
66
67
69
50
52
55
56
57
59
40
45
47
49
90
99
80

N de
estudiante
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

X Y
71
72
72
72
73
74
74
74
75
76
76
77
77
78
78
78
78
79
79
79
80
81
82
82
83

86
88
89
70
71
72
73
74
75
76
77
78
79
60
67
65
68
69
50
59
90
94
96
99
80

N de
estudiante
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

40-48
-3

X Y
84
84
85
86
86
86
87
87
88
88
88
88
89
89
89
90
91
92
93
94
95
96
97
98
99

83
84
86
88
89
70
78
79
78
77
79
78
78
60
69
90
96
97
99
80
81
82
83
89
70

94-102
-2

-1

5
3
2
10

9
100
Correlacin positiva moderada de 0,62

7) Cree y resuelva un ejercicio similar al anterior.


8) Consulte en la biblioteca o en el internet un ejercicio resuelto sobre el coeficiente de correlacin de
Pearson para datos agrupados en intervalos.

Correlacin y Regresin

184

ii) COEFICIENTE DE CORRELACIN POR RANGOS DE SPEARMAN


Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es
decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera
y peso de los atletas.
Se calcula aplicando la siguiente ecuacin:
6 2
= 1
(2 1)
rs = Coeficiente de correlacin por rangos de Spearman
d = Diferencia entre los rangos (X menos Y)
n = Nmero de datos
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes ms elevados le asignamos
el rango 1 al siguiente el rango 2 y as sucesivamente. Si se repiten dos puntajes o ms se calculan las
medias aritmticas.
Ejemplo ilustrativo N 1: La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin
(X) y el rango o puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la
asignatura de Estadstica. Realizar el diagrama de dispersin y calcular el coeficiente de correlacin por
rangos de Spearman.
Estudiante
Dyanita
Elizabeth
Mario
Orlando
Mathas
Josu
Emily
Monserrath

1
2
3
4
5
6
7
8

3
4
1
5
6
2
8
7

Solucin:
El diagrama de dispersin hecho en Excel se muestra en la siguiente figura:

Correlacin y Regresin

185

Para calcular el coeficiente de correlacin por rangos de Spearman de se llena la siguiente tabla:
= 2 = ( )2
3
-2
4
4
-2
4
1
2
4
5
-1
1
6
-1
1
2
4
16
8
-1
1
7
1
1
2
= 32

Estudiante
Dyanita
1
Elizabeth
2
Mario
3
Orlando
4
Mathas
5
Josu
6
Emily
7
Monserrath 8

Se aplica la frmula:
= 1

6 2
6 32
192 504 192 312
= 1
=1
=
=
= 0,619
2
2
( 1)
8(8 1)
504
504
504

Por lo tanto existe una correlacin positiva moderada entre la primera y segunda evaluacin de los 8
estudiantes.

En Excel se calcula de la siguiente manera:


a) Se inserta la funcin COEF.DE.CORREL y pulsar en Aceptar.

Correlacin y Regresin

186

b) En el cuadro de argumentos de la funcin, en el recuadro de la Matriz 1 seleccionar las celdas de X, y


en el recuadro de la Matriz 2 seleccionar las celdas de Y.

c) Pulsar en Aceptar.

Correlacin y Regresin

187

En GeoGebra se calcula de la siguiente manera:


a) En Entrada escribir Spearman

b) Seleccionar la opcin Spearman[ <Lista de Nmeros>, <Lista de Nmeros> ]. Escribir los datos de X
y de Y
Spearman[{1, 2, 3, 4, 5, 6, 7, 8}, {3, 4, 1, 5, 6, 2, 8, 7}]

Correlacin y Regresin

188

c) Enter

Ejemplo ilustrativo N 2
La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las asignaturas de
Matemtica y Estadstica. Calcular el coeficiente de correlacin por rangos de Spearman y realizar el
diagrama de dispersin.
N Estudiante Matemtica Estadstica
1 Dyana
10
8
Elizabeth
2
9
6
3 Mario
8
10
4 Orlando
7
9
5 Mathas
7
8
6 Josu
6
7
7 Emily
6
6
8 Monserrath
4
9
Solucin:
Para calcular el coeficiente de correlacin por rangos de Spearman se procede a clasificar u ordenar los
datos en rangos (X para Matemtica y Y para Estadstica) tomando en cuenta las siguientes
observaciones:
En la asignatura de Matemtica se observa:
- Dyana tiene la ms alta calificacin, ocupando el primer puesto, por lo que su rango es 1
- Elizabeth ocupa el segundo puesto, por lo que su rango es 2
- Mario se encuentra ubicado en el tercer lugar, por lo que su rango es 3
- Orlando y Mathas ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmtica de 4 y
5 que da por resultado 4,5
- Josu y Emily ocupan el sexto y sptimo lugar, por lo que su rango es la media aritmtica de 6 y 7 que
da por resultado 6,5
- Monserrath se encuentra ubicada en el octavo lugar, por lo que su rango es 8
En la asignatura de Estadstica se observa:
- Mario tiene la ms alta calificacin, ocupando el primer puesto, por lo que su rango es 1
- Orlando y Monserrath ocupan el segundo y tercer puesto, por lo que su rango es la media aritmtica de
2 y 3 que da por resultado 2,5
- Dyana y Mathas ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmtica de 4 y 5
que da por resultado 4,5
- Josu se encuentra ubicado en el sexto lugar, por lo que su rango es 6
- Elizabeth y Emily ocupan el sptimo y octavo lugar, por lo que su rango es la media aritmtica de 7 y
8 que da por resultado 7,5
Correlacin y Regresin

189

Los rangos X y Y se presentan en la siguiente tabla:


N
1
2
3
4
5
6
7
8

Estudiante Matemtica Estadstica


Dyana
10
8
Elizabeth
9
6
Mario
8
10
Orlando
7
9
Mathas
7
8
Josu
6
7
Emily
6
6
Monserrath
4
9

1
2
3
4,5
4,5
6,5
6,5
8

4,5
7,5
1
2,5
4,5
6
7,5
2,5

Calculando , 2 2 se obtiene los siguientes resultados:


N
1
2
3
4
5
6
7
8

Estudiante Matemtica Estadstica


Dyana
10
8
Elizabeth
9
6
Mario
8
10
Orlando
7
9
Mathas
7
8
Josu
6
7
Emily
6
6
Monserrath
4
9

1
2
3
4,5
4,5
6,5
6,5
8

4,5
7,5
1
2,5
4,5
6
7,5
2,5

= 2
-3,5
-5,5
2
2
0
0,5
-1
5,5

= ( )2
12,25
30,25
4
4
0
0,25
1
30,25
d2 = 82

Aplicando la frmula se obtiene:


6 2
6 82
492 504 492
12
= 1
= 1
=1
=
=
= 0,024
2
2
( 1)
8(8 1)
504
504
504
Por lo tanto existe una correlacin positiva muy baja
El diagrama de dispersin hecho en Graph se muestra en la siguiente figura:

Correlacin y Regresin

190

TAREA DE INTERAPRENDIZAJE N 18
1) Consulte sobre la biografa de Spearman y realice un organizador grfico de la misma.
2) La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin (X) y el rango o puesto
obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la asignatura de Matemtica.
X 1 2 3 4 5 6 7 8
Y 4 5 6 8 3 2 1 7

2.1) Realice el diagrama de dispersin en forma manual, empleando Excel y Graph.


2.2) Calcule el coeficiente de correlacin por rangos de Spearman empleando la ecuacin.
-0,19
2.3) Calcule el coeficiente de correlacin empleando Excel.
-0,1905
2.4) Calcule el coeficiente de correlacin empleando GeoGebra.
-0,19
3) Cree y resuelva un ejercicio similar al anterior.
4) La siguiente tabla muestra las
Matemtica y Estadstica.
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

calificaciones de 18 estudiantes universitarios en las asignaturas de


Estudiante
Dyanita
Emily
Mario
Orlando
Mathas
Benjamn
Segundo
Bertha
Alberto
Victoria
Sandra
Ximena
Daro
Santiago
Jos
Toms
Paola
Kevin

Matemtica
10
9
8
8
7
6
6
6
5
4
4
3
3
2
1
0,7
0,5
0,5

Estadstica
3,5
1
6
8
7
10
4
3,5
1
3
9
5
2,5
0,7
2
1,5
2,5
0,5

4.1) Realice el diagrama de dispersin en forma manual, empleando Excel y Graph.


4.2) Calcule el coeficiente de correlacin por rangos de Spearman empleando la ecuacin.
0,49
4.3) Calcule el coeficiente de correlacin empleando Excel.
0,49
5) Consulte en la biblioteca o en el internet un ejercicio resuelto sobre el coeficiente por rangos de
Spearman. Presente el ejercicio resuelto empleando Excel y Graph

Correlacin y Regresin

191

D) COEFICIENTE DE DETERMINACIN
Revela qu porcentaje del cambio en Y se explica por un cambio en X. Se calcula elevando al cuadrado
el coeficiente de correlacin.

=
( 2 )( 2 )
=
=
r = Coeficiente de correlacin de Pearson
2 = Coeficiente de determinacin

La ecuacin del coeficiente producto-momento (Coeficiente de Pearson) =


( 2 )( 2 )

puede

escribirse en la forma equivalente:


= =

( )( )
[ 2 ( )2 ][ 2 ( )2 ]

De donde coeficiente de determinacin = 2 = (Coeficiente de Pearson )2


Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre las temperaturas, calcular el coeficiente de determinacin
empleando la ecuacin obtenida de la forma equivalente del coeficiente de Pearson.
X 18 17 15 16 14 12 9 15 16 14 16 18
Y 13 15 14 13 9 10 8 13 12 13 10 8
Solucin:
Se calcula el coeficiente de Pearson llenando la siguiente tabla:

18
13
234
324
17
15
255
289
15
14
210
225
16
13
208
256
14
9
126
196
12
10
120
144
9
8
72
81
15
13
195
225
16
12
192
256
14
13
182
196
16
10
160
256
18
8
144
324

= = = =

Correlacin y Regresin

169
225
196
169
81
100
64
169
144
169
100
64

192

Se aplica la ecuacin para calcular el coeficiente de Pearson.


=

( )( )
[ 2 ( )2 ][ 2 ( )2 ]
25176 24840
[33264 32400][19800 19044]

12 2098 180 138


[12 2772 (180)2 ][12 1650 (138)2 ]
336

[864][756]

336
653184

336
= 0,4157
808,198

Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinacin.


Coeficiente de determinacin = 2 = (0,4157)2 = 0,1728
Esto establece que 17,28% del cambio en Y se explica mediante un cambio en X.

Nota:
El 2 tiene significado slo para las relaciones lineales. Dos variables pueden tener 2 = 0 y sin embargo
estar relacionadas en sentido curvilneo. El valor de 2 no se interpreta como si la variable Y fuera
causado por un cambio de la variable X, ya que la correlacin no significa causa.

En Excel se calcula elevando al cuadrado el coeficiente de correlacin o insertando la funcin


=COEFICIENTE.R2 como muestra la siguiente figura:

Correlacin y Regresin

193

TAREA DE INTERAPRENDIZAJE N 19
1) La siguiente tabla muestra el dinero en miles de dlares gastado en publicidad por una empresa (X)
para vender sus productos, y el nmero en miles de clientes (Y) que compran los productos de la empresa.
X 15 17 14 13 18 20 17 18 16 14 20 18
Y 30 34 28 26 32 40 34 36 32 25 40 36

1.1) Realice el diagrama de dispersin en forma manual.


1.2) Realice el diagrama de dispersin empleando Excel.
1.3) Realice el diagrama de dispersin empleando el programa Graph.
1.4) Calcule el coeficiente de Pearson empleando las dos frmulas.
0,96015
1.5) Calcule el coeficiente de determinacin empleando las dos frmulas y mediante Excel.
0,9219
2) La siguiente tabla muestra el tiempo en minutos dedicado al estudio y la calificacin obtenida sobre
10.
X 140 150 130 120 170 190 180 160 200 110 100 90
Y 7
8
7
6
8
10 9
8
10 6
5
4
2.1) Realice el diagrama de dispersin en forma manual.
2.2) Realice el diagrama de dispersin empleando Excel.
2.3) Realice el diagrama de dispersin empleando el programa Graph.
2.4) Calcule el coeficiente de Pearson empleando las dos frmulas.
0,9817
2.5) Calcule el coeficiente de determinacin empleando las dos frmulas y mediante Excel.
0,9638
3) Cree y resuelva un ejercicio similar a los anteriores.
4) Consulte en la biblioteca o en el internet un ejercicio de aplicacin del coeficiente de determinacin.
Presente el ejercicio resuelto empleando Excel y Graph

Correlacin y Regresin

194

5.2) ANLISIS DE REGRESIN


Los primeros y ms importantes estudios al respecto se deben a los cientficos Francis Galton (18221911) y Karl Pearson (1857-1936). Fue Galton quien utiliz por primera vez el trmino regresin para
indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos regresaba a la media
general.
La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con el objeto de
estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la
regresin es un mtodo que se emplea para predecir el valor de una variable en funcin de valores dados
a la otra variable. En estadstica la palabra predecir no se utiliza en el sentido empleado por los astrlogos,
futurlogos y mentalistas, sino mas bien en un sentido lgico como es el de utilizar el conocimiento del
comportamiento de una variable para obtener informacin sobre otra variable. Por ejemplo, puede
predecirse el resultado que obtendr un estudiante en su examen final, basados en el conocimiento de las
calificaciones promedio de sus exmenes parciales, o predecir la preferencia de los estudiantes por
profesiones cientficas, conociendo los promedios de sus calificaciones en los estudios escolares.
En todos los casos de regresin existe una dependencia funcional entre las variables. En el caso de dos
variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de
regresin de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresin de la altura de los
rboles sobre su dimetro, lo cual significa que midiendo el dimetro (variable independiente) y
reemplazando su valor en una relacin definida segn la clase de rbol se obtiene la altura, y aun sin
necesidad de clculos aprecian la altura utilizando grficas de la funcin de dependencia, altura = funcin
del dimetro.

A) PRINCIPIO DE LOS MNIMOS CUADRADOS


i) LA RECTA DE LOS MNIMOS CUADRADOS
Se llama lnea de mejor ajuste y se define como la lnea que hace mnima la suma de los cuadrados de
las desviaciones respecto a ella de todos los puntos que corresponden a la informacin recogida.
La recta de los mnimos cuadrados que aproxima el conjunto de puntos
(1 , 1 ), (2 , 2 ), (3 , 3 ), ( , ) tomando en cuenta a Y como variable dependiente tiene por
ecuacin
= 0 + 1
A esta ecuacin suele llamarse recta de regresin de sobre , y se usa para estimar los valores de
para valores dados de
Si a la recta de regresin = 0 + 1 se le suma en ambos lados = (0 + 1 ) se obtiene =
0 + 1
Si a la recta de regresin = 0 + 1 se multiplica por a ambos lados y luego se suma
= (0 + 1 ) se obtiene = 0 + 1 2
Las constantes 0 1 quedan fijadas al resolver simultneamente las ecuaciones anteriormente
encontradas, es decir, al resolver el siguiente sistema de ecuaciones:
= 0 + 1
{
= 0 + 1 2
Que se llaman las ecuaciones normales para la recta de mnimos cuadrados.
Correlacin y Regresin

195

Las constantes
frmulas:

a0

a1 de las anteriores ecuaciones tambin se pueden calcular empleando las siguientes

0 =

2
2 ( )2

1 =


2 ( )2

Otra ecuacin para los mnimos cuadrados para = , = de la recta de regresin de Y


sobre X es:

= ( 2)
x
La recta de los mnimos cuadrados que aproxima el conjunto de puntos
(1 , 1 ), (2 , 2 ), (3 , 3 ), ( , ) tomando en cuenta a X como variable dependiente tiene por
ecuacin:
= 0 + 1
A esta ecuacin suele llamarse recta de regresin de X sobre Y, y se usa para estimar los valores de X
para valores dados de Y. Las constantes 0 y 1 quedan fijadas al resolver el siguiente sistema de
ecuaciones:
= 0 + 1
{
= 0 + 1 2
Las constantes 0 y 1 del sistema de ecuaciones anterior se pueden calcular empleando las siguientes
frmulas:
2
0 =
2 ( )2

1 =


2 ( )2

Otra ecuacin para los mnimos cuadrados para = , = es:


=(


)
y2

El punto de interseccin entre las rectas = 0 + 1 con = 0 + 1 se simboliza (, ) y se


llama centroide o centro de gravedad

Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre la altura en centmetros (X) y los pesos en kilogramos (Y) de
una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 152 157 162 167 173 178 182 188
Y 56 61 67 72 70 72 83 92

Correlacin y Regresin

196

1) Ajustar la recta de mnimos cuadrados para Y como variable dependiente resolviendo el sistema:
= 0 + 1
{
= 0 + 1 2
2) Ajustar la recta de mnimos cuadrados para Y como variable dependiente empleando las frmulas:
0 =

2
2 ( )2

1 =


2 ( )2

3) Ajustar la recta de mnimos cuadrados para Y como variable dependiente empleando la frmula:

= ( 2)
x
4) Ajustar la recta de mnimos cuadrados para X como variable dependiente resolviendo el sistema:
{

= 0 + 1
= 0 + 1 2

5) Calcular el punto centroide.


6) Elaborar el diagrama de dispersin. Y en el mismo diagrama graficar las dos rectas de mnimos
cuadrados obtenidas en los pasos anteriores.
7) Estimar el valor de Y cuando X = 200 en el diagrama de dispersin de Y como variable dependiente.
8,2
8) Estimar el valor de X cuando Y= 100 en el diagrama de dispersin X como variable dependiente.

Solucin:
Se llena la siguiente tabla:

152
157
162
167
173
178
182
188
= 1359

2
2
8512
23104
3136
9577
24649
3721
10854
26244
4489
12024
27889
5184
12110
29929
4900
12816
31684
5184
15106
33124
6889
17296
35344
8464
2
2
= 573 = 98295 = 231967 = 41967

56
61
67
72
70
72
83
92

1) Remplazando valores en el sistema se tiene:


{

= 0 + 1
573 = 0 8 + 1 1359
80 + 13591 = 573
2 98295 = 1359 + 231967 {1359 + 231967 = 98295
= 0 + 1
0
1
0
1
Correlacin y Regresin

197

Resolviendo el sistema por determinantes (regla de Cramer) se obtiene:


573
1359
0 |98295 231967| 573 231967 98295 1359 665814
0 =
=
=
=
= 75,191
8
1359

231967

1359

1359
8855
|
|
1359 231967
8
573
1 |1359 98295| 8 98295 1359 573 7653
1 =
=
=
=
= 0,864

8855
8855
8855
Para calcular los valores de 1 0 en Excel se calcula de la siguiente manera:
a) Escribir los datos. Seleccionar las celdas donde aparecer la respuesta

b) Insertar la funcin ESTIMACION.LINEAL

Correlacin y Regresin

198

c) En la ventana Argumentos de Funcin, en la casilla Conocido_y seleccione los datos de Y, es decir,


B2:B9 y en la casilla Conocido_x seleccione los datos de X, es decir, A2:A9

d) Presione CTRL+SHIFT+ENTER

Los clculos en GeoGebra se muestran en la siguiente figura:

Correlacin y Regresin

199

Remplazando valores en la ecuacin respectiva se obtiene:


= 0 + 1 = 75,191 + 0,864
Interpretacin:
- El valor 1 = 0,864 indica que la recta tiene una pendiente positiva aumentando a razn de 0,864
- El valor de 0 = 75,191 indica el punto en donde la recta interseca al eje Y cuanto X = 0
2) Con los datos de la tabla anterior se substituye valores en las siguientes ecuaciones:
2 573 231967 1359 98295 665814
0 =
=
=
75,191
2 ( )2
8 231967 (1359)2
8855
1 =

8 98295 1359 573 7653


=
=
= 0,864
2 ( )2
8 231967 (1359)2
8855

Remplazando valores en la ecuacin respectiva se obtiene:


= 0 + 1 = 75,191 + 0,864
3) Se calcula las medias aritmticas de X y Y para llenar la siguiente tabla:
=

1359
573
= 169,875 ; =
= 71,625
8
8

152
157
162
167
173
178
182
188

56
61
67
72
70
72
83
92

-17,88
-12,88
-7,875
-2,875
3,125
8,125
12,125
18,125

-15,625
-10,625
-4,625
0,375
-1,625
0,375
11,375
20,375

279,297
136,797
36,422
-1,078
-5,078
3,047
137,922
369,297

319,516
165,766
62,016
8,266
9,766
66,016
147,016
328,516

244,141
112,891
21,391
0,141
2,641
0,141
129,391
415,141

= 1359

= 573

= 956,625 2 = 1106,875 2 = 925,875

Remplazando valores en la frmula respectiva se obtiene:



956,625
956,625
( )
= ( 2) =
=
x
1106,875
1106,875
956,625
( 169,875) 1106,875( 71,625) = 956,625( 169,875)
71,625 =
1106,875
1106,875 79280,20838 = 956,625 162510,4984
1106,875 = 956,625 162510,4984 + 79280,20838
Correlacin y Regresin

200

1106,875 = 956,625 83230,29


=

956,625 83230,29
956,625 83230,29
=

= 0,864 75,19
1106,875
1106,875 1106,875

= 75,19 + 0,864

4) Remplazando valores en sistema respectivo se obtiene:


{

= 0 + 1
1359 = 0 8 + 1 573
80 + 5731 = 1359
2 98295 = 573 + 41967 573 + 41967 = 98295
= 0 + 1
0
1
0
1

Resolviendo el sistema se obtiene:


0 = 95,871; 1 = 1,033
Los clculos en Excel se muestran en la siguiente figura:

Remplazando valores en la ecuacin de la recta de mnimos cuadrados se obtiene:


= 0 + 1 = 95,871 + 1,033
Los clculos en GeoGebra insertando Ajuste Lineal se muestran en la siguiente figura:

Interpretacin:
- El valor 1 = 1,033 indica que la recta tiene una pendiente positiva aumentando a razn de 1,033
- El valor de 0 = 95,871 indica el punto en donde la recta interseca al eje X cuanto Y = 0
Correlacin y Regresin

201

5) Para calcular el centroide (, ) se resuelve el sistema formado por las dos rectas de los mnimos
cuadrados en donde X es y Y es .
= 75,191 + 0,864
{
= 95,871 + 1,033
Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092
6) En Excel, insertando grfico de dispersin se obtiene la siguiente figura:

Empleando el programa Graph se obtiene la siguiente figura:

7) Remplazando X = 200 en la ecuacin solicitada se obtiene:


= 75,191 + 0,864 = 75,191 + 0,864 200 = 75,191 + 172,8 = 97,609
8) Remplazando Y = 100 en la ecuacin solicitada se obtiene:
= 95,871 + 1,033 = = 95,871 + 1,033 100 = = 95,871 + 103,3 = 199,171
Correlacin y Regresin

202

TAREA DE INTERAPRENDIZAJE N 20
1) Consulte sobre la biografa de Francis Galton y de Cramer, y realice un organizador grfico de cada
una.
2) Dada la siguiente tabla sobre la altura en centmetros (X) y los pesos en kilogramos (Y) de una muestra
de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 150 155 160 165 170 175 180 185
Y 55 60 63 67 70 74 79 85
2.1) Ajuste la recta de mnimos cuadrados para Y como variable dependiente resolviendo el siguiente
sistema y empleando Excel y GeoGebra.
= 0 + 1
{
= 0 + 1 2
= 66,869 + 0,812
2.2) Ajuste la recta de mnimos cuadrados para Y como variable dependiente empleando las frmulas
2

0 =

=
1
2 ( )2
2 ( )2
0 = 66,869 ;

1 = 0,812

2.3) Ajuste la recta de mnimos cuadrados para Y como variable dependiente empleando la frmula

= ( 2)
x
= 66,869 + 0,812
2.4) Ajuste la recta de mnimos cuadrados para X como variable dependiente resolviendo el siguiente
sistema y empleando Excel y GeoGebra.
{

= 0 + 1
= 0 + 1 2
= 83,18 + 1,22

2.5) Ajuste la recta de mnimos cuadrados para X como variable dependiente empleando las frmulas
2

0 =

=
1
2 ( )2
2 ( )2
0 = 83.18 ;

1 = 1,22

2.6) Ajuste la recta de mnimos cuadrados para X como variable dependiente empleando la frmula

= ( 2)
y
= 83,18 + 1,22
2.7) Calcule el punto centroide.
= 170,9 ; = 71,9
2.8) Calcule el coeficiente de determinacin.
0,99
Correlacin y Regresin

203

2.9) Elabore el diagrama de dispersin. Y en el mismo diagrama graficar las dos rectas de mnimos
cuadrados obtenidas en los pasos anteriores. Elabore de manera manual, empleando Excel y el programa
Graph.
2.10) Estime el valor de Y cuando X = 173 en el diagrama de dispersin de Y como variable dependiente.
73,6
2.11) Estime el valor de X cuando Y = 73 en el diagrama de dispersin de Y como variable dependiente.
172,2
3) Cree y resuelva un ejercicio similar al anterior con datos obtenidos de 10 amigas suyas.
4) Consulte en la biblioteca o en el internet sobre un ejercicio de aplicacin de la rectas de los mnimos
cuadrados. Presente ejercicio resuelto en forma manual y empleando Excel y Graph.

ii) LA PARBOLA DE LOS MNIMOS CUADRADOS


La
parbola
de
mnimos
cuadrados
que
aproxima
el
conjunto
de
puntos
(1 , 1 ), (2 , 2 ), (3 , 3 ), ( , ) tiene ecuacin dada por = 0 + 1 + 2 2 , donde las
constantes 0 , 1 y 2 se determinan al resolver simultneamente el sistema de ecuaciones que se forma
al multiplicar la ecuacin = 0 + 1 + 2 2 por 1, , sucesivamente, y sumando despus.
= 0 + 1 + 2 2
{ = 0 + 1 2 + 2 3
2 = 0 2 + 1 3 + 2 4
Ejemplo ilustrativo
La siguiente tabla muestra la poblacin de un pas en los aos 1960-2010 en intervalos de 5 aos.
Ao
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Poblacin (millones) 4,52 5,18 6,25 7,42 8,16 9,12 10,92 11,62 12,68 13,12 13,97
1) Ajustar una parbola de mnimos cuadrados de la forma = 0 + 1 + 2 2
2) Calcular los valores de tendencia para los aos dados.
3) Estimar la poblacin para los aos 2015 y 2020.
4) Calcular el coeficiente de determinacin.
5) Elaborar un diagrama de dispersin, y en el mismo diagrama graficar la parbola de los mnimos
cuadrados.
Nota: Se recomienda codificar o cambiar la numeracin de los aos, tratando que X = 0 est ubicado en
lo posible en el centro.

Correlacin y Regresin

204

Solucin:
1) Para ajustar una parbola de mnimos cuadrados se llena la siguiente tabla:
Ao

1960
1965
1970
1975
1980
1985
1990
1995
2000
2005
2010

-5
-4
-3
-2
-1
0
1
2
3
4
5
0

4,52
5,18
6,25
7,42
8,16
9,12
10,92
11,62
12,68
13,12
13,97
102,96

25
16
9
4
1
0
1
4
9
16
25
110

-125
-64
-27
-8
-1
0
1
8
27
64
125
0

625
256
81
16
1
0
1
16
81
256
625
1958

-22,6
-20,72
-18,75
-14,84
-8,16
0
10,92
23,24
38,04
52,48
69,85
109,46

113
82,88
56,25
29,68
8,16
0
10,92
46,48
114,12
209,92
349,25
1020,66

Se remplaza valores en el sistema y se obtiene:


= 0 + 1 + 2 2
{ = 0 + 1 2 + 2 3
2 = 0 2 + 1 3 + 2 4
102,96 = a0 11 + a1 0 + a2 110
11a0 + 0a1 + 110a2 = 102,96
{ 109,46 = a0 0 + a1 110 + a2 0 { 0a0 + 110a1 + 0a2 = 109,46
1020,66 = a0 110 + a1 0 + a2 1958
110a0 + 0a1 + 1958a2 = 1020,66
Resolviendo el sistema empleando determinantes (regla de Cramer) se obtiene:

a0 =

22175524,8 + 0 + 0 12349986 0 0 9825538,8


=
= 9,464
2369180 + 0 + 0 1331000 0 0
1038180

Correlacin y Regresin

205

1 =

23577549,48 + 0 + 0 1324466 0 0 2357549,48


=
= 0,995
1038180
1038180

2 =

1234998,6 + 0 + 0 1245816 0 0 10817,4


=
= 0,01
1038180
1038180

El sistema resuelto en Excel se muestra en la siguiente figura:

Correlacin y Regresin

206

Para resolver el sistema en GeoGebra se sigue los siguientes pasos:


a) Clic en Vista

b) Clic en CAS-Clculo Simblico. Escribir soluciones en la casilla 1

c) Escoger la opcin Soluciones[ <Lista de Ecuaciones>, <Lista de Variables>]

Correlacin y Regresin

207

d) Escribir la lista de ecuaciones y la lista de variables. Enter


Soluciones[ {11x+0y+110z=102.96,0x+110y+0z=109.46,110x+0y+1958z=1020.66}, {x,y,z} ]

67669
5473
149
= 9,464 ;
= 0,995 ;
= 0,01
7150
5500
14300
Remplazando los valores encontrados se obtiene la ecuacin de la parbola de mnimos cuadrados:
= 0 + 1 + 2 2 = 9,464 + 0,995 0,01 2
2) Los valores de tendencia se obtienen al remplazar los valores de X en la ecuacin de la parbola de
mnimos cuadrados, los cuales se presenta en la siguiente tabla:
Ao

1960
1965
1970
1975
1980
1985
1990
1995
2000
2005
2010

-5
-4
-3
-2
-1
0
1
2
3
4
5

4,52
5,18
6,25
7,42
8,16
9,12
10,92
11,62
12,68
13,12
13,97

Valores de tendencia
= 9,464 + 0,995 0,01 2
4,24
5,32
6,39
7,43
8,46
9,46
10,45
11,41
12,36
13,28
14,19

3) Para estimar la poblacin de los aos 2015 y 2020 se transforma estos aos a X siguiendo la secuencia
de la tabla anterior, siendo X = 6 para el ao 2015 y X= 7 para el 2020
Entonces para el 2015 se tiene:
Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(6) - 0,01(6)2 = 9,464 + 5,97-0,36 =15,074
Para el 2020 se tiene:
Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(7) - 0,01(7)2 = 9,464 + 6,965-0,49 =15,939

Correlacin y Regresin

208

4) Se llena la siguiente tabla y se aplica la ecuacin para calcular el coeficiente de Pearson


Ao
1960
1965
1970
1975
1980
1985
1990
1995
2000
2005
2010

2
-5 4,52
25
-4 5,18
16
-3 6,25
9
-2 7,42
4
-1 8,16
1
0
9,12
0
1 10,92
1
2 11,62
4
3 12,68
9
4 13,12 16
5 13,97 25
0 102,96 110

( )( )

[ 2 ( )2 ][ 2 ( )2 ]
= 0,996

-22,6
-20,72
-18,75
-14,84
-8,16
0
10,92
23,24
38,04
52,48
69,85
109,46

2
20,430
26,832
39,063
55,056
66,586
83,174
119,246
135,024
160,782
172,134
195,161
1073,490

11 109,46 0 102,96
[11 110 (0)2 ][11 1073,490 (102,96)2 ]

Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinacin.


Coeficiente de determinacin = 2 = (0,996)2 = 0,992
El coeficiente de determinacin calculado en Excel se muestra en la siguiente figura:

Correlacin y Regresin

209

5) El diagrama de dispersin y la parbola de los mnimos cuadrados


Mediante Graph se muestra en la siguiente figura:

Mediante GeoGebra se muestra en la siguiente figura:

Correlacin y Regresin

210

TAREA DE INTERAPRENDIZAJE N 21
1) La siguiente tabla muestra la poblacin aproximada de la Provincia de Imbabura en los aos
2010 en intervalos de 5 aos.

1960-

Ao
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Poblacin (miles) 123 140 170 201 221 247 296 315 344 356 379
1.1) Ajuste una parbola de mnimos cuadrados de la forma = 0 + 1 + 2 2 manera manual,
empleando Excel y GeoGebra.
Y = 256,464 + 26,991X - 0,265X2
1.2) Calcule los valores de tendencia para los aos dados de manera manual y empleando Excel.
Ao
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Valor de tendencia 114,88 144,26 173,11 201,42 229,21 256,46 283,19 309,39 335,05 360,19 384,79
1.3) Estime la poblacin para los aos 2015 y 2020
Ao 2015 = 408,87 miles de habitantes
Ao 2020 = 432,42 miles de habitantes
1.4) Calcule el coeficiente de determinacin de manera manual y empleando Excel.
0,992
1.5) Elabore un diagrama de dispersin, y en el mismo diagrama graficar la parbola de los mnimos
cuadrados de manera manual, empleando Graph y GeoGebra.

2) Cree y resuelva un ejercicio de aplicacin de la parbola de los mnimos cuadrados con datos de la
poblacin del Ecuador o de cualquier otro pas de manera manual, empleando Excel y Graph.
3) Consulte en la biblioteca o en el internet un ejercicio de aplicacin de la Parbola de los mnimos
cuadrados. Presente el ejercicio resuelto con GeoGebra y Graph.

iii) REGRESIN EXPONENCIAL


Cuando la curva de regresin de y sobre x es exponencial, es decir para cualquier x considerada, la media
de la distribucin est dada por la siguiente ecuacin predictora:
=
Tomando logaritmos en ambos miembros:
= +
Y se puede estimar ahora log Y y log , y de ah obtener
cuadrados.
Donde las constantes

y , aplicando los mtodos de los mnimos

quedan fijadas al resolver simultneamente las ecuaciones:


{

= + X
X logY = log X + log 2
Correlacin y Regresin

211

Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas
por cierto fabricante que an pueden usarse despus de recorrer cierto nmero de millas:
Miles de Millas recorridas (X)
Porcentaje til (Y)

1
99

2
95

5
85

15
55

25
30

30
24

35
20

40
15

1) Elaborar el diagrama de dispersin.


2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.
3) Calcular la ecuacin predictora.
4) Graficar la ecuacin predictora.
5) Estimar qu porcentaje de las llantas radiales del fabricante durarn 50000 millas.
Solucin:
1) Elaborando el diagrama de dispersin empleando Excel se obtiene la siguiente figura:

Empleando el programa Graph se obtiene la siguiente figura:

Correlacin y Regresin

212

2) Se llena la siguiente tabla:

99

2
5
15
25
30
35
40
= 153

95
85
55
30
24
20
15

1,996
1,978
1,929
1,740
1,477
1,380
1,301
1,176
= 12,97759

2

1
1,996
4
3,955
25
9,647
225
26,105
625
36,928
900
41,406
1225
45,536
1600
47,044
2
= 4605 = 212,61769

Resolviendo empleando Excel se muestra en la siguiente figura:

Remplazando valores en el sistema se obtiene:


{

= + X
X logY = log X + log 2

12,97759 = log 8 + log 153


8log + 153log = 12,97759
{
212,61769 = log 153 + log 4605
153log + 4605log = 212,61769

Al resolver el sistema se obtiene:


12,97759
153
|212,61769 4605| 59761,80195 32530,50657 27231,295389
=
=
=
=
= 2,027495747
8
153

36840 23409
13431
|
|
153 4605

8
12,97759
|153 212,61769| 1700,944152 1985,57127 284,627118
=
=
=
=
= 0,02119180389

13431
13431
13431

Correlacin y Regresin

213

Remplazando valores se obtiene:


= +
= 2,027496 0,02119
Aplicando el antilogaritmo se obtiene:
= anti log 2,027495747 = 106,536
= anti log(0,02119180389) = 0,952
Resolviendo empleando Excel se muestra en la siguiente figura:

3) Remplazando en la ecuacin predictora se obtiene:


=
= 106,536 0,952

Correlacin y Regresin

214

Realizando el diagrama de dispersin y los clculos de la ecuacin predictora de GeoGebra insertando


AjusteBaseExp[ <Lista de Puntos> ] se obtiene:

4) Graficando la ecuacin predictora empleando Excel se obtiene la siguiente figura:

5) La estimacin del porcentaje de llantas radiales que durarn 50000 millas se obtiene remplazando en
la ecuacin predictora el valor de X = 50
= 106,536 0,952
= 106,536 0,95250 = 9,106
Entonces el porcentaje sera de 9,106%
215
Correlacin y Regresin

TAREA DE INTERAPRENDIZAJE N 22
1) Elabore un organizador grfico sobre la regresin exponencial.
2) Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante
que an pueden usarse despus de recorrer cierto nmero de millas:
Miles de Millas recorridas (X)
Porcentaje til (Y)

1
98

2
92

5
80

10
64

20
36

30
32

40
17

50
11

2.1) Ajuste una curva exponencial aplicando el mtodo de mnimos cuadrados. Resolver manualmente
empleando Excel. Realizar los clculos empleando la mayor cantidad de decimales.
= 1,9988 0,0189
2.2) Calcule la ecuacin predictora en forma manual y con GeoGebra.
= 99,72 0,9574
2.3) Grafique la ecuacin predictora de manera manual y empleando Excel.
2.4) Estime qu porcentaje de las llantas radiales del fabricante durarn 35000 millas.
21,7%
3) Cree y resuelva un ejercicio de aplicacin de la regresin exponencial de manera manual, empleando
Excel y GeoGebra.

iv) REGRESIN POTENCIAL


La regresin potencial tiene por ecuacin predictora:
=
Y la regresin recproca es:
=

1
+

Para el primer caso los valores siguen una ley potencial. Si la ecuacin predictora est dada por:
tomando logaritmos en ambos miembros, queda:

= +

Donde las constantes

quedan fijadas al resolver simultneamente las ecuaciones:


{

= + logX
logX logY = log logX + ()2

Para el segundo caso, si la ecuacin predictora est dada por


misma expresin se puede escribir

1
+

, entonces invirtiendo, la

, o sea:
1
1
1
=
=+
+

Correlacin y Regresin

216

Donde las constantes

quedan fijadas al resolver simultneamente las ecuaciones:


1
= + X

{
1
X = X + 2

Ejemplos ilustrativo N 1
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable
independiente) e Y es la presin de una masa dada de gas (variable resultante).
X 1 2 3 4
5
6
7
Y 7 30 90 170 290 450 650
1.1) Elaborar el diagrama de dispersin.
1.2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.
1.3) Calcular la ecuacin predictora.
1.4) Graficar la ecuacin predictora.
1.5) Estimar la presin de la masa de gas de volumen 9.

Solucin:
1.1) El diagrama de dispersin elaborado en Excel se presenta en la siguiente figura:

Correlacin y Regresin

217

1.2) Para ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados se llena la siguiente
tabla:

1
2
3
4
5
6
7
= 28

7
30
90
170
290
450
650


0,0000
0,8451
0,0000
0,3010
1,4771
0,4447
0,4771
1,9542
0,9324
0,6021
2,2304
1,3429
0,6990
2,4624
1,7211
0,7782
2,6532
2,0646
0,8451
2,8129
2,3772
= 3,7024 = 14,4354 = 8,8829

()2
0,0000
0,0906
0,2276
0,3625
0,4886
0,6055
0,7142
()2 = 2,4890

Remplazando valores en el sistema de ecuaciones se obtiene:


{

= + logX
logX logY = log logX + ()2

14,4354 = 7 + 3,7024
7 + 3,7024 = 14,4354
{
8,8829 = 3,7024 + 2,4890
3,7024 + 2,4890 = 8,8829

Al resolver el sistema se obtiene: log = 0,819; = 2,351

Remplazando valores en la ecuacin predictora expresada en logaritmos se tiene:


= +
= 0,819 + 2,351
1.3) Para calcular la ecuacin predictora, primero se calcula el valor de de la siguiente manera:
= 0,819 = 0,819 = 6,592
Remplazando en la ecuacin predictora se obtiene:
=
= 6,592 2,351
1.4) Graficando la ecuacin predictora mediante Excel se muestra en la siguiente figura:

Correlacin y Regresin

218

Realizando el diagrama de dispersin y calculando la ecuacin predictora en GeoGebra

1.5) Para estimar la presin de la masa de gas de volumen 9 se reemplaza el valor X = 9 en la ecuacin
predictora
= 6,592 2,351
= 6,592 92,351 = 1154,63
Ejemplo ilustrativo N 2
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable independiente
e Y la variable resultante.
X 1
2 3
4
5
6
7
Y 1,4 1 0,9 0,7 0,6 0,55 0,5
2.1) Elaborar el diagrama de dispersin.

2.2) Calcular las constantes y , aplicando el mtodo de mnimos cuadrados.


2.3) Calcular la ecuacin predictora.
2.4) Graficar la ecuacin predictora.
2.5) Estimar el valor de Y para X = 9

Correlacin y Regresin

219

Solucin:
2.1) El diagrama de dispersin elaborado en Graph se muestra en la siguiente figura:

2.2) Para calcular las constantes


tabla:

y , aplicando el mtodo de mnimos cuadrados se llena la siguiente

(1/)

1/
2
1
1,4
0,7143
0,7143
1
2
1
1,0000
2,0000
4
3
0,9
1,1111
3,3333
9
4
0,7
1,4286
5,7143
16
5
0,6
1,6667
8,3333
25
6
0,55
1,8182
10,9091
36
7
0,5
2,0000
14,0000
49
2
(1/) = 9,7388 (1/) = 45,0043 = 140
= 28
Remplazando valores en el siguiente sistema se obtiene:
1
= + X

{
1
X = X + 2

9,7388 = 7 + 28
7 + 28 = 9,7388
{
45,0043 = 28 + 140
28 + 140 = 45,0043

Al resolver el sistema se obtiene:


= 0,5271; = 0,2160
2.3) Para calcular la ecuacin predictora se reemplaza los valores encontrados de y , y se obtiene:
1
1
=
=
+
0,5271 + 0,2160

Correlacin y Regresin

220

2.4) La grfica la ecuacin predictora elaborada en Excel se muestra en la siguiente figura:

La grfica la ecuacin predictora elaborada en Graph se muestra en la siguiente figura:

2.5) Para estimar el valor de Y para X = 9 se reemplaza el valor de X en la ecuacin predictora.


1
=
0,5271 + 0,2160
1
=
= 0,405
0,5271 + 0,2160 9

Correlacin y Regresin

221

TAREA DE INTERAPRENDIZAJE N 23
1) Elabore un organizador grfico sobre la regresin potencial.
2) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable
independiente) e Y es la presin de una masa dada de gas (variable resultante).
X 1 2 3 4
5
6
7
Y 5 35 90 180 300 460 670
2.1) Elabore el diagrama de dispersin de manera manual, empleando Excel y Graph
2.2) Ajuste una curva exponencial aplicando el mtodo de mnimos cuadrados empleando por lo menos
4 decimales para los clculos.
= 0,7437 + 2,4883
2.3) Calcule la ecuacin predictora en forma manual y con GeoGebra.
= 5,5424 2,4883
2.4) Grafique la ecuacin predictora de manera manual y empleando Excel.
2.5) Estime la presin de la masa de gas de volumen 8.
979,17
3) Cree y resuelva un ejercicio similar al anterior.
4) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable
independiente e Y la variable resultante.
X 1
2 3
4
5
6
7
Y 1,5 1 0,8 0,9 0,5 0,4 0,3
4.1) Elabore el diagrama de dispersin de manera manual, empleando Excel y Graph.
4.2) Calcule las constantes , aplicando el mtodo de mnimos cuadrados de manera manual y
empleando Excel.
= 0,0159; = 0,4196
4.3) Calcule la ecuacin predictora.
1
=
0,0159 + 0,4196
4.4) Grafique la ecuacin predictora de manera manual, empleando Excel y Graph.
4.5) Estime el valor de Y para X = 8
0,2965

5) Investigue en la biblioteca o en el internet un ejercicio de aplicacin de la regresin potencial. Presente


el ejercicio resuelto en forma manual, empleando Excel, GeoGebra y Graph.

Correlacin y Regresin

222

B) ERROR ESTNDAR DE ESTIMACIN


Es el grado de dispersin de los datos con respecto a la recta de regresin = 0 + 1
El error estndar de estimacin se calcula con la frmula:
( )2
=
2
Donde:
= cada valor de Y
= valor estimado de Y a partir de la recta de regresin
N = nmero de datos
Nota: Como se puede observar, el error estndar de estimacin es un clculo de la desviacin estndar
de la muestra de datos con respecto a la recta de regresin, en la que sustituye a la media de la
muestra, y con n-2 en el denominador en vez de n-1. La razn de que sea n-2, es debido a que se pierde
2 grados de libertad al calcular las 2 constantes, 0 y 1 en la recta de regresin.
Otras ecuaciones para calcular el error estndar de estimacin son:
=

2 0 1
2

2 1
=
2

Donde:
0 = ordenada en el origen (punto de interseccin de la recta con el eje y)
1 = pendiente de la recta (tangente del ngulo de inclinacin de la recta)
=
=
Ejemplo ilustrativo
Calcular error estndar de estimacin empleando las 3 frmulas dadas, utilizando los datos de la tabla
del ejemplo para ajustar la recta de mnimos cuadrados para Y como variable dependiente.
X 152 157 162 167 173 178 182 188
Y 56 61 67 72 70 72 83 92
Solucin:
Para comenzar a resolver este ejemplo recordemos que ya se obtuvo los valores respectivos al resolver
el ejemplo para ajustar la recta de mnimos cuadrados, los cuales fueron:
= 1359; = 573; = 98295; 2 = 231967; 2 = 41967; = 956,625
2 = 1106,875; 2 = 925,875; 0 = 75,191; 1 = 0,864; = 75,191 + 0,864
1) Para emplear la primera frmula se llena la siguiente tabla:

152
157
162
167
173
178
182
188

56
61
67
72
70
72
83
92

= 75,191 + 0,86
-75,191+0,86(152)
-75,191+0,86(157)
-75,191+0,86(162)
-75,191+0,86(167)
-75,191+0,86(173)
-75,191+0,86(178)
-75,191+0,86(182)
-75,191+0,86(188)

Correlacin y Regresin

( )2

55,529
0,222
59,829
1,371
64,129
8,243
68,429
12,752
73,589
12,881
77,889
34,680
81,329
2,792
86,489
30,371
103,312
223

Se remplaza valores en la primera frmula se obtiene:


( )2
103,312

=
=
= 3,842
2
82
Realizando los clculos de los componentes de la frmula empleando Excel se obtiene un valor ms
exacto, ya que Excel utiliza una mayor cantidad de decimales al realizar los clculos. Estos clculos se
muestran en la siguiente figura:

2) Remplazando valores en la segunda frmula se obtiene:


2 0 1
=
2
41967 (75,191)(573) 0,864(98295)
41967 + 43084,443 84926,88
=
=
= 4,556
82
6

Correlacin y Regresin

224

Los clculos de los componentes de la frmula empleando Excel se muestran en la siguiente figura:

3) Remplazando valores en la tercera frmula se obtiene:


2 1
925,875 0,864(956,625)
99,351

=
=
=
= 4,069
2
82
6
Los clculos de los componentes de la frmula empleando Excel se muestran en la siguiente figura:

Correlacin y Regresin

225

Empleando exclusivamente Excel para calcular el error estndar de estimacin se procede de la


siguiente manera:
Se inserta la funcin ERROR.TIPICO.XY. Se selecciona las celdas respectivas. Pulsar en Aceptar.

Interpretacin: El valor de = 4,064, significa que los puntos estn dispersos a una distancia de 4,064
de la recta de regresin.
TAREA DE INTERAPRENDIZAJE N 24
Dada la siguiente tabla sobre la altura en centmetros (X) y los pesos en kilogramos (Y) de una muestra
de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 150 155 160 165 170 175 180 185
Y 56 61 64 68 72 75 80 90
1) Calcule el coeficiente de determinacin de manera manual y empleando Excel.
0,97
2) Calcule el error estndar de estimacin empleando la primera frmula. Utilice 5 decimales para los
clculos. Los elementos de la frmula calcule empleando Excel, tal como se indic en el ejemplo.
2,1
3) Calcule el error estndar de estimacin empleando la segunda frmula. Utilice 5 decimales para los
clculos. Los elementos de la frmula calcule empleando Excel, tal como se indic en el ejemplo.
2,1
4) Calcule el error estndar de estimacin empleando la tercera frmula. Utilice 5 decimales para los
clculos. Los elementos de la frmula calcule empleando Excel, tal como se indic en el ejemplo.
2,1
5) Calcule el error estndar de estimacin empleando exclusivamente Excel.
2,1
6) Elabore el diagrama de dispersin, y en el mismo diagrama graficar la recta de regresin. Realice de
manera manual, empleando Excel y Graph.

Correlacin y Regresin

226

CAPTULO VI

SERIES DE TIEMPO

RESULTADOS DE APRENDIZAJE:

Analiza e interpreta la aplicacin de los datos de series de tiempo para hacer pronsticos.
Emplea algoritmos matemticos para resolver ejercicios de aplicacin sobre series de tiempo de
manera manual y empleando Excel.
Elabora diagramas de dispersin y lneas de tendencias de manera manual, empleando Excel, Graph
y GeoGebra
Crea y resuelve correctamente ejercicios de aplicacin sobre series de tiempo de manera manual,
empleando Excel, Graph y GeoGebra

CONTENIDOS:
Definicin
Movimientos o Componentes
Modelos de Series de Tiempo
Mtodos de Suavizamiento y Pronstico
Anlisis de Tendencia
Anlisis de Movimientos Estacionales
Anlisis de Movimientos Cclicos e Irregulares

227
Series Cronolgicas

6.1) DEFINICIN
Las series de tiempo llamadas tambin series cronolgicas o series histricas son un conjunto de datos
numricos que se obtienen en perodos regulares y especficos a travs del tiempo, los tiempos pueden
ser en aos, meses, semanas, das u otra unidad adecuada al problema que se est trabajando. Ejemplos
de series de tiempo son: Ventas mensuales de un producto en una empresa, produccin total anual de
petrleo en Ecuador durante un cierto nmero aos o las temperaturas anunciadas cada hora por el
meteorlogo para un aeropuerto.
Matemticamente, una serie de tiempo se define por los valores 1 , 2 , 3, . de una variable Y (ventas
mensuales, produccin total, etc.) en tiempos 1 , 2 , 3, . Si se reemplaza a X por la variable tiempo,
estas series se definen como distribuciones de pares ordenados (X,Y) en el plano cartesiano, siendo Y
una funcin de X; esto se denota por:
= () = ()
El principal objetivo de las series de tiempo es hacer proyecciones o pronsticos sobre una actividad
futura, suponiendo estables las condiciones y variaciones registradas hasta la fecha, lo cual permite
planear y tomar decisiones a corto o largo plazo. Despus, con base en esa situacin ideal, que supone
que los factores que influyeron en la serie en el pasado lo continuarn haciendo en el futuro, se analizan
las tendencias pasadas y el comportamiento de las actividades bajo la influencia de ellas; por ejemplo,
en la proyeccin de ventas de un producto o de un servicio de una empresa se calculan los posibles
precios, la reaccin del consumidor, la influencia de la competencia, etc.

6.2) MOVIMIENTOS O COMPONENTES


El modelo clsico o de descomposicin, considera que los datos de series de tiempo estn compuestas de
los siguientes cuatro patrones bsicos:
A) TENDENCIA SECULAR
La tendencia secular o simplemente tendencia, son movimientos o variaciones continuas de la variable
de modo uniforme y suave, por encima o por debajo, que se observan en el largo plazo durante un perodo
de longitud prolongada. Representan el comportamiento predominante o direccin general de la serie de
tiempo como ascendente o descendente. La grfica de la tendencia suele ser una curva suave y aun una
lnea recta que muestra la tendencia de las variaciones. Ejemplos de tendencia secular son las ventas,
exportaciones, produccin y el empleo.
La siguiente grfica muestra la tendencia de exportaciones de la Empresa D & M en perodo
20002009. Aunque los datos muestran ciertas variaciones estn por encima y por debajo de la recta de
tendencia, la tendencia secular es ascendente.

228
Series Cronolgicas

Empleando Excel para realizar la grfica anterior se procede de la siguiente manera:


a) Escribir los valores de X y Y en la hoja de clculo. Seleccionar B2:B13. Clic en Insertar Grfico de
Lnea con marcadores.

b) Seleccionar el grfico. Clic en Diseo 10 de Diseos de Grfico.

229
Series Cronolgicas

c) Borrar el texto Series 1 del grfico. Escribir Exportaciones de la Empresa D & M en ttulo del grfico.
Escribir Aos en ttulo del eje horizontal. Escribir Millones de dlares en ttulo del eje vertical. Poner los
aos de las celdas A2:A11 en los nmeros del eje horizontal. Agregar etiquetas. Dar formato al eje
vertical con un mximo de 5, tal como ya se indic en captulos anteriores.

d) Clic derecho en serie de datos (en cualquier punto).

230
Series Cronolgicas

e) Clic en Agregar lnea de tendencia. Elegir Lineal en Opciones de lnea de tendencia.

f) Clic en Cerrar en la ventana de Formato de lnea de tendencia.

231
Series Cronolgicas

g) Clic en insertar Formas.

h) Seleccionar Flecha y ubicar en el grfico en dos ocasiones.

232
Series Cronolgicas

i) Insertar Cuadro de texto. Escribir Recta de tendencia en un cuadro de texto, y en otro escribir Datos
reales.

B) MOVIMIENTOS ESTACIONALES
Representa un movimiento peridico que se producen en forma similar cada ao por la misma poca, en
correlacin con los meses o con las estaciones del ao y aun con determinadas fechas. Si los sucesos no
se repiten anualmente, los datos deben recolectarse trimestral, mensual o incluso semanalmente.
Ejemplos de movimientos estacionales son la variacin de precios de ciertos productos, incremento de
ventas de juguetes y disminucin de ventas de tiles Navidad, incremento de ventas de flores por el da
del amor y la amistad, etc.
A continuacin se muestra un ejemplo de grfica que representa este tipo de movimientos estacionales:

233
Series Cronolgicas

C) MOVIMIENTOS CCLICOS
Son variaciones hacia arriba y hacia abajo de la tendencia que se presentan cada cierto nmero de
intervalos, en forma peridica de manera ondular a modo de oscilaciones ms o menos regulares durante
un perodo relativamente prolongado, que por lo general abarca tres o ms aos de duracin. La
produccin, empleo, promedio industrial, etc. son ejemplos de este tipo de movimientos.
A continuacin se muestra un ejemplo de grfica que representa este tipo de movimientos cclicos:

D) MOVIMIENTOS IRREGULARES O ALEATORIOS


Son aquellas variaciones producidas por sucesos de ocurrencia imprevisible o accidental que producen
movimientos sin un patrn discernible; as por ejemplo, las exportaciones de una empresa pueden ser
afectadas por sucesos inusuales no previsibles tales como huelgas, guerras, terremotos, inundaciones,
etc. Estas variaciones irregulares son de corta duracin y de magnitud muy variable.

A continuacin se muestra un ejemplo de grfica que representa este tipo de movimientos irregulares:

234
Series Cronolgicas

TAREA DE INTERAPRENDIZAJE N 25
1) Realice un organizador grfico sobre las series de tiempo.
2) Elabore empleando Excel las grficas de los ejemplos presentados en los movimientos estacionales,
cclicos e irregulares.

3) Cree y elabore una grfica que represente a cada uno de los movimientos de las series de tiempo de
manera manual y empleando Excel.

6.3) MODELOS DE SERIES DE TIEMPO


Son expresiones matemticas de relacin entre los movimientos de tendencia secular (T), movimientos
cclicos (C), movimientos estacionales (E) y movimientos irregulares (I) que generan la variable Y. Hay
dos modelos para la definicin de Y, los cuales son:

A) MODELO MULTIPLICATIVO
En el que queda definida por el producto de las variaciones.
=
B) MODELO ADITIVO
En el que Y queda definida por la suma de las variaciones.
=+++

En el modelo multiplicativo, las variaciones se expresan en trminos relativos o porcentuales de la


tendencia, en tanto que en el modelo aditivo las variaciones se expresan como residuos en las mismas
unidades originales. El modelo aditivo sufre el supuesto irreal de que los movimientos o componentes
son independientes uno de otro, algo que difcilmente se da en el caso de la vida real. El modelo
multiplicativo supone que los movimientos o componentes interactan entre s y no se mueven
independientemente, por lo que este modelo es ms utilizado que el aditivo. Sin embargo, el criterio
fundamental que se debe seguir en el caso de una situacin dada es emplear el modelo que mejor se ajuste
a los datos.

235
Series Cronolgicas

6.4) MTODOS DE SUAVIZAMIENTO Y PRONSTICO


Estos mtodos eliminan las fluctuaciones aleatorias de la serie de tiempo, proporcionando datos menos
distorsionados del comportamiento real de misma.

A) MTODO DE LOS PROMEDIOS MVILES


El movimiento medio de orden N de una serie de valores 1 , 2 , 3 , se define por la sucesin de valores
correspondientes a las medias aritmticas:
1 + 2 + 2 + 3 + +1 3 + 4 + +2
;
;
; .

Por ejemplo: Dados los valores 4, 6, 8, 10, 12 tendramos para el movimiento medio de orden 2
4 + 6 6 + 8 8 + 10 10 + 12
;
;
;
2
2
2
2
O sea los valores 5; 7; 9; 11

Para el movimiento medio de orden 3 se tiene la serie


4 + 6 + 8 6 + 8 + 10 8 + 10 + 12
;
;
3
3
3
O sea los valores 6; 8; 10

Para el movimiento de orden 4


4 + 6 + 8 + 10 6 + 8 + 10 + 12
;
4
4
O sea los valores 7, 12
Nota:
Utilizando adecuadamente estos movimientos medios se eliminan los movimientos o variaciones
estacionales, cclicas e irregulares, quedando slo el movimiento de tendencia. Este mtodo presenta el
inconveniente de que se pierden datos iniciales y finales de la serie original. Tambin se puede observar
que a medida que N crece, la cantidad de nuevos datos se reduce.
Si se emplean medias aritmticas ponderadas en el mtodo de los promedios mviles, el mtodo toma de
nombre Promedios Mviles Ponderados de Orden N.

236
Series Cronolgicas

Ejemplo ilustrativo
Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa D & M durante los ltimos
3 aos tomados en perodos de trimestres:
Trimestre Ventas
1
12
2
16
3
20
4
34
5
23
6
19
7
20
8
35
9
11
10
19
11
24
12
36

1) Suavizar los datos empleando el mtodo de los promedios mviles de orden 3 (longitud de 3 perodos).
2) Pronosticar las ventas para el trimestre nmero 13.
3) Suponga que para el Gerente de Ventas la ltima venta realizada es el doble de importante que la
penltima, y la antepenltima venta tiene la mitad de importancia que la penltima. Realizar el pronstico
de ventas para el trimestre nmero 13 empleando el mtodo de los promedios mviles ponderados de
orden 3.
4) Elaborar un grfico en el que consten las ventas y los promedios mviles (ventas suavizadas).
Solucin:
1) El clculo de los promedios mviles de orden 3 se presentan en la siguiente tabla:
Trimestre Ventas Pronstico (Promedios mviles)
1
12
2
16
(12+16+20)/3 = 16,00
3
20
(16+20+34)/3 = 23,33
4
34
(20+34+23)/3 = 25,67
5
23
(34+23+19)/3 = 25,33
6
19
(23+19+20)/3 = 20,67
7
20
(19+20+35)/3 = 24,67
8
35
(20+35+11)/3 = 22,00
9
11
(35+11+19)/3 = 21,67
10
19
(11+19+24)/3 = 18,00
11
24
(19+24+36)/3 = 26,33
12
36
237
Series Cronolgicas

Empleando Excel se muestra en la siguiente figura:

2) El ltimo valor del promedio mvil, que en este ejemplo es 26,33, representa el pronstico de las
ventas para el trimestre nmero 13, y tericamente para todo trimestre futuro.

3) Para resolver lo planteado se toma en cuenta las 3 ltimas ventas con sus respectivos pesos o
ponderaciones. Estos datos se presentan en la siguiente tabla:
Trimestre Ventas
10
19
11
24
12
36

Pesos (w)
0,5
1
2

Remplazando valores en la frmula de la media aritmtica ponderada se obtiene:


= =

1 1 + 2 2 + 3 3 +
=

1 + 2 + 3 +

0,5 19 + 1 24 + 2 36 105,5
=
= 30,14
0,5 + 1 + 2
3,5

El valor 30,14 es el pronstico de ventas para el trimestre nmero 13.

Los clculos en Excel se muestran en la siguiente figura:

238
Series Cronolgicas

4) El grfico en el que constan las ventas y los promedios mviles se muestra en la siguiente figura
elaborado empleando Excel:

Empleando Graph se muestra en la siguiente figura:

239
Series Cronolgicas

B) SUAVIZACIN EXPONENCIAL
Este mtodo contiene un mecanismo de autocorreccin que ajusta los pronsticos en direccin opuesta a
los errores pasados. Es un caso particular de promedios mviles ponderados de los valores actuales y
anteriores en el cual las ponderaciones disminuyen exponencialmente. Se emplea tanto para suavizar
como para realizar pronsticos. Se emplea la siguiente frmula:
+1 = + (1 )
Donde:
+1 = pronstico para cualquier perodo futuro.
= constante de suavizacin, a la cual se le da un valor entre 0 y 1.
= valor real para el perodo de tiempo.
= pronstico hecho previamente para el perodo de tiempo
Cuando exista menos dispersin en los datos reales respecto a los datos pronosticados entonces ser ms
confiable el mtodo empleado. Para saber cuan preciso es el mtodo empleado en la realizacin del
pronstico se utiliza la siguiente frmula del cuadrado medio del error (CME) como indicador de
precisin del pronstico:
=

( )2

Siendo n el nmero de errores


Ejemplo ilustrativo
Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa D & M durante los ltimos
12 meses:
Meses
Ventas
Septiembre
6
Octubre
7
Noviembre
6
Diciembre
12
Enero
7
Febrero
10
Marzo
6
Abril
4
Mayo
9
Junio
7
Julio
8
Agosto
6
1) Suavizar los datos empleando el mtodo de suavizacin exponencial con = 0,5. Pronosticar las ventas
para el mes de septiembre. Calcular el cuadrado medio del error. Elaborar un grfico en el que consten
las ventas y los pronsticos.
2) Suavizar los datos empleando el mtodo de los promedios mviles de orden 3. Pronosticar las ventas
para mes de septiembre. Calcular el cuadrado medio del error. Elaborar un grfico en el que consten las
ventas y los promedios mviles.
3) Qu mtodo es el ms preciso?
240
Series Cronolgicas

Solucin:
1) Realizando los clculos de suavizamiento se obtienen los resultados respectivos de pronstico, los
cuales se presentan en la siguiente tabla:
Ventas
( )
Septiembre
6
Octubre
7
Noviembre
6
Diciembre
12
Enero
7
Febrero
10
Marzo
6
Abril
4
Mayo
9
Junio
7
Julio
8
Agosto
6

Pronstico con = 0,5


+1 = + (1 )

Meses

. = . = 6
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
+1 = . + (1 ) .

=
=
=
=
=
=
=
=
=
=
=

0,57 + (1 - 0,5)6
0,56 + (1 - 0,5)6,5
0,512 + (1 - 0,5)6,25
0,57 + (1 - 0,5)9,125
0,510 + (1 - 0,5)8,063
0,56 + (1 - 0,5)9,032
0,54 + (1 - 0,5)7,516
0,59 + (1 - 0,5)5,758
0,57 + (1 - 0,5)7,379
0,58 + (1 - 0,5)7,189
0,56 + (1 - 0,5)7,595

=
=
=
=
=
=
=
=
=
=
=

6,5
6,25
9,125
8,063
9,032
7,516
5,758
7,379
7,189
7,595
6,798

Observando la tabla anterior se tiene que el pronstico de ventas para el mes de septiembre es de 6,798,
o para cualquier perodo futuro, ya que los datos no presentan una tendencia sino que se supone que
varan o fluctan a largo plazo alrededor de este valor promedio.
Calculando el cuadrado medio del error se obtienen los siguientes resultados, los cuales se presentan en
la siguiente tabla:
Ventas Pronstico
( )

Septiembre
6
Octubre
7
6
Noviembre
6
6,5
Diciembre
12
6,25
Enero
7
9,125
Febrero
10
8,063
Marzo
6
9,032
Abril
4
7,516
Mayo
9
5,758
Junio
7
7,379
Julio
8
7,189
Agosto
6
7,595
Total
Meses

Error
( )2
1
0,25
33,063
4,516
3,752
9,193
12,362
10,511
0,144
0,658
2,544
77,993

241
Series Cronolgicas

Aplicando la frmula se obtiene el cuadrado medio del error:


( )2 77,993
=
=
= 7,09

11
Los clculos realizados en Excel se muestran en la siguiente figura:

La grfica de las ventas y los pronsticos con el mtodo de suavizacin exponencial elaborada en Excel
se muestra en la siguiente figura:

242
Series Cronolgicas

2) Suavizando los datos empleando el mtodo de los promedios mviles de orden 3 elaborado en Excel
se muestra en la siguiente figura:

Observando el grfico anterior se tiene que el ltimo pronstico calculado es de 7, por lo que el pronstico
para septiembre es de 7.
Observando el grfico anterior se tiene que el cuadrado medio del error es de 4,522.

La grfica de las ventas y los pronsticos con el mtodo de los promedios mviles elaborada en Graph
se muestra en la siguiente figura:

3) Como CME en el mtodo de suavizacin exponencial es de 7,09 y con el mtodo de los promedios
mviles es de 4,52, se concluye que el mtodo de los promedios mviles es el ms preciso para este
ejemplo ilustrativo.
243
Series Cronolgicas

TAREA DE INTERAPRENDIZAJE N 26
1) Realice un organizador grfico sobre los modelos de series de tiempo.
2) Realice un organizador grfico sobre los mtodos de suavizamiento y pronstico.
3) Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa D & M durante los
ltimos 20 trimestres:
Trimestre Ventas Trimestre Ventas
1
12
11
24
2
16
12
36
3
20
13
22
4
34
14
18
5
23
15
24
6
19
16
34
7
20
17
15
8
35
18
23
9
11
19
25
10
19
20
38

3.1) Suavice los datos empleando el mtodo de los promedios mviles de orden 3 de manera manual y
empleando Excel. Pronostique las ventas para el trimestre nmero 21.
28,67
3.2) Suponga que para el Gerente de Ventas, la venta realizada en el trimestre nmero 20 es el cudruplo
de importante que la realizada en el trimestre nmero 17, la venta del trimestre nmero 19 es el triple de
importante que la del trimestre nmero 17, la venta del trimestre nmero 18 es la mitad de importante
que la del trimestre nmero 20. Realizar el pronstico de ventas de manera manual y empleando Excel
para el trimestre nmero 21 utilizando el mtodo de los promedios mviles ponderados para un orden o
longitud de 4.
28,8
3.3) Elaborar un grfico en el que consten las ventas y los promedios mviles elaborado de manera
manual y empleando Excel.

4) Cree y resuelva un ejercicio de aplicacin de promedios mviles con datos reales sobre cualquier tema
de su preferencia.

244
Series Cronolgicas

5) Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa M & M durante los
ltimos 12 meses:
Meses
Ventas
( )

Julio
5

Agosto
6

Septiembre
7

Octubre
9

Noviembre
8

Diciembre
12

Enero
7

Febrero
10

Marzo
7

Abril
8

Mayo
11

Junio
8

5.1) Suavice los datos utilizando el mtodo de suavizacin exponencial con = 0,3 de manera manual y
empleando Excel. Pronostique las ventas para el mes de julio.
8,7
5.2) Calcule el cuadrado medio del error del mtodo anterior de manera manual y empleando Excel
5,2
5.3) Elabore un grfico en el que consten las ventas y los pronsticos de suavizacin exponencial de
manera manual y empleando Excel.

5.4) Suavice los datos empleando el mtodo de los promedios mviles de orden 3 de manera manual y
utilizando Excel. Pronosticar las ventas para mes de julio.
9
5.5) Calcular el cuadrado medio del error del mtodo anterior de manera manual y utilizando Excel.
3,02
5.6) Elabore un grfico en el que consten las ventas y los promedios mviles de manera manual y
empleando Graph.

5.7) Qu mtodo es el ms preciso para este ejercicio?


El mtodo de los promedios mviles

6) Cree y resuelva un ejercicio similar al anterior (5.1 a 5.7) con datos reales sobre cualquier tema de su
preferencia.
245
Series Cronolgicas

6.5) ANLISIS DE TENDENCIA


Es necesario describir la tendencia ascendente o descendente a largo plazo de una serie cronolgica por
medio de alguna lnea, y la ms adecuada ser la que mejor represente los datos y sea til para desarrollar
pronsticos. Para lograr la estimacin de la tendencia se utilizan con ms frecuencia los siguientes
mtodos:

A) MTODO DE LOS MNIMOS CUADRADOS


Este mtodo ya se estudi en el captulo anterior, en el que se indic las formas para hallar la ecuacin
de una recta de mnimos cuadrados. Con esta recta se obtendrn los valores de tendencia.

Ejemplo ilustrativo:
Con los siguientes datos acerca de las ventas en millones de dlares de la Empresa M & M:
Ao (X) Ventas (Y)
1995
3,4
1996
3,1
1997
3,9
1998
3,3
1999
3,2
2000
4,3
2001
3,9
2002
3,5
2003
3,6
2004
3,7
2005
4
2006
3,6
2007
4,1
2008
4,7
2009
4,2
2010
4,5
1) Hallar la ecuacin de tendencia por el mtodo de los mnimos cuadrados.
2) Pronosticar la tendencia de exportacin para el 2011.
3) Elaborar la grfica para los datos y la recta de tendencia.

246
Series Cronolgicas

Solucin:
1) Para hallar la ecuacin de tendencia por el mtodo de los mnimos cuadrados se llena la siguiente
tabla, codificando la numeracin de los aos 1995 como 1, 1996 como 2, y as consecutivamente para
facilitar los clculos.
Ao ()

2
2
1995
1
3,4
3,40
1
11,56
1996
2
3,1
6,20
4
9,61
1997
3
3,9
11,70
9
15,21
1998
4
3,3
13,20
16
10,89
1999
5
3,2
16,00
25
10,24
2000
6
4,3
25,80
36
18,49
2001
7
3,9
27,30
49
15,21
2002
8
3,5
28,00
64
12,25
2003
9
3,6
32,40
81
12,96
2004
10
3,7
37,00
100
13,69
2005
11
4
44,00
121
16,00
2006
12
3,6
43,20
144
12,96
2007
13
4,1
53,30
169
16,81
2008
14
4,7
65,80
196
22,09
2009
15
4,2
63,00
225
17,64
2010
16
4,5
72,00
256
20,25
Total
136
61
542,3
1496
235,86
Remplazando valores en las siguientes frmulas se obtiene los valores de a0 y a1:
0 =

2 61 1496 136 542,3 17503,2


=
=
= 3,2175 = 3,22
2 ( )2
16 1496 (136)2
5440

1 =

16 542,3 136 61 380,8


=
=
= 0,07
2 ( )2
16 1496 (136)2
5440

Interpretacin:
- El valor 1 = 0,07 al ser positiva indica que existe una tendencia ascendente de las exportaciones
aumentando a un cambio o razn promedio de 0,07 millones de dlares por cada ao.
- El valor de 0 = 3,22 indica el punto en donde la recta interseca al eje Y cuando X = 0, es decir indica
las exportaciones estimadas para el ao 1996 igual a 3,22.
Remplazado los valores anteriores en la recta de tendencia se obtiene:
= 0 + 1

Y = 3,22 + 0,07X
2) Para pronosticar la tendencia de exportacin para el 2011 se reemplaza X = 17 en la recta de tendencia,
obteniendo el siguiente resultado:
Y = 3,22 + 0,07X
Y = 3,22 + 0,0717 = 4,41
247
Series Cronolgicas

Los clculos en Excel se muestran en la siguiente figura:

3) La grfica de los datos y la recta de tendencia elaborada en Excel se muestran en la siguiente figura:

248
Series Cronolgicas

Para realizar la grfica anterior empleando Excel se procede de la siguiente manera:


a) Escribir los datos en la hoja de clculo. Seleccionar los datos. Insertar Grfico de Dispersin con lneas
suavizadas y marcadores.

b) Seleccionar el grfico. Escoger el Diseo 9 en Diseo de grfico.

249
Series Cronolgicas

c) Borrar las palabras Series1 y Lineal (Series1). Borrar las lneas de divisin. Borrar R 2 = 0,505 que
representa el coeficiente de determinacin que este caso no es necesario. Escribir Exportaciones de la
Empresa M & M en el ttulo del grfico. Escribir Aos en el ttulo del eje horizontal. Escribir millones
de dlares en el eje vertical.

d) Arrastrar el cuadro la ecuacin Y = 0,07X + 3,217 hacia abajo, esta ecuacin es la recta de tendencia
que Excel calcula al realizar el grfico. Agregar etiquetas. Editar el eje x de 1995 al 2010. Insertar los
textos Recta de tendencia y Exportaciones. Insertar formas de Flecha.

250
Series Cronolgicas

B) MTODO DE LOS SEMIPROMEDIOS


Este mtodo se aplica con el objeto de simplificar los clculos y consiste en:
a) Agrupar los datos en dos grupos iguales
b) Obtener el valor central (mediana) de los tiempos y la media aritmtica de los datos de cada grupo,
consiguindose as dos puntos de la recta de tendencia (1 , 1 ) y (2 , 2 ).
c) Estos valores se reemplazan en el siguiente sistema:
{

1 = 0 + 1 1
2 = 0 + 1 2

d) Resolviendo el sistema se encuentran los valores de 0 y 1 , los cuales se reemplazan en la ecuacin


de la recta de tendencia, la cual es:
= 0 + 1
Con esta recta de tendencia se puede realizar pronsticos, los cuales son menos exactos que los obtenidos
con el mtodo de los mnimos cuadrados, sin embargo, su diferencia es mnima.

Ejemplo ilustrativo N 1
Con los siguientes datos sobre las ventas en millones de dlares de la Empresa D & M
Ao
(X)
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010

Ventas
(Y)
1,5
1,8
2
1,5
2,2
2
3
2,8
2,4
2,9
3

1) Hallar la ecuacin de tendencia por el mtodo de los semipromedios.


2) Pronosticar la tendencia de ventas para el 2011.
3) Elaborar la grfica para los datos y la recta de tendencia.

251
Series Cronolgicas

Solucin:
1) Se codifica la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente para facilitar
los clculos. Se agrupa en dos grupos iguales.
Ao X
Y
Valor central X Semipromedio Y
2000 1
1,5
2001 2
1,8
2002 3
2
3
1,8
2003 4
1,5
2004 5
2,2
2005 6
2
2006 7
3
2007 8
2,8
2008 9
2,4
9
2,82
2009 10
2,9
2010 11
3
El ao 2005 se dej por fuera para tener grupos con el mismo nmero de aos. El valor central de 3
corresponde a la mediana del primer grupo 1, 2, 3, 4 y 5. El valor central de 9 corresponde a la mediana
del segundo grupo 7, 8, 9, 10 y 11. El semipromedio 1,8 corresponden a la media aritmtica del primer
grupo. El semipromedio 2,82 corresponden a la media aritmtica del segundo grupo. De esta manera se
obtienen dos puntos (3, 1.8) y (9, 2.82) de la recta de tendencia.
Remplazando los puntos en el siguiente sistema se obtiene:
{

1 = 0 + 1 1
1,8 = 0 + 31
{
2 = 0 + 1 2
2,82 = 0 + 91

Resolviendo el sistema empleando la regla de Cramer se obtiene:


1,8 3
a0 |2,82 9| 7,74
a0 =
=
=
= 1,29
1 3

6
|
|
1 9
1 1,8
a1 |1 2,82| 1,02
a1 =
=
=
= 0,17
1 3

6
|
|
1 9
Como a1 es positiva, la recta tiene una tendencia ascendente (pendiente positiva).
Remplazando los valores calculados se tiene la recta de tendencia, la cual es:
= 0 + 1
= 1,29 + 0,17
2) Para pronosticar la tendencia de exportacin para el 2011 se reemplaza X = 12 en la recta de tendencia,
obteniendo el siguiente resultado:
Y = 1,29 + 0,17X
Y = 1,29 + 0,1712 = 3,33

252
Series Cronolgicas

Interpretacin: Existe una tendencia ascendente a un cambio promedio de 0,17 millones de dlares por
cada ao, por lo que el Gerente de ventas de la empresa debe seguir aplicando las polticas necesarias
para mantener la tendencia ascendente y mejorar la tasa de crecimiento.
Los clculos realizados en Excel se muestran en la siguiente figura:

3) La grfica de los datos y la recta de tendencia elaborada en Graph se muestran en la siguiente figura:

253
Series Cronolgicas

Ejemplo ilustrativo N 2
Con los siguientes datos acerca de las ventas en miles de dlares de la Empresa D & M durante los
ltimos 12 meses:
Meses (X) Ventas (Y)
Septiembre
6
Octubre
7
Noviembre
6
Diciembre
12
Enero
7
Febrero
10
Marzo
6
Abril
4
Mayo
9
Junio
7
Julio
8
Agosto
6
1) Hallar la ecuacin de tendencia por el mtodo de los semipromedios.
2) Pronosticar la tendencia de ventas para el mes de septiembre.
3) Elaborar la grfica para los datos y la recta de tendencia.

Solucin:
1) Se codifica la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente para facilitar
los clculos. Se agrupa en dos grupos iguales.
Meses (X)
Septiembre
Octubre
Noviembre
Diciembre
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto

X
1
2
3
4
5
6
7
8
9
10
11
12

Y
6
7
6
12
7
10
6
4
9
7
8
6

Valor central X

Semipromedio Y

3,5

9,5

6,667

Remplazando los valores centrales y los semipromedios puntos en el siguiente sistema se obtiene:
{

1 = 0 + 1 1
8 = 0 + 3,51
{
2 = 0 + 1 2
6,667 = 0 + 9,51
254
Series Cronolgicas

Resolviendo el sistema se obtiene:


a0 = 8,778
a1 = 0,222
Como a1 es negativa, la recta tiene una tendencia descendente (pendiente negativa).
Remplazando los valores calculados se tiene la recta de tendencia, la cual es:
= 0 + 1
= 8,778 0,222

2) Para pronosticar la tendencia de ventas para el mes de septiembre se reemplaza X = 13 en la recta de


tendencia, obteniendo el siguiente resultado:
Y = 8,778 - 0,222X
Y = 8,778 - 0,22213 = 5,89

Interpretacin: Existe una tendencia descendente a un cambio promedio de 0,222 miles de dlares por
cada mes, por lo que el Gerente de ventas de la empresa debe aplicar los correctivos pertinentes para salir
de esta situacin.
Los clculos realizados en Excel se muestran en la siguiente figura:

255
Series Cronolgicas

3) La grfica de los datos y la recta de tendencia elaborada en Graph se muestran en la siguiente figura:

TAREA DE INTERAPRENDIZAJE N 27
1) Realice un organizador grfico del anlisis de tendencia
2) Qu interpretacin tiene el valor de 0 y 1 en la recta de tendencia?
3) Con los siguientes datos sobre las exportaciones en millones de dlares de la Empresa M & M
Ao (X)
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010

Exportaciones (Y)
4,3
3,9
3,5
3,6
3,7
4
3,6
4,1
4,7
4,2
4,5

3.1) Halle la recta de tendencia por el mtodo de los mnimos cuadrados de manera manual y empleando
Excel. Codifique la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente. Realice
la interpretacin respectiva.
Y = 3,644 + 0,061X
3.2) Pronostique la tendencia para el 2011
4,38
256
Series Cronolgicas

3.3) Grafique los datos y la recta de tendencia empleando Excel

3.4) Halle la recta de tendencia por el mtodo de los semipromedios de manera manual y empleando
Excel. Codifique la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente. Realice
la interpretacin respectiva.
Y = 3,59 + 0,07X
3.5) Pronostique la tendencia para el 2011.
4,43
3.6) Grafique los datos y la recta de tendencia empleando Graph.

4) Con los siguientes datos acerca de las exportaciones en millones de dlares de la Empresa M & M
Ao (X)
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010

Exportaciones (Y)
3,4
3,1
3,9
3,3
3,2
4,3
3,9
3,5
3,6
3,7
4
3,6
4,1
4,7
4,2
4,5
257
Series Cronolgicas

4.1) Halle la recta de tendencia por el mtodo de los semipromedios de manera manual y empleando
Excel. Realice la interpretacin respectiva.
Y = 3,308 + 0,059X
4.2) Pronostique la tendencia para el 2011
4,3
4.3) Grafique los datos y la recta de tendencia empleando Graph.

5) Cree un ejercicio de estimacin de tendencia con datos reales sobre cualquier tema de su preferencia.
Resulvalo empleando los dos mtodos aprendidos de manera manual, empleando Excel y Graph.
Realice las interpretaciones y pronsticos respectivos.

6.6) ANLISIS DE MOVIMIENTOS ESTACIONALES


Para analizar el movimiento estacional debemos estimar cmo varan los datos de la serie cronolgica en
el perodo de tiempo. Un conjunto de nmeros que muestra los valores relativos de una variable durante
los perodos de tiempo se llama un ndice estacional para la variable. El ndice estacional medio del ao
ha de ser 100%; esto es, la suma de los nmeros ndice de los 12 meses suman 1200%, o de los cuatro
trimestres suman el 400%, en caso contrario ha se corregirse multiplicado por el factor de ajuste, el
mismo que es:
=

120

400

A) CLCULO DEL NDICE ESTACIONAL POR EL MTODO DEL PORCENTAJE MEDIO


Este mtodo consiste en calcular los ndices estacionales como porcentajes de los perodos de tiempo
(mensual o trimestral). Para lo cual se calcula de cada ao la media mensual o trimestral, segn sea el
caso, luego se divide el dato de cada mes o trimestre por la media mensual o trimestral del
correspondiente ao y se multiplica por 100, y luego se calcular la media de cada mes o trimestre,
obtenindose el ndice estacional.

B) DESESTACIONALIZACIN DE LOS DATOS O AJUSTE DE LOS DATOS A LA


VARIACIN ESTACIONAL
Una vez obtenidos los ndices estacionales es posible eliminar el movimiento estacional de los datos,
para lo cual se divide todos los datos originales por el ndice estacional del perodo de tiempo (mes o
trimestre) correspondiente. Los valores desestacionalizados reflejan cmo sera la variable si se corrigiera
la influencia estacional.
258
Series Cronolgicas

Ejemplo ilustrativo:
Con los datos de la siguiente tabla que muestra las exportaciones en millones de dlares de la Empresa
D & M.
Trimestre I
II III IV
Ao
2008
20 32 22 40
2009
25 35 30 45
2010
28 38 36 44
1) Calcular el ndice estacional
2) Desestacionalizar los datos
Solucin:
1) Se calculada la media trimestral, la cual se presenta en la siguiente tabla:
Trimestre
Ao
2008
2009
2010

II

III IV Media trimestral

20 32 22 40 28,5
25 35 30 45 33,75
28 38 36 44 36,5

Se divide el dato de cada trimestre por la media trimestral del correspondiente ao y se multiplica por
100, como se muestra en la siguiente tabla:
Trimestre
Ao
2008
2009
2010

II

III

IV

70,175 112,281 77,193 140,351


74,074 103,704 88,889 133,333
76,712 104,110 98,630 120,548

Se calcula la media de cada trimestre como se muestra en la siguiente tabla:


Trimestre
Ao
2008
2009
2010
Media

II

III

IV

70,175
74,074
76,712
73,654

112,281
103,704
104,110
106,698

77,193
88,889
98,630
88,237

140,351
133,333
120,548
131,411

Se suma las medias de cada trimestre, las cuales deben dar como resultado 400. Al sumar 73,654 +
106,698 + 88,237 + 131,411 se obtiene 399,999, por lo que no existe la necesidad de multiplicar la media
trimestral por el factor de ajuste trimestral. Por lo tanto las medias trimestrales representan el ndice
estacional, como se muestra en la siguiente tabla:
Trimestre
Ao
2008
2009
2010
Media
ndice estacional

II

III

IV

70,175
74,074
76,712
73,654
73,654%

112,281
103,704
104,110
106,698
106,698%

77,193
88,889
98,630
88,237
88,237%

140,351
133,333
120,548
131,411
131,411%
259

Series Cronolgicas

Interpretacin:
El ndice estacional de 73,654% para el primer trimestre significa que las exportaciones de empresa D
& M son de 73,654% del promedio del ao total. Las exportaciones son 100% - 73,654% = 26,346% por
debajo del promedio trimestral del ao.
El ndice estacional de 106,698% para el segundo trimestre significa que las exportaciones de empresa
D & M son de 106,698% del promedio del ao total. Las exportaciones son 100% - 106,698% = 6,698%
por encima del promedio trimestral del ao.
2) Dividiendo los valores reales por sus ndices estacionales respectivos se obtienen los valores
desestacionalizados tambin denominados corregidos estacionalmente. En la siguiente tabla se muestra
los valores desestacionalizados:
2008 - I: 20/0,73654 = 27,15, y as sucesivamente
Trimestre I
Ao
2008
2009
2010

II

III

IV

27,15 29,99 24,93 30,44


33,94 32,80 33,99 34,24
38,02 35,61 40,80 33,48

Interpretacin: El valor de 27,15 significa que si las exportaciones de la empresa D & M no estuvieren
sujetas a la variacin estacional, las exportaciones para el primer trimestre del ao 2008 hubieran sido de
27,15 millones de dlares.
Los clculos en Excel se muestran en la siguiente figura:

260
Series Cronolgicas

TAREA INTERAPRENDIZAJE N 28
1) Realice un organizador grfico sobre el anlisis de movimientos estacionales.
2) Con los datos de la siguiente tabla que muestra las exportaciones trimestrales en millones de dlares
de la empresa M & D durante los aos 2008-2009.
Trimestre
I
II
III
IV
Ao
2008
24
31
21
42
2009
27
32
26
41
2010
28
27
35
44
2.1) Calcule el ndice estacional de manera manual y empleando Excel.
ndice

83,551 95,756 86,068 134,625

2.2) Desestacionalice los datos de manera manual y empleando Excel.


Trimestre
Ao
2008
2009
2010

II

III

IV

28,725 32,374 24,399 31,198


32,316 33,418 30,209 30,455
33,513 28,197 40,666 32,683

3) Con los datos de la siguiente tabla que muestra las exportaciones mensuales en millones de dlares de
la empresa M & D durante los aos 2005-2009.
Mes
Ao

En Feb. Mar. Abr. May. Jun. Jul. Ag. Sep. Oct. Nov. Dic.

2005
2006
2007
2008
2009

4
3
5
6
6

8
9
8
10
10

6
7
10
12
12

4
6
6
9
8

8
7
8
11
10

6
8
10
9
12

4
7
8
8
10

6
5
7
7
10

8
8
8
10
10

4
6
6
7
8

4
7
8
7
10

10
11
12
12
14

3.1) Calcule el ndice estacional de manera manual y empleando Excel.


ndice

59,74

114,60

115,67

81,48

111,11

111,86

9,11

87,34

111,75

77,03

88,89

149,43

3.2) Desestacionalice los datos de manera manual y empleando Excel.


Mes
Ao
2005
2006
2007
2008
2009

En

Feb. Mar. Abr.

May. Jun.

Jul.

Ag.

Sep. Oct.

Nov. Dic.

6,70
5,02
8,37
10,04
10,04

6,98
7,85
6,99
8,73
8,73

7,20
6,300
7,20
9,90
9,00

4,39
7,68
8,78
8,78
10,98

6,87
5,73
8,02
8,02
11,45

7,16
7,16
7,16
8,95
8,95

4,50
7,88
9,00
7,88
11,25

5,19
6,05
8,65
10,38
10,38

4,91
7,36
7,36
11,05
9,82

5,36
7,15
8,94
8,05
10,73

5,19
7,79
7,79
9,09
10,39

6,69
7,36
8,03
8,03
9,37

4) Cree y resuelva un ejercicio similar al anterior sobre cualquier tema de su preferencia.


261
Series Cronolgicas

6.7) ANLISIS DE MOVIMIENTOS CCLICOS E IRREGULARES


Los movimientos cclicos son de tipo peridico y presentan ms de un ao de duracin. Comnmente,
tales movimientos o variaciones no se pueden apartar de la naturaleza irregular, por lo que se analizarn
juntas.
Recordemos que Y = TCEI de donde CI = Y/TE. Por lo que los movimientos cclicos e irregulares
se obtienen dividiendo los datos originales entre el valor de tendencia estimado, y este cociente
multiplicando por 100% de la siguiente manera:
=

100%
.

Donde:
Y = Variable Y
. = Valor de tendencia estimado
CI = Movimientos cclicos e irregulares
El cociente se multiplica por 100 a fin de que la media cclica sea 100. Un valor cclico relativo de 100
indicar la ausencia de toda influencia cclica en el valor de la serie de tiempo anual.
Para facilitar la interpretacin de relativos ciclos suele elaborarse una grfica de ciclos, en el que se
describen los ciclos relativos segn el ao correspondiente. Las cumbres y valles asociados con el
componente cclico de las series de tiempo pueden resultar ms evidentes por medio de la elaboracin de
una grfica de este tipo.
Ejemplo ilustrativo
Con los siguientes datos acerca de las ventas en millones de dlares de la Empresa M & M:
Ao (X) Ventas (Y)
1995
3,4
1996
3,1
1997
3,9
1998
3,3
1999
3,2
2000
4,3
2001
3,9
2002
3,5
2003
3,6
2004
3,7
2005
4
2006
3,6
2007
4,1
2008
4,7
2009
4,2
2010
4,5
1) Determinar el componente cclico de cada uno de los valores de la serie cronolgica usando la ecuacin
de tendencia
2) Elaborar una grfica de ciclos

262
Series Cronolgicas

Solucin:
1) La ecuacin de tendencia lineal obtenida empleando el mtodo de los mnimos cuadrados es:
Y = 3,22 + 0,07X
Con esta ecuacin se calcula los valores estimados de Y reemplazando los valores de X en la recta de
tendencia. Luego se divide los datos originales Y entre el valor de tendencia estimado, y este cociente se
multiplica por 100%, como se muestra en la siguiente tabla:
Ao () Ventas () = 3,22 + 0,07
1995
3,4
3,29
1996
3,1
3,36
1997
3,9
3,43
1998
3,3
3,50
1999
3,2
3,57
2000
4,3
3,64
2001
3,9
3,71
2002
3,5
3,78
2003
3,6
3,85
2004
3,7
3,92
2005
4
3,99
2006
3,6
4,06
2007
4,1
4,13
2008
4,7
4,20
2009
4,2
4,27
2010
4,5
4,34

= (/ ) 100%
103,42
92,33
113,79
94,35
89,70
118,21
105,19
92,65
93,57
94,45
100,31
88,72
99,33
111,97
98,42
103,75

Los clculos en Excel se muestran en la siguiente figura:

263
Series Cronolgicas

2) La grfica de ciclos elaborada empleando Excel se muestra en la siguiente figura:

La grfica de ciclos elaborada empleando Graph se muestra en la siguiente figura:

264
Series Cronolgicas

TAREA DE INTERAPRENDIZAJE N 29
1) Elabore un organizador grfico sobre el anlisis de movimientos cclicos e irregulares
2) Con los siguientes datos sobre las exportaciones en millones de dlares de la Empresa M & D

Ao (X) Ventas (Y)


2000
4,3
2001
3,9
2002
3,5
2003
3,6
2004
3,7
2005
4
2006
3,6
2007
4,1
2008
4,7
2009
4,2
2010
4,5

2.1) Determine el componente cclico de cada uno de los valores de la serie cronolgica usando la
ecuacin de tendencia calculada por el mtodo de los mnimos cuadrados de manera manual y empleando
Excel.

= (/ ) 100%
116,07
103,57
91,47
92,61
93,71
99,77
88,45
99,25
112,12
98,76
104,32

265
Series Cronolgicas

2.2) Elabore una grfica de ciclos de manera manual, empleando Excel y Graph.

3) Cree un ejercicio de aplicacin de anlisis de movimientos cclicos e irregulares con datos reales sobre
cualquier tema de su preferencia. Resulvalo de manera manual, empleando Excel y Graph. Tambin
elabore la grfica de ciclos.

266
Series Cronolgicas

REFERENCIAS BIBLIOGRFICAS

Daza, Jorge. (2006). Estadstica Aplicada con Microsoft Excel. Lima, Per: Grupo Editorial Megabyte
Shao, Stephen. (1980). Estadstica para Economistas y Administradores de Empresas. Mxico DF:
Ed. Herrero Hnos.
Spiegel, Murray. (2000). Estadstica. Serie de Compendios Schaum. Mxico: Ed. McGraw-Hill
Surez, Mario. (2004). Interaprendizaje Holstico de Matemtica. Ecuador, Ibarra. Grficas Planeta.
Surez, Mario y Tapia, Fausto. (2012). Interaprendizaje de Estadstica Bsica. 1ra Edicin. Ecuador,
Ibarra. Universidad Tcnica del Norte.
Surez, Mario. (2011). Distribucin de frecuencias para datos agrupados en intervalos.
http://www.monografias.com/trabajos87/distribucion-frecuencias-datos-agrupados
intervalos/distribucion-frecuencias-datos-agrupados-intervalos.shtml
Surez,
Mario.
(2011).
Clculo
del
tamao
de
la
http://www.monografias.com/trabajos87/calculo-del-tamano-muestra/calculo-del-tamanomuestra.shtml

muestra.

Surez, Mario. (2011). Grficos estadsticos bsicos. http://www.monografias.com/trabajos88/graficosestadisticos-basicos/graficos-estadisticos-basicos.shtml


Surez, Mario. (2011). Gua didctica para el interaprendizaje de medidas de tendencia central.
http://www.monografias.com/trabajos85/interaprendizaje-medidas-tendencia-central/interaprendizajemedidas-tendencia-central.shtml
Surez, Mario. (2011). Media
aritmetica/media-aritmetica.shtml

aritmtica.

http://www.monografias.com/trabajos85/media-

Surez,
Mario.
(2011).
Ejemplos
ilustrativos
resueltos
de
la
Moda.
http://www.monografias.com/trabajos85/ejemplos-ilistrativos-resueltos-moda/ejemplos-ilistrativosresueltos-moda.shtml
Surez, Mario. (2011). La mediana para datos no agrupados
http://www.monografias.com/trabajos85/ejecicios-mediana/ejecicios-mediana.shtml

agrupados.

Surez, Mario. (2011). Medidas de posicin. http://www.monografias.com/trabajos87/medidasposicion/medidas-posicion.shtml


Surez, Mario. (2011). Medidas de dispersin. http://www.monografias.com/trabajos89/medidas-dedispersion/medidas-de-dispersion.shtml
Surez,
Mario.
(2011).
Medidas
de
forma:
asimetra
y
curtosis.
http://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-forma-asimetriacurtosis.shtml

267
Referencias Bibliogrficas

Surez, Mario. (2014). Coeficiente de correlacin de Karl Pearson con Excel, Graph y GeoGebra.
http://www.monografias.com/trabajos-pdf5/coeficiente-correlacion-pearson-excel-graph-ygeogebra/coeficiente-correlacion-pearson-excel-graph-y-geogebra.shtml
Surez, Mario. (2011). Coeficiente de Correlacin por Rangos de Spearman.
http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficientecorrelacion-rangos-spearman.shtml
Surez,
Mario.
(2011).
Dispersin
relativa
o
coeficiente
de
http://www.monografias.com/trabajos88/dispersion-relativa/dispersion-relativa.shtml

variacin.

Surez, Mario. (2012). Anlisis de correlacin empleando Excel y Graph.


http://www.monografias.com/trabajos93/analisis-correlacion-empleando-excel-y-graph/analisiscorrelacion-empleando-excely-graph.shtml
Surez, Mario. (2014). La recta de los mnimos cuadrados con Excel y GeoGebra.
http://www.monografias.com/trabajos-pdf5/recta-minimos-cuadrados-excel-y-geogebra/recta-minimoscuadrados-excel-y-geogebra.shtml
Surez, Mario. (2014). La Parbola de los mnimos cuadrados con Excel, Graph y Geogebra.
http://www.monografias.com/trabajos-pdf5/parabola-minimos-cuadrados-excel-graph-ygeogebra/parabola-minimos-cuadrados-excel-graph-y-geogebra.shtml
Surez, Mario. (2011). Regresin potencial mediante el mtodo de los mnimos cuadrados.
http://www.monografias.com/trabajos89/regresion-potencial-metodo-minimos-cuadrados/regresionpotencial-metodo-minimos-cuadrados.shtml
Surez, Mario. (2011). Regresin exponencial mediante el mtodo de los mnimos cuadrados.
http://www.monografias.com/trabajos89/regresion-exponencial-metodo-minimos-cuadrados/regresionexponencial-metodo-minimos-cuadrados.shtml
Surez, Mario. (2013). Conceptos bsicos de estadstica descriptiva e inferencial.
http://www.monografias.com/trabajos96/conceptos-basicos-estadistica-descriptiva-einferencial/conceptos-basicos-estadistica-descriptiva-e-inferencial.shtml
Surez, Mario. (2014). Cuartiles, diagrama de caja y bigotes, deciles y percentiles con Excel y con
Geogebra. http://www.monografias.com/trabajos-pdf5/cuartiles-diagrama-caja-y-bigotes-deciles-ypercentiles-excel-y-geogebra/cuartiles-diagrama-caja-y-bigotes-deciles-y-percentiles-excel-ygeogebra.shtml
Surez, Mario. (2014). Diagrama de tallo y hojas con GeoGebra.
http://www.monografias.com/trabajos100/diagrama-tallo-y-hojas-geogebra/diagrama-tallo-y-hojasgeogebra.shtml
Surez,
Mario.
(2011).
Anlisis
de
tendencia
para
series
de
tiempo.
http://www.monografias.com/trabajos87/analisis-tendencia-series-tiempo/analisis-tendencia-seriestiempo.shtml
Surez, Mario. (2011), Mtodos de suavizamiento y pronstico para series de tiempo,
http://www.monografias.com/trabajos87/metodos-suavizamiento-y-pronostico-series-tiempo/metodossuavizamiento-y-pronostico-series-tiempo.shtml

268
Referencias Bibliogrficas

You might also like