Professional Documents
Culture Documents
AUTORES:
Mgs. Mario O. Surez I.
Msc. Fausto A. Tapia Z.
IBARRA - ECUADOR
2014
Coordinacin de publicacin:
Universidad Tcnica del Norte
Segunda Edicin
Esta obra no puede ser reproducida total ni parcialmente por ningn medio sin expreso consentimiento
previo y por escrito de los autores.
DEDICATORIA
Mario
Con infinito amor en expansin
a mi esposa Dyanita Rivera, a mis hijos Emily Monserrath y Mathas Josu,
por ser mi fuente de inspiracin y mi ms anhelado sueo hecho realidad,
y a mis padres Bertha Ibujs y Segundo Surez por su ejemplo de sacrificio y lucha constante.
Fausto
Con especial afecto a mi familia
por la paciencia y apoyo brindado para la realizacin de este trabajo.
AGRADECIMIENTO
CONTENIDOS
Pg.
1
3
4
5
9
10
CONTRAPORTADA
DEDICATORIA
AGRADECIMIENTO
CONTENIDOS
PRESENTACIN
EVALUACIN DIAGNSTICA
CAPTULO I
DESCRIPCIN Y PRESENTACIN DE LA INFORMACIN ESTADSTICA
1.1 Qu es la Estadstica?
A Historia
B Definicin
C Aplicaciones
D Fines
E Objetivos
F Mtodos
G Clasificacin de la Estadstica
i Estadstica Descriptiva o Deductiva
ii Estadstica Inferencial o Inductiva
1.2 Conceptos y Definiciones Bsicas
A Poblacin
B Muestra
C Elemento o Individuo
D Datos Estadsticos
E Censo
F Encuesta
G Variable
i Clasificacin
ii Niveles de Medicin
1.3 Tablas o Cuadros Estadsticos
1.4 Distribucin de Frecuencias
A Para datos sin Agrupar
B Para datos Agrupados en Clases o Intervalos
1.5 Grficos Estadsticos Bsicos
A Diagramas de Barras
B Histogramas
C Polgono de Frecuencias
i Polgono de Frecuencias Acumuladas u Ojiva
ii Polgono de Frecuencias Relativas Acumuladas Porcentuales
D Diagrama de Tallo y Hojas
E Diagrama de Sectores
F Pictogramas
CAPTULO II
MEDIDAS DE TENDENCIA CENTRAL
2.1 Media Aritmtica
A Media Aritmtica Simple
i Definicin
ii Mtodos de Clculo
a Para Datos No Agrupados
b Para Datos Agrupados en Tablas de Frecuencias
Interaprendizaje de Estadstica Bsica
11
12
13
14
15
16
18
21
23
28
36
47
54
59
60
61
66
75
76
81
84
87
88
89
91
94
97
98
102
108
117
118
121
124
127
128
130
131
134
135
140
142
145
6
B Amplitud Intercuartlica
C Rango Semi-intercuartil o Desviacin Cuartlica
D Rango Percentil o Amplitud Cuartlica
3.4 Dispersin Relativa o Coeficiente de Variacin
A Propiedades
B Mtodos de Clculo
CAPTULO IV
MEDIDAS DE FORMA
4.1 Asimetra
A Tipos de Asimetra
i Asimetra Negativa o a la Izquierda
ii Simtrica
iii Asimetra Positiva o a la Derecha
B Medidas de Asimetra
i Coeficiente de Pearson
ii Medida de Yule Bowley o Medida Cuartlica
iii Medida de Fisher
4.2 Curtosis o Apuntamiento
A Tipos de Curtosis
i Leptocrtica
ii Mesocrtica
iii Platicrtica
B Medidas de Curtosis
i Medida de Fisher
ii Medida basada en Cuartiles y Percentiles
CAPTULO V
CORRELACIN Y REGRESIN
5.1 Anlisis de Correlacin
A Diagrama de Dispersin
B Clasificacin de la Correlacin
i Segn la relacin entre variables
ii Segn el nmero de variables
iii Segn el valor cuantitativo
C Coeficientes de Correlacin
i Coeficiente de Correlacin de Karl Pearson
ii Coeficiente de Correlacin por Rangos de Spearman
D Coeficiente de Determinacin
5.2 Anlisis de Regresin
A Principio de los Mnimos Cuadrados
i La Recta de los Mnimos Cuadrados
ii La Parbola de los Mnimos Cuadrados
iii Regresin Exponencial
iv Regresin Potencial
B Error Estndar de Estimacin
CAPTULO VI
SERIES CRONOLGICAS
6.1 Definicin
6.2 Movimientos o Componentes
A Tendencia Secular
B Movimientos Estacionales
C Movimientos Cclicos
146
147
153
154
155
159
160
163
164
165
166
185
192
195
204
211
216
223
227
228
233
7 234
235
236
240
246
251
258
262
REFERENCIAS BIBLIOGRFICAS
267
PRESENTACIN
La Estadstica es tan antigua como la humanidad y desde su origen ha tomado un carcter importante y
estratgico, aportando al desarrollo socio-econmico y poltico, por eso algunos estudiosos la llaman la
ciencia del Estado. Los historiadores afirman que las primeras formas de la Estadstica fueron los censos
de poblacin o bienes, organizados por el poder poltico con fines militares o fiscales. La Estadstica
hoy en da es considerada como una disciplina esencial en todos los campos del saber humano. Su
utilizacin es decisiva en la planeacin y programacin de las actividades de cualquier ndole, ayuda a
manejar informacin para resolver problemas, predecir o pronosticar hacia el futuro, y en definitiva, para
obtener conclusiones y tomar las decisiones ms adecuadas.
Conocedores que muchas personas por una u otra razn tienen cierto desinters a las asignaturas con base
matemtica como es la Estadstica, aun cuando estamos conscientes que los clculos matemticos
desempean un rol importante en nuestras vidas, se pone a disposicin del pblico la presente segunda
edicin con ejemplos ilustrativos que han sido cuidadosamente seleccionados y resueltos didcticamente
empleando un lenguaje matemtico sencillo de manera manual y recurriendo al uso de los programas de
fcil comprensin como son el Excel, el Graph y el GeoGebra. En cada captulo constan los resultados
de aprendizaje que se espera que los lectores sean capaces de alcanzar, los contenidos a tratar y las tareas
de interaprendizaje. Los contenidos y las tareas de interaprendizaje se han organizado de manera
secuencial e interrelacionadas entre s para afianzar y concatenar los resultados de aprendizaje que se van
logrando en el desarrollo de cada captulo del presente texto. En general, los lectores, dispondrn de los
elementos bsicos sobre esta fascinante disciplina, que les permitir aclarar juicios y ordenar ideas
orientadas al trabajo autnomo, reflexivo y creador durante el proceso de interaprendizaje de la misma.
Los contenidos y procesos didcticos de interaprendizaje de la presente obra ya fueron puestos en prctica
con las y los estudiantes en la primera edicin del mismo, obtenindose resultados ptimos, por lo que
estamos seguros que la presente segunda edicin tendr la acogida por parte de la comunidad acadmica
y seguir contribuyendo a mejorar significativamente la compresin de esta hermosa ciencia.
Seguros de que ninguna obra humana es perfecta, sern ustedes estimados lectores los que con sus
sugerencias nos seguirn ayudando a mejorar la presente propuesta.
Los Autores
EVALUACIN DIAGNSTICA
Lea cuidadosamente cada una de las siguientes interrogantes y conteste segn sus conocimientos previos,
no importa si se equivoca. La presente evaluacin puede ser resuelta de manera grupal o individual.
Siempre trabaje con disciplina, honradez y buena voluntad. Recuerde que el xito se refleja en nuestro
trabajo y hay que lograrlo, tarea tras tarea, y merecer ese logro. Los Autores
Segn la naturaleza de los siguientes enunciados, escriba en el parntesis la letra V si es verdadero o la
F si es falso. Si su respuesta es F escriba el por qu? de su respuesta.
1)
( )
2)
( )
3)
( )
4)
Los fines de la estadstica son conocer las caractersticas de los fenmenos, analizarlos y
predecir lo que suceder en el futuro.
( )
( )
Los mtodos de la Estadstica son recopilar, clasificar, tabular y presentar datos para la
toma de decisiones y solucin de problemas.
( )
( )
( )
La muestra es el conjunto de todos los elementos que tienen una caracterstica comn
( )
10) Las partes de una tabla o cuadro estadstico son: ttulo, conceptos o columna Matriz y
cuerpo del cuadro.
( )
5)
6)
7)
8)
9)
10
CAPTULO I
RESULTADOS DE APRENDIZAJE:
Describe con sus propias palabras conceptos bsicos de Estadstica y su aplicacin.
Recopila informacin estadstica utilizando encuestas.
Organiza, interpreta y presenta la informacin estadstica en tablas y grficos de manera manual y
empleando Excel.
CONTENIDOS:
Qu es la Estadstica?
Conceptos y Definiciones Bsicas.
Tablas o Cuadros Estadsticos.
Distribucin de Frecuencias.
Grficos Estadsticos.
11
1.1) QU ES LA ESTADSTICA?
A) HISTORIA
Establecer con absoluta claridad y precisin el proceso de desarrollo de esta ciencia que actualmente se
llama Estadstica, es una tarea difcil ya que la informacin que se dispone es fragmentada, parcial y
aislada.
Es seguro que desde la antigedad se realizaron inventarios de habitantes, bienes, productos, etc. Estos
inventarios o censos (palabra derivada del latn cencere que significa valuar o tasar) se realizaron con
fines catastrales, tributarios y militares.
En Egipto ya en el ao 3050 a. c se tiene noticias de estadsticas destinadas a fines semejantes a los
sealados y especialmente en la construccin de las pirmides.
En China en el ao 2000 a. c. se conocen estudios similares. El nacimiento de Cristo coincide con la
realizacin de un censo poblacional en gran escala en el Imperio Romano. Durante mucho tiempo se
entenda por estadstica la informacin relacionada con el gobierno, la palabra misma se deriva del
latn statisticus o estatus que significa del estado.
Ya en nuestra era, en el ao 727, los rabes realizaron estadsticas similares en lo que hoy es Espaa. En
Inglaterra en el ao 1083 y 1662 y el Alemania en 1741, se llevaron a cabo censos referentes a
defunciones, nacimientos, enfermedades, posesin de bienes, migraciones y otros problemas y los datos
obtenidos se utilizaron en la previsin y planificacin. En Amrica se realizaron encuestas mediante el
sistema de quipus.
El desarrollo cientfico de la estadstica comienza recin en el siglo XVII, con la introduccin en el
pensum de estudio de las universidades en Alemania.
A comienzos del siglo XX, una nueva aportacin de la escuela inglesa, preocupada por problemas de
ndole agropecuaria y biomtrica coloca a la estadstica en el tramo final de su establecimiento como
ciencia.
En general las primeras aplicaciones de la estadstica tuvieron que ver directamente con las actividades del
estado. Se cree que la primera persona que hizo uso de la palabra estadstica fue Godofredo Achenwall
(1719-1772), profesor y economista alemn, escribi sobre el descubrimiento de una nueva ciencia que
llam estadstica (palabra derivada de Staat que significa gobierno) y que defini como el conocimiento
profundo de la situacin respectiva y comparativa de cada estado.
B) DEFINICIN
Existen muchas definiciones de Estadstica, pero en sntesis la podemos definir como la ciencia rama de
la Matemtica que se ocupa de recolectar, organizar, presentar, analizar e interpretar informacin
cuantitativa para obtener conclusiones vlidas, solucionar problemas, predecir fenmenos y ayudar a una
toma de decisiones ms efectivas.
12
C) APLICACIONES
La Estadstica anteriormente slo se aplicaba a los asuntos del Estado, pero en la actualidad la utilizan
las compaas de seguros, empresarios, comerciantes, educadores, etc. No hay campo de la actividad
humana que no requiera del auxilio de esta ciencia, as por ejemplo:
- El educador mediante la estadstica podr conocer si un estudiante lee muy bien o regular, si la
asistencia es normal o irregular, si la estatura est en relacin con la edad, media aritmtica de
rendimiento escolar en un perodo determinado, etc.
- El hombre de negocios realiza encuestas estadsticas para determinar la reaccin de los consumidores
frente a los actuales productos de la empresa y en el lanzamiento de los nuevos.
- El economista emplea una amplia gama de estadsticas para estudiar los planes de los consumidores y
efectuar pronsticos sobre las tendencias de las actividades econmicas
- El gerente de una empresa elctrica proporciona un buen servicio a la comunidad mediante la variacin
estacional de las necesidades de carga
- El socilogo trata de auscultar la opinin pblica mediante encuestas, para determinar su preferencia
por un candidato presidencial, o su posicin frente a determinados problemas econmicos, polticos o
sociales
- El gelogo utiliza mtodos estadsticos para determinar las edades de las rocas
- El Genetista determina las semejanzas entre los resultados observados y esperados en una experiencia
gentica se determina estadsticamente
D) FINES
- Conocer las caractersticas de un grupo de casos de estudio.
- Comparar entre los resultados actuales y los obtenidos en experiencias pasadas para determinar las
causas que han influenciado en los cambios.
- Predecir lo que pude ocurrir en el futuro de un fenmeno.
E) OBJETIVOS
- Describir numricamente las caractersticas de los conjuntos de observaciones. Esta etapa consiste en
recopilar, organizar, tabular y presentar grficamente los datos, proporcionando una visin cuantitativa
de los fenmenos observados.
- Analizar los datos de manera objetiva con el fin de disponer de un concepto claro de universo o
poblacin y adoptar decisiones basadas en la informacin proporcionada por los datos de la muestra.
- Estimar o predecir lo que suceder en el futuro con un fenmeno de una manera relativamente
aceptable, as por ejemplo, podemos estimar cul ser la poblacin del pas dentro de un determinado
nmero de aos conociendo la actual.
Descripcin y Presentacin de la Informacin Estadstica
13
F) MTODOS
- Recopilacin.- Consiste en la obtencin de datos relacionados con el problema motivo de estudio,
utilizando instrumentos, tales como: cuestionarios, entrevistas, informes, memorias, etc.
- Organizacin.- Consiste en realizar una crtica, correccin, clasificacin y tabulacin de los datos
obtenidos en el paso anterior.
- Presentacin.- Consiste en mostrar datos de manera significativa y descriptiva. Los datos deben
colocarse en un orden lgico que revele rpida y fcilmente el mensaje que contienen. La presentacin
se la puede hacer a travs de grficos estadsticos.
- Anlisis.- Consiste en descomponer el fenmeno en partes y luego examinar cada una de ellas con el
objetivo de lograr una explicacin, haciendo uso, en su mayora, de los clculos matemticos.
- Interpretacin.- Consiste en un proceso mental, mediante el cual se encuentra un significado ms
amplio de los datos estadsticos con el objetivo de llegar a conclusiones para la toma de decisiones y
solucin de problemas.
G) CLASIFICACIN DE LA ESTADSTICA
i) Estadstica Descriptiva o Deductiva
Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal
que describa fcil y rpidamente las caractersticas esenciales de dichos datos mediante el empleo de
mtodos grficos, tabulares o numricos, as por ejemplo:
Supngase que un docente de Matemtica calcula la calificacin promedio de uno de sus cursos a su
cargo. Como solo se est describiendo el desempeo del curso pero no hace ninguna generalizacin
acerca de los diferentes cursos, en este caso el maestro est haciendo uso de la Estadstica Descriptiva.
ii) Estadstica Inferencial o Inductiva
Llamada tambin inferencia estadstica, la cual consiste en llegar a obtener conclusiones o
generalizaciones que sobrepasan los lmites de los conocimientos aportados por un conjunto de datos.
Busca obtener informacin sobre la poblacin basndose en el estudio de los datos de una muestra
tomada a partir de ella, as por ejemplo:
Supngase ahora que el docente de Matemtica utiliza el promedio de calificaciones obtenidas por uno
de sus cursos para estimar la calificacin promedio de los 5 cursos a su cargo. Como se est realizando
una generalizacin acerca los diferentes cursos, en este caso el maestro usa la Estadstica Inferencial.
1.2) CONCEPTOS Y DEFINICIONES BSICAS
A) POBLACIN
Llamado tambin universo o colectivo es el conjunto de todos los elementos que tienen una caracterstica
comn.
Una poblacin puede ser finita o infinita. Es poblacin finita cuando est delimitada y conocemos el
nmero que la integran, as por ejemplo: Estudiantes de la Universidad UTN. Es poblacin infinita
cuando a pesar de estar delimitada en el espacio, no se conoce el nmero de elementos que la integran,
as por ejemplo: Todos los profesionales universitarios que estn ejerciendo su carrera.
Descripcin y Presentacin de la Informacin Estadstica
14
B) MUESTRA
Es un subconjunto de la poblacin. Ejemplo: Estudiantes de 2do Semestre de la Universidad UTN.
Sus principales caractersticas son:
Representativa.- Se refiere a que todos y cada uno de los elementos de la poblacin tengan la misma
oportunidad de ser tomados en cuenta para formar dicha muestra.
Adecuada y vlida.- Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer
un mnimo de error posible respecto de la poblacin.
Para que una muestra sea fiable, es necesario que su tamao sea obtenido mediante procesos matemticos
que eliminen la incidencia del error.
Para calcular el tamao de la muestra suele utilizarse la siguiente frmula:
2 2
=
( 1) 2 + 2 2
Donde:
n = el tamao de la muestra.
N = tamao de la poblacin.
= Desviacin estndar de la poblacin que, generalmente cuando no se tiene su valor, suele utilizarse
un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se
lo toma en relacin al 95% de confianza equivale a 1,96 (como ms usual) o en relacin al 99% de
confianza equivale 2,58, valor que queda a criterio del encuestador.
e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un
valor que vara entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
960,4
960,4
=
= 277,74 = 278
2,4975 + 0,9604 3,4579
15
C) ELEMENTO O INDIVIDUO
Unidad mnima que compone una poblacin. El elemento puede ser una entidad simple (una persona) o
una entidad compleja (una familia), y se denomina unidad investigativa.
D) DATOS ESTADSTICOS
Son medidas, valores o caractersticas susceptibles de ser observados y contados. Como por ejemplo, la
edad de los estudiantes de la Universidad UTN.
Los datos estadsticos pueden ser clasificados en cualitativos (la diferencia entre ellos es de clase y no
de cantidad), cuantitativos (representan magnitudes), cronolgicos (difieren en instantes o perodos de
tiempo) y geogrficos (referidos a una localidad).
Los datos estadsticos se obtienen de fuentes primarias (obtenidos directamente sin intermediarios
valindose de observaciones, encuestas, entrevistas y sondeos de opinin) y fuentes secundarias
(obtenidos a travs de intermediarios valindose de textos, revistas, documentos, publicaciones de
prensa, y dems trabajos hechos por personas o entidades).
E) CENSO
Es una tcnica de recoleccin de datos estadsticos que se realiza a toda la poblacin
F) ENCUESTA
Es la tcnica que nos permite recolectar datos estadsticos que se realiza una muestra de la poblacin.
Se clasifica en:
- Descriptiva.- Cuando registra datos referentes a las caractersticas de los elementos o individuos.
- Explicativa.- Cuando averigua las causas o razones que originan los fenmenos.
- Mixtas.- Cuando es descriptiva y explicativa.
- Por muestreo.- Cuando recolecta informacin de grupos representativos de la poblacin.
16
Su estructura es:
- Nombre de la institucin que auspicia la encuesta.
- Tema de la encuesta.
- Objetivos de la encuesta.
- Datos informativos: Lugar, fecha, y otros datos que se considere necesario segn la naturaleza de la
informacin estadstica a encuestarse.
- Instrucciones para el encuestado para que sepa la forma de llenar la encuesta.
- Cuestionario o listado de preguntas (cerradas, abiertas, o ambas a la vez) sobre los diferentes aspectos
motivo de estudio.
- Frase de agradecimiento al encuestado, como por ejemplo, Gracias por su colaboracin!
( )
( )
Como es obvio, la respuesta ser forzosamente una de las alternativas planteadas: Las preguntas cerradas
son fciles de tabular y facilitan la cuantificacin mediante la asignacin de puntuaciones.
- Preguntas de eleccin mltiple o categorizada: Se trata en cierto modo de preguntas cerradas que,
dentro de los extremos de una escala permiten una serie de alternativas de respuestas cuyos matices son
fijados de antemano. Presentan dos formas: En abanico y de estimacin
- Preguntas con respuesta en abanico: Estas preguntas permiten contestar sealando una o varias
respuestas presentadas junto con la pregunta. Por ejemplo: Indique otras alternativas que considere
importantes para mejorar la educacin en nuestro pas.
- Preguntas de Estimacin: Son preguntas cuantitativas que introducen diversos grados de intensidad
creciente o decreciente para un mismo tem. Ejemplos:
-Cmo calificara la poltica educativa del gobierno actual?
Excelente ( )
Muy Buena ( )
Regular ( )
Deficiente ( )
-En qu porcentaje est de acuerdo con la poltica educativa del gobierno actual?
100% ( )
75% ( )
50% ( )
25% ( )
0% ( )
17
Poco ( )
Algo ( )
Mucho ( )
Probablemente S ( )
No ( )
An no decido ( )
G) VARIABLE
Son caracteres susceptibles a cambio y pueden tener diferentes valores en cada elemento o individuo.
i) Clasificacin
- Variable Cualitativa
Son atributos que se expresan mediante palabras no numricas. Como por ejemplo, profesin, religin,
marca de automvil, estado civil, sexo, raza, etc.
- Variable Cuantitativa
Es toda magnitud representada por nmeros. Como por ejemplo, peso, estatura, nmero de habitantes,
etc.
- Variable Discreta
Es una caracterstica cuantitativa representada por nmeros enteros o exactos, que generalmente resultan
del proceso de conteo, como por ejemplo: nmero de estudiantes de la promocin del ao anterior.
- Variable Continua
Es una caracterstica cuantitativa que puede tomar cualquier valor representado por un nmero racional,
que generalmente resultan del proceso de medicin, como por ejemplo, tiempo destinado a estudiar
Estadstica
- Nivel Nominal
Cuando los datos slo pueden contarse y clasificados en categoras, no existe un orden especfico entre
las clases. Como por ejemplo, se cuentan cuntos hombres y cuntas mujeres asisten a determinado
evento.
18
- Nivel Ordinal
Cuando se ordenan los datos por jerarquas, una categora es mayor que otra. Como por ejemplo,
excelente es mejor que bueno o bueno es mejor que regular. Otro ejemplo: Una persona puede tener
mucho o poco dinero.
- Nivel de Intervalos
Cuando se incluye todas las caractersticas del nivel ordinal, pero la diferencia entre los valores tiene un
significado medido en unidades iguales que son comunes y constantes, que permiten asignar nmeros
reales a todos los miembros de la clase ordenada, facilitando el establecimiento de diferencias en grados
de propiedad y entre objetos sobre la base de una medida. Como por ejemplo: La diferencia entre 70
kilogramos y 60 kilogramos, es de 10 kilogramos. Otro ejemplo: Si la temperatura de hoy es de 20 grados
centgrados y la de ayer fue de 25 grados centgrados, se sabe que la de hoy es 5 grados centgrados ms
baja que la de ayer.
TAREA DE INTERAPRENDIZAJE N 1
1) Realice un organizador grfico (cuadro sinptico, mapa conceptual, mentefacto, etc.) sobre la
historia de la Estadstica.
2) Etimolgicamente resuma qu significa la Estadstica
3) Defina con sus propias palabras lo que entiende por Estadstica.
4) Proponga 3 aplicaciones de la Estadstica en su vida cotidiana.
5) Realice un organizador grfico sobre los fines de la Estadstica.
6) Realice un organizador grfico sobre los objetivos de la Estadstica.
7) Realice un organizador grfico sobre los mtodos de la Estadstica.
8) Defina con sus propias palabras lo que entiende por Estadstica Descriptiva y Estadstica Inferencial.
Ilustre con un ejemplo cada definicin.
9) Proponga 3 ejemplos de poblacin, muestra y elemento.
10) Calcule el tamao de la muestra para una poblacin de 5000 con un error de muestreo del 5% y nivel
de confianza del 95%. Realice los clculos de manera manual y empleando Excel.
357
11) Consulte en la biblioteca o en el internet sobre los tipos de muestreo. Presente la consulta en un
organizador grfico.
Descripcin y Presentacin de la Informacin Estadstica
19
( )
15.2)
( )
15.3)
( )
15.4)
( )
15.5)
( )
15.6)
Dimetro de un cojn.
( )
15.7)
( )
15.8)
( )
15.9)
( )
( )
D, D, C, C, D, C, D, C, D, C
16) Segn el nivel de medicin de las variables, escriba en el parntesis la letra N si es Nominal, La O si
es Ordinal, la I si es de Intervalos o la R si es de Razn. Escriba el por qu? de su respuesta.
16.1)
( )
16.2)
( )
16.3)
( )
16.4)
Un sistema para medir las preferencias de los clientes respecto a los vehculos con base
en su estilo.
( )
16.5)
( )
16.6)
Un sistema para evaluar a los empleados con base en el nmero de das que faltan al
trabajo.
( )
16.7)
( )
16.8)
( )
20
16.9)
( )
( )
( )
( )
( )
( )
( )
( )
( )
16.18) Nmero de trabajos terminados, en el ltimo ao, de los empleados de una fbrica.
( )
( )
( )
O, R, N, N, N, O, I, O, O, N, I, N, O, I, I, N, N, O, N, R
17) Proponga 3 ejemplos de cada una de los tipos de variables y 3 ejemplos de cada uno de los niveles
de medicin.
21
- Nota de Encabezado.- Sirven para clarificar partes del cuadro que no han sido incluidas en el ttulo. Se
ubica despus del ttulo entre parntesis. No siempre est presente en un cuadro.
- Nota de Pie.- Sirven para clarificar algunas partes del cuadro que no son explicadas en ninguna parte.
Se ubica despus de la fuente. No siempre est presente en un cuadro.
(en miles)
Columna matriz
TIPO DE INSTITUCIN
Universidades
Escuelas Politcnicas
Institutos Tecnolgicos
Institutos Militares
Encabezados
Hombres
2010
Mujeres
TOTAL
.
.
.
.
2011
Hombres Mujeres TOTAL
Conceptos
Cuerpo
22
TAREA DE INTERAPRENDIZAJE N 2
1) Elabore un cuadro sobre cualquier informacin de su preferencia e identifique sus partes.
2) El Colegio D & M en el ao lectivo 2010-2011 tiene 800 alumnos y para su funcionamiento dispone
del siguiente personal por estamento: directivo: un rector y un vicerrector; de control: un inspector
general y 3 inspectores; docente: 80 maestros; psiclogos: 2; de administracin: 4, y mantenimiento: 10.
Llene la siguiente tabla o cuadro:
Cuadro N 1
PERSONAL DEL COLEGIO D & M POR ESTAMENTO Y ALUMNOS POR CADA UNO EN
EL AO LECTIVO 2010-2011
Estamento N de personas Alumnos por cada uno
Directivo
2
400
Totales
Fuente: Departamento Administrativo del Colegio D & M
3) Investigue el consumo de energa elctrica de su domicilio durante cada uno de los 6 ltimos meses.
Elabore un cuadro o tabla con los datos investigados, calculando el porcentaje de consumo de cada mes
sobre el total.
4) Investigue sobre cualquier tema de su inters y elabore una tabla.
- Frecuencia Absoluta ()
Es el nmero de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre
al total de datos observados.
- Frecuencia Relativa ()
Indica la proporcin con que se repite un valor. Es el cociente entre la frecuencia absoluta y el nmero
total de datos. La suma de las frecuencias relativas es siempre 1
23
- Frecuencia Acumulada ()
Indica el nmero de valores que son menores o iguales que el valor dado. Al sumar las frecuencias
absolutas desde el menor puntaje hacia arriba tenemos la frecuencia acumulada, es decir, es la suma de
la frecuencia absoluta primera con la segunda, este valor con la tercera, y as sucesivamente.
Ejemplo ilustrativo:
Calcular las diferentes frecuencias de las siguientes calificaciones evaluadas sobre 10 obtenidas de 40
estudiantes en la asignatura de Estadstica sin agrupar en clases:
10
6
6
8
8
8
7
5
10
10
9
10
6
9
7
8
9
8
7
8
7
8
10
6
5
8
8
5
7
9
9
10
9
7
8
10
8
9
6
5
Solucin:
El ejercicio resuelto se muestra en la tabla:
Calificacin
5
6
7
8
9
10
Total
4
5
6
11
7
7
40
4/40 = 0,1
5/40 = 0,125
6/40 = 0,15
11/40 = 0,275
7/40 = 0,175
7/40 = 0,175
1
4
4+5 = 9
9+6 = 15
15+ 11 = 26
26+7 = 33
33+7 = 40
%
0,1100 =10
0,125100 = 12,5
0,15100 = 15
0,275100 = 27,5
0,175100 = 17,5
0,175100 = 17,5
100
0,1
0,1+0,125 = 0,225
0,225+0,15 = 0,375
0,375+0,275 = 0,65
0,65+0,175 = 0,825
0,825+0,175 = 1
%
0,1100 =10
0,225100 = 22,5
0,375100 = 37,5
0,65100 = 65
0,825100 = 82,5
1100 = 100
24
b) Pulse en Aceptar para que se abra el cuadro de Argumentos de la funcin. Coloque el cursor en el
recuadro Rango y arrastre el ratn por la hoja seleccionando el rango A1:H5
25
c) Dentro del recuadro Rango, seleccione A1:H5 y pulse la tecla F4 con la finalidad de que el rango
permanezca fijo.
26
f) Para calcular las frecuencias absolutas de las otras calificaciones, pulse la esquina inferior derecha de
la celda B8, hasta que aparezca una cruz, luego arrastre el curso hacia abajo.
27
Cuando el valor de no es exacto, se debe redondear al valor superior ms cercano. Esto altera el valor
de rango por lo que es necesario efectuar un ajuste as:
=
28
Por ejemplo:
Si una distribucin de 40 datos el valor mayor es 41 y el menor es 20 se tiene:
6
Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene:
= = 6 4 = 24
El exceso de 3 que se tiene en este caso se distribuye entre y . Por lo general se agrega al mayor
y se quita al menor. Como por ejemplo, se podra agregar 2 al valor mayor y quitar 1 al valor menor,
obtenindose los siguientes nuevos valores:
= 41 + 2 = 43
= 20 1 = 19
O tambin se podra agregar 1 al valor mayor y quitar 2 al valor menor, obtenindose los siguientes
nuevos valores:
= 41 + 1 = 42
= 20 2 = 18
- Forme los Intervalos de Clase agregando al lmite inferior de cada clase, comenzando por el
del rango.
- Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
- Calcule la Marca de Clase ( ).- Es el valor medio de cada clase, se obtiene sumando los lmites
superior ( ) e inferior ( ) del intervalo y dividiendo sta suma entre 2
=
+
2
30
35
35
50
50
47
45
56
65
47
60
52
48
35
58
32
48
30
56
55
35
58
55
47
39
40
60
49
37
58
50
38
39
56
45
29
Solucin:
1) Calculando el Rango se obtiene:
= = 65 30 = 35
2) Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 40 = 6,32 = 6
3) Calculando el ancho se obtiene:
35
= =
= 5,83
6
Redondeando se obtiene: i = 6, por lo que es necesario realizar un ajuste al rango.
30
6) Realizando el conteo de datos que cae dentro de cada clase, calculando la marca de clase y las
frecuencias se obtiene:
Clases
30-35
36-41
42-47
48-53
54-59
60-65
Total
8
6
5
7
11
3
40
(30+35)/2 = 32,5
(36+41)/2 = 38,5
(42+47)/2 = 44,5
(48+53)/2 = 50,5
(54+59)/2 = 56,5
(60+65)/2 = 62,5
0,2
0,15
0,125
0,175
0,275
0,075
1
%
8
14
19
26
37
40
20
15
12,5
17,5
27,5
7,5
100
%
0,2
0,35
0,475
0,65
0,925
1
20
35
47,5
65
92,5
100
Para realizar los clculos de la frecuencia absoluta empleando Excel se procede de la siguiente manera:
a) Digite los datos, las clases y lmites superiores de las clases.
31
c) Insertar funcin. En Seleccionar una categora, elija Estadsticas. En Seleccionar una funcin, elija
FRECUENCIA
32
d) Clic en Aceptar para que aparezca la ventana Argumentos de funcin. En la casilla datos, seleccionar
los datos desde A1:H5, y en la casilla Grupos, seleccionar los datos desde B8:B13.
e) Presione CTRL+SHIFT+ENTER
33
f) Los clculos de la marca de clase y de las frecuencias empleando Excel se muestran en la siguiente
figura:
TAREA DE INTERAPRENDIZAJE N 3
1) Defina con sus propias palabras lo que entiende por distribucin de frecuencias.
2) Realice un organizador grfico sobre los tipos de frecuencias
3) Dadas las siguientes calificaciones evaluadas sobre 10 obtenidas de 40 estudiantes en la asignatura de
Estadstica:
9
7
8
7
6
9
7
8
8
9
7
8
8
9
8
7
7
10
6
9
9
9
6
8
6
5
10
5
5
10
9
8
5
5
8
8
7
8
9
7
3.1) Terminar de llenar de manera manual la siguiente tabla:
Calificacin
5
0,125
4
7
11
12,5
0,225
20
28
0,225
3
40
12,5
0,2
9
Total
0,7
42,5
70
100
22,5
40
100
34
5) Consulte sobre biografa de Herberth Arthur Sturges y elabore un organizador grfico de la misma.
6) A 40 docentes que laboran en la Universidad UTN se les pregunt su edad, obtenindose los siguientes
resultados:
32
50
52
40
45
38
58
58
54
44
48
38
49
55
58
48
42
55
46
38
54
44
47
43
48
40
57
55
46
57
47
46
48
54
57
48
51
59
54
55
6.1) Calcule el rango, nmero de intervalos y el ancho de la clase de manera manual y empleando Excel.
= 27; = 6; = 5
6.2) Calcule el nuevo rango
30
6.3) Calcule los nuevos y
61 y 31 60 y 30
6.4) Forme los intervalos de clase comenzando por = 31. Luego realice el conteo de datos que cae
dentro de cada clase de manera manual y empleando Excel, indicando cada uno los procesos seguidos.
Clases
31-35
36-40
41-45
46-50
51-55
56-60
Total
1
5
5
12
10
7
40
6.5) Calcule la marca de clase y las dems frecuencias de manera manual y empleando Excel, indicando
cada uno los procesos seguidos.
Clases
31-35
36-40
41-45
46-50
51-55
56-60
Total
1
5
5
12
10
7
40
33
38
43
48
53
58
0,025
0,125
0,125
0,300
0,250
0,175
1
1
6
11
23
33
40
2,5
12,5
12,5
30,0
25,0
17,5
100
0,025
0,150
0,275
0,575
0,825
1
2,50
15,0
27,5
57,5
82,5
100
35
A) DIAGRAMAS DE BARRAS
Es un grfico bidimensional en el que los objetos grficos elementales son rectngulos de igual base cuya
altura sea proporcional a sus frecuencias. Si en el eje horizontal se ubican las etiquetas con los nombres
de las categoras, y en el eje vertical la frecuencia absoluta, la relativa o la frecuencia porcentual, toma
el nombre de diagrama de barras vertical, y si se intercambian las ubicaciones de las categoras y las
frecuencias, toma el nombre de diagrama de barras horizontal.
Ejemplo ilustrativo:
Empleando los datos de la siguiente tabla sobre las siguientes calificaciones obtenidas en una evaluacin
por 40 estudiantes en la asignatura de Estadstica:
Calificacin
5
4
6
5
7
6
8
11
9
7
10
7
Total
40
1) Elaborar un diagrama de barras verticales en 2 dimensiones (2D) y 3 dimensiones (3D).
2) Elaborar un diagrama de barras horizontales en 2 dimensiones (2D) y 3 dimensiones (3D).
36
Solucin:
En Excel se elabora de la siguiente manera:
1) Barras verticales
a) Seleccionar las celdas B2:B7 y luego clic en Insertar Columna en 2-D.
37
d) En Etiquetas de eje horizontal (categora) seleccionar Editar para que aparezca la ventana Rtulos del
eje. En rango de rtulos del eje seleccionar A2:A7. Clic en Aceptar
38
e) Clic en Aceptar
39
g) Borrar Series 1. En ttulo del grfico escribir Calificaciones en Estadstica. En ttulo del eje vertical
escribir frecuencia absoluta. En ttulo del eje horizontal escribir calificacin.
40
41
k) Clic en Relleno.
42
43
44
2) Barras horizontales
Utilizando el grfico de barras verticales en 2D
a) Clic en Barra
45
c) A partir del grfico anterior, para elaborar el diagrama de barras horizontales en 3D, hacer clic en
Barras. Escoger la primera opcin de Barra en 3-D
46
B) HISTOGRAMAS
Se utiliza para datos agrupados en intervalos de clase, representando en el eje horizontal los intervalos
de clase o la marca de clase, y en el eje vertical se elabora rectngulos contiguos de base el ancho del
intervalo y de altura proporcional a las frecuencias representadas.
Ejemplo ilustrativo
A 40 docentes que laboran en la Universidad UTN se les pregunt su edad, obtenindose los siguientes
resultados:
Clases % %
31-35
36-40
41-45
46-50
51-55
56-60
Total
1
5
5
12
10
7
40
33
38
43
48
53
58
0,025
0,125
0,125
0,300
0,250
0,175
1
1
6
11
23
33
40
2,5
12,5
12,5
30,0
25,0
17,5
100
0,025
0,150
0,275
0,575
0,825
1
2,50
15,0
27,5
57,5
82,5
100
Solucin:
En Excel se realiza de la siguiente manera:
1) Histograma para
a) Seleccionar B2:B7. Insertar Columna. En diseos de grfico seleccionar Diseo 8.
47
b) Clic en Seleccionar datos para que aparezca la venta Seleccionar origen de datos. En Etiquetas de eje
horizontal (categora) seleccionar Editar para que aparezca la ventana Rtulos del eje. En rango de rtulos
del eje seleccionar A2:A7. Clic en Aceptar.
c) Clic en Aceptar
48
d) Escribir Edad de Docentes de la Universidad UTN en ttulo del grfico, Clases o Intervalos en Ttulo
del eje horizontal y f en Ttulo del eje vertical.
49
50
i) Seleccionar Imagen
51
k) Clic en Insertar
52
2) Histograma para f%
Utilizando el grfico anterior, calcular f%. Borrar la columna de fa y escribir la columna de f%. En eje
vertical escribir f%.
Cambiando de color
53
C) POLGONO DE FRECUENCIAS
Son grficos lineales que se realizan uniendo:
- Los puntos medios de las bases superiores de los rectngulos en un diagrama de barras.
54
55
c) Clic en Seleccionar datos para que aparezca la ventana Seleccionar origen de datos. En entradas de
leyenda (Series), clic en Editar, luego en nombre de serie escribir Calificaciones y clic en Aceptar. En
Etiquetas de eje horizontal (categora), clic en Editar, luego en rango de rtulos de eje seleccionar A2:A7
y clic en Aceptar.
56
d) Clic en Aceptar
57
f) Borrar Serie 1. En ttulo del grfico escribir Calificaciones en Estadstica. En ttulo del eje vertical
escribir frecuencia absoluta. Clic derecho en el grfico y luego agregar etiqueta de datos.
g) Para elaborar un polgono de frecuencias en tres dimensiones (3D), empleando el grfico anterior
hacer clic en Lnea.
58
h) Clic Lneas 3D
i) Polgono de Frecuencias Acumuladas u Ojiva.- Un grfico que recoja las frecuencias acumuladas
por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera se llama un
polgono de frecuencias acumuladas u ojiva.
Empleando polgono de frecuencias en 2D anterior, borrando la columna de la frecuencia absoluta y
escribiendo la columna de la frecuencia acumulada del ejemplo del clculo de las frecuencias sobre las
siguientes calificaciones obtenidas por 40 estudiantes en una evaluacin de la asignatura de Estadstica
se obtiene la siguiente figura que representa a una Ojiva:
59
A partir del grfico anterior, haciendo clic en Lnea y luego en Lneas 3D se obtiene una Ojiva en 3D
como muestra la siguiente figura:
ii) Polgono de Frecuencias Relativas Acumuladas Porcentuales.- Si se usan frecuencias fra% para
realizar un polgono de frecuencias, este recibe el nombre de polgono de frecuencias relativas
acumuladas porcentuales, o tambin llamado ojiva de porcentajes.
A continuacin se presenta una ojiva de porcentajes elaborada en Excel empleando los datos del ejemplo
de la Edad de 40 Docentes de la Universidad UTN:
60
Ejemplo ilustrativo:
A 40 estudiantes se les pidi que estimen el nmero de horas que habran dedicado a estudiar la semana
pasada (tanto en clase como fuera de ella), obtenindose los siguientes resultados:
30
36
47
50
58
30
37
47
52
58
32
38
47
54
58
32
39
48
55
58
35
39
48
55
58
35
40
49
56
60
35
45
50
56
60
35
45
50
56
65
61
Solucin:
A fin de elaborar el diagrama de tallo y hojas se ordena los datos con los dgitos iniciales de cada uno,
las decenas (tallos) a la izquierda de una lnea vertical, y a la derecha de esa recta el ltimo dgito de cada
dato, en este caso la unidad, conforme recorren los datos en el orden en que fueron anotados.
3
4
5
6
0022555567899
055777889
000245566688888
005
Interpretaciones: Hay 13 estudiantes que dedican entre 30 y 39 horas semanales a estudiar, 9 estudiantes
que dedican entre 40 y 49 horas semanales a estudiar, 15 estudiantes que dedican entre 50 y 59 horas
semanales a estudiar y existen 3 estudiantes que se dedican entre 60 y 65 horas semanales a estudiar.
En GeoGebra se elabora de la siguiente manera:
a) En Entrada se escribe las primeras letras de diagrama
62
c) Enter
63
64
65
E) DIAGRAMA DE SECTORES
Llamado tambin diagrama circular o de pastel. Es un grfico en el que a cada valor o modalidad se
asigna un sector circular de rea proporcional a la frecuencia que representan.
Ejemplo ilustrativo: Con los datos de la siguiente tabla sobre las calificaciones obtenidas por 40
estudiantes en una evaluacin de Estadstica, presentar la informacin a travs de un diagrama de
sectores:
Calificacin
5
4
6
5
7
6
8
11
9
7
10
7
Total
40
Solucin:
a) Se calcula la frecuencia relativa y el nmero de grados que representa cada calificacin. El nmero de
grados se calcula multiplicando la frecuencia relativa con 3600, as:
= 3600
66
Calificacin
5
6
7
8
9
10
Total
4
5
6
11
7
7
40
Grados
0,100
36
0,125
45
0,150
54
0,275
99
0,175
63
0,175
63
1
360
b) Se dibuja una circunferencia tomando para cada calificacin tantos grados como indica la tabla anterior
como se muestra en la siguiente figura:
67
68
d) Clic en Seleccionar datos para que aparezca la ventana Seleccionar origen de datos. En Etiquetas de
eje horizontal (categora), clic en Editar, luego en rango de rtulos de eje seleccionar A2:A7 y clic en
Aceptar. En ttulo del grfico escribir Calificaciones en Estadstica.
69
F) PICTOGRAMAS
Son dibujos, figuras o signos llamativos alusivos al carcter que se est estudiando cuyo tamao es
proporcional a la frecuencia que representa los datos.
Ejemplo ilustrativo: Un equipo de ftbol en su trayectoria tiene 120 partidos ganados, 60 perdidos y 30
empatados. Al representar estos datos mediante pictogramas se obtiene:
Partidos Ganados
120
Partidos Perdidos
60
Partidos Empatados
30
Otra forma de representar los datos mediante pictogramas se muestra en la siguiente figura:
Partidos Ganados
Partidos Perdidos
Partidos Empatados
120
60
30
TAREA DE INTERAPRENDIZAJE N 4
1) Presentar la informacin obtenida en la encuesta de la tarea de interaprendizaje N 1 mediante tablas
y grficos estadsticos. Una tabla y un grfico (de su preferencia) por cada pregunta.
2) Las calificaciones obtenidas por 40 estudiantes en una evaluacin de Matemtica son:
4
8
4
10
10
6
8
7
5
4
6
7
9
10
3
8
7
7
6
3
10
9
9
8
3
10
8
10
4
8
6
4
8
5
7
8
8
9
7
8
2.1) Elaborar un diagrama de barras verticales en 2D con la frecuencia absoluta de manera manual y
empleando Excel.
70
2.2) Elaborar un diagrama de barras verticales en 3D con la frecuencia relativa empleando Excel.
2.3) Elaborar un diagrama de barras horizontales en 3D con la frecuencia porcentual empleando Excel.
2.4) Elaborar un poligono de frecuencias en 2D con la frecuencia relativa acumulada de manera manual
y empleando Excel.
71
4) Elaborar un diagrama de sectores en 2D y 3D con las edades de 10 familiares suyos empleando Excel.
5) En una encuesta efectuada a los estudiantes de Segundo Semestre de la Universidad UTN sobre la
edad de sus padres, se obtuvieron los siguientes resultados:
40
45
56
60
62
48
56
52
54
44
43
58
49
54
46
57
40
45
56
48
44
48
57
53
48
50
47
45
56
47
47
56
58
44
47
58
41
59
55
60
Clases
39-42
43-46
47-50
51-54
55-58
59-62
0,075
7,5
44,5
0,275
10
21
25
0,1
11
40
0,625
62,5
100
56,5
0,1
1
40
10
100
72
5.2) Elaborar un histograma para la frecuencia absoluta de manera manual y empleando Excel, ubicando
la clases en el eje horizontal del grfico.
5.3) Elaborar un histograma para la fra% de manera manual y empleando Excel, ubicando las marcas de
clase en el eje horizontal del grfico.
5.4) Elaborar un diagrama de sectores en 2D para la frecuencia absoluta de manera manual y empleando
Excel.
50%
20%
Calcule la cantidad de extracto de naranja que se necesita para preparar 10 litros de bebida
2 litros
7) Cree y resuelva un ejercicio similar al anterior
73
8) Una empresa reporta sus prdidas y ganancias desde 2008 hasta el 2013, mostrando el siguiente
comportamiento, segn el grfico. Los dos aos consecutivos donde se da el mayor cambio de ingresos
totales son
4
3
2
1
0
2008
2009
2010
2011
2012
2013
-1
-2
-3
Aos
74
CAPTULO II
RESULTADOS DE APRENDIZAJE:
Interpreta las caractersticas y propiedades de las medidas de tendencia central, y comprende sus
aplicaciones.
Emplea algoritmos matemticos para calcular medidas de tendencia central de manera manual y
empleando Excel.
Realiza diagramas de caja y bigotes de manera manual y empleando GeoGebra.
Crea y resuelve ejercicios de aplicacin sobre las medidas de tendencia central de forma manual y
empleando Excel.
CONTENIDOS:
Media Aritmtica
Media Geomtrica
Media Armnica
La Mediana
Medidas de Posicin: Cuartiles, Deciles y Percentiles
Moda
Las medidas de tendencia central son medidas representativas que tienden a ubicarse hacia el centro del
conjunto de datos, es decir, una medida de tendencia central identifica el valor del dato central alrededor
de cual se centran los dems datos, siendo la media aritmtica una de aquellas medidas.
La medida aritmtica, al igual que cualquier otra medida de datos estadsticos, cuando se calcula a nivel
de toda la poblacin, se denominan parmetro, como por ejemplo, la calificacin promedio en el examen
de admisin de todos los estudiantes que ingresan a la Universidad UTN al primer semestre del presente
ao lectivo. Pero si se calcula basada en muestras, se denomina estadgrafo o estadstico, como por
ejemplo, la calificacin promedio en el examen de admisin de estudiantes de colegios fiscales que
ingresan a la Universidad UTN al primer semestre del presente ao lectivo.
1 + 2 + 3 + +
=
La media de una muestra es un estadstico (que se lee x barra). Con n observaciones en el conjunto
de datos de la muestra (1 , 2 , ), la media se determina as:
=
1 + 2 + 3 + +
=
b) Para Datos Agrupados en Tablas de Frecuencias.- Cuando una serie se la agrupa en serie simple
con frecuencias para obtener la media aritmtica, se multiplica la variable por la frecuencia respectiva
(f), luego se obtiene la suma de todos estos productos y luego a este valor se lo divide para el nmero de
elementos (n). Todo esto puede representarse mediante una frmula matemtica, as:
=
1 1 + 2 2 + 3 3 + +
=
=
1 + 2 + 3 +
1 1 + 2 2 + 3 3 +
=
=
1 + 2 + 3 +
Ejemplo ilustrativo
76
Medidas de Tendencia Central
Calcular la media aritmtica de las siguientes calificaciones de Estadstica tomadas de una muestra de
20, sin agrupar, agrupando en tablas de frecuencias y agrupando en intervalos.
4, 8, 10, 10, 5, 10, 9, 8, 6, 8, 10, 8, 5, 7, 4, 4, 8, 8, 6 y 6
Solucin:
1) Sin agrupar
4 + 8 + 10 + 10 + 5 + 10 + 9 + 8 + 6 + 8 + 10 + 8 + 5 + 7 + 4 + 4 + 8 + 8 + 6 + 6
=
20
144
=
= 7,2
20
=
c) Enter
77
Medidas de Tendencia Central
4
5
6
7
8
9
10
Total
3
2
3
1
6
1
4
20
3 4 + 2 5 + 3 6 + 1 7 + 6 8 + 1 9 + 4 10 144
=
=
= 7,2
3+2+3+1+6+1+4
20
=
En Excel
a) Se calcula la frecuencia absoluta. Luego se inserta la funcin SUMAPRODUCTO como se muestra
en la siguiente figura:
b) Enter
78
Medidas de Tendencia Central
3) Agrupando en intervalos
Intervalos
4- 5
6 -7
8- 9
10-11
5
4
7
4
4,5
6,5
8,5
10,5
En Excel
Se calcula el valor mximo( Xmx ),el valor mnimo( Xmn ),el Rango( R), el nmero de intervalos (ni ), el
ancho de los intervalos() , la marca del clase(), la frecuencia absoluta() y el nmero total de datos
() . Luego se inserta la funcin: SUMAPRODUCTO como se muestra en la siguiente figura:
79
Medidas de Tendencia Central
4 5
6 7
8 9
10 11
5
4
7
4
4,5
6,5
8,5
10,5
Suma
( )
5(4,5-7,5) = -15
4(6,5-7,5) = -4
7(8,5-7,5) = 7
4(10,5-7,5) =12
0
80
Medidas de Tendencia Central
1 1 + 2 2 + 3 3 +
=
1 + 2 + 3 +
Ejemplo ilustrativo: Se tiene una informacin acerca de las utilidades por pan y cantidades vendidas de
panes de tres tiendas. Calcular la media aritmtica promedio de la utilidad por pan.
Tienda Utilidad/pan Cantidad vendida
1
1
2000
2
0,8
1800
3
0,9
2100
Solucin:
1 1 + 2 2 + 3 3 +
=
=
1 + 2 + 3 +
En Excel:
Se inserta la funcin SUMAPRODUCTO como se muestra en la siguiente figura:
TAREA DE INTERAPRENDIZAJE N 5
1) Defina con sus propias palabras lo que entiende por medidas de tendencia central
2) Cul es la diferencia entre parmetro y estadgrafo?. Mediante un ejemplo ilustre su respuesta.
3) Qu entiende por media aritmtica simple?
Medidas de Tendencia Central
81
8) Calcule la media aritmtica de las siguientes calificaciones de Matemtica tomadas de una muestra en
forma manual y empleando Excel.
10
8
9
7
6
3
7
10
6
5
4
8
8
3
4
8
9
5
8
3
8
9
10
5
9
8
4
8
10
10
9
8
6
10
7
3
8.1) Sin agrupar.
7,0833
8.2) Agrupando en frecuencias.
7,0833
8.3) Agrupando en intervalos de ancho 2.
7
9) Compruebe la propiedad principal de la media aritmtica con los datos del ejercicio anterior agrupados
en intervalos de manera manual y empleando Excel.
10) Presente los datos del ejercicio 8 en un diagrama de barras verticales e histograma en 3D elaborados
empleando Excel.
82
Medidas de Tendencia Central
11) Cree y resuelva un ejercicio similar al N 8 con datos de cualquier tema de su inters.
12) Para construir un edificio se contrataron 30 obreros con un sueldo mensual de $ 300 cada uno. Calcule
el sueldo promedio.
$ 300
13) En una investigacin sobre la poblacin en 4 barrios de la ciudad de Ibarra, se encontr que el nmero
de habitantes es: 2000, 3000, 4500, 5000. Se supone que en 10 aos la poblacin se duplicar. Calcule la
poblacin promedio dentro de 10 aos.
7250 habitantes
14) Cuatro personas ganan mensualmente: $400, $300, $500, $700. Calcule el salario promedio si a cada
uno le aumentan $80.
$555
15) Un grupo de estudiantes obtuvieron las siguientes calificaciones evaluadas sobre 10 como se indica
en la siguiente tabla:
Asignatura
Calificacin
Matemtica 7
8
6
6
5
10
Estadstica
8
9
6
4
10
8
Ingls
9 10
8
8
7
6
Calcule la calificacin promedio del grupo
7,5
16) Un estudiante en la asignatura de Estadstica tiene las siguientes calificaciones: 8, 6 y 8. Cunto
debe obtener en el cuarto aporte para que su promedio exacto sea 8?
10
17) A un estudiante le han realizado 5 evaluaciones en Estadstica y su media aritmtica es 8. Si en
otras dos evaluaciones obtiene 7 y 9, calcular la nueva media aritmtica.
8
18) Los aportes de un estudiante en la asignatura de Matemtica son: el primer aporte es el doble del
segundo, y ste es cuatro unidades menos que el tercer aporte, y el cuarto aporte es 2 unidades ms que
el tercer aporte. Si el promedio exacto es 5, cules fueron los aportes?
1 = 4, 2 = 2, 3 = 6 4 = 8
19) Cree y resuelva un ejercicio similar anterior.
20) Si el examen final de Estadstica cuenta tres veces ms que una evaluacin parcial, y un estudiante
tiene 8 en el examen final, 7 y 9 en las dos parciales. Calcule la calificacin media en forma manual y
empleando Excel.
8
21) Crear un ejercicio de aplicacin sobre la media aritmtica ponderada y resulvalo forma manual y
empleando Excel.
22) Consulte en la biblioteca o en el internet sobre las propiedades de la media aritmtica. Presente la
consulta a travs de un organizador grfico
83
Medidas de Tendencia Central
Ejemplo ilustrativo N 1
La media geomtrica es til en el clculo de tasas de crecimiento; por ejemplo, si el crecimiento de las
ventas en un pequeo negocio son 3%, 4%,8%,9% y 10%, hallar la media de crecimiento.
Solucin:
= 1 2 3
5
= 3 4 8 9 10 = 6,128
Respuesta: 6,128%
O utilizando logaritmos:
log 1 + log 2 + log 3 + log
=
84
85
Medidas de Tendencia Central
c) Pulsar en Aceptar.
Ejemplo ilustrativo N 2
Calcular la tasa de crecimiento promedio a la que ha variado las ventas de cierto producto con base a la
siguiente tabla:
Mes
Enero Febrero Marzo Abril Mayo Junio
Ventas 500
550
600
700
800
850
Solucin:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los obtenidos el
mes anterior.
Mes
Ventas Porcentaje del
mes anterior
Enero
500
Febrero 550
550/500=1,100
Marzo 600
600/550=1,091
Abril
700
700/600=1,167
Mayo
800
800/700=1,143
Junio
850
850/800=1,063
Calculando la media geomtrica se obtiene:
= 1 2 3
5
Ventas
500
550
600
700
800
850
Se puede observar que el valor de 850,146 calculado con la media geomtrica es semejante al valor de
venta real de 850, por lo tanto el valor calculado para la media geomtrica est correcto.
86
log
Donde:
=
Ejemplo ilustrativo N 3
Calcular la media geomtrica para las siguientes calificaciones de Estadstica:
4
6
8
9
10
5
8
9
10
8
Solucin:
Se llena la siguiente tabla, realizando los clculos respectivos:
4
6
8
9
10
Total
5
8
9
10
8
40
log
0,602
0,778
0,903
0,954
1,000
log
3,010
6,225
8,128
9,542
8,000
34,906
34,906
log =
= 0,873
40
G = anti log 0,873 = 7,458
Los clculos en Excel se muestran en la siguiente figura:
87
Medidas de Tendencia Central
log
Donde:
xm =
TAREA DE INTERAPRENDIZAJE N 6
1) Realice un organizador grfico sobre la media geomtrica
2) Cree y resuelva un problema similar al ejemplo ilustrativo N 2 para el clculo de la media geomtrica
con datos sin agrupar. Resuelva manualmente empleando las dos ecuaciones presentadas y empleando
Excel
3) Calcular la media geomtrica para las siguientes calificaciones de Estadstica de manera manual y con
Excel
1
2
3
4
5
6
7
8
9
10
3
5
8
8
7
6
8
9
6
10
G = 5,23
88
Medidas de Tendencia Central
=
=
1
1
1
1
=1
+
+
1 2
1
1 1
1
1
(1 + 2 + )
Ejemplo ilustrativo: La velocidad de produccin de azcar de tres mquinas procesadoras son 0,5, 0,3
y 0,4 minutos por kilogramo. Hallar el tiempo promedio de produccin despus de una jornada de 4800
minutos del proceso.
Solucin:
Como en la razn minutos/kilogramos (min/kg) cada mquina trabaja 4800 min, la razn contante es el
tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador, por lo tanto se debe
emplear el promedio armnico.
3
=
=
=
= 0,383
1
1
1
1
1
1
1
=1
1 + 2 + 0,5 + 0,3 + 0,4
O empleando la otra ecuacin:
1
1
=
=
= 0,383
1 1
1
1
1 1
1
1
(
+
+
)
(
+
+
)
1 2
89
Medidas de Tendencia Central
c) Clic en Aceptar.
90
Medidas de Tendencia Central
=1
1 2
+
+
1 2
1 1 2
(
+
+
1 2
)
Ejemplo ilustrativo: En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran
en realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en realizar
la obra un obrero tipo (un obrero promedio).
Tiempo Obreros
4
4
5
5
6
7
7
2
9
2
Solucin:
20
20
2520
=
=
=
=
=
= 5,44
1 2
4 5 7 2 2 463
463
=1
+
+
+
+
+
+
1 2
4 5 6 7 9 126
En Excel se calcula de la siguiente manera:
Insertar la funcin = SUMA(B2:B6)/SUMAPRODUCTO((1/A2:A6);B2:B6) como se muestra en la
siguiente figura:
=1
1
2
1 + 2 +
91
Ejemplo ilustrativo: En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se
demoran para resolver una prueba de Estadstica determinados estudiantes. Calcular el tiempo promedio
que se demora en resolver la prueba un estudiante tipo.
Tiempo
[40-50)
[50-60)
[60-70)
[70-80)
[80-90]
Estudiantes
4
8
10
7
11
Solucin:
Realizando los clculos respectivos se obtiene:
[40-50)
[50-60)
[60-70)
[70-80)
[80-90]
Total
4
8
10
7
11
40
45
55
65
75
85
/
0,089
0,145
0,154
0,093
0,129
0,611
=1
1
2
+
+
1 2
40
= 65,47
0,611
TAREA DE INTERAPRENDIZAJE N 7
1) Realice un organizador grfico sobre la media armnica.
2) Calcule la media armnica de manera manual y empleando Excel de los siguientes nmeros:
2, 4, 6, 8, 9 y 10
H= 4,789
3) Cree y resuelva un ejercicio similar al anterior.
92
Medidas de Tendencia Central
4) En una empresa se ha controlado el tiempo que tardan tres obreros en realizar una obra. Uno demora
8 horas, el otro 6 horas y un tercero 4 horas.
4.1) Halle de manera manual y empleando Excel el rendimiento de un obrero tipo (obrero promedio).
H= 5,534
4.2) Para qu le servira a la empresa saber el rendimiento promedio de un obrero tipo?
5) Cree y resuelva un ejercicio similar al anterior.
6) Cree y resuelva dos ejercicios similares al ejemplo resuelto para el clculo de la media armnica con
datos agrupados en tablas de frecuencias.
7) En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran para resolver
una prueba de Estadstica determinados estudiantes.
Intervalo
N de
de tiempo estudiantes
[45-50)
2
[50-55)
2
[55-60)
7
[60-65)
4
[65-70)
5
[75-80)
7
[85-90]
13
7.1) Calcule el tiempo promedio que se demora en resolver la prueba un estudiante tipo. Resolver de
manera manual y empleando Excel.
H= 69,096
7.2) Para qu le servira al profesor saber el tiempo promedio que se demora en realizar la prueba un
estudiante tipo?
8) Cree y resuelva un ejercicio similar al anterior
8.1) Realice los clculos de manera manual y empleando Excel
8.2) Compruebe a travs de un ejercicio que la media geomtrica es menor o igual que la media
aritmtica, y mayor o igual que la media armnica, es decir, en smbolos:
9) En qu caso ocurrira que la media geomtrica sea igual a la media aritmtica e igual a la media
armnica?. Ponga un ejemplo y resulvalo manera manual y empleando Excel.
10) Consulte en la biblioteca o en internet 2 ejercicios de aplicacin de la media armnica y resulvalos
empleando Excel
93
Medidas de Tendencia Central
2.4) LA MEDIANA
La mediana, llamada algunas veces media posicional, es el valor del trmino medio que divide una
distribucin de datos ordenados en dos partes iguales, es decir, el 50% de los datos se ubican sobre la
mediana o hacia los puntajes altos y el 50% restante hacia los puntajes bajos.
A) PROPIEDADES
-La Mediana no tiene propiedades que le permite intervenir en desarrollos algebraicos como la media
aritmtica, sin embargo, posee propiedades que ponen en evidencia ciertas cualidades de un conjunto de
datos, lo cual no ocurre con la media aritmtica que promedia todos los valores y suprime sus
individualidades. En cambio, la mediana destaca los valores individuales.
- Tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores
que toma la variable, sino del orden de las mismas.
-Para el clculo de la mediana interesa que los valores estn ordenados de menor a mayor.
- Su aplicacin se ve limitada, ya que solo considera el orden jerrquico de los datos y no alguna
propiedad propia de los datos, como en el caso de la media aritmtica.
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
a) Si el nmero n de datos es impar, la mediana es el dato que se encuentra a la mitad de la lista. Para
calcular su posicin se aplica la siguiente ecuacin:
= +1 = +1
2 2
Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadstica evaluadas sobre diez: 10, 8,
6, 4, 9, 7, 10, 9 y 6
Solucin:
1) Se ordena los datos de menor a mayor:
4 6 6 7 8 9 9 10 10
1 2 3 4 5 6 7 8 9
2) Se aplica la ecuacin:
= +1
2
= 9+1 = = 5
2
94
Medidas de Tendencia Central
2) Clic en Aceptar para visualizar la ventana Argumentos de funcin. En la casilla Nmero1 seleccionar
los datos (Rango A1:H1)
95
Medidas de Tendencia Central
3) Pulsar en Aceptar
96
Medidas de Tendencia Central
b) Si el nmero n de datos es par, la mediana es la media aritmtica de los dos datos que se encuentran
a la mitad de la lista. Para calcular su posicin se aplica la siguiente ecuacin:
=
+ +1
2
Ejemplo ilustrativo: Calcular la mediana de las siguientes calificaciones del curso de Matemtica
evaluadas sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solucin:
1) Se ordena los datos de menor a mayor:
4 6 7 8 8 9 9 9 10 10
1 2 3 4 5 6 7 8 9 10
2) Se aplica la ecuacin
=
+ +1
2
5 + 6 8 + 9
=
= 8,5
2
2
+1
2
Ejemplo ilustrativo:
Dados los siguientes 20 nmeros: 1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6, 4, 4, 4 ,4, 5, 5, 5, 5
1) Agrupar los datos en tabla de frecuencia.
Solucin:
1
2
3
4
5
6
Total
1
3
2
4
8
2
20
97
2) Calcular la mediana.
Solucin:
Calculando la posicin de la mediana se obtiene:
=
+ 1 20 + 1
=
= 10,5
2
2
Como la posicin de la mediana es 10,5, su valor es el promedio de los datos dcimo y undcimo. Para
observar con claridad cules son los datos dcimo y undcimo se aconseja calcular la frecuencia
acumulada.
1
1 1
2
3 4
3
2 6
4
4 10
5
8 18
6
2 20
Total 20
Se observa que el dcimo dato es 4 y el undcimo es 5, por lo tanto:
=
4+5
= 4,5
2
6
16
35
46
50
98
En este ejemplo el intervalo de la media es [65,75).Se observa que 16 valores estn por debajo del valor
65. Los 9 que faltan para llegar a 25 se interpolan en el ancho del intervalo de la mediana que en este
ejemplo es 10.
19 corresponde a 10
9
9 10 90
=
= 4,737
19
19
Por lo tanto la Mediana es igual 65+4,737= 69,737
=
b) Empleando la ecuacin
= + (2
)
En donde:
= Lmite inferior del intervalo de clase de la mediana
= Nmero total de datos
=Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase de la mediana.
= Frecuencia absoluta del intervalo de clase de la mediana
= Ancho del intervalo
Ejemplo ilustrativo: Calcular la mediana del ejemplo anterior y representarla mediante un histograma
de frecuencias acumuladas.
Se calcula la frecuencia acumulada como se muestra en la siguiente tabla:
Intervalos
[ 45,55)
6
[ 55, 65) 10
[ 65, 75) 19
[ 75, 85) 11
[ 85, 95)
4
6
16
35
46
50
Solucin:
Se calcula la posicin de la mediana de la siguiente manera:
50
=
= 25
2
2
Por lo tanto el intervalo o clase de la mediana es [65,75).
50
16
9
90
2
= + (
) = 65 + ( 2
) 10 = 65 + ( ) 10 = 65 +
= 69,737
19
19
19
99
Medidas de Tendencia Central
10
=
=
35 16 25 16
19
9
Despejando AE se obtiene:
10
90
9 = =
= 4,737
19
19
Entonces, Md = 65+AE = 65+4,737= Md = 69,737
TAREA DE INTERAPRENDIZAJE N 8
1) Escriba 3 diferencias entre media aritmtica y mediana.
2) Realice un organizador grfico sobre la mediana.
3) Calcule la mediana de los nmeros 6, 6, 5, 2, 3, 4, 4, 5, 5, de manera manual, empleando Excel y con
GeoGebra.
Md= 5
4) Cree y resuelva un ejercicio similar al anterior
5) Calcule la mediana de los nmeros 11, 12, 9, 10, 7, 8, de manera manual y empleando Excel y con
GeoGebra.
Md= 9,5
6) Cree y resuelva un ejercicio similar al anterior.
100
Medidas de Tendencia Central
[ 60, 63)
5
[ 63, 66) 18
[ 66, 69) 42
[ 69, 72) 27
[ 72, 75)
8
Md= 67,93
10) Cree y resuelva un ejercicio similar al anterior.
11) Dados los siguientes nmeros:
50, 55, 59, 60, 69, 65, 66, 69, 63, 64, 70, 72, 77, 78, 79, 79, 77, 78, 71, 72, 73, 75, 77, 74, 73, 73, 74, 77,
80, 82, 85, 88, 89, 89, 85, 81, 82, 83, 82, 81, 90, 91, 92, 93, 94, 95, 96, 99, 100 y 109
11.1) Agrupe los datos en intervalos de ancho 10.
11.2) Calcule la media aritmtica de manera manual y empleando Excel.
78,7
11.3) Calcule la media geomtrica de manera manual y empleando Excel.
77,77
11.4) Calcule la media armnica de manera manual y empleando Excel.
76,81
11.5) Calcule la mediana por interpolacin, empleando la ecuacin y empleando un histograma para la
frecuencia acumulada.
78,33
12) Cree y resuelva un ejercicio similar al anterior consultando en la biblioteca o en el internet
101
Medidas de Tendencia Central
1
+ ]
2
= +2
[
Donde:
n = nmero total de datos
k = nmero del cuartil
Ejemplo ilustrativo:
Encuentre los cuartiles dada la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los cuartiles se ordena los datos de menor a mayor
6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el cuartil uno se obtiene:
= +2
[
Como la posicin del cuartil 1 es 2,5, su valor es el promedio de los datos segundo y tercero
2 + 3 9 + 9
1 = 2,5=
=
=9
2
2
O tambin la posicin 2,5 dice que el cuartil 1 est ubicado al 50% del trayecto comprendido entre el
segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1= 9+0,5(9-9) = 9
Interpretacin: Este resultado indica que el 25% de los datos es inferior a 9
Medidas de Tendencia Central
102
b) Pulse en Aceptar para visualizar la ventana Argumentos de Funcin. En la casilla Matriz seleccione
los datos (Rango A1:A8)
103
Medidas de Tendencia Central
d) Pulsar en Aceptar.
104
Medidas de Tendencia Central
d) Enter
105
Medidas de Tendencia Central
4 + 5 12 + 12
=
= 12
2
2
O tambin la posicin 4,5 dice que el cuartil 2 est ubicado al 50% del trayecto comprendido entre el
cuarto dato, que es 12 y el quinto dato que tambin es 12, es decir,
2 = 12 + 0,5(12 12) = 12
Interpretacin: Este resultado indica que el 50% de los datos es inferior a 12
En Excel se calcula de la siguiente manera:
Repetir los pasos para el cuartil 1, y en la opcin de cuartil, escribir 2
6 + 7 12 + 15
=
= 13,5
2
2
O tambin la posicin 6,5 dice que el cuartil 2 est ubicado al 50% del trayecto comprendido entre el
doceavo dato, que es 12 y el quinceavo dato que es 15, es decir, 3 = 12+0,5(15-12)
3 = 12+0,5(3)=12+1,5=13,5
106
Medidas de Tendencia Central
Interpretacin: Este resultado indica que el 75% de los datos es inferior a 13,5
En GeoGebra se calcula de la siguiente manera:
Notas importantes:
-Los clculos en Excel para un nmero impar de datos coinciden con los clculos realizados con las
ecuaciones.
-Para un nmero par de datos, aunque en ciertas ocasiones coinciden, suele existir diferencias en los
clculos del Q1 y Q3 realizados con Excel. Este error de clculo es: e = 0,25d, en donde d es la distancia
de separacin de los datos
-Para el Q1 se resta el error al valor obtenido con Excel
-Para el Q3 se suma el error al valor obtenido con Excel
En nuestro ejemplo = 0,25(7 6 ) = 0,25(15 12) = 0,25(3) = 0,75. Al sumar el error al valor
3 inicialmente calculado con Excel se obtiene el valor correcto como se muestra en la siguiente figura:
107
Medidas de Tendencia Central
6
9
12
15
17
1
2
3
1
1
1) Calcular el cuartil 2
2) Representar los cuartiles en un histograma para la (%) (Frecuencia relativa acumulada medida en
porcentajes). Determinar grficamente el valor de los cuartiles
Solucin:
1) Clculo del cuartil 2
Aplicando la primera ecuacin para el cuartil dos se obtiene:
= +2
[
2 =
]
4
[2+2]
4
]=
Como la posicin del cuartil 2 es 4,5, su valor es el promedio de los datos cuarto y quinto
Para observar con claridad cules son los datos
acumulada
6
9
12
15
17
1
2
3
1
1
1
3
6
7
8
6
9
12
15
17
n
1
2
3
1
1
8
1
3
6
7
8
0,125
0,25
0,375
0,125
0,125
(%)
0,125 12,5
0,375 37,5
0,75
75
0,875 87,5
1
100
108
Medidas de Tendencia Central
6
10
19
11
4
109
Medidas de Tendencia Central
Solucin:
1) Clculo de los cuartiles empleando la ecuacin
1.1) Clculo del primer cuartil
Primero se calcula nk/4 y despus se averigua el intervalo en el que est el cuartil, este intervalo recibe
el nombre de intervalo o clase del primer cuartil. Para averiguar el intervalo en el que estn los cuartiles
se aconseja calcular la frecuencia acumulada
50 1
=
= 12,5
4
4
Intervalos
45 - 55
55 - 65
65 - 75
75 - 85
85 - 95
n
6
10
19
11
4
50
6
16
35
46
50
6
10
19
11
4
50
6
16
35
46
50
0,12
0,20
0,38
0,22
0,08
(%)
12
32
70
92
100
111
Medidas de Tendencia Central
10
=
=
32 12 25 12
20 13
Despejando AE se obtiene:
10
13 = = 6,5
20
Entonces, Q1 = 55 + 6,5 = 61,5
2.3) Clculo del segundo cuartil
Observando en grfico tenemos que el Q2 = 65 + CI
Los tringulos CFG y CIH son semejantes, por lo que se cumple:
=
75 65
10
=
=
70 32 50 32
38 18
112
Medidas de Tendencia Central
Despejando CI se obtiene:
10
18 = = 4,737
38
Entonces, Q2 = 65 + 4,737 = 69,737
10
=
=
92 70 75 70
22
5
Despejando CI se obtiene:
10
5 = = 2,273
22
Entonces, 3 = 75 + 2,273 = 77,273
iii) Diagrama de caja y bigotes
Un diagrama de caja y bigotes es una representacin grfica que ayuda a visualizar una distribucin de
datos: caja desde 1 a 3 (50% de los datos), y bigotes el recorrido (distancia desde valor mnimo hasta
el valor mximo).
Para elaborar un diagrama de caja se procede de la siguiente manera:
a) Se marca los valores de la serie de datos sobre el eje horizontal o vertical.
b) Se ubica sobre el eje el valor mnimo, primer cuartil, mediana o segundo cuartil, tercer cuartil y el
valor mximo.
c) Se construye un rectngulo (caja) paralelo al eje, de longitud desde Q1 a Q3 y anchura arbitraria.
De acuerdo al ejemplo ilustrativo del clculo de cuartiles para datos sin agrupar de la distribucin de
datos 6, 9, 9, 12, 12, 12, 15 y 17 se obtienen:
Valor mnimo = 6
1 = 9
2 = 12
3 = 13,5
Valor mximo = 17
Por lo tanto el diagrama de caja y bigotes es:
113
Medidas de Tendencia Central
114
Medidas de Tendencia Central
Para escribir las llaves, en Vista seleccione Teclado. En el teclado virtual seleccione
115
Medidas de Tendencia Central
d) Enter
116
Medidas de Tendencia Central
B) DECILES
i) Definicin
Son cada uno de los 9 valores 1 , 2 , 3 , 4 , 5 , 6 , 7 , 9 que dividen a la distribucin de los datos en
10 partes iguales.
El primer decil es igual al dcimo percentil (1 = 1 ), el segundo decil es igual al veinteavo percentil
(2 = 20 ), y as sucesivamente.
ii) Mtodos de Clculo
a) Para Datos No Agrupados
La posicin o ubicacin de los deciles se encuentra aplicando la siguiente ecuacin:
= 1 = +5
[
+ ]
10 2
10
Donde:
n = nmero total de datos.
k = nmero del decil.
Ejemplo ilustrativo:
Calcular el quinto decil de la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los deciles se ordena los datos de menor a mayor.
6 9 9 12 12 12 15 17
1 2 3 4 5 6 7 8
Aplicando la ecuacin para el quinto decil se obtiene:
= +5
[
10
10
10
]= [
10
]= [
10
]=
4 + 5 12 + 12
=
= 12
2
2
O tambin la posicin 4,5 dice que el decil 5 est ubicado al 50% del trayecto comprendido entre el
cuarto dato, que es 12 y el quinto dato que tambin es 12, es decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:
Como D5 es igual a P50 se introduce la funcin PERCENTIL.INC(A1:A8;0,5) como se muestra en la
siguiente figura:
117
Medidas de Tendencia Central
C) PERCENTILES O CENTILES
i) Definicin
Son cada uno de los 99 valores P1, P2, P3,..P99 que dividen atribucin de los datos en 100 partes
iguales.
ii) Mtodos de Clculo
a) Para Datos No Agrupados
La posicin o ubicacin de los percentiles se encuentra aplicando la siguiente ecuacin:
= 1 = +50
[
+ ]
100 2
100
Donde:
n = nmero total de datos
k = nmero del percentil
Ejemplo ilustrativo:
Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en kg)
80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solucin:
Se ordena los datos de menor a mayor se tiene:
65 65 67 68 70 72 72 73 78 80
1 2 3 4 5 6 7 8 9 10
1) Clculo del percentil de orden 20 se obtiene:
= +50
[
100
100
]= [
100
]= [
]=
100
2 + 3 65 + 67
=
= 66
2
2
118
Medidas de Tendencia Central
100
100
]= [
100
]=
100
3 + 4 67 + 68
=
= 67,5 = 68
2
2
Donde:
=Lmite inferior del intervalo de clase del percentil.
= nmero total de datos.
= Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase del percentil.
= Frecuencia absoluta del intervalo de clase del percentil.
= Ancho del intervalo de clase del percentil.
TAREA DE INTERAPRENDIZAJE N 9
1) El valor de la mediana con qu valor del cuartil, decil y del percentil coincide?. Plantee y resuelva
un ejercicio para ilustrar su respuesta.
2) Por qu a los cuartiles, deciles y percentiles se les considera como medidas de posicin?
3) Realice un organizador grfico sobre las medidas de posicin.
4) Calcule los 3 cuartiles de las siguientes distribuciones de datos de manera manual, empleando Excel
y GeoGebra. Realice los diagramas de caja y bigotes de manera manual y empleando GeoGebra.
4.1) 5, 2, 6, 4, 1 y 3
1 = 2; 2 = 3; 3 = 5
4.2) 5, 2, 8, 4, 1, 6, 7 y 3
1 = 2,5; 2 = 4,5; 3 = 6,5
4.3) 9, 2, 8, 4, 5, 6, 7, 3 y 1
1 = 3; 2 = 5; 3 = 7
4.4) 36, 8, 12, 32, 24, 28, 16 y 4
1 = 10; 2 = 20; 3 = 30
4.5) 80, 70, 40, 60, 50, 30, 20 y 10
1 = 25; 2 = 45; 3 = 65
5) Dada la siguiente tabla:
6 9 12 15 17
1 2 3 1 1
5.1) Calcule el primero y tercer cuartil.
Q1=9; Q3=13,5
5.2) Calcule el segundo cuartil empleando un histograma para la frecuencia absoluta acumulada.
Q2=12
6) Cree y resuelva un ejercicio similar al presentado en el clculo de los cuartiles para datos agrupados
en intervalos.
7) Emplee los datos del ejercicio anterior y calcular los cuartiles empleando un histograma para la
frecuencia absoluta acumulada.
8) Calcule el quinto decil de 1, 3, 6, 9, 12, 15, 18 y 21 de manera manual y empleando Excel.
D5=10,5
9) Cree y resuelva un ejercicio sobre el clculo del decil 3 y del decil 7 para datos agrupados en tablas
de frecuencias.
120
Medidas de Tendencia Central
10) Cree y resuelva un ejercicio sobre el clculo de los deciles de orden 4 y 8 para datos agrupados en
intervalos empleando las ecuaciones y a travs de un histograma para la (%).
11) Calcule el percentil de orden 25 de 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 y 22 de manera manual y
empleando Excel.
P25=6
12) Calcule el percentil de orden 75 de 10, 20, 40, 50, 60, 70, 80, 90, 100, 120 y 140.
P75=95
13) Plantee y resuelva un ejercicio sobre el clculo de los percentiles 35 y 60 para datos agrupados en
intervalos empleando la frmula y a travs de un histograma para la (%).
14) Consulte en la biblioteca o en el internet sobre las aplicaciones de las medidas de posicin en la vida
diaria. Presente la consulta a travs de un organizador grfico.
2.6) MODA
La moda de un conjunto de datos es el valor que aparece con mayor frecuencia.
A) PROPIEDADES
- No es afectada por valores muy altos o muy bajos.
- La moda, al igual que la mediana, no se presta para tratamientos algebraicos como la media aritmtica.
- La moda puede no existir, e incluso no ser nica en caso de existir.
- Cuando en un conjunto de datos hay tres o ms datos diferentes con la misma frecuencia mayor, esta
informacin a menudo no resulta til (demasiadas modas tienden a distorsionar el significado de moda).
Por lo que en estos casos se considera que el conjunto de datos no tiene moda.
Para un conjunto de datos unimodales existe la siguiente relacin emprica:
Media aritmtica moda = 3 (media aritmtica mediana)
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
Se observa el dato que tiene mayor frecuencia
Ejemplo ilustrativo N 1
Determinar la moda del conjunto de datos 2, 4, 6, 8, 8 y 10
Solucin:
Mo = 8, porque es el dato que ocurre con mayor frecuencia. A este conjunto de datos se le llama unimodal
121
Medidas de Tendencia Central
c) Pulsar en Aceptar.
122
Medidas de Tendencia Central
Ejemplo ilustrativo N 2
Determinar la moda del conjunto de datos: 2, 4, 6, 8 y 10
Solucin:
Este conjunto de datos no tiene moda, porque todos los datos tienen la misma frecuencia.
En Excel se calcula de la siguiente manera:
Se inserta la funcin MODA.UNO, se selecciona las celdas respectivas y se pulsa en Aceptar.
Ejemplo ilustrativo N 3
Determinar la moda del conjunto de datos: 8, 4, 6, 6, 8, 2 y 10
Solucin:
Este conjunto de datos tiene dos modas, 8 y 6, y se llama bimodal.
En Excel se calcula de la siguiente manera:
Se inserta la funcin MODA.VARIOS, la cual debe especificarse como frmula de matriz, para lo cual
se selecciona las celdas donde aparecer la respuesta (B9:B10). Luego se inserta la funcin MODA
.VARIOS, se selecciona las celdas respectivas (A1:A7)
123
Medidas de Tendencia Central
2
4
6
8
10
f
1
2
3
1
1
Solucin:
Se observa que el dato con mayor frecuencia es 6, por lo tanto Mo = 6
= + (
)
+
0= Lmite inferior de la clase modal.
= Diferencia entre la frecuencia absoluta de la clase modal y la clase que la antecede.
= Diferencia entre la frecuencia absoluta de la clase modal y la clase que le sigue.
= ancho de la clase modal.
Ejemplo ilustrativo: Calcule la moda o modas (si las hay) de los siguientes datos:
Intervalo o Clase
10-19
20-29
30-39
40-49
50-59
3
7
15
12
8
124
Solucin:
Se observa que la clase modal es 30-39, ya que es el intervalo con la mayor frecuencia.
Aplicando la ecuacin
= + (
)
+
Se tiene:
15 7
8
80
= 30 + (
) 10 = 30 + (
) 10 = 30 +
= 37,27
(15 7) + (15 12)
8+3
11
10
10
=
=
3 = 8(10 ) 3 = 80 8
15 7 15 12
8
3
3 + 8 = 80 11 = 80 =
80
= 7,27
11
125
TAREA DE INTERAPRENDIZAJE N 10
1) Realice un organizador grfico sobre la moda.
2) Para una tienda de modas o para un diseador de autos, de qu le servira saber el valor de la moda?.
3) Se est estudiando el ingreso diario de un grupo de personas y se tiene los siguientes valores en dlares:
350, 400, 500, 350, 550, 1500 y 2000.
3.1) Calcule manualmente y empleando Excel la media aritmtica, la mediana y la moda.
= $ 807,14; Md = $ 500; Mo= $ 350
3.2) Qu valor es ms representativo del ingreso promedio?. Argumente su respuesta.
4) Plantee y resuelva un ejercicio con datos sin agrupar y comprueba la relacin emprica entre la media
aritmtica, mediana y moda.
5) Averige a 30 compaeros de su clase sobre el nmero de hermanas y hermanos.
5.1) Elabore una tabla de frecuencias.
5.2) Calcule la media aritmtica, mediana y moda.
6) Dados los siguientes datos: 50, 52, 59, 60, 60, 63, 64, 65, 69, 69, 70, 70, 72, 72, 74, 74, 75, 75, 76, 75,
74, 70, 77, 78, 78, 79, 79, 75, 80, 80, 81, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 98, 99,
100 y 109
6.1) Calcule manualmente y empleando Excel la media aritmtica, la mediana y la moda con los datos
sin agrupar.
= 78,42; Md=78; Mo=75
6.2) Agrupe los datos en intervalos de ancho 10. Complete la siguiente tabla:
Intervalo
50-59
70-79
12
90-99
2
6.3) A partir de la tabla anterior calcule media aritmtica, la mediana y la moda.
= 78,7; = 78,33; = 76,47
6.4) Calcule la media aritmtica empleando Excel.
= 78,7
6.5) Calcule la moda empleando un histograma.
= 76,47
6.6) Calcule la mediana a travs de un histograma para la fra(%)
= 78,33
6.7) Por qu varan los resultados de los datos sin agrupar con los datos agrupados en intervalos?
7) Plantee y resuelva un ejercicio similar al anterior.
126
Medidas de Tendencia Central
CAPTULO III
MEDIDAS DE DISPERSIN
RESULTADOS DE APRENDIZAJE:
CONTENIDOS:
127
Medidas de Dispersin
MEDIDAS DE DISPERSIN
Las medias de tendencia central o posicin nos indican donde se sita un dato dentro de una distribucin
de datos, se ubican generalmente hacia el centro de una distribucin estadstica y son medidas
representativas de un grupo de datos. Las medidas de dispersin, variabilidad o variacin nos indican si
esos datos estn prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se encuentran
los datos. Estas medidas de dispersin nos permiten apreciar la distancia que existe entre los datos a un
cierto valor central e identificar la concentracin de los mismos en un cierto sector de la distribucin, es
decir, permiten estimar informacin acerca de cmo se alejan o dispersan los datos con relacin al
promedio.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo
la media aritmtica el dato central ms utilizado. Cuando existe una dispersin pequea se dice que los
datos estn dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central
es un valor muy representativo. En el caso que la dispersin sea grande el valor central no es muy
confiable. Cuando una distribucin de datos tiene poca dispersin toma el nombre de distribucin
homognea y si su dispersin es alta se llama heterognea.
A) PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente
sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la
distancia que induce la desviacin media en el espacio de observaciones no es la natural (no permite
definir ngulos entre dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella
a la hora de hacer inferencia a la poblacin.
Cuando mayor sea el valor de la desviacin media, mayor es la dispersin de los datos. Sin embargo, no
proporciona una relacin matemtica precisa entre su magnitud y la posicin de un dato dentro de una
distribucin.
La desviacin media al tomar los valores absolutos mide una observacin sin mostrar si la misma est
por encima o por debajo de la media aritmtica.
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
Se emplea la frmula:
DM =
|x x|
n
128
Medidas de Dispersin
Ejemplo ilustrativo:
Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18
Solucin:
Se calcula la media aritmtica.
3 + 8 + 8 + 8 + 9 + 9 + 9 + 18
=
=9
8
Se calcula la desviacin media.
=
DM =
|x x|
n
DM =
|3 9| + |8 9| + |8 9| + |8 9| + |9 9| + |9 9| + |9 9| + |18 9|
8
DM =
6 + 1 + 1 + 1 + 0 + 0 + 0 + 9 18
=
= 2,25
8
8
129
Medidas de Dispersin
c) Pulsar en Aceptar.
| |
130
Medidas de Dispersin
Ejemplo ilustrativo: Calcular la desviacin media en base a la siguiente tabla sobre las calificaciones
de un estudiante en 12 asignaturas evaluadas sobre 10.
Calificacin Cantidad de asignaturas
6
4
7
2
8
3
9
2
10
1
Total
12
Solucin:
Se calcula la media aritmtica.
=
4 6 + 2 7 + 3 8 + 2 9 + 1 10 24 + 14 + 24 + 18 + 10 90
=
=
=
= 7,5
12
12
12
| | | |
6
4
1,5
6
7
2
0,5
1
8
3
0,5
1,5
9
2
1,5
3
10
1
2,5
2,5
Total 12
14
| | 14
=
= 1,167
12
| |
131
Medidas de Dispersin
Ejemplo ilustrativo:
Calcular la desviacin media de un curso de 40 estudiantes en la asignatura de Estadstica en base a la
siguiente tabla:
Calificacin Cantidad de estudiantes
2-4
6
4-6
8
6-8
16
8-10
10
Total
40
Solucin:
Para calcular la media aritmtica se llena la siguiente tabla:
Intervalo
2-4
6
3
18
4-6
8
5
40
6-8
16 7
112
8-10
10 9
90
Total
40
260
Calculando la media aritmtica se obtiene:
260
=
=
= 6,5
40
Para calcular la desviacin media se llena la siguiente tabla:
Intervalo
2-4
4-6
6-8
8-10
Total
=
6
8
16
10
40
3
5
7
9
| |
3,5
2,5
0,5
2,5
| |
21
12
8
25
66
66
= 1,65
40
TAREA DE INTERAPRENDIZAJE N 11
1) Conteste a las siguientes preguntas.
1.1) Cul es la diferencia entre medidas de tendencia central y medidas de dispersin?
1.2) Qu permiten o que se logra con las medidas de dispersin?
1.3) En qu caso una distribucin de datos toma el nombre de homognea?. Explique con un ejemplo.
1.4) En qu caso una distribucin de datos toma el nombre de heterognea?. Explique con un ejemplo.
132
Medidas de Dispersin
20
19
18
17
16
15
14
Total
2
2
3
4
6
3
3
23
DM = 1,46
6) Cree y resuelva un ejercicio similar al ejemplo presentado en el clculo de la desviacin media para
datos agrupados en tablas de frecuencias.
7) La siguiente tabla muestra la cantidad de dinero que se gasta por semana un grupo de 50 personas.
Calcular la desviacin media.
Intervalo
10-20
20-30
30-40
40-50
Total
8
15
12
15
50
DM= 9,456
A) PROPIEDADES
- La varianza y desviacin estndar (o cualquier otra medida de dispersin) indican el grado en que estn
dispersos los datos en una distribucin. A mayor medida, mayor dispersin.
- La varianza es un nmero muy grande con respecto a las observaciones, por lo que con frecuencia se
vuelve difcil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza siempre se expresa en trminos
de los datos originales elevados al cuadrado, se obtiene unidades de medida de los datos que no tiene
sentido o interpretacin lgica. Por ejemplo, si se calcula la varianza de una distribucin de datos
medidos en metros, segundos, dlares, etc., se obtendr una varianza mediada en metros cuadrados,
segundos cuadrados, dlares cuadrados, respectivamente, unidades de medida que no tienen significado
lgico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la raz cuadrada de la misma,
es decir, se calcula la desviacin estndar, la cual es un nmero pequeo expresado en unidades de los
datos originales y que tiene un significado lgico respeto a los mismos.
A pesar de lo anterior, es difcil describir exactamente qu es lo que mide la desviacin estndar. Sin
embargo, hay un resultado til, que lleva el nombre del matemtico ruso Pafnuty Lvovich Chebyshev, y
se aplica a todos los conjuntos de datos. Este teorema de Chebyshev establece que para todo conjunto de
datos, por lo menos 1 1/ 2 de las observaciones estn dentro de k desviaciones estndar de la media,
en donde k es cualquier nmero mayor que 1. Este teorema se expresa de la siguiente manera:
1
1
2
As por ejemplo, si se forma una distribucin de datos con k =3 desviaciones estndar por debajo de la
media hasta 3 desviaciones estndar por encima de la media, entonces por lo menos
1
1 91 8
1 2 =1 =
= = 0,8889 = 88,89%
3
9
9
9
Interpretacin: El 88,89% de todas las observaciones estarn dentro 3 desviaciones de la media.
134
Medidas de Dispersin
B) MTODOS DE CLCULO
i) Para Datos No Agrupados
La varianza para una poblacin se calcula con:
2 =
(xi )2
N
Donde:
=
= media aritmtica poblacional
=
= 2 =
(xi )2
N
Donde:
=
x =
=
= 2 =
(xi x)2
n1
Notas:
1) Para el clculo de la varianza de una muestra se divide por n-1 en lugar de N, debido a que se tiene n1 grados de libertad en la muestra. Otra razn por la que se divide por n-1 es debido a que una muestra
generalmente est un poco menos dispersa que la poblacin de la cual se tom. Al dividir para n-1 en
lugar de N se cumple con la tendencia y sentido lgico de que la varianza y desviacin estndar de la
muestra deben tener un valor ms pequeo que la varianza y desviacin estndar de la poblacin.
2) En la realidad, salvo indicacin expresa, no se calcula la varianza y la desviacin estndar de la
poblacin, ya que para ahorrar tiempo, esfuerzo, dinero, etc. es mejor trabajar con datos que representan
a la muestra.
135
Medidas de Dispersin
Ejemplo ilustrativo N 1
Considere que los siguientes datos corresponden al sueldo de una poblacin: $350, $400, $500, $700 y
$1000
1) Calcular la desviacin estndar.
2) Cul es el intervalo que est dentro de k = 2 desviaciones estndar de la media?. Qu porcentaje de
las observaciones se encuentran dentro de ese intervalo?
Solucin:
1) Para la calcular la desviacin estndar se sigue los siguientes pasos:
a) Se calcula la media aritmtica.
=
2950
5
= $ 590
2 =
282000
5
2 = $2 56400
136
Medidas de Dispersin
137
Medidas de Dispersin
c) Pulsar en Aceptar.
1
1
1 41 3
=1 2 =1 =
= = 0,75 = 75%
2
2
4
4
4
Interpretacin: Se puede afirmar de que por lo menos el 75% los sueldos estn entre $ 115,03 y
1064,97
Ejemplo ilustrativo N 2
Dos empresas, A y B, venden sobres de caf instantneo de 350 gramos. Se seleccionaron al azar en los
mercados cinco sobres de cada una de las compaas y se pesaron cuidadosamente sus contenidos. Los
resultados fueron los siguientes.
A
350,14
350,18
349,98
349,99
350,12
B
350,09
350,12
350,20
349,88
349,95
138
Medidas de Dispersin
Solucin:
a) Se calcula las medias aritmticas.
xA =
xA =
1750,41
= 350,082
5
xB =
xB =
1750,24
= 350,048
5
Interpretacin: Como la media aritmtica de la empresa A es mayor que la de la empresa B, por lo tanto
la empresa A proporciona ms caf en sus sobres.
b) Se calcula las desviaciones estndar.
(xi x)2
=
n1
A
350,14
350,18
349,98
349,99
350,12
Total
0,058
0,098
-0,102
-0,092
0,038
(xi x)2
0,003364
0,009604
0,010404
0,008464
0,001444
0,03328
B
350,09 0,042
350,12 0,072
350,20 0,152
349,88 -0,168
349,95 -0,098
(xi x)2
0,001764
0,005184
0,023104
0,028224
0,009604
0,06788
0,03328
0,03328
=
=
= 0,0912
51
4
0,06788
0,06788
=
= 0,13
51
4
139
Medidas de Dispersin
Donde:
f = frecuencia absoluta.
= 2 =
( )2
Ejemplo ilustrativo
Calcular la desviacin estndar de los siguientes datos correspondientes a una muestra.
Calificaciones
4
5
6
7
8
10
Total
3
6
4
13
7
6
39
Solucin:
a) Se llena la siguiente tabla:
Calificaciones
4
5
6
7
8
10
Total
3
6
4
13
7
6
39
12
30
24
91
56
60
273
273
=
=7
39
3
6
4
13
7
6
39
12
30
24
91
56
60
273
-3
-2
-1
0
1
3
( )2
9
4
1
0
1
9
( )2
27
24
4
0
7
54
116
( )2
( )2
1
= 2 =
( )2
1
Ejemplo ilustrativo
Calcular la desviacin estndar de los siguientes datos correspondientes a una muestra.
Intervalo
60-65
5
65-70
20
70-75
40
80-85
27
85-90
8
Total 100
Solucin:
a) Se llena la siguiente tabla:
Intervalo
60-65
65-70
70-75
80-85
85-90
Total
5
20
40
27
8
100
62,5
67,5
72,5
82,5
87,5
312,5
1350
2900
2227,5
700
7490
142
Medidas de Dispersin
7490
=
= 74,9
100
5
20
40
27
8
100
62,5
67,5
72,5
82,5
87,5
312,5
1350
2900
2227,5
700
7490
TAREA DE INTERAPRENDIZAJE N 12
1) Elabore un organizador grfico sobre la varianza y desviacin estndar.
2) Consulte sobre la biografa de Pafnuty Lvovich Chebyshev y elabore un organizador grfico sobre la
misma.
3) Calcule la desviacin estndar de las siguientes distribuciones correspondientes a una poblacin
empleando la ecuacin y mediante Excel.
3.1) 10, 12, 14, 16, 18, 20 y 40
9,3
3.2) 30, 20, 50, 40, 60, 80 y 90
23,73
4) Cree y resuelva un ejercicio similar al anterior.
5) Cree y resuelva un ejercicio similar al ejemplo presentado para el clculo de la desviacin estndar de
una muestra para datos sin agrupar.
143
Medidas de Dispersin
14
15
18
20
30
40
6
5
4
12
7
6
8,903
144
Medidas de Dispersin
Ejemplo ilustrativo:
Calcula el rango de las siguientes distribuciones:
1) 4, 6, 8, 10, 12, 14, 16
2) 5, 10, 13, 13, 14, 15, 17
Solucin:
1 = 16 4 = 12
2 = 17 5 = 12
En Excel se inserta la funcin MAX(Celdas) MIN(Celdas) como muestra la siguiente figura:
Ambas series tienen rango 12, pero estn desigualmente distribuidas, pues mientras la primera se
distribuye uniformemente a lo largo de todo el recorrido, la segunda tiene una mayor concentracin en
el centro.
La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio
las siguientes desventajas:
- En su clculo slo intervienen dos elementos del conjunto.
- Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la
amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la
variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.
Nota: Cuando los datos estn agrupados en intervalos se calcula la amplitud sacando la diferencia entre
la marca de clase mayor y la marca de clase menor.
145
Medidas de Dispersin
B) AMPLITUD INTERCUARTLICA
La amplitud intercuartlica es la distancia entre el tercer cuartil 3 y el primer cuartil 1.
Amplitud intercuartlica = tercer cuartil - primer cuartil = 3 1
C) RANGO SEMI-INTERCUARTIL O DESVIACIN CUARTLICA
La desviacin cuartlica es la mitad de la distancia entre el tercer cuartil y el primero
=
3 1
2
Ejemplo ilustrativo:
Si el tercer cuartil = 24 y el primer cuartil = 10. Cul es la desviacin cuartlica?
Solucin:
La amplitud intercuartlica es 24 - 10 = 14;
Por lo tanto, la desviacin cuartlica es:
=
14
2
TAREA DE INTERAPRENDIZAJE N 13
1) Realice un organizador grfico sobre las otras medidas de dispersin.
2) Plantee una distribucin de dados sin agrupar y calcule el rango, la amplitud intercuartlica, el rango
semi-intercuartil y el rango percentil de manera manual y empleando Excel.
3) Plantee una distribucin de datos agrupados en tablas de frecuencia y calcule el rango, la amplitud
intercuartlica, el rango semi-intercuartil y el rango percentil.
4) Plantee una distribucin de datos agrupados en intervalos y calcule el rango, la amplitud
intercuartlica, el rango semi-intercuartil y el rango percentil.
146
Medidas de Dispersin
A) PROPIEDADES
- Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es
una medida independiente de las unidades de medicin.
- Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos
conjuntos de datos.
B) MTODOS DE CLCULO
Para una poblacin se emplea la siguiente frmula:
=
100%
Donde:
=
=
=
100%
Donde:
=
=
=
Ejemplo ilustrativo N 1
Mathas, un estudiante universitario, tiene las siguientes calificaciones en las 10 asignaturas que recibe
en su carrera: 8, 7, 10, 9, 8, 7, 8, 10, 9 y 10. Josu, un compaero de Mathas, tiene las siguientes
calificaciones: 8, 9, 8, 7, 8, 9, 10, 7, 8 y 10. Cul estudiante tiene menor variabilidad en sus
calificaciones?
147
Medidas de Dispersin
Solucin:
Como se est tomando en cuenta todas las asignaturas, se debe calcular el coeficiente de variacin
poblacional.
Sin agrupar los datos empleando Excel se calcula el coeficiente de variacin tal como se muestra en la
siguiente figura:
Calificaciones ( )
7
8
9
10
Total
2
3
2
3
10
14
24
18
30
86
Calificaciones ( )
7
8
9
10
Total
2
4
2
2
10
14
32
18
20
84
86
=
= 8,6
10
84
=
= 8,4
10
148
Medidas de Dispersin
2
3
2
3
10
14
24
18
30
86
( )2
2,56
0,36
0,16
1,96
( )2
5,12
1,08
0,32
5,88
12,4
( )2
12,4
=
= 1,1136
10
2
4
2
2
10
14
32
18
20
84
( )2
1,96
0,16
0,36
2,56
( )2
3,92
0,64
0,72
5,12
10,4
( )2
10,4
=
= 1,0198
10
1,1136
=
= 0,129 = 12,9%
8,6
149
Medidas de Dispersin
1,0198
=
= 0,121 = 12,1%
8,4
Ejemplo ilustrativo N 2
Se saca una muestra de un curso de la Universidad UTN sobre las calificaciones en las asignaturas de
Matemtica y Estadstica, resultados que se presentan en las siguientes tablas. En qu asignatura existe
mayor variabilidad?. Realice los clculos empleando Excel
Matemtica
Intervalos
f
2-4
8
5-7
12
8 - 10
20
Total
40
Estadstica
f
Intervalos
8
24
14
57
18
8 - 10
40
Total
150
Medidas de Dispersin
Solucin:
Los clculos para la asignatura de Matemtica empleando Excel se muestran en la siguiente figura:
Los clculos para la asignatura de Estadstica empleando Excel se muestran en la siguiente figura:
TAREA DE INTERAPRENDIZAJE N 14
1) Calcule el coeficiente de variacin de las siguientes distribuciones de datos referentes a poblaciones.
Realice los clculos empleando la frmula respectiva y utilizando Excel.
1.1) 6, 8, 10, 4, 7, 8, 9, 8, 4 y 6
27,105 %
1.1) 6, 6, 8, 8, 8, 8, 9, 9, 5 y 7
17,31 %
151
Medidas de Dispersin
7
8
9
10
Total
4
8
12
6
30
10,88%
4) Cree y resuelva un ejercicio similar al presentado en el ejemplo 1 con datos sin agrupar y agrupando
en tablas de frecuencias. Resolver de manera manual y empleando Excel.
5) Calcule el coeficiente de variacin de manera manual y empleando Excel utilizando los datos de la
siguiente tabla correspondientes a una muestra.
Intervalos
24
57
8 - 10
Total
10
8
22
40
37,1 %
6) Cree y resuelva un ejercicio similar al presentado en el ejemplo 2. Resuelva de manera manual y
empleando Excel.
152
Medidas de Dispersin
CAPTULO IV
MEDIDAS DE FORMA
RESULTADOS DE APRENDIZAJE:
CONTENIDOS:
153
Medidas de Forma
4.1) ASIMETRA
Es una medida de forma de una distribucin que permite identificar y describir la manera como los datos
tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite
identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico.
A) TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:
i) Asimetra Negativa o a la Izquierda
Se da cuando en una distribucin la minora de los datos est en la parte izquierda de la media. Este tipo
de distribucin presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los datos
tiene a la izquierda una cola ms larga que a la derecha.
Tambin se dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando el valor
de la media aritmtica es menor que la mediana y ste valor de la mediana a su vez es menor que la moda,
en smbolos < < .
Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la simetra.
ii) Simtrica
Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los datos a ambos
lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una curva normal en forma
de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o tambin conocida como de
Laplace (1749-1827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica, su
mediana y su moda son iguales, en smbolos = =
154
Medidas de Forma
B) MEDIDAS DE ASIMETRA
i) Coeficiente de Karl Pearson
=
3( )
Donde:
= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.
Nota:
El Coeficiente de Pearson vara entre -3 y 3
Si As < 0 la distribucin ser asimtrica negativa.
Si As = 0 la distribucin ser simtrica.
Si As > 0 la distribucin ser asimtrica positiva.
ii) Medida de Yule Bowley o Medida Cuartlica
=
1 + 3 22
3 1
Donde:
1 = Cuartil uno; 2 = Cuartil dos = Mediana; 3 = Cuartil tres.
Nota:
La Medida de Bowley vara entre -1 y 1
Si As < 0 la distribucin ser asimtrica negativa.
Si As = 0 la distribucin ser simtrica.
Si As > 0 la distribucin ser asimtrica positiva.
Nota:
Si As < 0 Indica que existe presencia de la minora de datos en la parte izquierda de la media, aunque
en algunos casos no necesariamente indicar que la distribucin sea asimtrica negativa
Si As = 0 la distribucin ser simtrica
Si As > 0 Indica que existe presencia de la minora de datos en la parte derecha de la media, aunque
en algunos casos no necesariamente indicar que la distribucin sea asimtrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la siguiente
distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Calculando la media aritmtica se obtiene:
=
6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
=
=
= 11,5
8
8
9
2
9
3
12 12 12 15 17
4 5 6 7 8
2 + 3 9 + 9
=
=9
2
2
4 + 5 12 + 12
=
= 12
2
2
6 + 7 12 + 15
=
= 13,5
2
2
= 3,505
156
Medidas de Forma
3,505
3,505
1 + 3 22 9 + 13,5 2 12
=
= 0,333
3 1
13,5 9
(xi )2
N
(6 11,5)2 + (9 11,5)2 + (9 11,5)2 + (12 11,5)2 + (12 11,5)2 +(12 11,5)2 + (15 11,5)2 + (17 11,5)2
8
= 3,279
Calculando la Medida de Fisher se obtiene
Datos (xi x)3
6
-166,375
9
-15,625
9
-15,625
12
0,125
12
0,125
12
0,125
15
42,875
17
166,375
Total 12
( )3
12
=
=
= 0,035
3
8(3,279)3
157
Medidas de Forma
TAREA DE INTERAPRENDIZAJE N 15
1) Realice un organizador grfico sobre la asimetra.
2) Consulte y realice un organizador grfico para cada una de las biografas de Gauss, Laplace, Pearson,
Bowley y Fisher.
3) Calcule empleando las frmulas y mediante Excel el Coeficiente de Pearson, Medida de Bowley y la
Medida de Fisher dadas las siguientes distribuciones.
3.1) 4, 4, 8, 14, 14, 16, 18 y 20
-0,85; -0,45; -0,31
3.1) 6, 8, 10, 12, 14, 16, 18 y 20
0
4) Cree y resuelva un ejercicio para el clculo del Coeficiente de Pearson, Medida de Bowley y la Medida
de Fisher para datos agrupados en tablas de frecuencias, y otro ejercicio para datos agrupados en
intervalos. Emplee los conocimientos adquiridos en los anteriores captulos.
158
Medidas de Forma
B) MEDIDAS DE CURTOSIS
i) Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:
( )4
=
4
Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:
( )4
=
4
Para datos agrupados en intervalos se emplea la siguiente frmula:
( )4
=
4
Donde:
= cada uno de los valores
= nmero de datos
= media aritmtica
4 = Cudruplo de la desviacin estndar poblacional
= frecuencia absoluta
= marca de clase
Nota:
Si < 3 la distribucin es platicrtica
Si = 3 la distribucin es normal o mesocrtica
Si > 3 la distribucin es leptocrtica
159
Medidas de Forma
Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9, 9, 12, 12, 12,
15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solucin:
Calculando la media aritmtica se obtiene
6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
=
=
=
= 11,5
8
8
Calculando la desviacin estndar poblacional se obtiene:
(xi x)2
n
(6 11,5)2 + (9 11,5)2 + (9 11,5)2 + (12 11,5)2 + (12 11,5)2 +(12 11,5)2 + (15 11,5)2 + (17 11,5)2
=
8
= 3,279
Calculando la Medida de Fisher se obtiene:
Datos
6
9
9
12
12
12
15
17
Total
=
( )4
915,0625
39,0625
39,0625
0,0625
0,0625
0,0625
150,0625
915,0625
2058,5
(xi x)4
2058,5
=
= 2,23
4
n
8 (3,279)4
160
Medidas de Forma
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6
1
9
2
9
3
12 12 12 15 17
4 5 6 7 8
2 + 3 9 + 9
=
=9
2
2
6 + 7 12 + 15
=
= 13,5
2
2
100
]= [
100
100
]=
100
7 + 8 15 + 17
=
= 16
2
2
100
100
]= [
100
]=
100
Q 3 Q1
13,5 9
=
= 0,225
2(P90 P10 ) 2(16 6)
161
Medidas de Forma
TAREA DE INTERAPRENDIZAJE N 16
1) Realice un organizador grfico sobre la curtosis.
2) Cree y resuelva un ejercicio similar al presentado para el clculo de las medidas de curtosis con datos
sin agrupar.
3) Resuelva el ejercicio anterior empleando Excel.
4) Cree y resuelva un ejercicio para el clculo de las medidas de curtosis con datos agrupados en tablas
de frecuencia, y otro ejercicio con datos agrupados en intervalos. Emplee los conocimientos adquiridos
en los anteriores captulos.
162
Medidas de Forma
CAPTULO V
CORRELACIN Y RELACIN
RESULTADOS DE APRENDIZAJE:
Describe con sus propias palabras el significado de correlacin y regresin.
Emplea algoritmos matemticos para resolver ejercicios de aplicacin sobre correlacin y regresin
de manera manual y empleando Excel.
Elabora diagramas de dispersin y lneas de regresin de manera manual, empleando Excel, Graph y
GeoGebra
Crea y resuelve correctamente ejercicios de aplicacin sobre correlacin y regresin de manera
manual, empleando Excel, Graph y GeoGebra.
CONTENIDOS:
Anlisis de Correlacin: Diagrama de Dispersin, Clasificacin de la Correlacin, Coeficientes de
Correlacin y Coeficiente de Determinacin.
Anlisis de Regresin: Principio de los Mnimos Cuadrados y Error Estndar de Estimacin.
Correlacin y Regresin
163
CORRELACIN Y REGRESIN
Cuando se estudian en forma conjunta dos caractersticas (variables estadsticas) de una poblacin o
muestra, se dice que estamos analizando una variable estadstica bidimensional. La correlacin es el
grado de relacin que existe entre ambas caractersticas, y la regresin es la forma de expresar
matemticamente dicha relacin.
Correlacin y Regresin
164
C) COEFICIENTES DE CORRELACIN
Los coeficientes de correlacin son medidas que indican la situacin relativa de los mismos sucesos
respecto a las dos variables, es decir, son la expresin numrica que nos indica el grado de relacin
existente entre las 2 variables y en qu medida se relacionan. Son nmeros que varan entre los lmites
+1 y -1. Su magnitud indica el grado de asociacin entre las variables; el valor r = 0 indica que no existe
relacin entre las variables; los valores 1 son indicadores de una correlacin perfecta positiva (al crecer
o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
No hay correlacin
Correlacin Positiva
Correlacin Negativa
Correlacin y Regresin
165
Valor
-1
-0,9 a -0,99
-0,7 a -0,89
-0,4 a -0,69
-0,2 a -0,39
-0,01 a -0,19
0
0,01 a 0,19
0,2 a 0,39
0,4 a 0,69
0,7 a 0,89
0,9 a 0,99
1
Significado
Correlacin negativa grande y perfecta
Correlacin negativa muy alta
Correlacin negativa alta
Correlacin negativa moderada
Correlacin negativa baja
Correlacin negativa muy baja
Correlacin nula
Correlacin positiva muy baja
Correlacin positiva baja
Correlacin positiva moderada
Correlacin positiva alta
Correlacin positiva muy alta
Correlacin positiva grande y perfecta
Solucin:
Se calcula la media aritmtica
=
Para X:
180
=
= 15
12
Para Y:
138
=
= 11,5
12
Correlacin y Regresin
166
18
17
15
16
14
12
9
15
16
14
16
18
180
=
3
2
0
1
-1
-3
-6
0
1
-1
1
3
13
15
14
13
9
10
8
13
12
13
10
8
138
=
1,5
3,5
2,5
1,5
-2,5
-1,5
-3,5
1,5
0,5
1,5
-1,5
-3,5
9
4
0
1
1
9
36
0
1
1
1
9
72
4,5
7
0
1,5
2,5
4,5
21
0
0,5
-1,5
-1,5
-10,5
28
2,25
12,25
6,25
2,25
6,25
2,25
12,25
2,25
0,25
2,25
2,25
12,25
63
Se aplica la frmula:
=
( 2 )( 2 )
28
(72)(63)
= 0,416
Correlacin y Regresin
167
c) Pulsar en Aceptar.
Correlacin y Regresin
168
Correlacin y Regresin
169
c) Escribir los datos de X y los datos de Y. Para escribir las llaves utilizar el teclado virtual:
Pearson[ {18, 17, 15, 16, 14, 12, 9, 15, 16, 14, 16, 18}, {13, 15, 14, 13, 9, 10, 8, 13, 12, 13, 10, 8}]
d) Enter
Correlacin y Regresin
170
Correlacin y Regresin
171
d) Borrar Serie 1, las lneas horizontales y verticales (haciendo clic y suprimir en cada objeto).
Correlacin y Regresin
172
Correlacin y Regresin
173
h) Clic en Cerrar para culminar la elaboracin del diagrama de dispersin, aunque se le puede seguir
haciendo ms mejoras.
Correlacin y Regresin
174
Correlacin y Regresin
175
c) Escribir los puntos, y en estilo de lnea, escoger sin lnea. En rtulos poner en ver coordenadas a la
derecha. Pulsar en Aceptar.
Correlacin y Regresin
176
e) Llenar las casillas del Eje X de acuerdo a los datos del ejercicio.
f) Llenar las casillas del Eje Y de acuerdo a los datos del ejercicio.
Correlacin y Regresin
177
g) Pulsar en Aceptar para dar por culminado la elaboracin del diagrama de dispersin, el cual se
presenta en la siguiente figura:
Correlacin y Regresin
178
( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]
Donde:
= nmero de datos.
= frecuencia de celda.
= frecuencia de la variable X.
= frecuencia de la variable Y.
= valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda = 0, para que se hagan ms fciles los clculos.
= valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda = 0, para que se hagan ms fciles los clculos.
Ejemplo ilustrativo:
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones en una prueba de
conocimiento (Y) de 50 estudiantes:
N de
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
76
77
78
79
79
80
80
80
82
82
83
83
83
83
84
84
84
85
85
86
86
86
86
87
88
28
24
18
41
43
45
34
18
40
35
30
21
22
23
25
11
15
31
35
26
30
24
16
20
36
N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
88
88
88
88
89
89
90
90
90
91
92
92
93
93
93
94
96
97
98
99
100
101
101
102
102
40
31
35
26
30
24
18
11
15
38
34
31
33
35
24
40
35
36
40
33
51
54
55
41
45
179
Solucin:
1) En la tabla de frecuencias de dos variables, cada recuadro de esta tabla se llama una celda y
corresponde a un par de intervalos, y el nmero indicado en cada celda se llama frecuencia de celda.
Todos los totales indicados en la ltima fila y en la ltima columna se llaman totales marginales o
frecuencias marginales, y corresponden, respectivamente, a las frecuencias de intervalo de las
distribuciones de frecuencia separadas de la variable X y Y.
En la variable X:
Calculando el Rango se obtiene:
= = 102 76 = 26
Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 50 = 6,6 = 7
Calculando el ancho se obtiene:
26
= =
= 3,93 = 4
6,6
En la variable Y:
Calculando el Rango se obtiene:
= = 55 11 = 44
Calculando el nmero de intervalos se obtiene:
= 1 + 3,32 () = 1 + 3,32 50 = 6,64 = 7
Calculando el ancho se obtiene:
44
= =
= 6,62 = 7
6,64
Nota: Para la variable X se tomar un ancho de intervalo igual a 4 y para la variable Y un ancho de
intervalo igual a 7. Debe quedar igual nmero de intervalos para cada variable, que en este ejemplo es
igual a 7.
Correlacin y Regresin
180
Calificaciones (Y)
Contando las frecuencias de celda para cada par de intervalos de las variables X y Y se obtiene la
siguiente tabla de frecuencias de dos variables:
Coeficientes Intelectuales (X)
76-79 80-83 84-87 88-91 92-95 96-99 100-103
2
1
2
2
1
1
1
2
2
1
3
3
3
1
1
4
3
1
2
4
2
2
1
3
2
5
9
10
11
6
4
5
53-59
46-52
39-45
32-38
25-31
18-24
11-17
2
1
9
12
10
11
5
50
Interpretacin:
- El nmero 2 es la frecuencia de la celda correspondiente al par de intervalos 76-79 en Coeficiente
Intelectual y 39-45 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 5 en la fila de es el total marginal o frecuencia marginal del intervalo 76-79 en Coeficiente
Intelectual.
- El nmero 2 en la columna de es el total marginal o frecuencia marginal del intervalo 53-59 en
Calificacin obtenida en la prueba de conocimiento.
- El nmero 50 es total de frecuencias marginales y representa al nmero total de estudiantes.
2) Realizando los clculos respectivos se obtiene la siguiente tabla:
Coeficientes Intelectuales (X)
76-79 80-83 84-87 88-91 92-95 96-99 100-103
53-59
Calificaciones (Y)
46-52
39-45
32-38
25-31
18-24
11-17
-3
-2
-1
3
2
18
1
6
2
-6
1
-4
2
1
-2
2
4
12
3
0
3
0
-1
1
-2
2
9
9
-18
36
14
4
3
5
-15
45
9
16
-3
0
-1
10
-10
10
17
0
11
0
0
0
6
6
6
-2
4
8
16
2
5
15
45
30
18
18
-1
12
10
-10
10
11
-22
44
30
-15
45
50
-14
158
70
-30
130
70
Nota:
Los nmeros de las esquinas de cada celda en la anterior tabla representan el producto
, as por ejemplo, para obtener el nmero el nmero -6 de los intervalos 76-79 en X y 39-45 en
Correlacin y Regresin
181
Y se obtiene multiplicando 2(-3)1 = -6. Para obtener el nmero 18 de los intervalos 100-103 en X y 5359 en Y se obtiene multiplicando 233 = 18
Los nmeros de la ltima columna (18, 6, -1, 0, 8, 30 y 9) se obtienen sumando los nmeros de las
esquinas en cada fila, as por ejemplo, para obtener el nmero -1 se suma (-6) + (-4) + 0 + 1 +2 + 6 = -1
Los nmeros de la ltima fila (9, 14, 17, 0, -2, 2 y 30) se obtienen sumando los nmeros de las esquinas
en cada columna, as por ejemplo, para obtener el nmero 9 se suma (-6) + 3 + 12 = 9.
Para obtener el nmero -30 de la antepenlmina columna se obtiene sumando los resultados de ,
es decir, representa la
Para obtener el nmero -14 de la antepenlmina fila se obtiene sumando los resultados de , es
decir, representa la
Para obtener el nmero 130 de la penltima columna se obtiene sumando los resultados de 2 , es
decir, representa 2
Para obtener el nmero 158 de la penltima fila se obtiene sumando los resultados de 2 , es decir,
representa 2
Para obtener ltimo nmero 70 de la ltima columna se obtiene sumando los resultados de la ltima
columna 18 +6 +(-1) +0 + 8 + 30 +9 = 70, es decir, representa
Para obtener ltimo nmero 70 de la ltima fila se obtiene sumando los resultados de la ltima fila
9
+ 14 + 17 + 0 +(-2) +2 + 30 = 70 , es decir, representa . Por lo tanto tiene que ser igual al
ltimo nmero de la ltima columna como comprobacin que los clculos de la tabla han sido correctos.
Observando los datos en la tabla anterior se reemplaza los valores en la ecuacin del Coeficiente de
Correlacin de Pearson para datos agrupados, obtenindose:
( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]
50 70 (14)(30)
[50 158 (14)2 ][50 130 (30)2 ]
3080
43142400
3500 420
[7900 196][6500 900]
3080
[7704][5600]
3080
= 0,469
6568,287448
Correlacin y Regresin
182
TAREA DE INTERAPRENDIZAJE N 17
1) Elabore un organizador grfico de los tipos de correlacin.
2) Con los datos de la siguiente tabla sobre las temperaturas del da X y del da Y en determinadas horas
en una ciudad
X 9 10 12 14 16 18 20 22 24 26 28 30
Y 12 14 15 16 17 20 22 23 26 28 31 32
2.1) Calcule el coeficiente de correlacin de Pearson empleando la frmula y mediante Excel.
0,99
2.2) Elabore el diagrama de dispersin de manera manual.
2.3) Elabore el diagrama de dispersin empleando Excel.
2.4) Elabore el diagrama de dispersin empleando el programa Graph.
3) Cree y resuelva un ejercicio similar al anterior.
4) Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre las calificaciones obtenidos
en un curso de 50 estudiantes en la asignatura de Matemtica (X) y en la asignatura de Estadstica (Y),
determinar el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson.
3-4
5
5
1
11
1-2
7
4
11
12
9
4
17
8
50
60-69
8
1
2
5
2
18
50-59
3
10
6
2
21
40-49
4
6
1
11
15
17
22
22
15
9
100
183
determinar el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson para datos
agrupados.
N de
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
40
41
42
43
44
45
45
45
45
48
49
50
50
56
56
56
56
56
57
57
57
57
57
57
57
60
50
55
59
40
42
49
60
62
66
69
50
52
54
56
59
59
40
45
47
48
49
80
70
72
94-102 3
2
1
0
-1
-2
40-48 -3
N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
X Y
57
58
60
61
62
63
64
64
65
65
66
66
66
66
67
68
68
68
69
69
69
69
70
70
70
73
78
79
60
61
62
63
64
65
66
67
69
50
52
55
56
57
59
40
45
47
49
90
99
80
N de
estudiante
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
X Y
71
72
72
72
73
74
74
74
75
76
76
77
77
78
78
78
78
79
79
79
80
81
82
82
83
86
88
89
70
71
72
73
74
75
76
77
78
79
60
67
65
68
69
50
59
90
94
96
99
80
N de
estudiante
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
40-48
-3
X Y
84
84
85
86
86
86
87
87
88
88
88
88
89
89
89
90
91
92
93
94
95
96
97
98
99
83
84
86
88
89
70
78
79
78
77
79
78
78
60
69
90
96
97
99
80
81
82
83
89
70
94-102
-2
-1
5
3
2
10
9
100
Correlacin positiva moderada de 0,62
Correlacin y Regresin
184
1
2
3
4
5
6
7
8
3
4
1
5
6
2
8
7
Solucin:
El diagrama de dispersin hecho en Excel se muestra en la siguiente figura:
Correlacin y Regresin
185
Para calcular el coeficiente de correlacin por rangos de Spearman de se llena la siguiente tabla:
= 2 = ( )2
3
-2
4
4
-2
4
1
2
4
5
-1
1
6
-1
1
2
4
16
8
-1
1
7
1
1
2
= 32
Estudiante
Dyanita
1
Elizabeth
2
Mario
3
Orlando
4
Mathas
5
Josu
6
Emily
7
Monserrath 8
Se aplica la frmula:
= 1
6 2
6 32
192 504 192 312
= 1
=1
=
=
= 0,619
2
2
( 1)
8(8 1)
504
504
504
Por lo tanto existe una correlacin positiva moderada entre la primera y segunda evaluacin de los 8
estudiantes.
Correlacin y Regresin
186
c) Pulsar en Aceptar.
Correlacin y Regresin
187
b) Seleccionar la opcin Spearman[ <Lista de Nmeros>, <Lista de Nmeros> ]. Escribir los datos de X
y de Y
Spearman[{1, 2, 3, 4, 5, 6, 7, 8}, {3, 4, 1, 5, 6, 2, 8, 7}]
Correlacin y Regresin
188
c) Enter
Ejemplo ilustrativo N 2
La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las asignaturas de
Matemtica y Estadstica. Calcular el coeficiente de correlacin por rangos de Spearman y realizar el
diagrama de dispersin.
N Estudiante Matemtica Estadstica
1 Dyana
10
8
Elizabeth
2
9
6
3 Mario
8
10
4 Orlando
7
9
5 Mathas
7
8
6 Josu
6
7
7 Emily
6
6
8 Monserrath
4
9
Solucin:
Para calcular el coeficiente de correlacin por rangos de Spearman se procede a clasificar u ordenar los
datos en rangos (X para Matemtica y Y para Estadstica) tomando en cuenta las siguientes
observaciones:
En la asignatura de Matemtica se observa:
- Dyana tiene la ms alta calificacin, ocupando el primer puesto, por lo que su rango es 1
- Elizabeth ocupa el segundo puesto, por lo que su rango es 2
- Mario se encuentra ubicado en el tercer lugar, por lo que su rango es 3
- Orlando y Mathas ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmtica de 4 y
5 que da por resultado 4,5
- Josu y Emily ocupan el sexto y sptimo lugar, por lo que su rango es la media aritmtica de 6 y 7 que
da por resultado 6,5
- Monserrath se encuentra ubicada en el octavo lugar, por lo que su rango es 8
En la asignatura de Estadstica se observa:
- Mario tiene la ms alta calificacin, ocupando el primer puesto, por lo que su rango es 1
- Orlando y Monserrath ocupan el segundo y tercer puesto, por lo que su rango es la media aritmtica de
2 y 3 que da por resultado 2,5
- Dyana y Mathas ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmtica de 4 y 5
que da por resultado 4,5
- Josu se encuentra ubicado en el sexto lugar, por lo que su rango es 6
- Elizabeth y Emily ocupan el sptimo y octavo lugar, por lo que su rango es la media aritmtica de 7 y
8 que da por resultado 7,5
Correlacin y Regresin
189
1
2
3
4,5
4,5
6,5
6,5
8
4,5
7,5
1
2,5
4,5
6
7,5
2,5
1
2
3
4,5
4,5
6,5
6,5
8
4,5
7,5
1
2,5
4,5
6
7,5
2,5
= 2
-3,5
-5,5
2
2
0
0,5
-1
5,5
= ( )2
12,25
30,25
4
4
0
0,25
1
30,25
d2 = 82
Correlacin y Regresin
190
TAREA DE INTERAPRENDIZAJE N 18
1) Consulte sobre la biografa de Spearman y realice un organizador grfico de la misma.
2) La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin (X) y el rango o puesto
obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la asignatura de Matemtica.
X 1 2 3 4 5 6 7 8
Y 4 5 6 8 3 2 1 7
Matemtica
10
9
8
8
7
6
6
6
5
4
4
3
3
2
1
0,7
0,5
0,5
Estadstica
3,5
1
6
8
7
10
4
3,5
1
3
9
5
2,5
0,7
2
1,5
2,5
0,5
Correlacin y Regresin
191
D) COEFICIENTE DE DETERMINACIN
Revela qu porcentaje del cambio en Y se explica por un cambio en X. Se calcula elevando al cuadrado
el coeficiente de correlacin.
=
( 2 )( 2 )
=
=
r = Coeficiente de correlacin de Pearson
2 = Coeficiente de determinacin
( 2 )( 2 )
puede
( )( )
[ 2 ( )2 ][ 2 ( )2 ]
18
13
234
324
17
15
255
289
15
14
210
225
16
13
208
256
14
9
126
196
12
10
120
144
9
8
72
81
15
13
195
225
16
12
192
256
14
13
182
196
16
10
160
256
18
8
144
324
= = = =
Correlacin y Regresin
169
225
196
169
81
100
64
169
144
169
100
64
192
( )( )
[ 2 ( )2 ][ 2 ( )2 ]
25176 24840
[33264 32400][19800 19044]
[864][756]
336
653184
336
= 0,4157
808,198
Nota:
El 2 tiene significado slo para las relaciones lineales. Dos variables pueden tener 2 = 0 y sin embargo
estar relacionadas en sentido curvilneo. El valor de 2 no se interpreta como si la variable Y fuera
causado por un cambio de la variable X, ya que la correlacin no significa causa.
Correlacin y Regresin
193
TAREA DE INTERAPRENDIZAJE N 19
1) La siguiente tabla muestra el dinero en miles de dlares gastado en publicidad por una empresa (X)
para vender sus productos, y el nmero en miles de clientes (Y) que compran los productos de la empresa.
X 15 17 14 13 18 20 17 18 16 14 20 18
Y 30 34 28 26 32 40 34 36 32 25 40 36
Correlacin y Regresin
194
195
Las constantes
frmulas:
a0
0 =
2
2 ( )2
1 =
2 ( )2
1 =
2 ( )2
)
y2
Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre la altura en centmetros (X) y los pesos en kilogramos (Y) de
una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 152 157 162 167 173 178 182 188
Y 56 61 67 72 70 72 83 92
Correlacin y Regresin
196
1) Ajustar la recta de mnimos cuadrados para Y como variable dependiente resolviendo el sistema:
= 0 + 1
{
= 0 + 1 2
2) Ajustar la recta de mnimos cuadrados para Y como variable dependiente empleando las frmulas:
0 =
2
2 ( )2
1 =
2 ( )2
3) Ajustar la recta de mnimos cuadrados para Y como variable dependiente empleando la frmula:
= ( 2)
x
4) Ajustar la recta de mnimos cuadrados para X como variable dependiente resolviendo el sistema:
{
= 0 + 1
= 0 + 1 2
Solucin:
Se llena la siguiente tabla:
152
157
162
167
173
178
182
188
= 1359
2
2
8512
23104
3136
9577
24649
3721
10854
26244
4489
12024
27889
5184
12110
29929
4900
12816
31684
5184
15106
33124
6889
17296
35344
8464
2
2
= 573 = 98295 = 231967 = 41967
56
61
67
72
70
72
83
92
= 0 + 1
573 = 0 8 + 1 1359
80 + 13591 = 573
2 98295 = 1359 + 231967 {1359 + 231967 = 98295
= 0 + 1
0
1
0
1
Correlacin y Regresin
197
231967
1359
1359
8855
|
|
1359 231967
8
573
1 |1359 98295| 8 98295 1359 573 7653
1 =
=
=
=
= 0,864
8855
8855
8855
Para calcular los valores de 1 0 en Excel se calcula de la siguiente manera:
a) Escribir los datos. Seleccionar las celdas donde aparecer la respuesta
Correlacin y Regresin
198
d) Presione CTRL+SHIFT+ENTER
Correlacin y Regresin
199
1359
573
= 169,875 ; =
= 71,625
8
8
152
157
162
167
173
178
182
188
56
61
67
72
70
72
83
92
-17,88
-12,88
-7,875
-2,875
3,125
8,125
12,125
18,125
-15,625
-10,625
-4,625
0,375
-1,625
0,375
11,375
20,375
279,297
136,797
36,422
-1,078
-5,078
3,047
137,922
369,297
319,516
165,766
62,016
8,266
9,766
66,016
147,016
328,516
244,141
112,891
21,391
0,141
2,641
0,141
129,391
415,141
= 1359
= 573
200
956,625 83230,29
956,625 83230,29
=
= 0,864 75,19
1106,875
1106,875 1106,875
= 75,19 + 0,864
= 0 + 1
1359 = 0 8 + 1 573
80 + 5731 = 1359
2 98295 = 573 + 41967 573 + 41967 = 98295
= 0 + 1
0
1
0
1
Interpretacin:
- El valor 1 = 1,033 indica que la recta tiene una pendiente positiva aumentando a razn de 1,033
- El valor de 0 = 95,871 indica el punto en donde la recta interseca al eje X cuanto Y = 0
Correlacin y Regresin
201
5) Para calcular el centroide (, ) se resuelve el sistema formado por las dos rectas de los mnimos
cuadrados en donde X es y Y es .
= 75,191 + 0,864
{
= 95,871 + 1,033
Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092
6) En Excel, insertando grfico de dispersin se obtiene la siguiente figura:
202
TAREA DE INTERAPRENDIZAJE N 20
1) Consulte sobre la biografa de Francis Galton y de Cramer, y realice un organizador grfico de cada
una.
2) Dada la siguiente tabla sobre la altura en centmetros (X) y los pesos en kilogramos (Y) de una muestra
de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 150 155 160 165 170 175 180 185
Y 55 60 63 67 70 74 79 85
2.1) Ajuste la recta de mnimos cuadrados para Y como variable dependiente resolviendo el siguiente
sistema y empleando Excel y GeoGebra.
= 0 + 1
{
= 0 + 1 2
= 66,869 + 0,812
2.2) Ajuste la recta de mnimos cuadrados para Y como variable dependiente empleando las frmulas
2
0 =
=
1
2 ( )2
2 ( )2
0 = 66,869 ;
1 = 0,812
2.3) Ajuste la recta de mnimos cuadrados para Y como variable dependiente empleando la frmula
= ( 2)
x
= 66,869 + 0,812
2.4) Ajuste la recta de mnimos cuadrados para X como variable dependiente resolviendo el siguiente
sistema y empleando Excel y GeoGebra.
{
= 0 + 1
= 0 + 1 2
= 83,18 + 1,22
2.5) Ajuste la recta de mnimos cuadrados para X como variable dependiente empleando las frmulas
2
0 =
=
1
2 ( )2
2 ( )2
0 = 83.18 ;
1 = 1,22
2.6) Ajuste la recta de mnimos cuadrados para X como variable dependiente empleando la frmula
= ( 2)
y
= 83,18 + 1,22
2.7) Calcule el punto centroide.
= 170,9 ; = 71,9
2.8) Calcule el coeficiente de determinacin.
0,99
Correlacin y Regresin
203
2.9) Elabore el diagrama de dispersin. Y en el mismo diagrama graficar las dos rectas de mnimos
cuadrados obtenidas en los pasos anteriores. Elabore de manera manual, empleando Excel y el programa
Graph.
2.10) Estime el valor de Y cuando X = 173 en el diagrama de dispersin de Y como variable dependiente.
73,6
2.11) Estime el valor de X cuando Y = 73 en el diagrama de dispersin de Y como variable dependiente.
172,2
3) Cree y resuelva un ejercicio similar al anterior con datos obtenidos de 10 amigas suyas.
4) Consulte en la biblioteca o en el internet sobre un ejercicio de aplicacin de la rectas de los mnimos
cuadrados. Presente ejercicio resuelto en forma manual y empleando Excel y Graph.
Correlacin y Regresin
204
Solucin:
1) Para ajustar una parbola de mnimos cuadrados se llena la siguiente tabla:
Ao
1960
1965
1970
1975
1980
1985
1990
1995
2000
2005
2010
-5
-4
-3
-2
-1
0
1
2
3
4
5
0
4,52
5,18
6,25
7,42
8,16
9,12
10,92
11,62
12,68
13,12
13,97
102,96
25
16
9
4
1
0
1
4
9
16
25
110
-125
-64
-27
-8
-1
0
1
8
27
64
125
0
625
256
81
16
1
0
1
16
81
256
625
1958
-22,6
-20,72
-18,75
-14,84
-8,16
0
10,92
23,24
38,04
52,48
69,85
109,46
113
82,88
56,25
29,68
8,16
0
10,92
46,48
114,12
209,92
349,25
1020,66
a0 =
Correlacin y Regresin
205
1 =
2 =
Correlacin y Regresin
206
Correlacin y Regresin
207
67669
5473
149
= 9,464 ;
= 0,995 ;
= 0,01
7150
5500
14300
Remplazando los valores encontrados se obtiene la ecuacin de la parbola de mnimos cuadrados:
= 0 + 1 + 2 2 = 9,464 + 0,995 0,01 2
2) Los valores de tendencia se obtienen al remplazar los valores de X en la ecuacin de la parbola de
mnimos cuadrados, los cuales se presenta en la siguiente tabla:
Ao
1960
1965
1970
1975
1980
1985
1990
1995
2000
2005
2010
-5
-4
-3
-2
-1
0
1
2
3
4
5
4,52
5,18
6,25
7,42
8,16
9,12
10,92
11,62
12,68
13,12
13,97
Valores de tendencia
= 9,464 + 0,995 0,01 2
4,24
5,32
6,39
7,43
8,46
9,46
10,45
11,41
12,36
13,28
14,19
3) Para estimar la poblacin de los aos 2015 y 2020 se transforma estos aos a X siguiendo la secuencia
de la tabla anterior, siendo X = 6 para el ao 2015 y X= 7 para el 2020
Entonces para el 2015 se tiene:
Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(6) - 0,01(6)2 = 9,464 + 5,97-0,36 =15,074
Para el 2020 se tiene:
Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(7) - 0,01(7)2 = 9,464 + 6,965-0,49 =15,939
Correlacin y Regresin
208
2
-5 4,52
25
-4 5,18
16
-3 6,25
9
-2 7,42
4
-1 8,16
1
0
9,12
0
1 10,92
1
2 11,62
4
3 12,68
9
4 13,12 16
5 13,97 25
0 102,96 110
( )( )
[ 2 ( )2 ][ 2 ( )2 ]
= 0,996
-22,6
-20,72
-18,75
-14,84
-8,16
0
10,92
23,24
38,04
52,48
69,85
109,46
2
20,430
26,832
39,063
55,056
66,586
83,174
119,246
135,024
160,782
172,134
195,161
1073,490
11 109,46 0 102,96
[11 110 (0)2 ][11 1073,490 (102,96)2 ]
Correlacin y Regresin
209
Correlacin y Regresin
210
TAREA DE INTERAPRENDIZAJE N 21
1) La siguiente tabla muestra la poblacin aproximada de la Provincia de Imbabura en los aos
2010 en intervalos de 5 aos.
1960-
Ao
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Poblacin (miles) 123 140 170 201 221 247 296 315 344 356 379
1.1) Ajuste una parbola de mnimos cuadrados de la forma = 0 + 1 + 2 2 manera manual,
empleando Excel y GeoGebra.
Y = 256,464 + 26,991X - 0,265X2
1.2) Calcule los valores de tendencia para los aos dados de manera manual y empleando Excel.
Ao
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Valor de tendencia 114,88 144,26 173,11 201,42 229,21 256,46 283,19 309,39 335,05 360,19 384,79
1.3) Estime la poblacin para los aos 2015 y 2020
Ao 2015 = 408,87 miles de habitantes
Ao 2020 = 432,42 miles de habitantes
1.4) Calcule el coeficiente de determinacin de manera manual y empleando Excel.
0,992
1.5) Elabore un diagrama de dispersin, y en el mismo diagrama graficar la parbola de los mnimos
cuadrados de manera manual, empleando Graph y GeoGebra.
2) Cree y resuelva un ejercicio de aplicacin de la parbola de los mnimos cuadrados con datos de la
poblacin del Ecuador o de cualquier otro pas de manera manual, empleando Excel y Graph.
3) Consulte en la biblioteca o en el internet un ejercicio de aplicacin de la Parbola de los mnimos
cuadrados. Presente el ejercicio resuelto con GeoGebra y Graph.
= + X
X logY = log X + log 2
Correlacin y Regresin
211
Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas
por cierto fabricante que an pueden usarse despus de recorrer cierto nmero de millas:
Miles de Millas recorridas (X)
Porcentaje til (Y)
1
99
2
95
5
85
15
55
25
30
30
24
35
20
40
15
Correlacin y Regresin
212
99
2
5
15
25
30
35
40
= 153
95
85
55
30
24
20
15
1,996
1,978
1,929
1,740
1,477
1,380
1,301
1,176
= 12,97759
2
1
1,996
4
3,955
25
9,647
225
26,105
625
36,928
900
41,406
1225
45,536
1600
47,044
2
= 4605 = 212,61769
= + X
X logY = log X + log 2
36840 23409
13431
|
|
153 4605
8
12,97759
|153 212,61769| 1700,944152 1985,57127 284,627118
=
=
=
=
= 0,02119180389
13431
13431
13431
Correlacin y Regresin
213
Correlacin y Regresin
214
5) La estimacin del porcentaje de llantas radiales que durarn 50000 millas se obtiene remplazando en
la ecuacin predictora el valor de X = 50
= 106,536 0,952
= 106,536 0,95250 = 9,106
Entonces el porcentaje sera de 9,106%
215
Correlacin y Regresin
TAREA DE INTERAPRENDIZAJE N 22
1) Elabore un organizador grfico sobre la regresin exponencial.
2) Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante
que an pueden usarse despus de recorrer cierto nmero de millas:
Miles de Millas recorridas (X)
Porcentaje til (Y)
1
98
2
92
5
80
10
64
20
36
30
32
40
17
50
11
2.1) Ajuste una curva exponencial aplicando el mtodo de mnimos cuadrados. Resolver manualmente
empleando Excel. Realizar los clculos empleando la mayor cantidad de decimales.
= 1,9988 0,0189
2.2) Calcule la ecuacin predictora en forma manual y con GeoGebra.
= 99,72 0,9574
2.3) Grafique la ecuacin predictora de manera manual y empleando Excel.
2.4) Estime qu porcentaje de las llantas radiales del fabricante durarn 35000 millas.
21,7%
3) Cree y resuelva un ejercicio de aplicacin de la regresin exponencial de manera manual, empleando
Excel y GeoGebra.
1
+
Para el primer caso los valores siguen una ley potencial. Si la ecuacin predictora est dada por:
tomando logaritmos en ambos miembros, queda:
= +
= + logX
logX logY = log logX + ()2
1
+
, entonces invirtiendo, la
, o sea:
1
1
1
=
=+
+
Correlacin y Regresin
216
{
1
X = X + 2
Ejemplos ilustrativo N 1
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable
independiente) e Y es la presin de una masa dada de gas (variable resultante).
X 1 2 3 4
5
6
7
Y 7 30 90 170 290 450 650
1.1) Elaborar el diagrama de dispersin.
1.2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.
1.3) Calcular la ecuacin predictora.
1.4) Graficar la ecuacin predictora.
1.5) Estimar la presin de la masa de gas de volumen 9.
Solucin:
1.1) El diagrama de dispersin elaborado en Excel se presenta en la siguiente figura:
Correlacin y Regresin
217
1.2) Para ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados se llena la siguiente
tabla:
1
2
3
4
5
6
7
= 28
7
30
90
170
290
450
650
0,0000
0,8451
0,0000
0,3010
1,4771
0,4447
0,4771
1,9542
0,9324
0,6021
2,2304
1,3429
0,6990
2,4624
1,7211
0,7782
2,6532
2,0646
0,8451
2,8129
2,3772
= 3,7024 = 14,4354 = 8,8829
()2
0,0000
0,0906
0,2276
0,3625
0,4886
0,6055
0,7142
()2 = 2,4890
= + logX
logX logY = log logX + ()2
14,4354 = 7 + 3,7024
7 + 3,7024 = 14,4354
{
8,8829 = 3,7024 + 2,4890
3,7024 + 2,4890 = 8,8829
Correlacin y Regresin
218
1.5) Para estimar la presin de la masa de gas de volumen 9 se reemplaza el valor X = 9 en la ecuacin
predictora
= 6,592 2,351
= 6,592 92,351 = 1154,63
Ejemplo ilustrativo N 2
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable independiente
e Y la variable resultante.
X 1
2 3
4
5
6
7
Y 1,4 1 0,9 0,7 0,6 0,55 0,5
2.1) Elaborar el diagrama de dispersin.
Correlacin y Regresin
219
Solucin:
2.1) El diagrama de dispersin elaborado en Graph se muestra en la siguiente figura:
(1/)
1/
2
1
1,4
0,7143
0,7143
1
2
1
1,0000
2,0000
4
3
0,9
1,1111
3,3333
9
4
0,7
1,4286
5,7143
16
5
0,6
1,6667
8,3333
25
6
0,55
1,8182
10,9091
36
7
0,5
2,0000
14,0000
49
2
(1/) = 9,7388 (1/) = 45,0043 = 140
= 28
Remplazando valores en el siguiente sistema se obtiene:
1
= + X
{
1
X = X + 2
9,7388 = 7 + 28
7 + 28 = 9,7388
{
45,0043 = 28 + 140
28 + 140 = 45,0043
Correlacin y Regresin
220
Correlacin y Regresin
221
TAREA DE INTERAPRENDIZAJE N 23
1) Elabore un organizador grfico sobre la regresin potencial.
2) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable
independiente) e Y es la presin de una masa dada de gas (variable resultante).
X 1 2 3 4
5
6
7
Y 5 35 90 180 300 460 670
2.1) Elabore el diagrama de dispersin de manera manual, empleando Excel y Graph
2.2) Ajuste una curva exponencial aplicando el mtodo de mnimos cuadrados empleando por lo menos
4 decimales para los clculos.
= 0,7437 + 2,4883
2.3) Calcule la ecuacin predictora en forma manual y con GeoGebra.
= 5,5424 2,4883
2.4) Grafique la ecuacin predictora de manera manual y empleando Excel.
2.5) Estime la presin de la masa de gas de volumen 8.
979,17
3) Cree y resuelva un ejercicio similar al anterior.
4) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable
independiente e Y la variable resultante.
X 1
2 3
4
5
6
7
Y 1,5 1 0,8 0,9 0,5 0,4 0,3
4.1) Elabore el diagrama de dispersin de manera manual, empleando Excel y Graph.
4.2) Calcule las constantes , aplicando el mtodo de mnimos cuadrados de manera manual y
empleando Excel.
= 0,0159; = 0,4196
4.3) Calcule la ecuacin predictora.
1
=
0,0159 + 0,4196
4.4) Grafique la ecuacin predictora de manera manual, empleando Excel y Graph.
4.5) Estime el valor de Y para X = 8
0,2965
Correlacin y Regresin
222
2 0 1
2
2 1
=
2
Donde:
0 = ordenada en el origen (punto de interseccin de la recta con el eje y)
1 = pendiente de la recta (tangente del ngulo de inclinacin de la recta)
=
=
Ejemplo ilustrativo
Calcular error estndar de estimacin empleando las 3 frmulas dadas, utilizando los datos de la tabla
del ejemplo para ajustar la recta de mnimos cuadrados para Y como variable dependiente.
X 152 157 162 167 173 178 182 188
Y 56 61 67 72 70 72 83 92
Solucin:
Para comenzar a resolver este ejemplo recordemos que ya se obtuvo los valores respectivos al resolver
el ejemplo para ajustar la recta de mnimos cuadrados, los cuales fueron:
= 1359; = 573; = 98295; 2 = 231967; 2 = 41967; = 956,625
2 = 1106,875; 2 = 925,875; 0 = 75,191; 1 = 0,864; = 75,191 + 0,864
1) Para emplear la primera frmula se llena la siguiente tabla:
152
157
162
167
173
178
182
188
56
61
67
72
70
72
83
92
= 75,191 + 0,86
-75,191+0,86(152)
-75,191+0,86(157)
-75,191+0,86(162)
-75,191+0,86(167)
-75,191+0,86(173)
-75,191+0,86(178)
-75,191+0,86(182)
-75,191+0,86(188)
Correlacin y Regresin
( )2
55,529
0,222
59,829
1,371
64,129
8,243
68,429
12,752
73,589
12,881
77,889
34,680
81,329
2,792
86,489
30,371
103,312
223
=
=
= 3,842
2
82
Realizando los clculos de los componentes de la frmula empleando Excel se obtiene un valor ms
exacto, ya que Excel utiliza una mayor cantidad de decimales al realizar los clculos. Estos clculos se
muestran en la siguiente figura:
Correlacin y Regresin
224
Los clculos de los componentes de la frmula empleando Excel se muestran en la siguiente figura:
=
=
=
= 4,069
2
82
6
Los clculos de los componentes de la frmula empleando Excel se muestran en la siguiente figura:
Correlacin y Regresin
225
Interpretacin: El valor de = 4,064, significa que los puntos estn dispersos a una distancia de 4,064
de la recta de regresin.
TAREA DE INTERAPRENDIZAJE N 24
Dada la siguiente tabla sobre la altura en centmetros (X) y los pesos en kilogramos (Y) de una muestra
de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 150 155 160 165 170 175 180 185
Y 56 61 64 68 72 75 80 90
1) Calcule el coeficiente de determinacin de manera manual y empleando Excel.
0,97
2) Calcule el error estndar de estimacin empleando la primera frmula. Utilice 5 decimales para los
clculos. Los elementos de la frmula calcule empleando Excel, tal como se indic en el ejemplo.
2,1
3) Calcule el error estndar de estimacin empleando la segunda frmula. Utilice 5 decimales para los
clculos. Los elementos de la frmula calcule empleando Excel, tal como se indic en el ejemplo.
2,1
4) Calcule el error estndar de estimacin empleando la tercera frmula. Utilice 5 decimales para los
clculos. Los elementos de la frmula calcule empleando Excel, tal como se indic en el ejemplo.
2,1
5) Calcule el error estndar de estimacin empleando exclusivamente Excel.
2,1
6) Elabore el diagrama de dispersin, y en el mismo diagrama graficar la recta de regresin. Realice de
manera manual, empleando Excel y Graph.
Correlacin y Regresin
226
CAPTULO VI
SERIES DE TIEMPO
RESULTADOS DE APRENDIZAJE:
Analiza e interpreta la aplicacin de los datos de series de tiempo para hacer pronsticos.
Emplea algoritmos matemticos para resolver ejercicios de aplicacin sobre series de tiempo de
manera manual y empleando Excel.
Elabora diagramas de dispersin y lneas de tendencias de manera manual, empleando Excel, Graph
y GeoGebra
Crea y resuelve correctamente ejercicios de aplicacin sobre series de tiempo de manera manual,
empleando Excel, Graph y GeoGebra
CONTENIDOS:
Definicin
Movimientos o Componentes
Modelos de Series de Tiempo
Mtodos de Suavizamiento y Pronstico
Anlisis de Tendencia
Anlisis de Movimientos Estacionales
Anlisis de Movimientos Cclicos e Irregulares
227
Series Cronolgicas
6.1) DEFINICIN
Las series de tiempo llamadas tambin series cronolgicas o series histricas son un conjunto de datos
numricos que se obtienen en perodos regulares y especficos a travs del tiempo, los tiempos pueden
ser en aos, meses, semanas, das u otra unidad adecuada al problema que se est trabajando. Ejemplos
de series de tiempo son: Ventas mensuales de un producto en una empresa, produccin total anual de
petrleo en Ecuador durante un cierto nmero aos o las temperaturas anunciadas cada hora por el
meteorlogo para un aeropuerto.
Matemticamente, una serie de tiempo se define por los valores 1 , 2 , 3, . de una variable Y (ventas
mensuales, produccin total, etc.) en tiempos 1 , 2 , 3, . Si se reemplaza a X por la variable tiempo,
estas series se definen como distribuciones de pares ordenados (X,Y) en el plano cartesiano, siendo Y
una funcin de X; esto se denota por:
= () = ()
El principal objetivo de las series de tiempo es hacer proyecciones o pronsticos sobre una actividad
futura, suponiendo estables las condiciones y variaciones registradas hasta la fecha, lo cual permite
planear y tomar decisiones a corto o largo plazo. Despus, con base en esa situacin ideal, que supone
que los factores que influyeron en la serie en el pasado lo continuarn haciendo en el futuro, se analizan
las tendencias pasadas y el comportamiento de las actividades bajo la influencia de ellas; por ejemplo,
en la proyeccin de ventas de un producto o de un servicio de una empresa se calculan los posibles
precios, la reaccin del consumidor, la influencia de la competencia, etc.
228
Series Cronolgicas
229
Series Cronolgicas
c) Borrar el texto Series 1 del grfico. Escribir Exportaciones de la Empresa D & M en ttulo del grfico.
Escribir Aos en ttulo del eje horizontal. Escribir Millones de dlares en ttulo del eje vertical. Poner los
aos de las celdas A2:A11 en los nmeros del eje horizontal. Agregar etiquetas. Dar formato al eje
vertical con un mximo de 5, tal como ya se indic en captulos anteriores.
230
Series Cronolgicas
231
Series Cronolgicas
232
Series Cronolgicas
i) Insertar Cuadro de texto. Escribir Recta de tendencia en un cuadro de texto, y en otro escribir Datos
reales.
B) MOVIMIENTOS ESTACIONALES
Representa un movimiento peridico que se producen en forma similar cada ao por la misma poca, en
correlacin con los meses o con las estaciones del ao y aun con determinadas fechas. Si los sucesos no
se repiten anualmente, los datos deben recolectarse trimestral, mensual o incluso semanalmente.
Ejemplos de movimientos estacionales son la variacin de precios de ciertos productos, incremento de
ventas de juguetes y disminucin de ventas de tiles Navidad, incremento de ventas de flores por el da
del amor y la amistad, etc.
A continuacin se muestra un ejemplo de grfica que representa este tipo de movimientos estacionales:
233
Series Cronolgicas
C) MOVIMIENTOS CCLICOS
Son variaciones hacia arriba y hacia abajo de la tendencia que se presentan cada cierto nmero de
intervalos, en forma peridica de manera ondular a modo de oscilaciones ms o menos regulares durante
un perodo relativamente prolongado, que por lo general abarca tres o ms aos de duracin. La
produccin, empleo, promedio industrial, etc. son ejemplos de este tipo de movimientos.
A continuacin se muestra un ejemplo de grfica que representa este tipo de movimientos cclicos:
A continuacin se muestra un ejemplo de grfica que representa este tipo de movimientos irregulares:
234
Series Cronolgicas
TAREA DE INTERAPRENDIZAJE N 25
1) Realice un organizador grfico sobre las series de tiempo.
2) Elabore empleando Excel las grficas de los ejemplos presentados en los movimientos estacionales,
cclicos e irregulares.
3) Cree y elabore una grfica que represente a cada uno de los movimientos de las series de tiempo de
manera manual y empleando Excel.
A) MODELO MULTIPLICATIVO
En el que queda definida por el producto de las variaciones.
=
B) MODELO ADITIVO
En el que Y queda definida por la suma de las variaciones.
=+++
235
Series Cronolgicas
Por ejemplo: Dados los valores 4, 6, 8, 10, 12 tendramos para el movimiento medio de orden 2
4 + 6 6 + 8 8 + 10 10 + 12
;
;
;
2
2
2
2
O sea los valores 5; 7; 9; 11
236
Series Cronolgicas
Ejemplo ilustrativo
Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa D & M durante los ltimos
3 aos tomados en perodos de trimestres:
Trimestre Ventas
1
12
2
16
3
20
4
34
5
23
6
19
7
20
8
35
9
11
10
19
11
24
12
36
1) Suavizar los datos empleando el mtodo de los promedios mviles de orden 3 (longitud de 3 perodos).
2) Pronosticar las ventas para el trimestre nmero 13.
3) Suponga que para el Gerente de Ventas la ltima venta realizada es el doble de importante que la
penltima, y la antepenltima venta tiene la mitad de importancia que la penltima. Realizar el pronstico
de ventas para el trimestre nmero 13 empleando el mtodo de los promedios mviles ponderados de
orden 3.
4) Elaborar un grfico en el que consten las ventas y los promedios mviles (ventas suavizadas).
Solucin:
1) El clculo de los promedios mviles de orden 3 se presentan en la siguiente tabla:
Trimestre Ventas Pronstico (Promedios mviles)
1
12
2
16
(12+16+20)/3 = 16,00
3
20
(16+20+34)/3 = 23,33
4
34
(20+34+23)/3 = 25,67
5
23
(34+23+19)/3 = 25,33
6
19
(23+19+20)/3 = 20,67
7
20
(19+20+35)/3 = 24,67
8
35
(20+35+11)/3 = 22,00
9
11
(35+11+19)/3 = 21,67
10
19
(11+19+24)/3 = 18,00
11
24
(19+24+36)/3 = 26,33
12
36
237
Series Cronolgicas
2) El ltimo valor del promedio mvil, que en este ejemplo es 26,33, representa el pronstico de las
ventas para el trimestre nmero 13, y tericamente para todo trimestre futuro.
3) Para resolver lo planteado se toma en cuenta las 3 ltimas ventas con sus respectivos pesos o
ponderaciones. Estos datos se presentan en la siguiente tabla:
Trimestre Ventas
10
19
11
24
12
36
Pesos (w)
0,5
1
2
1 1 + 2 2 + 3 3 +
=
1 + 2 + 3 +
0,5 19 + 1 24 + 2 36 105,5
=
= 30,14
0,5 + 1 + 2
3,5
238
Series Cronolgicas
4) El grfico en el que constan las ventas y los promedios mviles se muestra en la siguiente figura
elaborado empleando Excel:
239
Series Cronolgicas
B) SUAVIZACIN EXPONENCIAL
Este mtodo contiene un mecanismo de autocorreccin que ajusta los pronsticos en direccin opuesta a
los errores pasados. Es un caso particular de promedios mviles ponderados de los valores actuales y
anteriores en el cual las ponderaciones disminuyen exponencialmente. Se emplea tanto para suavizar
como para realizar pronsticos. Se emplea la siguiente frmula:
+1 = + (1 )
Donde:
+1 = pronstico para cualquier perodo futuro.
= constante de suavizacin, a la cual se le da un valor entre 0 y 1.
= valor real para el perodo de tiempo.
= pronstico hecho previamente para el perodo de tiempo
Cuando exista menos dispersin en los datos reales respecto a los datos pronosticados entonces ser ms
confiable el mtodo empleado. Para saber cuan preciso es el mtodo empleado en la realizacin del
pronstico se utiliza la siguiente frmula del cuadrado medio del error (CME) como indicador de
precisin del pronstico:
=
( )2
Solucin:
1) Realizando los clculos de suavizamiento se obtienen los resultados respectivos de pronstico, los
cuales se presentan en la siguiente tabla:
Ventas
( )
Septiembre
6
Octubre
7
Noviembre
6
Diciembre
12
Enero
7
Febrero
10
Marzo
6
Abril
4
Mayo
9
Junio
7
Julio
8
Agosto
6
Meses
. = . = 6
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
. = . + (1 ) .
+1 = . + (1 ) .
=
=
=
=
=
=
=
=
=
=
=
0,57 + (1 - 0,5)6
0,56 + (1 - 0,5)6,5
0,512 + (1 - 0,5)6,25
0,57 + (1 - 0,5)9,125
0,510 + (1 - 0,5)8,063
0,56 + (1 - 0,5)9,032
0,54 + (1 - 0,5)7,516
0,59 + (1 - 0,5)5,758
0,57 + (1 - 0,5)7,379
0,58 + (1 - 0,5)7,189
0,56 + (1 - 0,5)7,595
=
=
=
=
=
=
=
=
=
=
=
6,5
6,25
9,125
8,063
9,032
7,516
5,758
7,379
7,189
7,595
6,798
Observando la tabla anterior se tiene que el pronstico de ventas para el mes de septiembre es de 6,798,
o para cualquier perodo futuro, ya que los datos no presentan una tendencia sino que se supone que
varan o fluctan a largo plazo alrededor de este valor promedio.
Calculando el cuadrado medio del error se obtienen los siguientes resultados, los cuales se presentan en
la siguiente tabla:
Ventas Pronstico
( )
Septiembre
6
Octubre
7
6
Noviembre
6
6,5
Diciembre
12
6,25
Enero
7
9,125
Febrero
10
8,063
Marzo
6
9,032
Abril
4
7,516
Mayo
9
5,758
Junio
7
7,379
Julio
8
7,189
Agosto
6
7,595
Total
Meses
Error
( )2
1
0,25
33,063
4,516
3,752
9,193
12,362
10,511
0,144
0,658
2,544
77,993
241
Series Cronolgicas
11
Los clculos realizados en Excel se muestran en la siguiente figura:
La grfica de las ventas y los pronsticos con el mtodo de suavizacin exponencial elaborada en Excel
se muestra en la siguiente figura:
242
Series Cronolgicas
2) Suavizando los datos empleando el mtodo de los promedios mviles de orden 3 elaborado en Excel
se muestra en la siguiente figura:
Observando el grfico anterior se tiene que el ltimo pronstico calculado es de 7, por lo que el pronstico
para septiembre es de 7.
Observando el grfico anterior se tiene que el cuadrado medio del error es de 4,522.
La grfica de las ventas y los pronsticos con el mtodo de los promedios mviles elaborada en Graph
se muestra en la siguiente figura:
3) Como CME en el mtodo de suavizacin exponencial es de 7,09 y con el mtodo de los promedios
mviles es de 4,52, se concluye que el mtodo de los promedios mviles es el ms preciso para este
ejemplo ilustrativo.
243
Series Cronolgicas
TAREA DE INTERAPRENDIZAJE N 26
1) Realice un organizador grfico sobre los modelos de series de tiempo.
2) Realice un organizador grfico sobre los mtodos de suavizamiento y pronstico.
3) Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa D & M durante los
ltimos 20 trimestres:
Trimestre Ventas Trimestre Ventas
1
12
11
24
2
16
12
36
3
20
13
22
4
34
14
18
5
23
15
24
6
19
16
34
7
20
17
15
8
35
18
23
9
11
19
25
10
19
20
38
3.1) Suavice los datos empleando el mtodo de los promedios mviles de orden 3 de manera manual y
empleando Excel. Pronostique las ventas para el trimestre nmero 21.
28,67
3.2) Suponga que para el Gerente de Ventas, la venta realizada en el trimestre nmero 20 es el cudruplo
de importante que la realizada en el trimestre nmero 17, la venta del trimestre nmero 19 es el triple de
importante que la del trimestre nmero 17, la venta del trimestre nmero 18 es la mitad de importante
que la del trimestre nmero 20. Realizar el pronstico de ventas de manera manual y empleando Excel
para el trimestre nmero 21 utilizando el mtodo de los promedios mviles ponderados para un orden o
longitud de 4.
28,8
3.3) Elaborar un grfico en el que consten las ventas y los promedios mviles elaborado de manera
manual y empleando Excel.
4) Cree y resuelva un ejercicio de aplicacin de promedios mviles con datos reales sobre cualquier tema
de su preferencia.
244
Series Cronolgicas
5) Con los siguientes datos acerca de la ventas en miles de dlares de la Empresa M & M durante los
ltimos 12 meses:
Meses
Ventas
( )
Julio
5
Agosto
6
Septiembre
7
Octubre
9
Noviembre
8
Diciembre
12
Enero
7
Febrero
10
Marzo
7
Abril
8
Mayo
11
Junio
8
5.1) Suavice los datos utilizando el mtodo de suavizacin exponencial con = 0,3 de manera manual y
empleando Excel. Pronostique las ventas para el mes de julio.
8,7
5.2) Calcule el cuadrado medio del error del mtodo anterior de manera manual y empleando Excel
5,2
5.3) Elabore un grfico en el que consten las ventas y los pronsticos de suavizacin exponencial de
manera manual y empleando Excel.
5.4) Suavice los datos empleando el mtodo de los promedios mviles de orden 3 de manera manual y
utilizando Excel. Pronosticar las ventas para mes de julio.
9
5.5) Calcular el cuadrado medio del error del mtodo anterior de manera manual y utilizando Excel.
3,02
5.6) Elabore un grfico en el que consten las ventas y los promedios mviles de manera manual y
empleando Graph.
6) Cree y resuelva un ejercicio similar al anterior (5.1 a 5.7) con datos reales sobre cualquier tema de su
preferencia.
245
Series Cronolgicas
Ejemplo ilustrativo:
Con los siguientes datos acerca de las ventas en millones de dlares de la Empresa M & M:
Ao (X) Ventas (Y)
1995
3,4
1996
3,1
1997
3,9
1998
3,3
1999
3,2
2000
4,3
2001
3,9
2002
3,5
2003
3,6
2004
3,7
2005
4
2006
3,6
2007
4,1
2008
4,7
2009
4,2
2010
4,5
1) Hallar la ecuacin de tendencia por el mtodo de los mnimos cuadrados.
2) Pronosticar la tendencia de exportacin para el 2011.
3) Elaborar la grfica para los datos y la recta de tendencia.
246
Series Cronolgicas
Solucin:
1) Para hallar la ecuacin de tendencia por el mtodo de los mnimos cuadrados se llena la siguiente
tabla, codificando la numeracin de los aos 1995 como 1, 1996 como 2, y as consecutivamente para
facilitar los clculos.
Ao ()
2
2
1995
1
3,4
3,40
1
11,56
1996
2
3,1
6,20
4
9,61
1997
3
3,9
11,70
9
15,21
1998
4
3,3
13,20
16
10,89
1999
5
3,2
16,00
25
10,24
2000
6
4,3
25,80
36
18,49
2001
7
3,9
27,30
49
15,21
2002
8
3,5
28,00
64
12,25
2003
9
3,6
32,40
81
12,96
2004
10
3,7
37,00
100
13,69
2005
11
4
44,00
121
16,00
2006
12
3,6
43,20
144
12,96
2007
13
4,1
53,30
169
16,81
2008
14
4,7
65,80
196
22,09
2009
15
4,2
63,00
225
17,64
2010
16
4,5
72,00
256
20,25
Total
136
61
542,3
1496
235,86
Remplazando valores en las siguientes frmulas se obtiene los valores de a0 y a1:
0 =
1 =
Interpretacin:
- El valor 1 = 0,07 al ser positiva indica que existe una tendencia ascendente de las exportaciones
aumentando a un cambio o razn promedio de 0,07 millones de dlares por cada ao.
- El valor de 0 = 3,22 indica el punto en donde la recta interseca al eje Y cuando X = 0, es decir indica
las exportaciones estimadas para el ao 1996 igual a 3,22.
Remplazado los valores anteriores en la recta de tendencia se obtiene:
= 0 + 1
Y = 3,22 + 0,07X
2) Para pronosticar la tendencia de exportacin para el 2011 se reemplaza X = 17 en la recta de tendencia,
obteniendo el siguiente resultado:
Y = 3,22 + 0,07X
Y = 3,22 + 0,0717 = 4,41
247
Series Cronolgicas
3) La grfica de los datos y la recta de tendencia elaborada en Excel se muestran en la siguiente figura:
248
Series Cronolgicas
249
Series Cronolgicas
c) Borrar las palabras Series1 y Lineal (Series1). Borrar las lneas de divisin. Borrar R 2 = 0,505 que
representa el coeficiente de determinacin que este caso no es necesario. Escribir Exportaciones de la
Empresa M & M en el ttulo del grfico. Escribir Aos en el ttulo del eje horizontal. Escribir millones
de dlares en el eje vertical.
d) Arrastrar el cuadro la ecuacin Y = 0,07X + 3,217 hacia abajo, esta ecuacin es la recta de tendencia
que Excel calcula al realizar el grfico. Agregar etiquetas. Editar el eje x de 1995 al 2010. Insertar los
textos Recta de tendencia y Exportaciones. Insertar formas de Flecha.
250
Series Cronolgicas
1 = 0 + 1 1
2 = 0 + 1 2
Ejemplo ilustrativo N 1
Con los siguientes datos sobre las ventas en millones de dlares de la Empresa D & M
Ao
(X)
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Ventas
(Y)
1,5
1,8
2
1,5
2,2
2
3
2,8
2,4
2,9
3
251
Series Cronolgicas
Solucin:
1) Se codifica la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente para facilitar
los clculos. Se agrupa en dos grupos iguales.
Ao X
Y
Valor central X Semipromedio Y
2000 1
1,5
2001 2
1,8
2002 3
2
3
1,8
2003 4
1,5
2004 5
2,2
2005 6
2
2006 7
3
2007 8
2,8
2008 9
2,4
9
2,82
2009 10
2,9
2010 11
3
El ao 2005 se dej por fuera para tener grupos con el mismo nmero de aos. El valor central de 3
corresponde a la mediana del primer grupo 1, 2, 3, 4 y 5. El valor central de 9 corresponde a la mediana
del segundo grupo 7, 8, 9, 10 y 11. El semipromedio 1,8 corresponden a la media aritmtica del primer
grupo. El semipromedio 2,82 corresponden a la media aritmtica del segundo grupo. De esta manera se
obtienen dos puntos (3, 1.8) y (9, 2.82) de la recta de tendencia.
Remplazando los puntos en el siguiente sistema se obtiene:
{
1 = 0 + 1 1
1,8 = 0 + 31
{
2 = 0 + 1 2
2,82 = 0 + 91
6
|
|
1 9
1 1,8
a1 |1 2,82| 1,02
a1 =
=
=
= 0,17
1 3
6
|
|
1 9
Como a1 es positiva, la recta tiene una tendencia ascendente (pendiente positiva).
Remplazando los valores calculados se tiene la recta de tendencia, la cual es:
= 0 + 1
= 1,29 + 0,17
2) Para pronosticar la tendencia de exportacin para el 2011 se reemplaza X = 12 en la recta de tendencia,
obteniendo el siguiente resultado:
Y = 1,29 + 0,17X
Y = 1,29 + 0,1712 = 3,33
252
Series Cronolgicas
Interpretacin: Existe una tendencia ascendente a un cambio promedio de 0,17 millones de dlares por
cada ao, por lo que el Gerente de ventas de la empresa debe seguir aplicando las polticas necesarias
para mantener la tendencia ascendente y mejorar la tasa de crecimiento.
Los clculos realizados en Excel se muestran en la siguiente figura:
3) La grfica de los datos y la recta de tendencia elaborada en Graph se muestran en la siguiente figura:
253
Series Cronolgicas
Ejemplo ilustrativo N 2
Con los siguientes datos acerca de las ventas en miles de dlares de la Empresa D & M durante los
ltimos 12 meses:
Meses (X) Ventas (Y)
Septiembre
6
Octubre
7
Noviembre
6
Diciembre
12
Enero
7
Febrero
10
Marzo
6
Abril
4
Mayo
9
Junio
7
Julio
8
Agosto
6
1) Hallar la ecuacin de tendencia por el mtodo de los semipromedios.
2) Pronosticar la tendencia de ventas para el mes de septiembre.
3) Elaborar la grfica para los datos y la recta de tendencia.
Solucin:
1) Se codifica la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente para facilitar
los clculos. Se agrupa en dos grupos iguales.
Meses (X)
Septiembre
Octubre
Noviembre
Diciembre
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
X
1
2
3
4
5
6
7
8
9
10
11
12
Y
6
7
6
12
7
10
6
4
9
7
8
6
Valor central X
Semipromedio Y
3,5
9,5
6,667
Remplazando los valores centrales y los semipromedios puntos en el siguiente sistema se obtiene:
{
1 = 0 + 1 1
8 = 0 + 3,51
{
2 = 0 + 1 2
6,667 = 0 + 9,51
254
Series Cronolgicas
Interpretacin: Existe una tendencia descendente a un cambio promedio de 0,222 miles de dlares por
cada mes, por lo que el Gerente de ventas de la empresa debe aplicar los correctivos pertinentes para salir
de esta situacin.
Los clculos realizados en Excel se muestran en la siguiente figura:
255
Series Cronolgicas
3) La grfica de los datos y la recta de tendencia elaborada en Graph se muestran en la siguiente figura:
TAREA DE INTERAPRENDIZAJE N 27
1) Realice un organizador grfico del anlisis de tendencia
2) Qu interpretacin tiene el valor de 0 y 1 en la recta de tendencia?
3) Con los siguientes datos sobre las exportaciones en millones de dlares de la Empresa M & M
Ao (X)
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Exportaciones (Y)
4,3
3,9
3,5
3,6
3,7
4
3,6
4,1
4,7
4,2
4,5
3.1) Halle la recta de tendencia por el mtodo de los mnimos cuadrados de manera manual y empleando
Excel. Codifique la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente. Realice
la interpretacin respectiva.
Y = 3,644 + 0,061X
3.2) Pronostique la tendencia para el 2011
4,38
256
Series Cronolgicas
3.4) Halle la recta de tendencia por el mtodo de los semipromedios de manera manual y empleando
Excel. Codifique la numeracin de los aos 2000 como 1, 2001 como 2, y as consecutivamente. Realice
la interpretacin respectiva.
Y = 3,59 + 0,07X
3.5) Pronostique la tendencia para el 2011.
4,43
3.6) Grafique los datos y la recta de tendencia empleando Graph.
4) Con los siguientes datos acerca de las exportaciones en millones de dlares de la Empresa M & M
Ao (X)
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Exportaciones (Y)
3,4
3,1
3,9
3,3
3,2
4,3
3,9
3,5
3,6
3,7
4
3,6
4,1
4,7
4,2
4,5
257
Series Cronolgicas
4.1) Halle la recta de tendencia por el mtodo de los semipromedios de manera manual y empleando
Excel. Realice la interpretacin respectiva.
Y = 3,308 + 0,059X
4.2) Pronostique la tendencia para el 2011
4,3
4.3) Grafique los datos y la recta de tendencia empleando Graph.
5) Cree un ejercicio de estimacin de tendencia con datos reales sobre cualquier tema de su preferencia.
Resulvalo empleando los dos mtodos aprendidos de manera manual, empleando Excel y Graph.
Realice las interpretaciones y pronsticos respectivos.
120
400
Ejemplo ilustrativo:
Con los datos de la siguiente tabla que muestra las exportaciones en millones de dlares de la Empresa
D & M.
Trimestre I
II III IV
Ao
2008
20 32 22 40
2009
25 35 30 45
2010
28 38 36 44
1) Calcular el ndice estacional
2) Desestacionalizar los datos
Solucin:
1) Se calculada la media trimestral, la cual se presenta en la siguiente tabla:
Trimestre
Ao
2008
2009
2010
II
20 32 22 40 28,5
25 35 30 45 33,75
28 38 36 44 36,5
Se divide el dato de cada trimestre por la media trimestral del correspondiente ao y se multiplica por
100, como se muestra en la siguiente tabla:
Trimestre
Ao
2008
2009
2010
II
III
IV
II
III
IV
70,175
74,074
76,712
73,654
112,281
103,704
104,110
106,698
77,193
88,889
98,630
88,237
140,351
133,333
120,548
131,411
Se suma las medias de cada trimestre, las cuales deben dar como resultado 400. Al sumar 73,654 +
106,698 + 88,237 + 131,411 se obtiene 399,999, por lo que no existe la necesidad de multiplicar la media
trimestral por el factor de ajuste trimestral. Por lo tanto las medias trimestrales representan el ndice
estacional, como se muestra en la siguiente tabla:
Trimestre
Ao
2008
2009
2010
Media
ndice estacional
II
III
IV
70,175
74,074
76,712
73,654
73,654%
112,281
103,704
104,110
106,698
106,698%
77,193
88,889
98,630
88,237
88,237%
140,351
133,333
120,548
131,411
131,411%
259
Series Cronolgicas
Interpretacin:
El ndice estacional de 73,654% para el primer trimestre significa que las exportaciones de empresa D
& M son de 73,654% del promedio del ao total. Las exportaciones son 100% - 73,654% = 26,346% por
debajo del promedio trimestral del ao.
El ndice estacional de 106,698% para el segundo trimestre significa que las exportaciones de empresa
D & M son de 106,698% del promedio del ao total. Las exportaciones son 100% - 106,698% = 6,698%
por encima del promedio trimestral del ao.
2) Dividiendo los valores reales por sus ndices estacionales respectivos se obtienen los valores
desestacionalizados tambin denominados corregidos estacionalmente. En la siguiente tabla se muestra
los valores desestacionalizados:
2008 - I: 20/0,73654 = 27,15, y as sucesivamente
Trimestre I
Ao
2008
2009
2010
II
III
IV
Interpretacin: El valor de 27,15 significa que si las exportaciones de la empresa D & M no estuvieren
sujetas a la variacin estacional, las exportaciones para el primer trimestre del ao 2008 hubieran sido de
27,15 millones de dlares.
Los clculos en Excel se muestran en la siguiente figura:
260
Series Cronolgicas
TAREA INTERAPRENDIZAJE N 28
1) Realice un organizador grfico sobre el anlisis de movimientos estacionales.
2) Con los datos de la siguiente tabla que muestra las exportaciones trimestrales en millones de dlares
de la empresa M & D durante los aos 2008-2009.
Trimestre
I
II
III
IV
Ao
2008
24
31
21
42
2009
27
32
26
41
2010
28
27
35
44
2.1) Calcule el ndice estacional de manera manual y empleando Excel.
ndice
II
III
IV
3) Con los datos de la siguiente tabla que muestra las exportaciones mensuales en millones de dlares de
la empresa M & D durante los aos 2005-2009.
Mes
Ao
En Feb. Mar. Abr. May. Jun. Jul. Ag. Sep. Oct. Nov. Dic.
2005
2006
2007
2008
2009
4
3
5
6
6
8
9
8
10
10
6
7
10
12
12
4
6
6
9
8
8
7
8
11
10
6
8
10
9
12
4
7
8
8
10
6
5
7
7
10
8
8
8
10
10
4
6
6
7
8
4
7
8
7
10
10
11
12
12
14
59,74
114,60
115,67
81,48
111,11
111,86
9,11
87,34
111,75
77,03
88,89
149,43
En
May. Jun.
Jul.
Ag.
Sep. Oct.
Nov. Dic.
6,70
5,02
8,37
10,04
10,04
6,98
7,85
6,99
8,73
8,73
7,20
6,300
7,20
9,90
9,00
4,39
7,68
8,78
8,78
10,98
6,87
5,73
8,02
8,02
11,45
7,16
7,16
7,16
8,95
8,95
4,50
7,88
9,00
7,88
11,25
5,19
6,05
8,65
10,38
10,38
4,91
7,36
7,36
11,05
9,82
5,36
7,15
8,94
8,05
10,73
5,19
7,79
7,79
9,09
10,39
6,69
7,36
8,03
8,03
9,37
100%
.
Donde:
Y = Variable Y
. = Valor de tendencia estimado
CI = Movimientos cclicos e irregulares
El cociente se multiplica por 100 a fin de que la media cclica sea 100. Un valor cclico relativo de 100
indicar la ausencia de toda influencia cclica en el valor de la serie de tiempo anual.
Para facilitar la interpretacin de relativos ciclos suele elaborarse una grfica de ciclos, en el que se
describen los ciclos relativos segn el ao correspondiente. Las cumbres y valles asociados con el
componente cclico de las series de tiempo pueden resultar ms evidentes por medio de la elaboracin de
una grfica de este tipo.
Ejemplo ilustrativo
Con los siguientes datos acerca de las ventas en millones de dlares de la Empresa M & M:
Ao (X) Ventas (Y)
1995
3,4
1996
3,1
1997
3,9
1998
3,3
1999
3,2
2000
4,3
2001
3,9
2002
3,5
2003
3,6
2004
3,7
2005
4
2006
3,6
2007
4,1
2008
4,7
2009
4,2
2010
4,5
1) Determinar el componente cclico de cada uno de los valores de la serie cronolgica usando la ecuacin
de tendencia
2) Elaborar una grfica de ciclos
262
Series Cronolgicas
Solucin:
1) La ecuacin de tendencia lineal obtenida empleando el mtodo de los mnimos cuadrados es:
Y = 3,22 + 0,07X
Con esta ecuacin se calcula los valores estimados de Y reemplazando los valores de X en la recta de
tendencia. Luego se divide los datos originales Y entre el valor de tendencia estimado, y este cociente se
multiplica por 100%, como se muestra en la siguiente tabla:
Ao () Ventas () = 3,22 + 0,07
1995
3,4
3,29
1996
3,1
3,36
1997
3,9
3,43
1998
3,3
3,50
1999
3,2
3,57
2000
4,3
3,64
2001
3,9
3,71
2002
3,5
3,78
2003
3,6
3,85
2004
3,7
3,92
2005
4
3,99
2006
3,6
4,06
2007
4,1
4,13
2008
4,7
4,20
2009
4,2
4,27
2010
4,5
4,34
= (/ ) 100%
103,42
92,33
113,79
94,35
89,70
118,21
105,19
92,65
93,57
94,45
100,31
88,72
99,33
111,97
98,42
103,75
263
Series Cronolgicas
264
Series Cronolgicas
TAREA DE INTERAPRENDIZAJE N 29
1) Elabore un organizador grfico sobre el anlisis de movimientos cclicos e irregulares
2) Con los siguientes datos sobre las exportaciones en millones de dlares de la Empresa M & D
2.1) Determine el componente cclico de cada uno de los valores de la serie cronolgica usando la
ecuacin de tendencia calculada por el mtodo de los mnimos cuadrados de manera manual y empleando
Excel.
= (/ ) 100%
116,07
103,57
91,47
92,61
93,71
99,77
88,45
99,25
112,12
98,76
104,32
265
Series Cronolgicas
2.2) Elabore una grfica de ciclos de manera manual, empleando Excel y Graph.
3) Cree un ejercicio de aplicacin de anlisis de movimientos cclicos e irregulares con datos reales sobre
cualquier tema de su preferencia. Resulvalo de manera manual, empleando Excel y Graph. Tambin
elabore la grfica de ciclos.
266
Series Cronolgicas
REFERENCIAS BIBLIOGRFICAS
Daza, Jorge. (2006). Estadstica Aplicada con Microsoft Excel. Lima, Per: Grupo Editorial Megabyte
Shao, Stephen. (1980). Estadstica para Economistas y Administradores de Empresas. Mxico DF:
Ed. Herrero Hnos.
Spiegel, Murray. (2000). Estadstica. Serie de Compendios Schaum. Mxico: Ed. McGraw-Hill
Surez, Mario. (2004). Interaprendizaje Holstico de Matemtica. Ecuador, Ibarra. Grficas Planeta.
Surez, Mario y Tapia, Fausto. (2012). Interaprendizaje de Estadstica Bsica. 1ra Edicin. Ecuador,
Ibarra. Universidad Tcnica del Norte.
Surez, Mario. (2011). Distribucin de frecuencias para datos agrupados en intervalos.
http://www.monografias.com/trabajos87/distribucion-frecuencias-datos-agrupados
intervalos/distribucion-frecuencias-datos-agrupados-intervalos.shtml
Surez,
Mario.
(2011).
Clculo
del
tamao
de
la
http://www.monografias.com/trabajos87/calculo-del-tamano-muestra/calculo-del-tamanomuestra.shtml
muestra.
aritmtica.
http://www.monografias.com/trabajos85/media-
Surez,
Mario.
(2011).
Ejemplos
ilustrativos
resueltos
de
la
Moda.
http://www.monografias.com/trabajos85/ejemplos-ilistrativos-resueltos-moda/ejemplos-ilistrativosresueltos-moda.shtml
Surez, Mario. (2011). La mediana para datos no agrupados
http://www.monografias.com/trabajos85/ejecicios-mediana/ejecicios-mediana.shtml
agrupados.
267
Referencias Bibliogrficas
Surez, Mario. (2014). Coeficiente de correlacin de Karl Pearson con Excel, Graph y GeoGebra.
http://www.monografias.com/trabajos-pdf5/coeficiente-correlacion-pearson-excel-graph-ygeogebra/coeficiente-correlacion-pearson-excel-graph-y-geogebra.shtml
Surez, Mario. (2011). Coeficiente de Correlacin por Rangos de Spearman.
http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficientecorrelacion-rangos-spearman.shtml
Surez,
Mario.
(2011).
Dispersin
relativa
o
coeficiente
de
http://www.monografias.com/trabajos88/dispersion-relativa/dispersion-relativa.shtml
variacin.
268
Referencias Bibliogrficas