You are on page 1of 61

Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

INDICE

1. INTRODUCCIÓN A LA ESTADÍSTICA
1.1. Conceptos Básicos
1.2. Tipos de Variables
1.3. Elaboración de Cuadros Estadísticos
1.3.1. Distribuciones de frecuencias según tipos de variables.
1.3.2. Intervalos de clases.
1.3.3. Frecuencias absolutas y relativas.
1.3.4. Frecuencias acumuladas.
1.4. Gráficos y su Interpretación
1.5. Gráficos lineales y semi-logarítmicos.
1.6. Gráficos de barras, circulares, y de puntos.
1.7. Diagrama de pareto.
1.8. Histograma.
1.9. Polígono de frecuencias
1.10. Polígono de frecuencias acumuladas ojivas
1.11.
.
2. MEDIDAS DE TENDENCIA CENTRAL
2.1. Media aritmética.
2.2. Geométrica.
2.3. Armónica.
2.4. Mediana.
2.5. Modo.
2.6. Rango medio.
2.7. Eje Medio.
2.8. Relación empírica.
2.9. Propiedades limitaciones.
2.10. Fractiles: Cuartiles, Deciles y Percentiles.
2.11. Aplicaciones utilizando software estadístico

3. MEDIDAS DE DISPERSIÓN
3.1. Rango
3.2. Desviación Media
3.3. Varianza.
3.4. Desviación estándar.
3.5. Propiedades.
3.6. Teorema de Chebyshev
3.7. Coeficiente de variación.
3.8. Momentos.
3.9. Medidas de asimetría y curtosis
3.10. Diagrama de caja y sesgo

4. FUNDAMENTOS DE PROBABILIDADES
4.1. Experimento aleatorio.
4.2. Espacio Muestra.
4.3. Formas de presentación del espacio muestra.
4.4. Reglas de conteo.
4.5. Sucesos.
4.6. Definición clásica, frecuencias y axiomática de probabilidades.
4.7. Probabilidad subjetiva.
4.8. Sucesos naturales y excluyentes.
4.9. Sucesos interdependientes.
4.10. Reglas de adición.
4.11. Probabilidad condicional.

2
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Unidad 1
1. INTRODUCCIÓN A LA ESTADÍSTICA
La Estadística, nace de las necesidades reales del hombre. La variada y cuantiosa información relacionada con éste y que es
necesaria para la toma de decisiones, hace que la estadística sea hoy, una importante herramienta de trabajo.
Entre las tareas principales de la Estadística, está el de reunir la información integrada por un conjunto de datos, con el
propósito de obtener conclusiones válidas del comportamiento de éstos, como también hacer una inferencia sobre
comportamientos futuros.
En cuanto al uso y la aplicación, puede decirse que abarca todo el ámbito humano encontrándose en las relaciones
comerciales, financieras, políticas, sociales, etc. siendo fundamental en el campo de la investigación y en la toma de
decisiones.
Es así también como en el área de las empresas de servicio y manufactura es posible realizar un análisis profundo del proceso
estadístico al control de la productividad y de la calidad.
1.1. Conceptos básicos

Definición de Estadística

Se denomina Estadística a la rama de las matemáticas que se ocupa de reunir, organizar, clasificar, presentar, resumir, analizar
e interpretar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.

Pueden distinguirse dos ramas diferentes en Estadística:

Estadística Descriptiva, registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas
de centralización y de dispersión), que describen el conjunto estudiado.

Estadística Inferencial, parte de la estadística que se ocupa de llegar a conclusiones (inferencias), o la toma de una decisión
acerca de las poblaciones a partir de los datos de las muestras extraídas de ellas.

Población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Individuo o unidad estadística es cada uno de los elementos que componen la población.

3
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el
de la población.

Muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.

Valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire
5 veces obtenemos dos valores: cara y cruz.

Dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Parámetros: Es una característica cuantificable de una población. (Una medida resumen calculada sobre la población).

Estadístico: Es una medida, un valor que se calcula para describir una característica a partir de una sola muestra. (Una
medida resumen calculada sobre la muestra).

Variable: Característica o fenómeno de una población o muestra que será estudiada, la cual puede tomar diferentes valores.

Practico # 1

Cuestiones a completar

1. Un........................ es una característica de una población. (Parámetro, estadístico)


2. Un........................ es una característica de una muestra. (parámetro, estadístico)
3. Un conjunto extraído de la población se llama........................ (muestra, población, censo)
4. Las variables que toman valores numéricos que se pueden contar se llaman........................ (cualitativas, discretas,
continuas)
5. Las variables que toman valores sobre un intervalo se llaman................................ (cuantitativas, discretas, continuas)
6. Sacar conclusiones sobre una población a partir de una muestra, es cuestión de la estadística........................ (descriptiva,
inferencial)
7. La estadística........................ trata de hacer predicciones sobre una población, basándose en la información de una
muestra de la población elegida apropiadamente. (Descriptiva, Inferencial)
8. La estadística.............................. supone la recogida, organización, resumen y presentación de los datos.
(Descriptiva, inferencial)
9. El conjunto de todos los elementos bajo consideración se llama ........................ (muestra, población)

4
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

1.2. Tipos de variables

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.

Las variables pueden ser de dos tipos:

Variable cualitativa Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con
números. Podemos distinguir dos tipos:

Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un
criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no
numéricas, en las que existe un orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente.


Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa. Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar
operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta. Una variable discreta es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua. Una variable continua es aquella que puede tomar valores comprendidos entre dos números.
Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Las variables también se pueden clasificar en:

• Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de
una clase).

• Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de
los alumnos de una clase).

• Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de
los alumnos de una clase).

5
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Etapas de un estudio estadístico.

Los métodos estadísticos abarcan todas las etapas de la investigación, desde el diseño de la investigación hasta el análisis final
de los datos.

Podemos distinguir tres grandes etapas:

 Diseño: Planeamiento y desarrollo de las investigaciones


 Descripción: Resumen y exploración de los datos
 Inferencia: Predicciones y toma de decisiones sobre las características de una población en base a la información
recogida en una muestra de la población.
Tipos de relevamientos para la obtención de la información

Las técnicas o tipos de recolección de datos se definen como el conjunto de procedimientos y herramientas para recoger,
validar y analizar la información necesaria que permita lograr los objetivos de la investigación.

Un instrumento de recolección de datos es cualquier recurso de que se vale el investigador para acercarse a los fenómenos y
extraer de ellos información. Existen múltiples y diferentes instrumentos útiles para la recolección de datos y para ser usados en
todo tipo de investigaciones, ya sean cualitativas, cuantitativas o mixtas.

Las técnicas más frecuentes son:

1) La observación.
2) Técnica documental
3) La entrevista
4) El cuestionario.
5) La encuesta.

La observación.- es la acción de mirar con rigor en forma sistemática y profunda, con el interés de descubrir la importancia de
aquello que se observa.

La técnica documental.- es un tipo de observación que recopila o busca sus datos en documentos, fuentes escritas o graficas
de todo tipo.

La entrevista.- es una situación de interrelación o dialogo entre personas, es una técnica donde una persona llamada
entrevistador, solicita al entrevistado le proporcione alguna información. Cuando una encuesta está dirigida a la totalidad de
elementos de una población, se llama censo; cuando está dirigida a una parte representativa muestra de la población, se llama
encuesta por muestreo.

El cuestionario.- es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas, que se formulan al
encuestado o entrevistado, con el propósito de obtener los datos de las variables consideradas en el estudio. El cuestionario
debe ser adaptado a las necesidades de la investigación y a las características del grupo que se estudia.

La encuesta.- es una técnica de recolección de datos, donde se obtiene la información tal como se necesita, preparada ex
profesamente y con objetivo estadístico. Permite observar y registrar características en las unidades de análisis de una
determinada población o muestra, delimitada en el tiempo y en el espacio.

6
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Errores posibles en la recolección de los datos.

Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante los cómputos
de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente
identificables.

Los diez errores más comunes

1. Registrar información innecesaria, redundante o sin significado


2. Registrar información en formas diferentes, desperdigando el análisis y con alto costo para tratamiento, análisis y
aprovechamiento.
3. Digitar la información en el campo equivocado.
4. Digitar información incorrecta.
5. Digitar información con errores ortográficos.
6. Digitar información incompleta.
7. Información de contacto incorrecta correo o teléfono
8. Personas distintas con identidades similares ID, correo, teléfono
9. Digitar más de un dato del mismo tipo en el mismo campo registro.
10. Introducción de espacios en blanco antes, durante o al final de la información

Practico #1

1. Indica que variables son cualitativas y cuales cuantitativas:


 Comida Favorita.________________
 Profesión que te gusta._____________
 Número de goles marcados por tu equipo favorito en la última temporada. _____________
 Número de alumnos de tu Instituto. _____________
 El color de los ojos de tus compañeros de clase. _____________
 Coeficiente intelectual de tus compañeros de clase. _____________
2. De las siguientes variables indica cuáles son discretas y cuales continúas.
 Número de acciones vendidas cada día en la Bolsa. _____________
 Temperaturas registradas cada hora en un observatorio. _____________
 Período de duración de un automóvil. _____________
 El diámetro de las ruedas de varios coches. _____________
 Número de hijos de 50 familias. _____________
3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas.
 La nacionalidad de una persona. _____________
 Número de litros de agua contenidos en un depósito. _____________
 Número de libros en un estante de librería. _____________
 Suma de puntos tenidos en el lanzamiento de un par de dados. _____________
 La profesión de una persona. _____________
 El área de las distintas baldosas de un edificio. _____________

7
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

1.3. Elaboración de Cuadros Estadísticos


1.3.1. Distribuciones de frecuencias según tipos de variables.

La información estadística puede constar de un gran número de observaciones y mientras mayor sea el número, mayor puede
ser la conveniencia y necesidad de presentarla en forma resumida, la cual puede permitir algunos detalles pero en cambio
puede revelar la naturaleza general de la información. Un resumen de tal distribución se denomina Distribución de Frecuencias.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando
a cada dato su frecuencia correspondiente.

La distribución muestra la frecuencia de cada valor de la variable.

1.3.2. Tipos de frecuencias


1.3.2.1. Frecuencias absolutas y relativas.

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

1.3.2.2. Frecuencias Acumuladas.

Frecuencia absoluta acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de
datos. Se puede expresar en tantos por ciento.

8
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

1.3.2.3. Distribución de frecuencias de datos no agrupados

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en
la tercera anotamos la frecuencia absoluta.

xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 IIIII I 6 9 0.194 0.290
30 IIIII II 7 16 0.226 0.516
31 IIIII III 8 24 0.258 0.774
32 III 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1
31 1.00
Este tipo de tablas de frecuencias se utiliza con variables discretas.

1.3.2.4. Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de
valores o la variable es continua.

Número de intervalos o clases (K).- Es el número de grupos en el cual es posible dividir los valores de la variable. El número
de clases no debe ser ni muy grande ni muy pequeño, un número pequeño de clases puede ocultar la naturaleza general de los
datos y un número muy grande puede ser demasiado detallado como para revelar alguna información útil. Como regla general
se recomienda que el número de clases esté entre 5 y 20. Hay una regla llamada Regla de Sturges que puede dar una
aproximación razonable para el número de clases, ella es:

K = número de clases K = 1 + 3.3 Log N ; N= total de datos.

Límites de la clase.- Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Rango (R).- Rango o recorrido es la diferencia entre el valor máximo y valor mínimo que toma la variable X.

Amplitud de la clase.- Una vez determinado el número de clases, debe decidirse la amplitud de estas. Tomando la misma
amplitud para todas las clases, este valor queda dado por:

𝑅
𝐴=𝐾; R=rango; K=intervalos.

Marca de clase.- La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el
cálculo de algunos parámetros.

9
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Ejemplo 1:

Las velocidades, en millas por hora, de los conductores de 55 automóviles fueron medidas con un radar en una calle de cierta
ciudad:
27 23 22 38 43 24 35 26 28 20 18
25 23 22 63 31 30 41 45 29 43 27
29 28 27 25 29 28 24 37 28 18 29
26 33 25 27 25 34 32 36 22 33 32
21 23 24 18 48 23 15 38 26 23 21
Construya una distribución de frecuencias para las velocidades de estos 55 automóviles.

Solución:

Primero. Para una mayor facilidad se recomienda ordenar los datos de menor a mayor.

N=55

Segundo Calcular el número de clases.


K = 1 + 3.3 Log (55)
K = 6.743
De acuerdo a la regla de Sturges, deberíamos tener 6 ó 7 clases. Para efectos de cálculos el valor de K se aproxima el entero
más próximo.
K=7
Tercero. Calcular la amplitud. Para esto previamente calculamos el rango, identificamos el dato mayor y el menor, en nuestro
caso tales datos son 15 y 63.
R = 63 – 15 = 48
𝑅 48
𝐴= = = 6,857
𝐾 7
A = 6.857
La amplitud debe aproximarse al entero más cercano.
A=7
Cuarto. Una vez determinado el número de clases y la amplitud, debe elegirse el extremo inferior de la primera clase. Dado
que aquí el valor mínimo es 15, el extremo inferior puede ser 15 o menos; por consiguiente tomaremos como criterio usar el
número 15.
Quinto. Establecido el extremo inferior, se sumará la amplitud a éste para obtener el valor del límite inferior de la siguiente
clase y así sucesivamente. Para obtener los límites superiores, se le resta uno al límite inferior posterior. Se tiene que tomar en
cuenta que en la última clase esté contenido el dato mayor.
Sexto. Una vez construidos los diversos intervalos de clase, se cuenta el número de elementos que cae en cada uno,
obteniéndose así las respectivas frecuencias.

10
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Clase xi fi Fi hi Hi % (hi*100)
[15 - 22) 18,5 7 7 0,127 0,127 12,73
[22 - 29) 25,5 26 33 0,473 0,600 47,27
[29 - 36) 32,5 12 45 0,218 0,818 21,82
[36 - 43) 39,5 5 50 0,091 0,909 9,09
[43 - 50) 46,5 4 54 0,073 0,982 7,27
[50 - 57) 53,5 0 54 0,000 0,982 0,00
[57 - 64) 60,5 1 55 0,018 1,000 1,82
55 1,000 100,00
Ejemplo 2

Los siguientes datos corresponden a la edad de las personas que viajan en un bus.

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

Construir la tabla de frecuencias y responder las siguientes preguntas:

1) ¿Cuántos menores de 15 años viajan en el bus?


2) ¿Cuánto es el porcentaje de niños menores a 5 años?
3) Cantidad en porcentaje de adultos mayores a 30 años.
4) Cantidad de adultos mayor a 45 años.

Solución.

1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos
queramos establecer.

Es conveniente que el número de intervalos oscile entre 5 y 20.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50/5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.

Clase Xi fi Fi hi Hi % (hi*100)
[0 - 5) 2,5 1 1 0,025 0,025 2,50
[5 - 10) 7,5 1 2 0,025 0,050 2,50
[10 - 15) 12,5 3 5 0,075 0,125 7,50
[15 - 20) 17,5 3 8 0,075 0,200 7,50
[20 - 25) 22,5 3 11 0,075 0,2775 7,50
[25 - 30) 27,5 6 17 0,150 0,425 15,00
[30 - 35) 32,5 7 24 0,175 0,600 17,50
[35 - 40) 37,5 10 34 0,250 0,850 25,00
[40 - 45) 42,5 4 38 0,100 0,950 10,00
[45 - 50) 47,5 2 40 0,050 1,00 5,00
40 1,000 100,00
Respuestas
1) En el bus viajan 5 menores de 15 años. (F3=5).
2) El porcentaje de niños menores a 5 años es 2,50%. (h1*100)
3) El porcentaje de adultos mayores a 30 años es 57.5%. (1,00 – F6 )*100 = (1,00 – 0,425)*100=57.5%
4) La cantidad de adultos mayor a 45 años es 2. F10=2
11
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

EJERCICIOS
1. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias.
2. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias.
3. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias.
4. En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño.
Los siguientes datos corresponden al peso, en kilógramos, de estas piezas, que poseen las mismas dimensiones, pero distinta
aleación.

a) Construir una tabla de frecuencias de amplitud 5 comenzando desde 36


b) ¿Cuántos engranajes pesan entre 46 y 55 Kg.?..
c) ¿Qué porcentaje representa a aquellos engranajes cuyo peso es inferior a 51 Kg.?.
d) ¿Cuál es la frecuencia relativa para aquel intervalo cuya marca de clase es 48?.
e) ¿Qué porcentaje representa a aquellas piezas que pesan más de 50 Kg. ?
5. En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de discos de embrague. Para
ello se ha recopilado la siguiente información referente a la duración en horas de ellos

a) Construir una tabla de frecuencia de amplitud 5 comenzando desde 285

b)¿Cuántos discos duraron entre 290 y 299 horas?.

c) ¿Cuántos discos no alcanzaron a durar 300 horas?

d) ¿Qué porcentaje representan los discos que duraron entre 310 y 314 horas?

e) ¿Cuál es el intervalo de mayor frecuencia absoluta?.

12
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

1.4. Gráficos y su Interpretación

Las gráficas revelan un patrón de comportamiento de la variable en estudio. Se ofrecen muchos tipos de gráficos para describir
el conjunto de datos estadísticos. Dependiendo del tipo de datos y lo que se quiera representar, se hará uso del método gráfico
más adecuado como forma de presentar una información.

Al realizar un gráfico en general se deben tener en cuenta los siguientes elementos.

1. Titulo
2. Tabla o Distribución de Frecuencias
3. Escala
4. Cuerpo de la gráfica
5. Convenciones
6. Notas aclaratorias
7. Numeración

Entre los gráficos más comunes tenemos:


VARIACION DE LA INFLACION EN BOLIVIA (1994-2002)
Gráfico de Líneas:

Usado básicamente para mostrar el comportamiento de una variable


cuantitativa a través del tiempo. El gráfico de líneas consiste en
segmentos rectilíneos unidos entre sí, los cuales resaltan las
variaciones de la variable por unidad de tiempo. Para su construcción
ha de procederse de la siguiente manera: en el eje de las ordenadas
se marcan los puntos de acuerdo con la escala que se esté utilizando. En el caso de una escala aritmética, distancias iguales
en el eje, representan distancias iguales en la variable.

El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el número de ítems que ha de presentarse,
así como la longitud del eje. Es de anotar la conveniencia de mostrar la
interrupción y acercamiento del eje a su origen cuando esto haya ocurrido.

Gráfico de Líneas Compuesto: Cuando se tienen varias variables a


representar, con el fin de establecer comparaciones entre ellas (siempre que
su unidad de medida sea la misma); se utiliza plasmarlos en un sólo gráfico,
el cual es el resultado de representar varias variables en un mismo plano.

Gráfico de Barras: El gráfico de barras, como su nombre lo indica, está NÚMERO DE HIJOS DE 50 HOBRERAS EN EL PARQUE INDUSTRIAL

constituido por barras rectangulares de igual ancho, conservando la


misma distancia de separación entre sí. Se utiliza básicamente para
mostrar y comparar frecuencias de variables cualitativas o
comportamientos en el tiempo, cuando el número de ítems es reducido.
Son barras del ancho que se desee, y de altura, la frecuencia absoluta o
relativa..

13
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Éstos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal

Gráficos circulares.

El gráfico de pastel, también denominado circular o de sectores, su


forma es circular y cada frecuencia está representada por un sector del
círculo.

Este gráfico permite apreciar qué parte representa cada clase dentro del
total, pero a veces se hace difícil apreciar la diferencia entre una
frecuencia y otra.

Estos gráficos son utilizados fundamentalmente para representar


variables de atributos.

Diagrama de puntos es una gráfica utilizada para ilustrar un número reducido de datos, la cual permite identificar con facilidad
dos características:

 La localización de los datos.

 La dispersión o variabilidad de los datos.

Este diagrama muestra cada uno de los elementos de un conjunto de datos numéricos por encima de una recta numérica (eje
horizontal), facilita la ubicación de los espacios vacíos y los agrupamientos en un conjunto de datos, así como la manera en que
estos datos se distribuyen a los largo del eje horizontal.

Diagrama de Pareto.

Un diagrama de Pareto está formado por un gráfico de barras y un gráfico de línea. Los valores individuales se representan
por las barras y el total acumulado es representado por la línea.

El eje vertical es la frecuencia con la que ocurren los valores


individuales y el eje vertical derecho es el porcentaje
acumulado.

El propósito del diagrama de Pareto es resaltar los valores


individuales más importantes y hacer notar cómo el 20% de
ellos suma generalmente el 80% del total acumulado, lo cual

14
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

conocemos como la regla del 80-20 o como principio de Pareto. Para crear un diagrama de Pareto debemos preparar los
datos.

Histograma.

Un histograma es una representación gráfica de una variable en forma de barras.

Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia
absoluta de cada intervalo.

La superficie de cada barra es proporcional a la frecuencia de los valores representados.

Polígono de frecuencia

Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo.

Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla:

Intervalos xi fi Fi
[50, 60) 55 8 8 Polígono de
Histograma frecuencia
[60, 70) 65 10 18
[70, 80) 75 16 34
Frecuencia absoluta

[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
65

Polígono de frecuencias acumuladas (OJIVA). Intervalos

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una
distribución acumulativa y de igual manera que éstas, existen ojivas mayor que y ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la aplicación de la técnica es
parcial):

1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva
menor que, con el derecho.

2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor
que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se
usaron para ejemplificar el histograma:

15
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00"
se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las
4:00 horas).

De forma análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el número de
observaciones menores que la frontera señalada (en caso de tiempos sería el número o de observaciones antes de la hora que
señala la frontera).

Histogramas con intervalos de amplitud diferente

Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de los rectángulos del
histograma.

hi es la altura del intervalo.


fi es la frecuencia del intervalo.
ai es la amplitud del intervalo.
Ejemplo

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50
alumnos.

Intervalos fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50

Diagrama de sectores

Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables
cualitativas.

Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta
correspondiente.

16
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

El diagrama circular se construye con la ayuda de un transportador de ángulos.

Ejemplo

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún
deporte.

Alumnos Ángulo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°

Los histogramas siguientes representan distintas formas posibles para la distribución de los datos.

17
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Si lo que deseamos es reflejar el tipo de medida que estamos usando, elegiremos el tipo de gráfico según esta tabla

Decisión según el tipo de medida

Gráfico de barras
Puede ser simple o múltiple,
vertical (o de columnas) u
horizontal

Gráfico de sectores o tarta


Puede estar construido con frecuencias o
Variable de tipo nominal o porcentajes
cualitativa
Los tipos más usados son los de
sectores y barras.
Pictograma
El perfil ortogonal es muy usado
Es un gráfico de barras en el que estas se han
en Psicología
sustituido por de distinta altura o tamaño

Perfil ortogonal
Es un gráfico lineal en el que
Tipo de
el eje X contiene variables cualitativas
variable

Cualitativa

Cuantitativa
discreta
Barras
También se usan en cuantitativos
Continua o
discreta Variable cuantitativa discreta
agrupada Ambas pueden ser simples o
múltiples, normales o
acumuladas.
Lineal
Puede ser de frecuencias normales o
acumuladas

Histograma

Variable cuantitativa continua

Polígono de frecuencias

18
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Prácticos

1. Las puntuaciones obtenidas por un grupo en una prueba han sido:


15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias y dibujar su histograma.
2. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias dibujar el polígono de frecuencias.
3. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias dibujar las ojiva mayor y la ojiva menor .
4. En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño.
Los siguientes datos corresponden al peso, en kilógramos, de estas piezas, que poseen las mismas dimensiones, pero distinta
aleación.

a) Construir una tabla de frecuencias de amplitud 5 comenzando desde 36


b) Dibujar el polígono de frecuencias y el histograma
5. En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de discos de embrague. Para
ello se ha recopilado la siguiente información referente a la duración en horas de ellos

a) Construir una tabla de frecuencia de amplitud 5 comenzando desde 285


b) Dibujar las ojiva mayor y ojiva menor

19
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Unidad 2
2. MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de
datos, ayudan a describir las características típicas de conjuntos de datos y a resumir la información en un sólo número. Las
medidas de tendencia central se denominan medidas de posición.

Las medidas de tendencia central más utilizadas son: media, mediana, moda, rango

2.1. Media aritmética.

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

es el símbolo de la media aritmética.

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Media aritmética para datos agrupados

20
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

Ejercicio de media aritmética

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la
puntuación media.

xi fi xi • fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820

Propiedades de la media aritmética

a) La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a
cero.

La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =

= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

b) La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se
hace mínima cuando dicho número coincide con la media aritmética.

c) Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho
número.

d) Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por
dicho número.

Observaciones sobre la media aritmética

21
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

a) La media se puede hallar sólo para variables cuantitativas.

b) La media es independiente de las amplitudes de los intervalos.

c) La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.

d) La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

xi fi
[60, 63) 61.5 5
[63, 66) 64.5 18
[66, 69) 67.5 42
[69, 72) 70.5 27
[72, ∞ ) 8
100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último intervalo.

2.2. Media Geométrica.

La media geométrica de un conjunto de n observaciones es la raíz enésima de su producto. El cálculo de la media geométrica
exige que todas las observaciones sean positivas:

Ejemplo. Obtener la media geométrica de los datos: 3, 8, 9.

Ejemplo.

Las siguientes temperaturas han sido tomadas de un experimento químico: 13.4°C, 12.8°C, 11.9°C,

13.6°C. Determinar la temperatura geométrica media de este proceso.

Las características de la media geométrica son:

1. Se toman en cuenta todos los valores de la variable.

2. Es afectada por valores extremos aunque en menor medida que la media aritmética.

3. Si un dato es cero, su resultado será cero.

4. No puede ser calculada en distribuciones con clase abiertas.

5. Es mayormente usada para promediar tasas de intereses anuales, inflación razones y valores que muestren una progresión
geométrica (efecto multiplicativo sobre el de los años anteriores).
22
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

2.3. Media Armónica.

La media armónica se define como el recíproco de la media aritmética. Esto es:

Ejemplo.

Obtener la media armónica de los datos: 6, 9, 7, 2.

Las características de la media armónica son:

1. No se influye por la existencia de determinados valores mucho más grandes que el resto.

2. Presenta cambio sensible a valores mucho más pequeños que el conjunto.

3. No está definida en el caso de la existencia de valores nulos.

2.4. Mediana.

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana

1) Ordenamos los datos de menor a mayor.

2) Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6

Me= 5

3) Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12

Me= 9.5

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
𝐍
Es decir tenemos que buscar el intervalo en el que se encuentre .
𝟐

23
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Li es el límite inferior de la clase donde se encuentra la mediana.


𝐍
𝟐
es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
100/2 = 50

Clase de la mediana: [66, 69)

2.5. Modo o Moda.

La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5

Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es
bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

24
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8
3+5
𝑀𝑜 = 2
= 4 → Mo = 4

Cálculo de la moda para datos agrupados

1º Todos los intervalos tienen la misma amplitud.

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

Ejemplo Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.


25
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:

Ejemplo

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50
alumnos. Calcular la moda.

fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50

2.6. Rango medio.

El rango medio es el promedio de las observaciones menores y mayores de una serie de datos.

El rango medio a menudo es usado como una medición de resumen tanto por analistas financieros como por reporteros
meteorológicos, puesto que puede proporcionar una medición adecuada, rápida y simple para caracterizar toda una serie de
datos, como por ejemplo todo una serie de lecturas registradas de temperatura por horas durante todo un día.

2.7. Eje Medio.

Como última medida de tendencia central, mencionamos al eje medio, que es el promedio del primer y tercer cuartiles de una
serie de datos. Es decir:

Eje medio: (Q1 + Q2) / 2

Siendo Q1 y Q2, el primer y segundo cuartil. En conclusión podemos decir que es una medición de resumen usada para zanjar
problemas potenciales introducidos por los valores extremos de los datos.

2.8. Relación empírica.

En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En
cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:

Media – Moda = 3(Media – Mediana)

26
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda
respectivamente, para curvas simétricas los tres valores coinciden

2.9. Fractiles: Cuartiles, Deciles y Percentiles.

Los fractiles son aquellas medidas que facilitan la localización de la posición de un dato respecto a su grupo. Ejemplo: la
mediana

Sinónimos
Fractiles Cuantiles Medidas de orden Medidas de Posición
Los fractiles tienen nombres especiales, dependiendo del número de partes iguales en que se dividen los datos, siendo estos:
Cuartiles, Deciles y Percentiles

Cuartiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Cálculo de los cuartiles

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la expresión

Número impar de datos

2, 5, 3, 6, 7, 4, 9

27
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Número par de datos

2, 5, 3, 4, 6, 7, 1, 9

Cálculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra

en la tabla de las frecuencias acumuladas.

Li es el límite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.

ai es la amplitud de la clase.

Ejercicio de cuartiles

Calcular los cuartiles de la distribución de la tabla:

fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Cálculo del primer cuartil

Cálculo del segundo cuartil

Cálculo del tercer cuartil

28
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Los deciles

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

D5 coincide con la mediana.

Cálculo de los deciles

En primer lugar buscamos la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.

Li es el límite inferior de la clase donde se encuentra el decil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase el decil..

ai es la amplitud de la clase.

Ejercicio de deciles

Calcular los deciles de la distribución de la tabla:

[50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2 65
Fi 8 18 34 48 58 63 65
Cálculo del primer decil

Cálculo del segundo decil

Cálculo del tercer decil

29
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Cálculo del cuarto decil

Cálculo del quinto decil

Cálculo del sexto decil

Cálculo del séptimo decil

Cálculo del octavo decil

Cálculo del noveno decil

Los percentiles

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

P50 coincide con la mediana.

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

Li es el límite inferior de la clase donde se encuentra el percentil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del percentil.

ai es la amplitud de la clase.

30
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Ejercicio de percentiles

Calcular el percentil 35 y 60 de la distribución de la tabla:

fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentil 35

Percentil 60

2.10. Aplicaciones utilizando software estadístico

31
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Unidad 3

3. MEDIDAS DE DISPERSIÓN

Medidas de dispersión estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos
concentrados, o más o menos dispersos.

Es importante medir la dispersión por las siguientes razones:

a) La dispersión proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central, si los
datos se encuentran muy dispersos, la posición central es menos representativa de los datos, como un todo, que cuando éstos
se agrupan más cerca del valor de la media.

b) Existen problemas característicos para datos muy dispersos, por lo que es necesario reconocer esa dispersión alta para
poder abordar ese tipo de problemas.

c) Cuando se desea comparar diferentes muestras, si no se desea tener una alta dispersión de valores con respecto del centro
de distribución, o esto presenta riesgos inaceptables, se necesita reconocerla y evitar elegir distribuciones que tengan las
dispersiones más grandes.

Asimismo, la dispersión puede medirse desde tres enfoques, la distancia, la dispersión promedio y la dispersión relativa.

3.1. Rango

Es la diferencia entre el más alto y el más pequeño de los valores observados. El rango es fácil de entender y de calcular, pero
su utilidad como medida de dispersión es limitada, pues solo toma en cuenta el valor más grande y el más pequeño y ninguna
otra observación del conjunto de datos, restándole importancia a las variaciones entre todas las demás observaciones.

RANGO (R)

R = (Dato mayor – Dato menor)

3.2. Desviación Media

La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadística y la media
aritmética.

Di = |x - x|

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

La desviación media se representa por

32
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Ejemplo

Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:

Ejemplo

Calcular la desviación media de la distribución:

xi fi xi · fi |x - x| |x - x| · fi
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57

3.3. Varianza.

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

La varianza se representa por .

33
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribución de la tabla:

xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050

Propiedades de la varianza

1) La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2) Si a todos los valores de la variable se les suma un número la varianza no varía.

3) Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho
número.

4) Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza
total.

Si todas las muestras tienen el mismo tamaño:


34
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Si las muestras tienen distinto tamaño:

Observaciones sobre la varianza

1) La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.

2) En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

3) La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

3.4. Desviación estándar.

La desviación típica es la raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.

La desviación típica se representa por σ.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación típica para datos agrupados

Ejercicios de desviación típica

Calcular la desviación típica de la distribución: 9, 3, 8, 8, 9, 8, 9, 18

35
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Calcular la desviación típica de la distribución de la tabla:

xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050

Propiedades de la desviación típica

1) La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2) Si a todos los valores de la variable se les suma un número la desviación típica no varía.

3) Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.

4) Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular
la desviación típica total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la desviación típica

1) La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas.

2) En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.

3) Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media.

3.5. Coeficiente de variación.

El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

El coeficiente de variación se suele expresar en porcentajes:

36
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean
positivas.

Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

Ejercicio

Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

Puntuaciones diferenciales

Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmética.

xi = Xi − X

Puntuaciones típicas

Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este proceso se
llama tipificación.

Las puntuaciones típicas se representan por z.

Observaciones sobre puntuaciones típicas

La media aritmética de las puntuaciones típicas es 0.

La desviación típica de las puntuaciones típicas es 1.

Las puntuaciones típicas son adimensionales, es decir, son independientes de las unidades utilizadas.

Las puntuaciones típicas se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones.

Ejemplo

En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las
desviaciones típicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg.
¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?

José es más grueso respecto de su grupo que Ana respecto al suyo

3.6. Momentos.

37
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Los dos estadísticos más importantes son la media y la desviación típica. Ambos pertenecen a un grupo que se denominan
"momentos".

Se llama momento de orden r respecto de un valor "c" a la expresión:

Si c=0 se le llama momento respecto al origen:

Los primeros momentos respecto al origen son:

Si c= se le llama momento respecto de la media o momento central:

Los primeros momentos respecto a la media son:

3.7. Medidas de asimetría y curtosis

Un conjunto de datos o distribución de datos queda exhaustivamente descrito cuando pueden especificarse una medida de
posición, una medida de dispersión, un índice de asimetría y un índice de curtosis. Las medidas de asimetría y curtosis se
refieren a la “forma” de la distribución y, aunque no son tan importantes como las medidas de posición y dispersión y son muy
poco utilizadas, aportan también información sobre la distribución de los valores de una muestra o población.

Simetría

La asimetría de una distribución hace referencia al grado en que los datos se reparten por encima y por debajo de la tendencia
central.

En la práctica casi nunca se encuentran polígonos de frecuencias o histogramas completamente simétricos, por lo cual, el
grado en el cual la distribución es asimétrica constituye su sesgo.
Si una distribución de frecuencias es simétrica, no tiene sesgo, es decir, el sesgo es nulo. Si una o más observaciones son
grandes, la media de la distribución se vuelve mayor que la Me o la Mo, en tales casos se dice que la distribución tiene sesgo

38
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

positivo. Si una o más observaciones muy pequeñas se encuentran presentes, la media es la menor de los tres promedios y se
dice que la distribución tiene sesgo negativo. Obsérvese el siguiente diagrama:

Medida de asimetría de Fisher.

En una distribución simétrica las observaciones de la variable tienden a situarse en igual proporción a ambos lados del valor
medio. Cualquier medida que recoja alteraciones de esta situación proporcionará una cuantificación de la asimetría de la
distribución. Una primera propuesta podría ser la siguiente:

en tanto que define un promedio de las desviación es de la variable con respecto al valor medio. En el caso de que se dieran
muchas observaciones por encima de la media se esperaría un valor positivo, mientras que una mayor proporción de valores
por debajo de la media proporcionaría un valor negativo. Es posible que ya se haya dado cuenta de que esta propuesta, si no
se modifica, es inservible, puesto que por definición siempre

Una alternativa es tomar las desviaciones de la variable respecto a la media pero elevadas a alguna potencia. Al elevar las
desviaciones al cuadrado se obtiene la expresión de la varianza, una medida de dispersión de los valores respecto a la media,
pero que no ayuda a señalar la posición de las observaciones a derecha o izquierda de la medida de posición central. El cubo
de las desviaciones, al respetar el signo de la diferencia sí permite promediar tanto la importancia de la desviación, como su
dirección. Se utilizaría, por tanto, un estadístico conocido como el momento de orden tres con respecto a la media (m3):

O, si los datos están agrupados en frecuencias, como:

En función del signo de m3 puede determinarse si la asimetría es por la derecha o por la izquierda (según un número
relativamente elevado de observaciones tomen valores en la parte derecha o izquierda de la distribución). También se habla de
asimetría positiva (por la derecha) o asimetría negativa (por la izquierda). Una distribución simétrica tenderá a un valor de m3
igual a cero. Por tanto tendremos:

39
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Medida de asimetría de Pearson.


Recuerde que hemos planteado una relación entre media, moda y mediana que permitía definir la simetría o asimetría de una
distribución. En una distribución simétrica los tres valores tienden a coincidir, mientras que en una distribución asimétrica se
presentan con un orden distinto. Pearson propuso el siguiente estadístico:

La curtosis

La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide
cuán puntiaguda es una distribución.

Tipos de curtosis

La curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:

Medidas de curtosis

1) Medida de Fisher

Para datos sin agruparse emplea la siguiente fórmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

40
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Para datos agrupados en intervalos se emplea la siguiente fórmula:

Nota:

Si α < 3 → la distribución es platicúrtica

Si α= 3→ la distribución es normal o mesocúrtica

Si α > 3→ la distribución es leptocúrtica

2) Medida basada en Cuartiles y Percentiles

k (letra griega minúscula kappa) = Coeficiente percentil de curtosis

Nota:

Si k < 0,263→ la distribución es platicúrtica

Si k= 0,263→ la distribución es normal o mesocúrtica

Si k> 0,263→la distribución es leptocúrtica

Esta medida no es muy utilizada

.Ejemplo ilustrativo:

Determinar qué tipo de curtosis tiene la siguiente distribución:

6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.

Solución:

Calculando la media aritmética se obtiene

41
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Calculando la desviación estándar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene:

Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:

Calculando el cuartil uno se obtiene:

Calculando el cuartil tres se obtiene:

Calculando el percentil 90 se tiene:

42
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Calculando elpercentil 10 se tiene:

Calculando el coeficiente percentil de curtosis se obtiene:

Como y , la distribución es platicúrtica

3.8. Diagrama de caja - bigotes

Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características
importantes, al mismo tiempo, tales como la dispersión y simetría.

Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo,
alineado horizontal o verticalmente.

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico.
Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con
los cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las
líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato
o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

Ejemplo distribución de edades

Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.

36, 25, 37, 24, 39, 20, 36, 45, 31, 31, 39, 24, 29, 23, 41, 40, 33, 24, 34, 40

Ordenar los datos

Para calcular los parámetros estadístico, lo primero es ordenar la distribución

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Calculo de Cuartiles

43
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer
cuartil es la media aritmética de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en
un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15,
resulta

Q3=(39 + 39) / 2 = 39

Dibujar la Caja y los Bigotes

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)

La primera parte de la caja a (Q1, Q2),

La segunda parte de la caja a (Q2, Q3)

El bigote de la derecha viene dado por (Q3, Xmáx).

Información del diagrama

Podemos obtener abundante información de una distribución a partir de estas representaciones. Veamos alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el
25% y el 50% de la población está más dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más
concentrados que el 25% de los mayores.

El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años.

La mayor utilidad de los diagramas caja bigotes es para comparar dos o más conjuntos de datos. La figura dos gráficos de
cajas de dos diferentes conjunto de datos.

44
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

A partir de dicha comparación puede obtenerse bastante información de ambas distribuciones.

45
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Unidad 6

4. FUNDAMENTOS DE PROBABILIDADES

Concepto de probabilidad

El concepto de probabilidad, es muy utilizado en la comunicación entre las personas, por ejemplo solemos escuchar con
bastante frecuencia

El paciente tiene una probabilidad del 80% de sobrevivir a la operación.


Hay un 20% de que llueva mañana.
Es probable que me gane la lotería.

La probabilidad intenta dar una medida entre cero y uno de que ocurra un evento

La probabilidad de un evento es el cociente entre el número de casos “igualmente posibles” favorables a ese evento y el total
de todos los casos igualmente posibles

4.1. Experimento aleatorio.

Si se lanza reiteradamente un dado, sabemos que los resultados posibles son uno de estos números: 1,2,3,4,5 y 6; pero no
podríamos predecir con certeza, qué número saldrá, aunque repitiéramos el experimento varias veces, en las mismas
condiciones.

A este tipo de experimento denominamos experimentos aleatorios, son aquellos en los que no se pueden predecir los
resultados de antemano, aunque se conozcan los resultados posibles y pueda repetirse indefinidamente el experimento en las
mismas condiciones iniciales.

Cada experimento aleatorio, admite un cierto número de resultados posibles, a veces este número puede ser finito, como
cuando se arroja un dado o una moneda. También puede ser infinito, como los diferentes tonos de color que se pueden obtener
cuando se mezclan los colores primarios.

4.2. Espacio muestral .

Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra
griega Ω).

46
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Ejemplo: Si se tira un dado y se juega a obtener menor que 4

E = {1,2,3,4,5,6}

En este caso la totalidad de resultados posibles son 6.

Ejemplo: Se juega a obtener resultados iguales en lanzamientos de dos monedas.

Entonces. E = {(cara; cara) (cara; cruz) (cruz; cara) (cruz; cruz)}

En este caso la totalidad de resultados posibles son 4

4.3. Reglas de conteo.

Un paso necesario en la asignación de probabilidades es poder identificar y contar los resultados experimentales. A
continuación se analizan tres reglas de conteo que resultan útiles.

Experimento de varias etapas

La primer regla de conteo es para experimentos de varias etapas. Considere el experimento que consiste en lanzar dos
monedas. Los resultados experimentales se definen en términos de la sucesión de caras o escudos que aparecen en las caras
superiores de las dos monedas. ¿Cuantos resultados experimentales son posibles para este experimento? Lanzar las dos
monedas se pueden considerar como un experimento de dos pasos en que el primero es el lanzamiento de la primera moneda
y el segundo es el lanzamiento de la segunda. Si para denotar escudo usamos la H y para denotar cara empleamos una
T.(H,H) indica el resultado experimental con escudo en la primera moneda y un escudo en la segunda. Con esta notación
podemos describir el espacio muestral S para el lanzamiento de monedas de la manera siguiente:

S={(H,H),(H,T),(T,H),(T,T)}

Así vemos que son posibles cuatro resultados experimentales. En este caso, no es difícil listarlos todos.

La regla de conteo para experimentos de varias etapas permite determinar el número de resultados experimentales sin listarlos.

Regla de conteo para experimentos de etapas múltiples

Si un experimento se puede describir como una sucesión de K etapas, en las que hay n1 resultados posibles de la primera
etapa, n2 en la segunda, etc.., la cantidad total de resultados experimentales es igual a (n1),(n2)......(nK).

Si el experimento de lanzar dos monedas se considera como una sucesión de primero lanzar una moneda (n1=2) y luego lanzar
la otra (n2=2), podemos inferir de la regla de conteo que hay (2)(2)=4 resultados experimentales distintos. Como se observa,
hay S={(H,H),(H,T),(T,H),(T,T)}. El número de resultados experimentales en un experimento que consiste en el lanzamiento de
seis monedas es:

(2)(2)(2)(2)(2)(2)=64

Combinaciones

Una segunda regla de conteo que con frecuencia es de utilidad, permite contar la cantidad de resultados experimentales
cuando en un experimento se deben seleccionar r objetos entre un conjunto de n objetos (por lo común más grande). Se llama
regla de conteo para combinaciones. El orden de los objetos seleccionados no es importante en el orden.

47
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Regla de conteo para combinaciones

La cantidad de combinaciones de n objetos tomados r a la vez es

La notación ! significa factorial; por ejemplo, 5 factorial es 5!=(5)(4)(3)(2)(1)=120. Por definición, 0! es igual a 1.

Un ejemplo de la regla de conteo para combinaciones es un procedimiento de control de calidad en que un inspector selecciona
al azar dos de cinco partes, para examinar y ver si tiene defectos. En un grupo de cinco partes, ¿cuantas combinaciones de dos
partes se puede seleccionar?. La regla de conteo de la ecuación que para n=5 y r=2 el resultado es

Así, hay 10 resultados en el experimento de seleccionar al azar dos partes de un grupo de cinco. Si identificamos a cinco partes
como A,B,C,AD,AE,BC,BD,BE,CD,CE y DE.

Otro ejemplo es el siguiente: la lotería de Nacional emplea selección aleatoria de seis números de un grupo de 47 para
determinar al ganador semanal. Se puede aplicar la regla de conteo. para combinaciones, para calcular la cantidad de maneras
en que se pueden seleccionar seis números distintos de entre un grupo de 47 números.

La regla de conteo para combinaciones indica que hay mas de 10 millones de resultados experimentales para determinar al
ganador de la lotería. Una persona se compra un boleto de lotería tiene una posibilidad de ganar 10737573 .

Ejemplos

¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5.?

m=5 n=5

Sí entran todos los elementos. De 5 dígitos entran sólo 3.

Sí importa el orden. Son números distintos el 123, 231, 321.

No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.

¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas?

Sí entran todos los elementos. Tienen que sentarse las 8 personas.

Sí importa el orden.

48
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

No se repiten los elementos. Una persona no se puede repetir.

Permutaciones

Una tercer regla de conteo que a veces resulta útil es la regla de conteo para permutaciones. Esta permite que uno pueda
calcular el número de resultados experimentales al seleccionar r objetos de un conjunto n objetos, donde es importante el orden
de selección. Si los mismos r objetos se seleccionan en otro orden se considera que se trata de un resultado experimental
distinto. En las permutaciones si importa el orden

Regla de conteo para permutaciones

El número de permutaciones de n objetos tomando r a la vez está dado por

La regla de conteo para permutaciones tiene estrecha relación con la de las combinaciones. No obstante, un experimento
tendrá más permutaciones que combinaciones para el mismo número de objetos porque cada selección de r objetos tiene n!
formas distintas para ordenarlos.

Como ejemplo, considere de nuevo el proceso de control de calidad en que un inspector selecciona dos de cinco partes para
hallar los defectos. ¿Cuantas permutaciones es posible seleccionar? La regla de conteo de ecuación muestra que con n=5 y
r=2 se tiene

Por tanto, 20 resultados son posibles para el experimento de elegir al azar dos pares de un grupo de cinco cuando hay que
tomar en cuenta el orden de selección. Si marcamos las partes A,B,C, y E, las 20 permutaciones son
AB,BA,AC,CA,AD,DA,AE,EA,BC,CB,BD,,DB,BE,EB,CD,DC,CE,EC,DE,ED.

¿Cuántos números de 5 cifras son divisibles por 5?

Para que un número sea divisible por cinco debe acabar en 0 ó 5, así que:

Podemos elegir la primera cifra de entre 9 (1, 2, 3, 4, 5, 6, 7, 8, 9, si la primera cifra es 0 no cuenta como número de 5 cifras).
Podemos elegir la segunda cifra de entre 10 (nos vale cualquier guarismo). También podemos elegir de entre 10 la tercera y la
cuarta cifra. La última cifra solo puede ser 0 ó 5, lo que nos da solo 2 posibilidades.

Así que existe un total de 9 · 10 · 10 · 10 · 2 = 18000 números de 5 cifras divisibles por 5.

4.4. Sucesos.

En estadística, un evento o suceso es un subconjunto de un espacio muestral, es decir, un conjunto de posibles resultados que
se pueden dar en un experimento aleatorio.

49
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Se llama suceso de un experimento aleatorio a cada uno de los subconjuntos del espacio muestral "E" . El conjunto de todos
los sucesos de un experimento aleatorio se conoce como espacio de sucesos y se representa por "S".

Suceso: cada uno de los resultados de un experimento aleatorio; suceso elemental es cada uno de los resultados más
simples, más directos de un experimento aleatorio. Ej.: ”obtener un 3” al lanzar un dado es un suceso elemental;
”obtener cifra par” es un suceso no elemental; ambos son resultados del experimento, pero el primero es más directo.

Ejemplo: Si se tira un dado y se juega a obtener menor que 4

E = {1, 2, 3, 4, 5, 6}

En este caso la totalidad de resultados posibles son 3.

Ejemplo: Se juega a obtener resultados iguales en lanzamientos de dos monedas.

Entonces. E = {(cara; cara), (cara; cruz), (cruz; cara), (cruz; cruz)}

Los casos favorables son A= {(cara; cara), (cruz; cruz)}

Entonces los casos favorables son 2.

Entonces la probabilidad de que ocurra un evento o suceso viene dado por la formula

𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒 [𝑛(𝐴)]


𝑃(𝐴) =
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠[𝑛(𝐸)]

Ejemplo 1: calcular la probabilidad de que ocurra que al tirar un dado se obtenga un valor menor que 5

Sea el evento

A = obtener menor a 5
𝑛 (A)=4 o sea los casos favorables son 4
𝑛 (E)=6 o sea los casos posibles son 6

[𝑛(𝐴)] 4 2
𝑃(𝐴) = = =
[𝑛(𝐸)] 6 3

O sea la probabilidad de obtener un número menor que cinco al arrojar un dado es de

Ejemplo 2: ¿Cuál es la probabilidad de obtener resultados iguales en lanzamientos de dos monedas?

Sea el evento

B = obtener resultados iguales al lanzar dos monedas


𝑛 (B)=2 o sea los casos favorables son 2
𝑛 (E)=4 o sea los casos posibles son 4

[𝑛(𝐵)] 2 1
𝑃(𝐴) = = =
[𝑛(𝐸)] 4 2

4.5. Definición clásica, frecuencias y axiomática de probabilidades.

Probabilidad clásica
50
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Estableció la “regla de Laplace” para el cálculo de probabilidades cuando los eventos posibles en un experimento aleatorio
tienen la misma probabilidad de suceder. Además de sus trabajos sobre probabilidad se destacó en ecuaciones diferenciales y
mecánica celeste. La probabilidad de un evento es la razón entre el número de casos favorables y el número total de casos
que pueden presentarse, siempre que los resultados sean equiprobables. Es una forma de probabilidad objetiva. No es
necesario realizar ningún experimento para determinar la probabilidad de un evento.

Un ejemplo típico de este modelo de probabilidad hace referencia al lanzamiento de una moneda “legal“ . Entendemos por
“legal“, que la probabilidad de que se obtenga un escudo o cara es la misma, son eventos equiprobables. Entonces, el número
de casos favorables para que se obtenga un escudo es 1, y el número de casos totales es dos.

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝑒𝑠𝑐𝑢𝑑𝑜 1


𝑝(𝑒𝑠𝑐𝑢𝑑𝑜) = =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 2

Otro ejemplo citado con frecuencia es el lanzamiento de un dado, Se asume que, al igual que en la moneda, las probabilidades
de cada cara del dado, es la misma. Entonces, el número de casos favorables para que se obtenga, por ejemplo, un tres; es 1,
y el número de casos totales es seis.

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝑡𝑟𝑒𝑠 1


𝑝(𝑡𝑟𝑒𝑠) = =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 6

Otro Ejemplo Probabilidad de que salga un varón al tomar 2 bebés y observar su sexo

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝑣𝑎𝑟𝑜𝑛 2 1


𝑝(𝑣𝑎𝑟𝑜𝑛) = = =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 4 2

Probabilidad frecuencial

Generalmente la teoría de probabilidad es considerada una rama de las matemáticas, sin embargo, sus fundamentos son
puramente filosóficos, y Richard von Mises, desarrolló la correcta teoría de probabilidad objetiva o “de frecuencia”

Es una forma empírica de calcular probabilidades. Es necesario repetir el experimento varias veces para calcular la
probabilidad.

La tabla muestra el número de veces que se obtuvo cada resultado al lanzar dos dados, cien veces.

51
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Cuanto más grande es el número de veces que se lanzan los dados, la frecuencia relativa se aproxima a la probabilidad de
ocurrencia de cada evento.

La probabilidad frecuencial, a diferencia de la subjetiva, siempre se cuantifica

Puede expresarse como fracción, número decimal o porcentaje

Se calcula mediante la fórmula:

Ejemplo de aplicación de la fórmula:

Se lanzan dos dados 100 veces y se cuenta el número de ocasiones en las que la suma de las caras es igual a 2,
3, 4, ..., 12

La tabla de la derecha contiene los resultados de este experimento aleatorio.

52
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

En la tabla de distribución de frecuencias, se observa que el número 3 se obtuvo en 9 ocasiones, por lo tanto:

También puede expresarse como: 9%

Axiomática de probabilidades

Andréi Kolmogórov, matemático ruso, entre muchos otros trabajos científicos, estructuró el sistema axiomático de la
probabilidad. Se basó en la teoría de conjuntos. Fundamenta matemáticamente la probabilidad.

Axiomas de la probabilidad

La probabilidad de un suceso X es un número real mayor o igual a cero: P(X)≥0


La probabilidad del universo Ω es igual a 1: P(Ω)=1
Si A1, A2, … Ai son sucesos mutuamente excluyentes, entonces

P(A1UA2…UAi) = ΣP(Ai)

4.6. Probabilidad subjetiva.

Es el grado de certeza que tenemos de que un suceso va a ocurrir. Suele indicarse como un número decimal, menor que uno o
como un porcentaje.

Se basa en la opinión personal, la experiencia o la intuición. En ocasiones hace uso de datos históricos.

No siempre se cuantifica.

53
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Las estimaciones subjetivas de probabilidad cambian de una persona a otra

No es necesario realizar ningún experimento para estimar la probabilidad subjetiva de un evento.

A pesar del uso ocasional de datos históricos, dichas estimaciones presentan un elevado grado de incertidumbre

No obstante dicha incertidumbre, en muchas circunstancias, es necesario recurrir a la probabilidad subjetiva.

4.7. Operaciones con sucesos

54
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

4.8. Probabilidad condicional.

Sean A y B dos sucesos de un mismo espacio muestral E.

Se llama probabilidad del suceso B condicionado a A y se representa por P(B/A) a la probabilidad del suceso B una vez
ha ocurrido el A.

En otras palabras, para poder calcular la P(B) debemos saber si A ocurrió o no.

Ejemplo Calcular la probabilidad de obtener un 6 al tirar un dado sabiendo que ha salido par.

55
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

5. Ejercicios
Lee atentamente los siguientes planteamientos y resuelve

1. En una bolsa se tienen 4 pelotas azules, 3 rojas, 2 verdes y 1 blanca. Si se saca una pelota, ¿cuál es la probabilidad de
sacar una pelota roja?, ¿y cuál es la probabilidad de sacar una verde?, ¿cuál de las dos tiene más probabilidad?
2. En un cajón hay 18 remeras blancas y 6 azules. Halla la probabilidad de sacar una…
a) Remera blanca:
b) Remera verde:
c) Remera azul:
3. Una empresa concederá un ascenso a dos empleados de un grupo de seis hombres y tres mujeres
a) ¿Cuál es la probabilidad que sea una mujer?
b) ¿Cuál es la probabilidad que sea un hombre?
4. Se lanza un solo dado ¿Cuál es la probabilidad de que caiga un múltiplo de 2?
5. Se lanza un dado encuentre la probabilidad de que el número de la cara superior sea:
a) 3
b) Impar
c) Menor que 5.
d) No mayor que tres.
6. En un grupo de expedientes médicos se clasifica a los pacientes por género y por tipo de diabetes (I o II). Los
agrupamientos pueden ser como sigue:

Si aleatoriamente se elige un expediente, encuentre la probabilidad de que la persona seleccionada:

a) sea mujer
b) parezca diabetes de tipo II
7. Una persona posee un billete de lotería perteneciente a una tirada de 150 billetes. Es sorteo ofrece un primer premio, dos
segundos y cinco terceros premios. Cuál es la probabilidad de ganar:

a) el primer premio
b) el segundo premio
c) el tercer premio
8. Las puntuaciones obtenidas por un grupo en una prueba han sido:

15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.

Construir la tabla de distribución de frecuencias y dibuja el polígono de frecuencias.

9. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:

3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.

Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.

56
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

10. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:

5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.

Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.

11. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:

Peso fi
[50, 60) 8
[60, 70) 10
[70, 80) 16
[80,90) 14
[90, 100) 10
[100, 110) 5
[110, 120) 2
1 Construir la tabla de frecuencias. 2 Representar el histograma y el polígono de frecuencias.

12. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física.

3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28,
38, 41, 48, 15, 32, 13.

1 Construir la tabla de frecuencias. 2 Dibujar el histograma y el polígono de frecuencias.

13. Sea una distribución estadística que viene dada por la siguiente tabla:

xi fi
61 5
64 18
67 42
70 27
73 8
Calcular: La moda, mediana, media. El rango, desviación media, varianza y desviación típica.

14. Calcular la media, la mediana y la moda de la siguiente serie de números:

5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.

15. Hallar la varianza y la desviación típica de la siguiente serie de datos:

12, 6, 7, 3, 15, 10, 18, 5.

16. Hallar la media, mediana y moda de la siguiente serie de números:

3, 5, 2, 6, 5, 9, 5, 2, 8, 6.

17. Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:

2, 3, 6, 8, 11.12, 6, 7, 3, 15, 10, 18, 5.

18. Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:

fi

57
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

[38, 44) 7
[44, 50) 8
[50, 56) 15
[56, 62) 25
[62, 68) 18
[68, 74) 9
[74, 80) 6

Dibujar el histograma y el polígono de frecuencias acumuladas.

19. Dadas las series estadísticas:

3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1.

Calcular: La moda, la mediana y la media, La desviación media, la varianza y la desviación típica, 3Los cuartiles 1º y 3º,
Los deciles 2º y 7º, Los percentiles 32 y 85.

20. Una distribución estadística viene dada por la siguiente tabla:

fi
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
Hallar: La moda, mediana y media, El rango, desviación media y varianza, Los cuartiles 1º y 3º, Los deciles 3º y 6º, Los
percentiles 30 y 70.

21. Dada la distribución estadística:

fi
[0, 5) 3
[5, 10) 4
[10, 15) 7
[15, 20) 8
[20, 25) 2
[25, ∞) 6
Calcular: La mediana, moda, Cuartil 2º y 3º, Media.

22. Un dentista observa el número de caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece
resumida en la siguiente tabla:

Nº de caries fi ni
0 25 0.25
1 20 0.2
2 x z
3 15 0.15
4 y 0.05
Completar la tabla obteniendo los valores x, y, z,. Hacer un diagrama de sectores,. Calcular el número medio de caries.

23. Se tiene el siguiente conjunto de 26 datos:


58
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18

Obtener su mediana y cuartiles.

24. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por
primera vez:

Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
25. Dibujar el polígono de frecuencias. Calcular la moda, la mediana, la media y la varianza, 5Completar los datos que
faltan en la siguiente tabla estadística:

xi fi Fi ni
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8
Calcular la media, mediana y moda de esta distribución.

Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide:

Calcular su media y su varianza. Si los todos los datos anteriores los multiplicamos por 3, cúal será la nueva media y
varianza.

26. El resultado de lanzar dos dados 120 veces viene dado por la tabla:

Sumas Veces
2 3
3 8
4 9
5 11
6 20
7 19
8 16
9 13
10 11
11 6
12 4
Calcular la media y la desviación típica. Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).

27. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:

59
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

Altura Nº de jugadores
[170, 175) 1
[175, 180) 3
[180, 185) 4
[185, 190) 8
[190, 195) 5
[195, 2.00) 2
Calcular: La media, La mediana, La desviación típica, ¿Cuántos jugadores se encuentran por encima de la media más una
desviación típica?

28. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla:

1 2 3 4 5 6
fi a 32 35 33 b 35
Determinar a y b sabiendo que la puntuación media es 3.6.

29. El histograma de la distribución correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

Formar la tabla de la distribución. 2Si Andrés pesa 72 kg, ¿cuántos alumnos hay menos pesados que él? Calcular la moda.
Hallar la mediana, ¿A partir de que valores se encuentran el 25% de los alumnos más pesados?

30. De esta distribución de frecuencias absolutas acumuladas, calcular:

Edad Fi
[0, 2) 4
[2, 4) 11
[4, 6) 24
[6, 8) 34
[8, 10) 40
Media aritmética y desviación típica. ¿Entre qué valores se encuentran las 10 edades centrales? Representar el polígono
de frecuencias absolutas acumuladas.

31. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media es de 1.60 m y la desviación típica es de 20
cm. Otra persona B mide 1.80 m y vive en una ciudad donde la estatura media es de 1.70 m y la desviación típica es de 15
cm. ¿Cuál de las dos será más alta respecto a sus conciudadanos?

60
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.

32. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los siguientes resultados: para el primer test la
media es 6 y la desviación típica 1.5.

Para el segundo test la media es 4 y la desviación típica 0.5.

Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con el grupo, ¿en cuál de los dos tests obtuvo mejor
puntuación?

33. La asistencia de espectadores a las 4 salas de un cine un determinado día fue de 200, 500, 300 y 1000 personas.

Calcular la dispersión del número de asistentes. Calcular el coeficiente de variación. Si el día del espectador acuden 50
personas más a cada sala, ¿qué efecto tendría sobre la dispersión?

61
1º Contaduría General

You might also like