Professional Documents
Culture Documents
INDICE
1. INTRODUCCIÓN A LA ESTADÍSTICA
1.1. Conceptos Básicos
1.2. Tipos de Variables
1.3. Elaboración de Cuadros Estadísticos
1.3.1. Distribuciones de frecuencias según tipos de variables.
1.3.2. Intervalos de clases.
1.3.3. Frecuencias absolutas y relativas.
1.3.4. Frecuencias acumuladas.
1.4. Gráficos y su Interpretación
1.5. Gráficos lineales y semi-logarítmicos.
1.6. Gráficos de barras, circulares, y de puntos.
1.7. Diagrama de pareto.
1.8. Histograma.
1.9. Polígono de frecuencias
1.10. Polígono de frecuencias acumuladas ojivas
1.11.
.
2. MEDIDAS DE TENDENCIA CENTRAL
2.1. Media aritmética.
2.2. Geométrica.
2.3. Armónica.
2.4. Mediana.
2.5. Modo.
2.6. Rango medio.
2.7. Eje Medio.
2.8. Relación empírica.
2.9. Propiedades limitaciones.
2.10. Fractiles: Cuartiles, Deciles y Percentiles.
2.11. Aplicaciones utilizando software estadístico
3. MEDIDAS DE DISPERSIÓN
3.1. Rango
3.2. Desviación Media
3.3. Varianza.
3.4. Desviación estándar.
3.5. Propiedades.
3.6. Teorema de Chebyshev
3.7. Coeficiente de variación.
3.8. Momentos.
3.9. Medidas de asimetría y curtosis
3.10. Diagrama de caja y sesgo
4. FUNDAMENTOS DE PROBABILIDADES
4.1. Experimento aleatorio.
4.2. Espacio Muestra.
4.3. Formas de presentación del espacio muestra.
4.4. Reglas de conteo.
4.5. Sucesos.
4.6. Definición clásica, frecuencias y axiomática de probabilidades.
4.7. Probabilidad subjetiva.
4.8. Sucesos naturales y excluyentes.
4.9. Sucesos interdependientes.
4.10. Reglas de adición.
4.11. Probabilidad condicional.
2
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Unidad 1
1. INTRODUCCIÓN A LA ESTADÍSTICA
La Estadística, nace de las necesidades reales del hombre. La variada y cuantiosa información relacionada con éste y que es
necesaria para la toma de decisiones, hace que la estadística sea hoy, una importante herramienta de trabajo.
Entre las tareas principales de la Estadística, está el de reunir la información integrada por un conjunto de datos, con el
propósito de obtener conclusiones válidas del comportamiento de éstos, como también hacer una inferencia sobre
comportamientos futuros.
En cuanto al uso y la aplicación, puede decirse que abarca todo el ámbito humano encontrándose en las relaciones
comerciales, financieras, políticas, sociales, etc. siendo fundamental en el campo de la investigación y en la toma de
decisiones.
Es así también como en el área de las empresas de servicio y manufactura es posible realizar un análisis profundo del proceso
estadístico al control de la productividad y de la calidad.
1.1. Conceptos básicos
Definición de Estadística
Se denomina Estadística a la rama de las matemáticas que se ocupa de reunir, organizar, clasificar, presentar, resumir, analizar
e interpretar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.
Estadística Descriptiva, registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas
de centralización y de dispersión), que describen el conjunto estudiado.
Estadística Inferencial, parte de la estadística que se ocupa de llegar a conclusiones (inferencias), o la toma de una decisión
acerca de las poblaciones a partir de los datos de las muestras extraídas de ellas.
Población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.
Individuo o unidad estadística es cada uno de los elementos que componen la población.
3
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el
de la población.
Muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.
Valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire
5 veces obtenemos dos valores: cara y cruz.
Dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Parámetros: Es una característica cuantificable de una población. (Una medida resumen calculada sobre la población).
Estadístico: Es una medida, un valor que se calcula para describir una característica a partir de una sola muestra. (Una
medida resumen calculada sobre la muestra).
Variable: Característica o fenómeno de una población o muestra que será estudiada, la cual puede tomar diferentes valores.
Practico # 1
Cuestiones a completar
4
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.
Variable cualitativa Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con
números. Podemos distinguir dos tipos:
Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un
criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no
numéricas, en las que existe un orden. Por ejemplo:
Variable cuantitativa. Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar
operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta. Una variable discreta es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua. Una variable continua es aquella que puede tomar valores comprendidos entre dos números.
Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.
• Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de
una clase).
• Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de
los alumnos de una clase).
• Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de
los alumnos de una clase).
5
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Los métodos estadísticos abarcan todas las etapas de la investigación, desde el diseño de la investigación hasta el análisis final
de los datos.
Las técnicas o tipos de recolección de datos se definen como el conjunto de procedimientos y herramientas para recoger,
validar y analizar la información necesaria que permita lograr los objetivos de la investigación.
Un instrumento de recolección de datos es cualquier recurso de que se vale el investigador para acercarse a los fenómenos y
extraer de ellos información. Existen múltiples y diferentes instrumentos útiles para la recolección de datos y para ser usados en
todo tipo de investigaciones, ya sean cualitativas, cuantitativas o mixtas.
1) La observación.
2) Técnica documental
3) La entrevista
4) El cuestionario.
5) La encuesta.
La observación.- es la acción de mirar con rigor en forma sistemática y profunda, con el interés de descubrir la importancia de
aquello que se observa.
La técnica documental.- es un tipo de observación que recopila o busca sus datos en documentos, fuentes escritas o graficas
de todo tipo.
La entrevista.- es una situación de interrelación o dialogo entre personas, es una técnica donde una persona llamada
entrevistador, solicita al entrevistado le proporcione alguna información. Cuando una encuesta está dirigida a la totalidad de
elementos de una población, se llama censo; cuando está dirigida a una parte representativa muestra de la población, se llama
encuesta por muestreo.
El cuestionario.- es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas, que se formulan al
encuestado o entrevistado, con el propósito de obtener los datos de las variables consideradas en el estudio. El cuestionario
debe ser adaptado a las necesidades de la investigación y a las características del grupo que se estudia.
La encuesta.- es una técnica de recolección de datos, donde se obtiene la información tal como se necesita, preparada ex
profesamente y con objetivo estadístico. Permite observar y registrar características en las unidades de análisis de una
determinada población o muestra, delimitada en el tiempo y en el espacio.
6
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante los cómputos
de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente
identificables.
Practico #1
7
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
La información estadística puede constar de un gran número de observaciones y mientras mayor sea el número, mayor puede
ser la conveniencia y necesidad de presentarla en forma resumida, la cual puede permitir algunos detalles pero en cambio
puede revelar la naturaleza general de la información. Un resumen de tal distribución se denomina Distribución de Frecuencias.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando
a cada dato su frecuencia correspondiente.
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de
datos. Se puede expresar en tantos por ciento.
8
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en
la tercera anotamos la frecuencia absoluta.
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 IIIII I 6 9 0.194 0.290
30 IIIII II 7 16 0.226 0.516
31 IIIII III 8 24 0.258 0.774
32 III 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1
31 1.00
Este tipo de tablas de frecuencias se utiliza con variables discretas.
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de
valores o la variable es continua.
Número de intervalos o clases (K).- Es el número de grupos en el cual es posible dividir los valores de la variable. El número
de clases no debe ser ni muy grande ni muy pequeño, un número pequeño de clases puede ocultar la naturaleza general de los
datos y un número muy grande puede ser demasiado detallado como para revelar alguna información útil. Como regla general
se recomienda que el número de clases esté entre 5 y 20. Hay una regla llamada Regla de Sturges que puede dar una
aproximación razonable para el número de clases, ella es:
Límites de la clase.- Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Rango (R).- Rango o recorrido es la diferencia entre el valor máximo y valor mínimo que toma la variable X.
Amplitud de la clase.- Una vez determinado el número de clases, debe decidirse la amplitud de estas. Tomando la misma
amplitud para todas las clases, este valor queda dado por:
𝑅
𝐴=𝐾; R=rango; K=intervalos.
Marca de clase.- La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el
cálculo de algunos parámetros.
9
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Ejemplo 1:
Las velocidades, en millas por hora, de los conductores de 55 automóviles fueron medidas con un radar en una calle de cierta
ciudad:
27 23 22 38 43 24 35 26 28 20 18
25 23 22 63 31 30 41 45 29 43 27
29 28 27 25 29 28 24 37 28 18 29
26 33 25 27 25 34 32 36 22 33 32
21 23 24 18 48 23 15 38 26 23 21
Construya una distribución de frecuencias para las velocidades de estos 55 automóviles.
Solución:
Primero. Para una mayor facilidad se recomienda ordenar los datos de menor a mayor.
N=55
10
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Clase xi fi Fi hi Hi % (hi*100)
[15 - 22) 18,5 7 7 0,127 0,127 12,73
[22 - 29) 25,5 26 33 0,473 0,600 47,27
[29 - 36) 32,5 12 45 0,218 0,818 21,82
[36 - 43) 39,5 5 50 0,091 0,909 9,09
[43 - 50) 46,5 4 54 0,073 0,982 7,27
[50 - 57) 53,5 0 54 0,000 0,982 0,00
[57 - 64) 60,5 1 55 0,018 1,000 1,82
55 1,000 100,00
Ejemplo 2
Los siguientes datos corresponden a la edad de las personas que viajan en un bus.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Solución.
1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos
queramos establecer.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.
Clase Xi fi Fi hi Hi % (hi*100)
[0 - 5) 2,5 1 1 0,025 0,025 2,50
[5 - 10) 7,5 1 2 0,025 0,050 2,50
[10 - 15) 12,5 3 5 0,075 0,125 7,50
[15 - 20) 17,5 3 8 0,075 0,200 7,50
[20 - 25) 22,5 3 11 0,075 0,2775 7,50
[25 - 30) 27,5 6 17 0,150 0,425 15,00
[30 - 35) 32,5 7 24 0,175 0,600 17,50
[35 - 40) 37,5 10 34 0,250 0,850 25,00
[40 - 45) 42,5 4 38 0,100 0,950 10,00
[45 - 50) 47,5 2 40 0,050 1,00 5,00
40 1,000 100,00
Respuestas
1) En el bus viajan 5 menores de 15 años. (F3=5).
2) El porcentaje de niños menores a 5 años es 2,50%. (h1*100)
3) El porcentaje de adultos mayores a 30 años es 57.5%. (1,00 – F6 )*100 = (1,00 – 0,425)*100=57.5%
4) La cantidad de adultos mayor a 45 años es 2. F10=2
11
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
EJERCICIOS
1. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias.
2. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias.
3. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias.
4. En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño.
Los siguientes datos corresponden al peso, en kilógramos, de estas piezas, que poseen las mismas dimensiones, pero distinta
aleación.
d) ¿Qué porcentaje representan los discos que duraron entre 310 y 314 horas?
12
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Las gráficas revelan un patrón de comportamiento de la variable en estudio. Se ofrecen muchos tipos de gráficos para describir
el conjunto de datos estadísticos. Dependiendo del tipo de datos y lo que se quiera representar, se hará uso del método gráfico
más adecuado como forma de presentar una información.
1. Titulo
2. Tabla o Distribución de Frecuencias
3. Escala
4. Cuerpo de la gráfica
5. Convenciones
6. Notas aclaratorias
7. Numeración
El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el número de ítems que ha de presentarse,
así como la longitud del eje. Es de anotar la conveniencia de mostrar la
interrupción y acercamiento del eje a su origen cuando esto haya ocurrido.
Gráfico de Barras: El gráfico de barras, como su nombre lo indica, está NÚMERO DE HIJOS DE 50 HOBRERAS EN EL PARQUE INDUSTRIAL
13
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Éstos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal
Gráficos circulares.
Este gráfico permite apreciar qué parte representa cada clase dentro del
total, pero a veces se hace difícil apreciar la diferencia entre una
frecuencia y otra.
Diagrama de puntos es una gráfica utilizada para ilustrar un número reducido de datos, la cual permite identificar con facilidad
dos características:
Este diagrama muestra cada uno de los elementos de un conjunto de datos numéricos por encima de una recta numérica (eje
horizontal), facilita la ubicación de los espacios vacíos y los agrupamientos en un conjunto de datos, así como la manera en que
estos datos se distribuyen a los largo del eje horizontal.
Diagrama de Pareto.
Un diagrama de Pareto está formado por un gráfico de barras y un gráfico de línea. Los valores individuales se representan
por las barras y el total acumulado es representado por la línea.
14
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
conocemos como la regla del 80-20 o como principio de Pareto. Para crear un diagrama de Pareto debemos preparar los
datos.
Histograma.
Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia
absoluta de cada intervalo.
Polígono de frecuencia
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo.
Intervalos xi fi Fi
[50, 60) 55 8 8 Polígono de
Histograma frecuencia
[60, 70) 65 10 18
[70, 80) 75 16 34
Frecuencia absoluta
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
65
Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una
distribución acumulativa y de igual manera que éstas, existen ojivas mayor que y ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la aplicación de la técnica es
parcial):
1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva
menor que, con el derecho.
2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor
que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se
usaron para ejemplificar el histograma:
15
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00"
se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las
4:00 horas).
De forma análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el número de
observaciones menores que la frontera señalada (en caso de tiempos sería el número o de observaciones antes de la hora que
señala la frontera).
Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de los rectángulos del
histograma.
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50
alumnos.
Intervalos fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Diagrama de sectores
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables
cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta
correspondiente.
16
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Ejemplo
En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún
deporte.
Alumnos Ángulo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°
Los histogramas siguientes representan distintas formas posibles para la distribución de los datos.
17
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Si lo que deseamos es reflejar el tipo de medida que estamos usando, elegiremos el tipo de gráfico según esta tabla
Gráfico de barras
Puede ser simple o múltiple,
vertical (o de columnas) u
horizontal
Perfil ortogonal
Es un gráfico lineal en el que
Tipo de
el eje X contiene variables cualitativas
variable
Cualitativa
Cuantitativa
discreta
Barras
También se usan en cuantitativos
Continua o
discreta Variable cuantitativa discreta
agrupada Ambas pueden ser simples o
múltiples, normales o
acumuladas.
Lineal
Puede ser de frecuencias normales o
acumuladas
Histograma
Polígono de frecuencias
18
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Prácticos
19
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Unidad 2
2. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de
datos, ayudan a describir las características típicas de conjuntos de datos y a resumir la información en un sólo número. Las
medidas de tendencia central se denominan medidas de posición.
Las medidas de tendencia central más utilizadas son: media, mediana, moda, rango
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
20
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la
puntuación media.
xi fi xi • fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
a) La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a
cero.
La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
b) La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se
hace mínima cuando dicho número coincide con la media aritmética.
c) Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho
número.
d) Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por
dicho número.
21
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
c) La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos:
La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.
xi fi
[60, 63) 61.5 5
[63, 66) 64.5 18
[66, 69) 67.5 42
[69, 72) 70.5 27
[72, ∞ ) 8
100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último intervalo.
La media geométrica de un conjunto de n observaciones es la raíz enésima de su producto. El cálculo de la media geométrica
exige que todas las observaciones sean positivas:
Ejemplo.
Las siguientes temperaturas han sido tomadas de un experimento químico: 13.4°C, 12.8°C, 11.9°C,
2. Es afectada por valores extremos aunque en menor medida que la media aritmética.
5. Es mayormente usada para promediar tasas de intereses anuales, inflación razones y valores que muestren una progresión
geométrica (efecto multiplicativo sobre el de los años anteriores).
22
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Ejemplo.
1. No se influye por la existencia de determinados valores mucho más grandes que el resto.
2.4. Mediana.
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
Cálculo de la mediana
2, 3, 4, 4, 5, 5, 5, 6, 6
Me= 5
3) Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12
Me= 9.5
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
𝐍
Es decir tenemos que buscar el intervalo en el que se encuentre .
𝟐
23
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
ai es la amplitud de la clase.
Ejemplo
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
100/2 = 50
2, 3, 3, 4, 4, 4, 5, 5
Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es
bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9
Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
24
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8
3+5
𝑀𝑜 = 2
= 4 → Mo = 4
ai es la amplitud de la clase.
Ejemplo Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50
alumnos. Calcular la moda.
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
El rango medio es el promedio de las observaciones menores y mayores de una serie de datos.
El rango medio a menudo es usado como una medición de resumen tanto por analistas financieros como por reporteros
meteorológicos, puesto que puede proporcionar una medición adecuada, rápida y simple para caracterizar toda una serie de
datos, como por ejemplo todo una serie de lecturas registradas de temperatura por horas durante todo un día.
Como última medida de tendencia central, mencionamos al eje medio, que es el promedio del primer y tercer cuartiles de una
serie de datos. Es decir:
Siendo Q1 y Q2, el primer y segundo cuartil. En conclusión podemos decir que es una medición de resumen usada para zanjar
problemas potenciales introducidos por los valores extremos de los datos.
En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En
cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:
26
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda
respectivamente, para curvas simétricas los tres valores coinciden
Los fractiles son aquellas medidas que facilitan la localización de la posición de un dato respecto a su grupo. Ejemplo: la
mediana
Sinónimos
Fractiles Cuantiles Medidas de orden Medidas de Posición
Los fractiles tienen nombres especiales, dependiendo del número de partes iguales en que se dividen los datos, siendo estos:
Cuartiles, Deciles y Percentiles
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
2, 5, 3, 6, 7, 4, 9
27
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
2, 5, 3, 4, 6, 7, 1, 9
ai es la amplitud de la clase.
Ejercicio de cuartiles
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Cálculo del primer cuartil
28
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Los deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
ai es la amplitud de la clase.
Ejercicio de deciles
[50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2 65
Fi 8 18 34 48 58 63 65
Cálculo del primer decil
29
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Los percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.
ai es la amplitud de la clase.
30
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Ejercicio de percentiles
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentil 35
Percentil 60
31
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Unidad 3
3. MEDIDAS DE DISPERSIÓN
Medidas de dispersión estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos
concentrados, o más o menos dispersos.
a) La dispersión proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central, si los
datos se encuentran muy dispersos, la posición central es menos representativa de los datos, como un todo, que cuando éstos
se agrupan más cerca del valor de la media.
b) Existen problemas característicos para datos muy dispersos, por lo que es necesario reconocer esa dispersión alta para
poder abordar ese tipo de problemas.
c) Cuando se desea comparar diferentes muestras, si no se desea tener una alta dispersión de valores con respecto del centro
de distribución, o esto presenta riesgos inaceptables, se necesita reconocerla y evitar elegir distribuciones que tengan las
dispersiones más grandes.
Asimismo, la dispersión puede medirse desde tres enfoques, la distancia, la dispersión promedio y la dispersión relativa.
3.1. Rango
Es la diferencia entre el más alto y el más pequeño de los valores observados. El rango es fácil de entender y de calcular, pero
su utilidad como medida de dispersión es limitada, pues solo toma en cuenta el valor más grande y el más pequeño y ninguna
otra observación del conjunto de datos, restándole importancia a las variaciones entre todas las demás observaciones.
RANGO (R)
La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadística y la media
aritmética.
Di = |x - x|
Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
32
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Ejemplo
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
Ejemplo
xi fi xi · fi |x - x| |x - x| · fi
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57
3.3. Varianza.
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
33
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Ejercicios de varianza
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
Propiedades de la varianza
1) La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
3) Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho
número.
4) Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza
total.
1) La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2) En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3) La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
35
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
1) La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2) Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3) Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
4) Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular
la desviación típica total.
1) La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas.
2) En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
3) Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media.
36
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean
positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.
Ejercicio
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?
Puntuaciones diferenciales
Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmética.
xi = Xi − X
Puntuaciones típicas
Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este proceso se
llama tipificación.
Las puntuaciones típicas son adimensionales, es decir, son independientes de las unidades utilizadas.
Las puntuaciones típicas se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones.
Ejemplo
En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las
desviaciones típicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg.
¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?
3.6. Momentos.
37
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Los dos estadísticos más importantes son la media y la desviación típica. Ambos pertenecen a un grupo que se denominan
"momentos".
Un conjunto de datos o distribución de datos queda exhaustivamente descrito cuando pueden especificarse una medida de
posición, una medida de dispersión, un índice de asimetría y un índice de curtosis. Las medidas de asimetría y curtosis se
refieren a la “forma” de la distribución y, aunque no son tan importantes como las medidas de posición y dispersión y son muy
poco utilizadas, aportan también información sobre la distribución de los valores de una muestra o población.
Simetría
La asimetría de una distribución hace referencia al grado en que los datos se reparten por encima y por debajo de la tendencia
central.
En la práctica casi nunca se encuentran polígonos de frecuencias o histogramas completamente simétricos, por lo cual, el
grado en el cual la distribución es asimétrica constituye su sesgo.
Si una distribución de frecuencias es simétrica, no tiene sesgo, es decir, el sesgo es nulo. Si una o más observaciones son
grandes, la media de la distribución se vuelve mayor que la Me o la Mo, en tales casos se dice que la distribución tiene sesgo
38
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
positivo. Si una o más observaciones muy pequeñas se encuentran presentes, la media es la menor de los tres promedios y se
dice que la distribución tiene sesgo negativo. Obsérvese el siguiente diagrama:
En una distribución simétrica las observaciones de la variable tienden a situarse en igual proporción a ambos lados del valor
medio. Cualquier medida que recoja alteraciones de esta situación proporcionará una cuantificación de la asimetría de la
distribución. Una primera propuesta podría ser la siguiente:
en tanto que define un promedio de las desviación es de la variable con respecto al valor medio. En el caso de que se dieran
muchas observaciones por encima de la media se esperaría un valor positivo, mientras que una mayor proporción de valores
por debajo de la media proporcionaría un valor negativo. Es posible que ya se haya dado cuenta de que esta propuesta, si no
se modifica, es inservible, puesto que por definición siempre
Una alternativa es tomar las desviaciones de la variable respecto a la media pero elevadas a alguna potencia. Al elevar las
desviaciones al cuadrado se obtiene la expresión de la varianza, una medida de dispersión de los valores respecto a la media,
pero que no ayuda a señalar la posición de las observaciones a derecha o izquierda de la medida de posición central. El cubo
de las desviaciones, al respetar el signo de la diferencia sí permite promediar tanto la importancia de la desviación, como su
dirección. Se utilizaría, por tanto, un estadístico conocido como el momento de orden tres con respecto a la media (m3):
En función del signo de m3 puede determinarse si la asimetría es por la derecha o por la izquierda (según un número
relativamente elevado de observaciones tomen valores en la parte derecha o izquierda de la distribución). También se habla de
asimetría positiva (por la derecha) o asimetría negativa (por la izquierda). Una distribución simétrica tenderá a un valor de m3
igual a cero. Por tanto tendremos:
39
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
La curtosis
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide
cuán puntiaguda es una distribución.
Tipos de curtosis
La curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:
Medidas de curtosis
1) Medida de Fisher
40
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Nota:
Nota:
.Ejemplo ilustrativo:
6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solución:
41
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
42
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características
importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo,
alineado horizontal o verticalmente.
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico.
Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con
los cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las
líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato
o caso que no se encuentre dentro de este rango es marcado e identificado individualmente
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.
36, 25, 37, 24, 39, 20, 36, 45, 31, 31, 39, 24, 29, 23, 41, 40, 33, 24, 34, 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calculo de Cuartiles
43
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer
cuartil es la media aritmética de dicho valor y el siguiente:
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en
un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente:
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15,
resulta
Q3=(39 + 39) / 2 = 39
Podemos obtener abundante información de una distribución a partir de estas representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el
25% y el 50% de la población está más dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más
concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años.
La mayor utilidad de los diagramas caja bigotes es para comparar dos o más conjuntos de datos. La figura dos gráficos de
cajas de dos diferentes conjunto de datos.
44
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
45
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Unidad 6
4. FUNDAMENTOS DE PROBABILIDADES
Concepto de probabilidad
El concepto de probabilidad, es muy utilizado en la comunicación entre las personas, por ejemplo solemos escuchar con
bastante frecuencia
La probabilidad intenta dar una medida entre cero y uno de que ocurra un evento
La probabilidad de un evento es el cociente entre el número de casos “igualmente posibles” favorables a ese evento y el total
de todos los casos igualmente posibles
Si se lanza reiteradamente un dado, sabemos que los resultados posibles son uno de estos números: 1,2,3,4,5 y 6; pero no
podríamos predecir con certeza, qué número saldrá, aunque repitiéramos el experimento varias veces, en las mismas
condiciones.
A este tipo de experimento denominamos experimentos aleatorios, son aquellos en los que no se pueden predecir los
resultados de antemano, aunque se conozcan los resultados posibles y pueda repetirse indefinidamente el experimento en las
mismas condiciones iniciales.
Cada experimento aleatorio, admite un cierto número de resultados posibles, a veces este número puede ser finito, como
cuando se arroja un dado o una moneda. También puede ser infinito, como los diferentes tonos de color que se pueden obtener
cuando se mezclan los colores primarios.
Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra
griega Ω).
46
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
E = {1,2,3,4,5,6}
Un paso necesario en la asignación de probabilidades es poder identificar y contar los resultados experimentales. A
continuación se analizan tres reglas de conteo que resultan útiles.
La primer regla de conteo es para experimentos de varias etapas. Considere el experimento que consiste en lanzar dos
monedas. Los resultados experimentales se definen en términos de la sucesión de caras o escudos que aparecen en las caras
superiores de las dos monedas. ¿Cuantos resultados experimentales son posibles para este experimento? Lanzar las dos
monedas se pueden considerar como un experimento de dos pasos en que el primero es el lanzamiento de la primera moneda
y el segundo es el lanzamiento de la segunda. Si para denotar escudo usamos la H y para denotar cara empleamos una
T.(H,H) indica el resultado experimental con escudo en la primera moneda y un escudo en la segunda. Con esta notación
podemos describir el espacio muestral S para el lanzamiento de monedas de la manera siguiente:
S={(H,H),(H,T),(T,H),(T,T)}
Así vemos que son posibles cuatro resultados experimentales. En este caso, no es difícil listarlos todos.
La regla de conteo para experimentos de varias etapas permite determinar el número de resultados experimentales sin listarlos.
Si un experimento se puede describir como una sucesión de K etapas, en las que hay n1 resultados posibles de la primera
etapa, n2 en la segunda, etc.., la cantidad total de resultados experimentales es igual a (n1),(n2)......(nK).
Si el experimento de lanzar dos monedas se considera como una sucesión de primero lanzar una moneda (n1=2) y luego lanzar
la otra (n2=2), podemos inferir de la regla de conteo que hay (2)(2)=4 resultados experimentales distintos. Como se observa,
hay S={(H,H),(H,T),(T,H),(T,T)}. El número de resultados experimentales en un experimento que consiste en el lanzamiento de
seis monedas es:
(2)(2)(2)(2)(2)(2)=64
Combinaciones
Una segunda regla de conteo que con frecuencia es de utilidad, permite contar la cantidad de resultados experimentales
cuando en un experimento se deben seleccionar r objetos entre un conjunto de n objetos (por lo común más grande). Se llama
regla de conteo para combinaciones. El orden de los objetos seleccionados no es importante en el orden.
47
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
La notación ! significa factorial; por ejemplo, 5 factorial es 5!=(5)(4)(3)(2)(1)=120. Por definición, 0! es igual a 1.
Un ejemplo de la regla de conteo para combinaciones es un procedimiento de control de calidad en que un inspector selecciona
al azar dos de cinco partes, para examinar y ver si tiene defectos. En un grupo de cinco partes, ¿cuantas combinaciones de dos
partes se puede seleccionar?. La regla de conteo de la ecuación que para n=5 y r=2 el resultado es
Así, hay 10 resultados en el experimento de seleccionar al azar dos partes de un grupo de cinco. Si identificamos a cinco partes
como A,B,C,AD,AE,BC,BD,BE,CD,CE y DE.
Otro ejemplo es el siguiente: la lotería de Nacional emplea selección aleatoria de seis números de un grupo de 47 para
determinar al ganador semanal. Se puede aplicar la regla de conteo. para combinaciones, para calcular la cantidad de maneras
en que se pueden seleccionar seis números distintos de entre un grupo de 47 números.
La regla de conteo para combinaciones indica que hay mas de 10 millones de resultados experimentales para determinar al
ganador de la lotería. Una persona se compra un boleto de lotería tiene una posibilidad de ganar 10737573 .
Ejemplos
¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5.?
m=5 n=5
No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.
¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas?
Sí importa el orden.
48
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Permutaciones
Una tercer regla de conteo que a veces resulta útil es la regla de conteo para permutaciones. Esta permite que uno pueda
calcular el número de resultados experimentales al seleccionar r objetos de un conjunto n objetos, donde es importante el orden
de selección. Si los mismos r objetos se seleccionan en otro orden se considera que se trata de un resultado experimental
distinto. En las permutaciones si importa el orden
La regla de conteo para permutaciones tiene estrecha relación con la de las combinaciones. No obstante, un experimento
tendrá más permutaciones que combinaciones para el mismo número de objetos porque cada selección de r objetos tiene n!
formas distintas para ordenarlos.
Como ejemplo, considere de nuevo el proceso de control de calidad en que un inspector selecciona dos de cinco partes para
hallar los defectos. ¿Cuantas permutaciones es posible seleccionar? La regla de conteo de ecuación muestra que con n=5 y
r=2 se tiene
Por tanto, 20 resultados son posibles para el experimento de elegir al azar dos pares de un grupo de cinco cuando hay que
tomar en cuenta el orden de selección. Si marcamos las partes A,B,C, y E, las 20 permutaciones son
AB,BA,AC,CA,AD,DA,AE,EA,BC,CB,BD,,DB,BE,EB,CD,DC,CE,EC,DE,ED.
Para que un número sea divisible por cinco debe acabar en 0 ó 5, así que:
Podemos elegir la primera cifra de entre 9 (1, 2, 3, 4, 5, 6, 7, 8, 9, si la primera cifra es 0 no cuenta como número de 5 cifras).
Podemos elegir la segunda cifra de entre 10 (nos vale cualquier guarismo). También podemos elegir de entre 10 la tercera y la
cuarta cifra. La última cifra solo puede ser 0 ó 5, lo que nos da solo 2 posibilidades.
4.4. Sucesos.
En estadística, un evento o suceso es un subconjunto de un espacio muestral, es decir, un conjunto de posibles resultados que
se pueden dar en un experimento aleatorio.
49
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Se llama suceso de un experimento aleatorio a cada uno de los subconjuntos del espacio muestral "E" . El conjunto de todos
los sucesos de un experimento aleatorio se conoce como espacio de sucesos y se representa por "S".
Suceso: cada uno de los resultados de un experimento aleatorio; suceso elemental es cada uno de los resultados más
simples, más directos de un experimento aleatorio. Ej.: ”obtener un 3” al lanzar un dado es un suceso elemental;
”obtener cifra par” es un suceso no elemental; ambos son resultados del experimento, pero el primero es más directo.
E = {1, 2, 3, 4, 5, 6}
Entonces la probabilidad de que ocurra un evento o suceso viene dado por la formula
Ejemplo 1: calcular la probabilidad de que ocurra que al tirar un dado se obtenga un valor menor que 5
Sea el evento
A = obtener menor a 5
𝑛 (A)=4 o sea los casos favorables son 4
𝑛 (E)=6 o sea los casos posibles son 6
[𝑛(𝐴)] 4 2
𝑃(𝐴) = = =
[𝑛(𝐸)] 6 3
Sea el evento
[𝑛(𝐵)] 2 1
𝑃(𝐴) = = =
[𝑛(𝐸)] 4 2
Probabilidad clásica
50
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Estableció la “regla de Laplace” para el cálculo de probabilidades cuando los eventos posibles en un experimento aleatorio
tienen la misma probabilidad de suceder. Además de sus trabajos sobre probabilidad se destacó en ecuaciones diferenciales y
mecánica celeste. La probabilidad de un evento es la razón entre el número de casos favorables y el número total de casos
que pueden presentarse, siempre que los resultados sean equiprobables. Es una forma de probabilidad objetiva. No es
necesario realizar ningún experimento para determinar la probabilidad de un evento.
Un ejemplo típico de este modelo de probabilidad hace referencia al lanzamiento de una moneda “legal“ . Entendemos por
“legal“, que la probabilidad de que se obtenga un escudo o cara es la misma, son eventos equiprobables. Entonces, el número
de casos favorables para que se obtenga un escudo es 1, y el número de casos totales es dos.
Otro ejemplo citado con frecuencia es el lanzamiento de un dado, Se asume que, al igual que en la moneda, las probabilidades
de cada cara del dado, es la misma. Entonces, el número de casos favorables para que se obtenga, por ejemplo, un tres; es 1,
y el número de casos totales es seis.
Otro Ejemplo Probabilidad de que salga un varón al tomar 2 bebés y observar su sexo
Probabilidad frecuencial
Generalmente la teoría de probabilidad es considerada una rama de las matemáticas, sin embargo, sus fundamentos son
puramente filosóficos, y Richard von Mises, desarrolló la correcta teoría de probabilidad objetiva o “de frecuencia”
Es una forma empírica de calcular probabilidades. Es necesario repetir el experimento varias veces para calcular la
probabilidad.
La tabla muestra el número de veces que se obtuvo cada resultado al lanzar dos dados, cien veces.
51
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Cuanto más grande es el número de veces que se lanzan los dados, la frecuencia relativa se aproxima a la probabilidad de
ocurrencia de cada evento.
Se lanzan dos dados 100 veces y se cuenta el número de ocasiones en las que la suma de las caras es igual a 2,
3, 4, ..., 12
52
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
En la tabla de distribución de frecuencias, se observa que el número 3 se obtuvo en 9 ocasiones, por lo tanto:
Axiomática de probabilidades
Andréi Kolmogórov, matemático ruso, entre muchos otros trabajos científicos, estructuró el sistema axiomático de la
probabilidad. Se basó en la teoría de conjuntos. Fundamenta matemáticamente la probabilidad.
Axiomas de la probabilidad
P(A1UA2…UAi) = ΣP(Ai)
Es el grado de certeza que tenemos de que un suceso va a ocurrir. Suele indicarse como un número decimal, menor que uno o
como un porcentaje.
Se basa en la opinión personal, la experiencia o la intuición. En ocasiones hace uso de datos históricos.
No siempre se cuantifica.
53
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
A pesar del uso ocasional de datos históricos, dichas estimaciones presentan un elevado grado de incertidumbre
54
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Se llama probabilidad del suceso B condicionado a A y se representa por P(B/A) a la probabilidad del suceso B una vez
ha ocurrido el A.
En otras palabras, para poder calcular la P(B) debemos saber si A ocurrió o no.
Ejemplo Calcular la probabilidad de obtener un 6 al tirar un dado sabiendo que ha salido par.
55
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
5. Ejercicios
Lee atentamente los siguientes planteamientos y resuelve
1. En una bolsa se tienen 4 pelotas azules, 3 rojas, 2 verdes y 1 blanca. Si se saca una pelota, ¿cuál es la probabilidad de
sacar una pelota roja?, ¿y cuál es la probabilidad de sacar una verde?, ¿cuál de las dos tiene más probabilidad?
2. En un cajón hay 18 remeras blancas y 6 azules. Halla la probabilidad de sacar una…
a) Remera blanca:
b) Remera verde:
c) Remera azul:
3. Una empresa concederá un ascenso a dos empleados de un grupo de seis hombres y tres mujeres
a) ¿Cuál es la probabilidad que sea una mujer?
b) ¿Cuál es la probabilidad que sea un hombre?
4. Se lanza un solo dado ¿Cuál es la probabilidad de que caiga un múltiplo de 2?
5. Se lanza un dado encuentre la probabilidad de que el número de la cara superior sea:
a) 3
b) Impar
c) Menor que 5.
d) No mayor que tres.
6. En un grupo de expedientes médicos se clasifica a los pacientes por género y por tipo de diabetes (I o II). Los
agrupamientos pueden ser como sigue:
a) sea mujer
b) parezca diabetes de tipo II
7. Una persona posee un billete de lotería perteneciente a una tirada de 150 billetes. Es sorteo ofrece un primer premio, dos
segundos y cinco terceros premios. Cuál es la probabilidad de ganar:
a) el primer premio
b) el segundo premio
c) el tercer premio
8. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
9. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
56
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
11. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
Peso fi
[50, 60) 8
[60, 70) 10
[70, 80) 16
[80,90) 14
[90, 100) 10
[100, 110) 5
[110, 120) 2
1 Construir la tabla de frecuencias. 2 Representar el histograma y el polígono de frecuencias.
12. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28,
38, 41, 48, 15, 32, 13.
13. Sea una distribución estadística que viene dada por la siguiente tabla:
xi fi
61 5
64 18
67 42
70 27
73 8
Calcular: La moda, mediana, media. El rango, desviación media, varianza y desviación típica.
5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
17. Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:
18. Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:
fi
57
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
[38, 44) 7
[44, 50) 8
[50, 56) 15
[56, 62) 25
[62, 68) 18
[68, 74) 9
[74, 80) 6
3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1.
Calcular: La moda, la mediana y la media, La desviación media, la varianza y la desviación típica, 3Los cuartiles 1º y 3º,
Los deciles 2º y 7º, Los percentiles 32 y 85.
fi
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
Hallar: La moda, mediana y media, El rango, desviación media y varianza, Los cuartiles 1º y 3º, Los deciles 3º y 6º, Los
percentiles 30 y 70.
fi
[0, 5) 3
[5, 10) 4
[10, 15) 7
[15, 20) 8
[20, 25) 2
[25, ∞) 6
Calcular: La mediana, moda, Cuartil 2º y 3º, Media.
22. Un dentista observa el número de caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece
resumida en la siguiente tabla:
Nº de caries fi ni
0 25 0.25
1 20 0.2
2 x z
3 15 0.15
4 y 0.05
Completar la tabla obteniendo los valores x, y, z,. Hacer un diagrama de sectores,. Calcular el número medio de caries.
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
24. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por
primera vez:
Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
25. Dibujar el polígono de frecuencias. Calcular la moda, la mediana, la media y la varianza, 5Completar los datos que
faltan en la siguiente tabla estadística:
xi fi Fi ni
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8
Calcular la media, mediana y moda de esta distribución.
Calcular su media y su varianza. Si los todos los datos anteriores los multiplicamos por 3, cúal será la nueva media y
varianza.
26. El resultado de lanzar dos dados 120 veces viene dado por la tabla:
Sumas Veces
2 3
3 8
4 9
5 11
6 20
7 19
8 16
9 13
10 11
11 6
12 4
Calcular la media y la desviación típica. Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).
27. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
59
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
Altura Nº de jugadores
[170, 175) 1
[175, 180) 3
[180, 185) 4
[185, 190) 8
[190, 195) 5
[195, 2.00) 2
Calcular: La media, La mediana, La desviación típica, ¿Cuántos jugadores se encuentran por encima de la media más una
desviación típica?
28. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla:
1 2 3 4 5 6
fi a 32 35 33 b 35
Determinar a y b sabiendo que la puntuación media es 3.6.
Formar la tabla de la distribución. 2Si Andrés pesa 72 kg, ¿cuántos alumnos hay menos pesados que él? Calcular la moda.
Hallar la mediana, ¿A partir de que valores se encuentran el 25% de los alumnos más pesados?
Edad Fi
[0, 2) 4
[2, 4) 11
[4, 6) 24
[6, 8) 34
[8, 10) 40
Media aritmética y desviación típica. ¿Entre qué valores se encuentran las 10 edades centrales? Representar el polígono
de frecuencias absolutas acumuladas.
31. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media es de 1.60 m y la desviación típica es de 20
cm. Otra persona B mide 1.80 m y vive en una ciudad donde la estatura media es de 1.70 m y la desviación típica es de 15
cm. ¿Cuál de las dos será más alta respecto a sus conciudadanos?
60
1º Contaduría General
Instituto Tecnológico Jesús-María Ing. Francisco Méndez M.
32. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los siguientes resultados: para el primer test la
media es 6 y la desviación típica 1.5.
Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con el grupo, ¿en cuál de los dos tests obtuvo mejor
puntuación?
33. La asistencia de espectadores a las 4 salas de un cine un determinado día fue de 200, 500, 300 y 1000 personas.
Calcular la dispersión del número de asistentes. Calcular el coeficiente de variación. Si el día del espectador acuden 50
personas más a cada sala, ¿qué efecto tendría sobre la dispersión?
61
1º Contaduría General