You are on page 1of 37

UNIVERSIDAD NACIONAL

“FEDERICO VILLARREAL”
Escuela de Universitaria de Posgrado

Distribuciones de Probabilidad

JORGE L. PASTOR PAREDES


ESTADÍSTICA

PARAMÉTRICA NO PARAMÉTRICA

DESCRIPTIVA INFERENCIAL Contrastes:


• Homogeneidad
• Chi-X2 de Independencia
• Dist. de Frecuencias • Probabilidad • de Bondad de Ajuste
• Med. de Tendencia Central • Distribución Discreta • Múltiples de Bondad de Medias
• Med. de Dispersión • Distribución Normal • Múltiples de Homogeneidad :
• Med. de Localización • Muestreo Kruskal Wallis
• Prueba de Hipótesis
• ANOVA
• Regresión Simple
• Regresión Múltiple
• Series de Tiempo
• ARIMA (Box Jenkins)
ESTIMADORES ESTADÍSTICOS

Muestra Población

T Total T
E
P
S X µ
Media A
T
R
A P Proporción π A
D
M
I s2 Varianza σ2 E
G
T
R S Desviación Estándar σ R
A
O
F X1 – X2 Diferencia de muestras µ1 – µ2 S
O
S P1 – P2 Diferencia de proporciones
π1 – π2
Distribuciones de Probabilidad

Distribución Distribución
Discreta Continua

• Binomial • Normal
• Hipergeométrica • Exponencial
• Poisson • Uniforme
Distribución de Probabilidad
 Conjunto de todos los posibles resultados de un experimento
asociado a la probabilidad de ocurrencia de cada uno de ellos.
 Para tres tiradas de una moneda, la distribución de probabilidad
que no salga cara es cero, que salga una, dos y tres caras.

Px
Número de caras Probabilidad de los resultados

0 1/8 = 0.125 3/8

1 3/8 = 0.375 2/8

2 3/8 = 0.375
1/8
3 1/8 = 0.125

Total 8/8 = 1 0
0 1 2 3
Número de Caras
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
6-3

Variables Aleatorias
 Conjunto de variables cuyos valores dependen del azar, los cuales
pueden tomar diferentes valores, siendo posible establecer una
medida de su probabilidad.
Ejemplo: considere un experimento aleatorio en el que se lanza tres
veces una moneda. Sea X el número de caras. Sea C el resultado de
obtener una cara y S el de obtener un sello.
 El espacio muestral para este experimento será:

SSC SCC
SSS CSC SCS CCC
CSS CCS

 Entonces, los valores posibles de X (número de caras) son x = 0, 1, 2,


3.

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-5

Explicación:
 El resultado “cero caras” ocurrió una vez.

 El resultado “una cara” ocurrió tres veces.

 El resultado “dos caras” ocurrió tres veces.

 El resultado “tres caras” ocurrió una vez.

 De la definición de variable aleatoria, la X definida en este


experimento, es una variable aleatoria.

Característica de una Distribución de Probabilidad:


 La probabilidad de un resultado siempre debe estar entre 0 y 1.

 La suma de todos los resultados mutuamente excluyentes siempre es


1.

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-8

Variable Aleatoria Discreta


 Es una variable que solo puede tomar ciertos valores claramente
separados, que son el resultado de la cuenta de alguna
característica de interés.
 Toma únicamente un número finito o numerable de valores.
Ejemplo: sea X el número de caras obtenidas al lanzar 3 veces una
moneda. Aquí los valores de X son x = 0, 1, 2, 3.
Ejemplo: Si hay 40 alumnos en el aula, la cantidad de ausentes en
una clase del viernes puede ser: 0, 1, 2, 3......40.
6-9

Variable Aleatoria Continua


 Es una variable que puede tomar un número infinito de valores.
 Puede tomar uno de una cantidad infinitamente grande de valores,
dentro de ciertas limitaciones.
 Ejemplos: La distancia en km entre una ciudad y otra
El tiempo que dura una siesta
La presión de un neumático

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-10

Media de una Distribución Discreta


 Indica la ubicación central de los datos: es el promedio.
 También se conoce como el valor esperado, E(x) de una distribución
de probabilidad, es un promedio ponderado.
 La media se calcula con la fórmula:

μ= [ x * P( x)]
 donde  representa la media y P(x) es la probabilidad de los diferentes
resultados x.

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-12

Varianza y Desviación Estándar


 La varianza mide la cantidad de dispersión (variación) de una
distribución.
 La varianza de una distribución discreta se denota por la letra griega
(sigma cuadrada).
La desviación estándar se obtiene sacando la raíz cuadrada de
2

sigma.
 La varianza de una distribución de probabilidad discreta se calcula a
partir de la fórmula:

  [( x   ) P( x)]  
2 2 2

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


Ejemplo: No. Autos
La siguiente distribución de Vendidos Prob.
probabilidad corresponde a los X P(x)
autos vendidos un día sábado 0 0.10
con sus respectivas 1 0.20
probabilidades, encontrar la 2 0.30
media y la varianza de la 3 0.30
distribución 4 0.10

Responder:
1. Que tipo de distribución de probabilidad es?
2. En un sábado cualquiera, cuantos autos espera vender?
3. Cuál es la varianza de la distribución?
Es una distribución de probabilidad discreta, se espera vender una
cantidad determinada de autos, no así 5 o 50 ni la mitad de un
auto.
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
Espera vender en promedio el ponderado de los autos vendidos con
la probabilidad de venta.
μ= [ x * P( x)]
= 0(0.10) + 1(0.20) + 2(0.30) + 3(0.30 + 4(0.10)

= 2.10

X P(x) XP(x) X-μ (X-μ)2 (X-μ)2 P(x)


0 0.10 0 -2.1 4.41 0.441
1 0.20 0.20 -1.1 1.21 0.242
2 0.30 0.60 -0.1 0.01 0.003
3 0.30 0.90 0.9 0.81 0.243
4 0.10 0.40 1.9 3.61 0.361
μ = 2.10 2 = 1.290

 2  [( x   )2 P( x)]  1.290   1.290  1.136


®Jorge L. Pastor Paredes UBA, UNFV, UNSA
6-18

Distribución de Probabilidad Binomial


 Es una distribución de probabilidad discreta en el que solo existe dos
resultados posibles en la ejecución de un experimento.
 La distribución binomial tiene las siguientes características:
1. El resultado de un experimento es mutuamente excluyente: éxito
(x) o fracaso (1-x) (Bernoulli).
2. Los éxitos o fracasos son resultados de una cantidad fija de
ensayos “con reemplazo”.
3. La probabilidad de éxito o fracaso es la misma para cada ensayo.
4. Los ensayos son independientes.

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-20

 La fórmula para la distribución de probabilidad binomial es:

P( x)  nCx  x (1   ) n  x • C es una combinación


• n el número de ensayos
n! • x el número de éxitos observados
P( x)   x (1   ) n  x • Л la probabilidad de éxito en cada
x !(n  x )! ensayo (no es pi=3.1416)

Media, Varianza y Desviación Estándar

 La media está dada por:   n

 La varianza está dada por:  2  n (1   )


 Desviación estándar:   n (1   )

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-21

Ejemplo:
Como se sabe, la respuesta a una pregunta de verdadero/falso es correcta
o incorrecta. Considere que 1) un examen consiste en cuatro preguntas de
verdadero/falso, y 2) un estudiante no sabe nada a cerca de la materia. La
probabilidad de que el alumno adivine la respuesta correcta a la primera
pregunta es 0.50, Asimismo, la probabilidad de acertar en cada una de las
preguntas restantes vale 0.50.
Cuál es la probabilidad de:
a) No obtener exactamente ninguna de las cuatro en forma correcta.
b) Obtener exactamente una de las cuatro.
c) Encontrar la media y la varianza.

4!
a) P(0)  0.500 (1  0.50) 4  0  0.0625
0!(4  0)!

4!
b) P(1)  0.501 (1  0.50) 4 1  0.2500
1!(4  1)!
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
6-22

c) La media, varianza y la desviación estándar es:

Recuerde que  = 0.50 y n = 4

Media = μ  nπ  4(0.50)  2

Varianza = 2 = n  (1 -  ) = (4)(0.50)(1-0.50) =1

Desv. Estándar = σ  σ  1  1
2

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


6-27

Distribución Hipergeométrica
 Es aplicable a muestreo “sin reemplazo” de una población finita,
(muestra de una población pequeña) en el cuál se da una serie de
experimentos tal que el resultado de cualquiera de ellos a partir del
segundo es afectado por el resultado de los anteriores.
 Características:
a) Existen solo dos resultados posibles.
b) La probabilidad de un éxito no es la misma en cada ensayo.
c) La distribución resulta de un conteo del número de éxitos en
una cantidad fija de ensayos.

Donde:
(S C x )(N S Cn  x ) • N es el tamaño de la población,
P(x)  • S es la cantidad de éxitos en la población,
N Cn • x es el número de éxitos de interés,
• n es el número de ensayos o muestra, y
• C es una combinación.
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
Ejemplo:
Durante la semana se fabricaron 50 juegos de PayStation (N=50). Operaron 40
sin problemas (S=40) y 10 tuvieron al menos un defecto. Se selecciona una
muestra al azar de 5 (n=5). ¿Cuál es la probabilidad de que 4 (x=4) de las 5
funcionen perfectamente? Observe que el muestreo se hace sin reposición y
que el tamaño de la muestra de 5 es 10% de la población (esto es mayor que la
condición de 5%).
Solución:
(40C4 )(5040C54 ) (40C4 )(10C1 )
P(4)  
50 C5 50 C5

40! 10!
( )( )
4!36! 1!9! (91,390)(10)
P(4)    0.431
50! 2'118,760
5!45!
La probabilidad de seleccionar 5 juegos al azar de 50, y descubrir que 4 de los
5 operan bien, es 0.431 o 43.1%
Caso:
Una población consta de 10 elementos, 6 de los cuales se encuentran
defectuosos. En una muestra de 3 elementos, ¿cuál es la probabilidad de
que exactamente 2 sean defectuosos?

N = 10
S=6 (6C2 )(106C32 )
n=3 P(2) 
x=2 10 C3

(S C x )(N S Cn  x )
P(x)  (
6!
)(
4!
)
N Cn 2!4! 1!3! (15)(4)
P(2)    0.50
10! 120
3!7!

20
6-30

Distribución de Poisson
 Es aplicable a casos en los cuales se desea obtener la probabilidad de
un evento sobre algún intervalo (tiempo o espacio).
 Es la forma límite de la distribución Binomial donde la probabilidad de
éxito  es muy pequeña y n es grande.
 Ejemplo: Número de turistas que visitan el Cuzco en un mes; número
de asaltos ocurridos en Lima en un año; número de computadoras que
presentan fallas, etc.

Donde:
 e x u
•  es la media aritmética del número de
P( x )  ocurrencias (éxitos) en un intervalo
x!
específico de tiempo.
• e es la constante 2.71828
• x es el número de ocurrencias (éxitos).

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


Ejemplo:
Una muestra aleatoria de 1000 viajes aéreos revela un total de 300
maletas perdidas. La media aritmética del número de maletas
perdidas por vuelo es 0.3 (300/1000). Si la cantidad de maletas
perdidas por viaje aéreo sigue una distribución de Poisson con
μ = 0.30 Calcular la probabilidad de no perder ninguna maleta y la
probabilidad de perder una maleta.

0.30 e 0.30
P(0)   0.7408
 x e u 0!
P( x) 
x!
0.31 e 0.30
P(1)   0.2222
1!

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


7-3

Distribución de
Probabilidad Normal
Distribución de Probabilidad Normal
 La curva de la DPN tiene “forma de campana” con un solo pico
justo en el centro de la distribución.
 La media, mediana y moda (Me, Md y Mo) de la distribución son
iguales y se localizan en el pico.
 La mitad del área bajo la curva está a la derecha del pico, y la otra
mitad está a la izquierda.
 La distribución normal es simétrica respecto a su media.
 La distribución normal es “asintótica” la curva se acerca cada vez
más al eje x pero en realidad nunca llega a tocarlo.

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


Gráfico de una Distribución Normal

0.5 0.5

La curva
normal es
simétrica

En teoría, la curva se
extiende hasta el
infinito.

Cola -∞ Cola + ∞

Me=Md=Mo
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
Familia de Curvas de Distribución Normal

= 1.6 = 1.6 = 1.6

μ=283 μ=310 μ=321

h h =52 h =26
i i i

=41

μ=283 Y μ=310 Y μ=321 Y


i i

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


7-6

Distribución Normal Estándar

 Es aquella distribución normal que tiene media igual a 0 y


desviación estándar igual a 1.
 Valor Normal Z: es la distancia entre un valor seleccionado,
designado como X, y la población media , dividida entre la
desviación estándar de la población .

0.4719
X μ
z
σ

-z 0 1.91 +z

®Jorge L. Pastor Paredes UBA, UNFV, UNSA


7-7

Ejemplo:
La media de un grupo de ingresos semanales con distribución normal para un gran conjunto
de gerentes de nivel medio, es $1000 ¿cuál es el desvío normal o valor z para un ingreso x
de 1100? ¿para uno de 900? DS=100
Solución:
para x = 1100 para x = 900
0.3413

1100  1000 900  1000


Z  1.00 Z  1.00
100 100
El desvío Z=1.00 indica que un ingreso semanal de $1100 para un gerente de nivel medio
está una desviación estándar por en cima de la media; asimismo Z=-1 indica
0 que
1 un ingreso
de $900 se encuentra una desviación estándar por debajo de la media. 1000 1100
El 34.13% de los ingresos semanales están entre 1100 y 1000 o existe una probabilidad de
34.13% que el ingresos específico se halle entre 1100 y 1000.
7-8

Áreas bajo la Curva Normal

• Cerca de 68% del área bajo la curva


normal está a menos de una desviación
estándar respecto a la media.   1
• Alrededor de 95% está a menos de dos
desviaciones estándar de la media.   2
• 99.74% está a menos de tres desviaciones
estándar de la media.   3

  3   2  1    1   2   3
68.26%
95.44%
99.74%
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
Transformación de las Mediciones a Valores Z
El área total bajo la curva normal es igual a 1.
El área bajo la curva normal dentro de +/- una
DS respecto a la media es 0.6826

x
  3   2  1    1   2   3

-3 -2 -1 0 1 2 3 z
®Jorge L. Pastor Paredes UBA, UNFV, UNSA
7-11

Ejemplo:
La distribución de los ingresos anuales de un grupo de empleados a nivel
gerencial sigue aproximadamente una DN con media de US$37,200 y desviación
estándar US$800

a) Entre que par de cantidades está aproximadamente el 68% de los ingresos?


b) Entre que par de cantidades se encuentra aproximadamente el 95% de los
ingresos?
c) Entre que par de cantidades están prácticamente todos los ingresos?
d) Cuáles son la media, la mediana y la moda de los ingresos?
e) Es simétrica la distribución de los ingresos?

La media, mediana y moda es 37,2


Es una DN simétrica
68%

95%

  3   2   1    1   2   3 x
34.8 35.6 36,4 37,2 38 38,8 39,6 Z
32
Caso:
Consulte la información relacionada con el ingreso semanal de los supervisores de turno
en la industria del vidrio. La distribución de los ingresos semanales tiene una distribución
de probabilidad normal, con una media de $1000 y una desviación estándar de $100.
¿Cuál es la probabilidad de seleccionar a un supervisor de turno de la industria del vidrio
cuyo ingreso:
1. Oscile entre $790 y $1000? Se visualiza en Tabla. El área bajo la
2. Sea menor que $790? curva norma estándar correspondiente a
un valor z de -2.10 es 0.4821
Solución _
La probabilidad de localizar a un
X  790  1000 supervisor que gane entre 790 y 1000 es
   2.10 0.4821 o P (790< Ingreso<1000)=0.4821
 100

El área bajo la mitad izquierda de la media es de


0.5000, y el área a la derecha también es de 0.5000.
Como el área bajo la curva entre $790 y $1 000 es
0.4821, el área debajo de $790 es 0.0179, que se
determina al restar 0.5000 – 0.4821. En notación
probabilística: P(ingreso semanal < $790) =0.0179.
Esto significa que 48.21% de los supervisores tiene
ingresos semanales que oscilan entre $790 y $1 000.
Además, es previsible que 1.79% gane menos de
$790 a la semana.
33
Siguiendo con el caso anterior, los ingresos semanales tienen una distribución de
probabilidad normal, con una media de $1000 y una desviación estándar de $100. ¿Cuál
es el área bajo esta curva normal, entre $840 y $1200?
El problema se puede dividir en dos partes.
840  1000
En el caso del área entre $840 y la media de $1 000:   1.60
100
1200  1000
En el del área entre la media de $1 000 y $1 200:   2.00
100

El área bajo la curva de un valor z de -1.60


es 0.4452 El área bajo la curva de un valor z
de 2.00 es 0.4772. Si suma las dos áreas la
probabilidad de elegir un ingreso entre $840
y $1200 es de 0.9224.
En notación probabilística: P($840 < ingreso
semanal < $1200) =0.4452 + 0.4772=
0.9224. El 92.24% de los supervisores tiene
un ingreso semanal de entre $840 y $1200.

34
Nuevamente con el caso anterior, la distribución del ingreso semanal de los supervisores
de turno de la industria del vidrio, ¿cuál es el área bajo la curva normal entre $1150 y
$1250? De nuevo, el caso se divide en dos partes.

Primero hallar el valor z relacionado con un salario semanal de $1250:


1250  1000
  2.50
100
Primero hallar el valor z relacionado con un salario semanal de $1150:
1150  1000
El área relacionada con un valor z de 2.50   1.50
100
es de 0.4938, la probabilidad de un salario
semanal entre $1000 y $1250 es de 0.4938.
De manera similar, el área asociada con un
valor z de 1.50 es 0.4332; de este modo, la
probabilidad de un salario semanal entre
$1000 y $1150 es de 0.4332. La
probabilidad de un salario semanal entre
$1150 y $1250 se calcula al restar el área
asociada con un valor z de 1.50 (0.4332) de
la probabilidad asociada con un valor z de
2.50 (0.4938). Por consiguiente, la
probabilidad de un salario semanal entre
35
$1150 y $1250 es de 0.0606.
Caso:
La empresa BFG pretende establecer una garantía de millage mínimo para su
nuevo neumático MX100. Algunas pruebas refvelan que el millaje medio es de
67,900 con una desviación estándar de 2,050 y que la distribución de millas
tiene una DPN. La empresa desea determiner el millaje mínimo garantizado de
manera que no haya que sustituir más de 4% de los neumáticos. Cuál es el
millaje mínimo que debe garantizar la empresa?

El siguiente diagrama muestra las fecetas del caso en el que X representa el


millaje mínimo garantizado.

X  67,900

2,050

36
Observe que hay dos incognitas z y X. Para determiner X, primero calcule z y
después despeje X. Observe que el área que se encuentra por debajo de la
curva normal a la izquierda de la media µ y X es 0.4600 y se determina al restar
0.5000 – 0.0400. Luego busque en la Tabla el área más proxima a 0.4600 que
es 0.4599 siga por los márgenes de este valor y encuentre el valor z de 1.75
este valor está a la izquierda por lo tanto es -1.75

X  67,900 X  67,900
 1.75  1.75(2,050)  X  67,900
2,050 2,050

X  67,900  1.75(2,050)  64,312

La empresa puede anunciar que reemplazará de forma gratuita cualquier


neumático que se desgaste antes de llegar a las 64,312 millas. La empresa sabra
que solo 4% de los neumáticos se sustituirá de acuerdo con este plan.

37

You might also like