You are on page 1of 71

MODELOS O DISTRIBUCIONES

DE PROBABILIDAD
EXPERIMENTOS ALEATORIOS

Considere las siguientes situaciones:

1. Se cuenta el nmero de naves que arriban a un puerto,


por da.

2. Se le pregunta a un consumidor su marca preferida de


leche.

3. Un fiscalizador examina declaraciones de impuesto y


cuenta cuntas son errneas.
4. Se observa el cambio mensual de un ndice de precios.

5. Un investigador cuenta el nmero de partculas atmicas


captadas por un instrumento.

6. Se toman los tiempos entre llegadas de clientes a la fila


de una caja bancaria.
7. Se extraen 20 peces de una lago, y se cuenta cuntos
superan los 15 c. de largo

8. Se mide el peso de los contenidos de arroz en bolsas a la


salida de una empacadora.

9. Un meteorlogo registra las temperaturas mximas


diarias.
10. Un oftalmlogo registra el color de ojos de sus
pacientes.

11. Un inspector registra el nmero de temes de frutas


daada en un cargamento.

12. Una persona compra un nmero de lotera y espera que


sea el ganador.
Cada uno de estos ejemplos corresponde a un
experimento aleatorio.

Un experimento aleatorio es un proceso que puede


concretarse en al menos dos resultados posibles, con
incertidumbre en cuanto a cul de ellos tendr lugar.
Una variable que es el resultado de un experimento, y que
toma valores numricos, es discreta si slo puede tomar
una cantidad numerable de valores.

En caso que tome valores en un intervalo de nmeros


reales, por lo tanto los valores no pueden enumerarse, se
dice que la variable es contnua.
En los ejemplos, 2 y 10 no son variables numricas.

De las restantes, 1, 3, 6, 7, 11 y 12 son discretas.

6 y 12 tienen un rango extremadamente grande.

4, 5, 8 y 9 son continuas, aunque las escalas en que se


miden tienen limitaciones, por lo que lo que se registra
resulta ser discreto.
Si la variable es discreta, cada valor tiene asociado una
probabilidad, a nivel poblacional, equivalente a una frecuencia
relativa, a nivel muestral.

Tambin se puede representar mediante un grfico de barras,


como se muestra en la figura siguiente.
Si la variable es continua, en el caso muestral se divide la
tabla en intervalos, que pueden representarse mediante
un histograma.

En el caso poblacional, en cambio, se consideran


intervalos infinitamente angostos, de modo que el perfil
histograma toma la forma de una curva, como en la
siguiente figura.
Tanto en el caso discreto como continuo, existen
modelos probabilsticos conocidos, que pueden
aplicarse a determinados fenmenos, para
representar, en forma aproximada, las proporciones de
valores existentes en la poblacin, es decir, sus
probabilidades.

Las funciones de probabilidad asociadas a estos


modelos pueden escribirse como una ecuacin
matemtica.
Es as como existen los modelos

Binomial, Geomtrico,

Hipergeomtrico, Poisson,

Exponencial, Normal,

chi-cuadrado, t de Student,

F, Gamma,

Beta,

entre muchsimos otros.


Por la forma en que se definieron las probabilidades, como
frecuencias relativas, aplicadas a toda la poblacin, resulta
que son positivas y la suma de las probabilidades de todos
los valores posibles de la variable que estamos
describiendo, es igual a 1.
En el caso de los modelos de probabilidad continuos, como
la variable toma infinitos valores, la probabilidad asociada a
un valor puntual es cero.

Slo pueden ser mayores que cero las probabilidades de


intervalos de valores.

Estas probabilidades pueden encontrarse, para algunos


casos de uso comn, en tablas, en las que se presentan
habitualmente probabilidades de intervalos que parten
desde menos infinito hasta una seleccin de valores de la
variable.
Ejemplos:

Extraer al azar un nmero n de objetos, de una


poblacin en que hay de dos tipos (por ej, hombres y
mujeres).

El modelo binomial describe las probabilidades de


obtener 0, 1, 2, ..., o n de uno de los dos tipos.
El nmero de das de licencias mdicas que se producen
en una institucin, o de fallas de un sistema
computacional, en un mes, es aleatorio y podra
representarse mediante un modelo Poisson.
El nmero de declaraciones de impuesto que se debe
revisar, hasta encontrar a un infractor, puede
representarse probabilsticamente mediante un
modelo geomtrico.
La probabilidad de encontrar un tem defectuoso al
inspeccionar un nmero determinado de temes de un
lote pequeo, puede representarse mediante un
modelo hipergeomtrico.
Una proporcin de medidores de luz domiciliarios, que
se encuentra descalibrados, en alguna regin, podra
representarse por un modelo beta.
Los tiempos entre llegadas de clientes a una oficina de
atencin de pblico, pueden representarse por un
modelo exponencial.
El error respecto de una medida especificada, en un
objeto producido por un proceso industrial, es una
variable continua que puede representarse mediante
un modelo normal.

Tambin podra representar la dispersin, en torno a un


valor promedio, de los puntajes de la prueba de
seleccin universitaria.
En el caso de una muestra de valores de una variable podamos
calcular varios descriptores, que nos mostrarn algunas
caractersticas numricas de esa variable.

De la misma forma, en el caso poblacional, tambin existiran


estos descriptores, aunque, como no observamos toda la
poblacin, no podemos conocer sus valores.

Estos valores, que son fijos pero desconocidos, se denominan


parmetros de la poblacin.
Entre ellos destacamos el promedio poblacional, que es
el valor esperado de la variable, que ya definimos.

Es una medida de centro, poblacional.

Tambin est la desviacin estndar poblacional,


una medida de dispersin de la poblacin.

Veremos algunos de estos modelos probabilsticos:


EL MODELO DE PROBABILIDAD BINOMIAL

Supongamos que un experimento aleatorio tiene slo


dos resultados posibles mutuamente excluyentes y
conjuntamente exhaustivos, "xito" y "fracaso", y que p
es la probabilidad de obtener xito en cada repeticin.

Si se realizan n repeticiones independientes, la


distribucin del nmero de xitos, X, resultante se
denomina distribucin binomial.
Su funcin de probabilidad es

n!
Prob( x) p x (1 x) n x para x= 0,1,2,.,n
x!(n x)!

donde n! 1 2 3 ... n y 0! 1
EJEMPLO 4:

Supongamos ahora que un agente de seguros tiene cinco


contactos, y piensa que para cada uno la probabilidad de
conseguir una venta es 0.4.

La distribucin del nmero de ventas, X es, entonces,


binomial, con n = 5 y p = 0,4, es decir,
5!
Prob( x exitos ) ( 0 .4 ) x ( 0 .6 ) 5 x
x!(5 x)!

para x = 0, 1,..., 5
Las probabilidades para el nmero de xitos (ventas
logradas) son

Prob(0 xitos) = 5! (0,4)0(0,6)5 = (0,6)5 = 0,078


0! 5!

Prob(1 xitos) = 5! (0,4)1(0,6)4 = (5)(0,4)(0,6)4 = 0,259


1! 4!

Prob(2 xitos) = 5! (0,4)2(0,6)3 = (10)(0,4)2(0,6)3 = 0,346


2! 3!
Prob(3 xitos) = 5! (0,4)3(0,6)2 = (10)(0,4)3(0,6)2 = 0,230
3! 2!

Prob(4 xitos) = 5! (0,4)4(0,6)1 = (5)(0,4)4(0,6) = 0,077


4! 1!

Prob(5 xitos) = 5! (0,4)5(0,6)0 = (0,4)5 = 0,01


5! 0!
EJEMPLO 5:

Una compaa recibe un gran cargamento de artculos, y


decide aceptar el envo si en una muestra aleatoria de
veinte artculos no hay ms de uno defectuoso.

Es decir, se acepta el cargamento si el nmero de


artculos defectuosos es cero o uno, por lo que si Prob(X)
es la funcin de probabilidad del nmero X de artculos
defectuosos en la muestra, tenemos

P(aceptar el cargamento) = Prob(0) + Prob(1)


Supongamos que la proporcin de artculos defectuosos en
el cargamento es p = 0,1.

Para n= 20, en la Tabla 1 del Apndice, encontramos que


las probabilidades de cero y un artculos defectuosos en la
muestra son, respectivamente, Prob(0) = 0,1216 y
Prob(1) = 0,2702.

Por tanto, con esta regla de decisin, la probabilidad de


que la compaa acepte l envo es
Prob(aceptar el cargamento) = 0,1216 + 0,2702 = 0,3918

Anlogamente, si el 20% de los artculos del cargamento


son defectuosos, es decir, si p=0,2, entonces,

Prob(aceptar el cargamento) = 0,0115 + 0,0576 = 0,0691

y para p= 0,3

Prob(aceptar el cargamento) = 0,0008 + 0,0068 = 0,0076


EL MODELO DE PROBABILIDAD DE POISSON

Supongamos que puede asumirse lo siguiente:

Para cada intervalo de tiempo muy pequeo de tiempo,


la probabilidad de que ocurra un suceso en ese intervalo
es aproximadamente proporcional a la amplitud del
intervalo y no puede ocurrir dos o ms sucesos en un
intervalo.
Si lo anterior es cierto, puede probarse que la probabilidad
de X ocurrencias en el intervalo de tiempo de 0 a T es

e x
Prob( x ocurrencia s )
x!
donde es el nmero medio de ocurrencias entre 0 y T, y e
= 2,71828 ... es la base de los logaritmos naturales.

Este modelo probabilstico se denomina Distribucin de


Poisson.
EJEMPLO 6:

Un estudio indica que el nmero de huelgas anuales


en una fbrica britnica tpica con 2.000 empleados,
se puede representar por una distribucin de Poisson
con media = 0,4.

La funcin de probabilidad del nmero de huelgas


anuales X es, entonces,

e 0.4 (0.4) x
Prob( x huelgas )
x!

para x = 0, 1, 2,..
Podemos calcular ahora probabilidades para nmeros concretos
de huelgas anuales, usando e- = 0,6703.

La probabilidad de que no haya huelgas es

Prob(0 huelgas) = e-0.4(0.4)0 = (0.6703)(1) = 0.6703


0! 1
Anlogamente

Prob(1 huelga) = e-0.4(0.4)1 = (0.6703)(0.4) = 0.2681


1! 1

Prob(2 huelgas) = e-0.4(0.4)2 = (0.6703)(0.16) = 0.0536


2! 21

Prob(3 huelgas) = e-0.4(0.4)3 = (0.6703)(0.064) = 0.0071


3! 6
Prob(4 huelgas) = e-0.4(0.4)4 = (0.6703)(0.0256) = 0.0007
4! 24

Estas probabilidades pueden usarse para hallar la probabilidad


de que el nmero de huelgas est en un intervalo concreto.

Por ejemplo, la probabilidad de que haya ms de una huelga en


un ao es

Prob(ms de 1 huelga) = 1 P(0 huelgas) P(1 huelga)

= 1 0.6703 0.2681 = 0.0616


EJEMPLO 7.

La distribucin de Poisson ha resultado ser muy til en


problemas de lneas de espera o colas.

Los clientes llegan a una maquina fotocopiadora a una tasa


media de dos cada cinco minutos.

En la prctica, se pueden representar los procesos de


llegada de esta clase mediante una distribucin de Poisson.
Asumiendo que ste es el caso, representaremos por X el
nmero de llegadas de clientes en un periodo de cinco
minutos con lo cual X tiene una distribucin de poisson con
media = 2.

La funcin de probabilidad es

Prob(x) = e-22x
x! para x = 0, 1, 2,...
Las probabilidades para el nmero de llegadas en un perodo
de cinco minutos son

Prob(0 llegadas) = e-2(2)0 = (0.135335)(1) = 0.1353


0! 1

Prob(1 llegadas) = e-2(2)1 = (0.135335)(2) = 0.2707


1! 1
Prob(2 llegadas) = e-2(2)2 = (0.135335)(4) = 0.2707
2! 2

y as sucesivamente.

As, por ejemplo, la probabilidad de que se produzcan ms de


dos llegadas en un periodo de cinco minutos es

Prob(X>2) = 1 Prob(0) Prob (1) Prob (2) = 1 0.1353


0.2707 0.2707 = 0.3233
EL MODELO DE PROBABILIDAD NORMAL

La variacin existe en todo fenmeno.

Cuando tal variacin se debe a una multitud de fuentes,


que no son identificables, y que cada una aporta una
pequesima contribucin al fenmeno que estamos
observando, suele ser apropiado el modelo normal para
representar la variabilidad.
Su funcin de probabilidad est definida
matemticamente por la ecuacin

1 1 ( x )2
prob( x) exp
2 2
2

en que exp{} significa e elevado a lo que hay dentro del


parntesis, siendo e el nmero 2.71828..., as como es
el nmero 3.14159....

Los parmetros son y . es el valor medio esperado


y es la desviacin estndar poblacional.
Un caso especial es el modelo probabilstico normal
estndar, que tiene valor medio esperado cero y
desviacin estndar 1.

La ecuacin de la funcin de probabilidad es

1 1 2
prob( x) exp x
2 2
Distribucin normal
Sin duda, la distribucin continua de
probabilidad ms importante, por la
frecuencia con que se encuentra y
por sus aplicaciones tericas, es la
distribucin normal, gaussiana o
de Laplace-Gauss.
Fue descubierta y publicada por
primera vez en 1733 por De Moivre.
A la misma llegaron, de forma
independiente, Laplace (1812) y
Gauss (1809), en relacin con la
teora de los errores de observacin
astronmica y fsica .

Anatoli Timofyevich Fomenko 45


Gaussian Distributions I and II
Caracteres morfolgicos de individuos (personas, animales, plantas,...) de
una especie (tallas, pesos, dimetros, permetros,...).

Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un


mismo grupo de individuos, puntuaciones de examen,...

Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un


frmaco.

Errores cometidos al medir ciertas magnitudes.


Valores estadsticos muestrales, por ejemplo: la media.
Y en general cualquier caracterstica que se obtenga como suma de
muchos factores.

Otras distribuciones como la binomial o la de Poisson se aproximan


a la normal. Distribuciones binomiales con n grande (n >30) y p ni pequeo (np > 5)
46
ni grande ( n (1-p) > 5 ).
Distribucin normal o
gaussiana
Est caracterizada por dos parmetros: la media, y
la desviacin tpica, .

Su funcin de densidad es:

( x ) 2
1
N (, ) P( x) e 2 2
( 0)
2

La curva normal adopta un nmero infinito de formas,


determinadas por sus parmetros y .
47
Caractersticas de la distribucin Normal

Tiene forma de campana, es asinttica al eje de las abscisas (para x = )


Simtrica con respecto a la media () donde coinciden
la mediana (Mn) y la moda (Mo).
Los puntos de inflexin tienen
como abscisas los valores .

Puntos
de
inflexin

+
- , Mo, Mn + 48
Distribucin normal con =0 para varios valores
1.6

1.2 0.25
0.5
1

p(x) 0.8

0.4

0
-2.50 -1.50 -0.50 0.50 1.50 2.50
x 49
( x ) 2
1
N (, ) P( x) e 2 2
( 0)
2

5 5

10

20 30 40 50 60 70 80 90 100 110 120

Curvas normales con distintas medias y desviaciones estndar.


50
N(, ): Interpretacin probabilista
Entre la media y una
desviacin tpica
tenemos siempre la
misma probabilidad:
aproximadamente el
68%.
Entre la media y
dos desviaciones
tpicas aprox. 95%

Si tomamos intervalos centrados en , y cuyos extremos estn


a distancia , tenemos probabilidad 68%
a distancia 2 , tenemos probabilidad 95%
51
a distancia 25 tenemos probabilidad 99%
( x ) 2
1
N (, ) P( x) e 2 2

2
Podemos obtener la funcin de
distribucin F(x) integrando la
funcin de densidad de probabilidad:

x ( v ) 2 De modo que la probabilidad de una


1
F ( x) e
2
2
dv variable aleatoria normal X en un
2 intervalo a x b es:
b ( v ) 2
1
P(a X b) F (b) F (a)
2 a
e 2 2
dv
( v ) 2
1
En particular:
2 e

2 2
dv 1

No podemos calcular analticamente el valor de la integral!


52
Tabularemos sus valores numricos...
Cmo calcular probabilidades asociadas
a una curva normal especfica?

Dado que tanto como pueden asumir infinitos valores, es


impracticable tabular las probabilidades para todas las posibles
distribuciones normales. Para solucionarlo, se utiliza la
distribucin normal reducida o tipificada.

Se define una variable z= x -


Es una traslacin , y un cambio de escala de


la variable original.
53
La nueva variable z se distribuye como una
NORMAL con media = 0 y desviacin tpica = 1
Recordemos de nuevo que en cualquier distribucin normal las
probabilidades delimitadas entre :
68 %
2 95 %
3 99 %

95%
68%
99%
68%

95%
99% z
-3 -2 -1 0 1 2 3 54
Tipificacin
Dada una variable de media y desviacin tpica
, se denomina valor tipificado z, de una
observacin x, a la distancia (con signo) con
respecto a la media, medido en desviaciones
tpicas, es decir:

x
z

En el caso de variable X normal, la interpretacin es clara:
asigna a todo valor de N(, ), un valor de N(0,1) que deja
exctamente la misma probabilidad por debajo.
Nos permite as comparar entre dos valores de dos
distribuciones normales diferentes, para saber cul de los
55
dos es ms extremo.
56
Se quiere dar una beca a uno de dos estudiantes de sistemas
educativos diferentes y se asignar al que tenga mejor
expediente acadmico:
El estudiante A tiene una calificacin de 8 en un sistema
donde la calificacin de los alumnos se comporta como
N(6,1).
El estudiante B tiene una calificacin de 80 en un sistema
donde la calificacin de los alumnos se comporta como
No podemos comparar directamente 8
N(70,10).
puntos de A frente a los 80 de B, pero
como ambas poblaciones se comportan
de modo normal, podemos tipificar y
observar las puntuaciones sobre una
distribucin de referencia N(0,1).

Como zA > zB, podemos decir que el


porcentaje de compaeros del mismo
sistema de estudios que ha superado xA A 86
zA 2
en calificacin al estudiante A es mayor A 1
que el que ha superado B. En principio
A es mejor candidato para la beca. x B 80 70
zB B 1
B 10 57
x ( v ) 2
Apliquemos el cambio de 1
variable tipificada a la funcin F ( x)
2 e

2 2
dv
de distribucin F(x):
z2
1
- p( z ) e 2
; z
z 2
z u2
dv dz 1
F ( z ) p(Z z )
2
e 2
du

Las probabilidades de la variable tipificada (z) estn


tabuladas para los diferentes valores de la variable.
Para calcular probabilidades, una vez transformada,
la variable a valores de z, se busca en una tabla el
rea correspondiente.
58
z2
1 Caracterstica de la distribucin
p( z ) e 2
; z normal tipificada (reducida o
2 estndar):
z u2
1
F ( z ) p(Z z )
2 e

2
du No depende de ningn parmetro.

Su media es 0, su varianza es 1 y su
desviacin tpica es 1.

La curva f(x) es simtrica respecto al


eje de ordenadas y tiene un mximo
en este eje.

Tiene dos puntos de inflexin en z =1


y z = -1.

59
Hay varios tipos de tablas de la distribucin normal
La que se explica aqu representa las reas para los
diferentes valores de z desde 0 hasta +.

Los valores
negativos de z NO
estn tabulados, ya
que la distribucin
es simtrica

+
0 60
61
La tabla consta de: *Margen izquierdo : Los enteros de z y
su primer decimal.
* Margen superior: segundo decimal
* Cuerpo de la tabla: reas correspondientes,
acumuladas, desde 0
hasta 3.99

0 1 2 3 4 5 6 7 8 9

0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ......
0.3 .1179 ..... ...... ...... ......
0.4 .1554 .... ..... ....

0.5 .1915 ....

62
EJEMPLOS:
1.-Cul es la probabilidad de que un
valor de z est entre 0 y -2.03?

2.-Cul es la probabilidad de que un


valor de z est entre -2.03 y +2.03?

3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z < )

5. Hallar P ( 0.34 < z < 2.30 )

63
Ejemplo 1
Cul es la probabilidad de que un valor de z est entre 0 y -2.03?

Cmo la curva es simtrica


P (-2.03 < z < 0) = P (0 < z < 2.03)

?
z
-3 -2 -1 0 1 2 3
64
Ejemplo 1
Cul es la probabilidad de que un valor de z est entre 0 y -2.03?
Se busca en la tabla el rea correspondiente a z = 2.03

0 1 2 3 4
1.8
1.9
2.0 0.47882
2.1

47. 88%

z
-3 -2 -1 0 1 2 3
65
Ejemplo 2
Cul es la probabilidad de que un valor de z est entre -2.03 y 2.03 ?
En el ejemplo 1, vimos que la probabilidad de que z estuviera entre
0 y 2.03 = 0.47882
La misma rea hay entre 0 y
-2.03 , por lo tanto
P ( -2.03< z< 2.03) = 0.95764

?
95.76%
47.88% 47.88%
z
-3 -2 -1 0 1 2 3
66
Ejemplo 3
Cul es la probabilidad de que un valor de z sea mayor a 1.25 ?

1.- La probabilidad de 0 < z < + = 0.500


2.- La probabilidad de 0 < z < 1.25 = 0.39435
3.- La probabilidad de z > 1.25 =
0.500 - 0.39435= 0.10565

50%

39.44%
10.56%
? z
-3 -2 -1 0 1 2 3

67
Ejemplo 4
Hallar P( -0.34 < z < )
P(0 < z <0.34) = 0.13307 = 63.31%
P(-0.34 < z < 0)
P (0 < z < ) = 0.50000
P( -0.34 < z < ) =
0.13307 + 0.50000 = 0.63307

13.31% 50%

-3 -2 -1 0 1 2 3 68
Ejemplo 5
Hallar P( 0.34 < z < 2.30) P(0< z <0.34) = 0.13307
P( 0 < z < 2.30) = 0.4893
P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623

35.62%

z
-3 -2 -1 0 1 2 3
69
EJEMPLO

Sea una variable distribuida normalmente con media


= 4 y desviacin tpica = 1.5.
Cul es la probabilidad de encontrar un valor x 6
(P(x 6 ))?

70
=4 = 1.5 Hallar P ( x > 6 )
x
1.- transformar x en un valor de z z
z = (6 - 4)/1.5 = 1.33
2.- Hallar P ( 0 < z < 1.33) =
3.- 0.5000 - 0.40824 = 0.5

0.40824

0.09176
? x
-0.5 1 2.5 4 5.5 6 7 8.5
-3 -2 -1 0 1 1.33 2 3 z

71

You might also like