You are on page 1of 12

Probabilidad y Estadstica (I.I.

Tema 3

Tema 3 VARIABLE ALEATORIA DISCRETA. PRINCIPALES DISTRIBUCIONES


1.- Definicin de variable aleatoria discreta. Normalmente, los resultados posibles (espacio muestral ) de un experimento aleatorio no son valores numricos. Por ejemplo, si el experimento consiste en lanzar de modo ordenado 2 monedas al aire para observar el nmero de caras (C) y cruces (X) que se obtienen, el espacio muestral asociado a dicho experimento aleatorio sera: = {CC, CX, XC, XX} En Estadstica resulta ms fcil utilizar valores numricos en lugar de trabajar directamente con los elementos de un espacio muestral como el anterior. As, preferimos identificar los sucesos {CX, XC} con el valor numrico 1, que representa el nmero de caras obtenidas al realizar el experimento. De este modo aparece el concepto de variable aleatoria. Sea (, (), P) un espacio de probabilidad. Una funcin X: X()= x es una variable aleatoria, es decir, las variables aleatorias unidimensionales son funciones cuyos valores dependen del resultado de un experimento aleatorio. Una variable aleatoria es una funcin que asocia un nmero real y slo uno x, a cada suceso elemental del espacio muestral ( ) de un experimento aleatorio. Las variables aleatorias discretas son aquellas que slo pueden tomar un nmero de valores finito o infinito numerable. X: X()= x Se representan mediante letras maysculas y pueden tomar n posibles valores: X = { x1, x2, ... , xi , ... , xn } Ejemplo:

Por tanto, la variable X viene definida por los valores: 0, 1, 2 En el ejemplo anterior, X = {0, 1, 2}

Experimento aleatorio: Lanzar una moneda al aire dos veces Espacio muestral: = {CC, CX, XC, XX} Sucesos elementales: {CC}, {CX}, {XC}, {XX} Se define la variable X: N de caras obtenidas Asignacin de nmeros reales: (CC, 2); (CX, 1); (XC, 1); (XX, 0)

La v.a.d., X, queda caracterizada por la funcin de probabilidad, f(x) = P(X = x), y por la funcin de distribucin, F(x) = P(X x).

Probabilidad y Estadstica (I.I.)

Tema 3

funcin de probabilidad, f(x), a la funcin que indica la probabilidad de cada posible valor de la v. a. d. X, es decir: f: N [0, 1] i=1, .., xi f(xi) = P(X = xi) = pi =P[{ t.q. X()=xi] y que verifica: (i) 0 f(xi) 1 (ii) f(xi) = 1

2.- Funcin de probabilidad, f(x) (, (), P) un espacio de probabilidad, X v. a. d., y {xi}i=1.. los valores que toma. Se llama

Si xi no es uno de los valores que puede tomar X, entonces f(xi)=0. Grficamente se representa mediante un diagrama de barras anlogo al de distribucin de frecuencias relativas para variables discretas.

Con los datos del ejemplo anterior: X f(xi) 0 0,25 1 0,50 2 0,25 f (x)

la funcin de probabilidad de X. Se llama funcin de distribucin (acumulativa) de la v.a.d. X, F(x), a la probabilidad de que X sea menor o igual que x; es decir: F: N [0, 1] xi F(xi) = P(X xi) = P[{ t.q. X() xi] F(xi) = P(X xi) = Que cumple las siguientes propiedades: (i) F(-)=0 (ii) F(xmin) = f(x1)
x j xi

2 3.- Funcin de distribucin, F(x) 0 1 Sea (, (), P) un espacio de probabilidad, X v. a. d., {xi}i=1.. los valores que toma y {pi}i=1..

f (x

Probabilidad y Estadstica (I.I.)

Tema 3

(iii) F(xmax) = 1 (iv) F()=1 (v) F es montona no decreciente, es decir, si xi xj entonces F(xi) F(xj) (vi) F es continua a derecha, tiene lmites a izquierda y es constante en [xi-1, xi), donde toma el valor

f (x
k i

(vii) P(X > x) = 1 - P(X x) = 1 - F(x) (viii) P(xi X xj) = F(xj) - F(xi-1) Grficamente resulta en la funcin escalera

Continuando con el ejemplo anterior: X F(xi) 0 0,25 1 0,75 2 1,00 F (x)

4.- Caractersticas de las v. a. discretas Se trata de resumir la informacin de una variable aleatoria en un conjunto de medidas (nmeros). De forma anloga a lo que se hizo en el tema de Estadstica Descriptiva, podemos definir para las variables aleatorias medidas de centralizacin, dispersin, simetra y forma. Por su inters especial, nos vamos a centrar en dos medidas sobre variables aleatorias que son: la esperanza matemtica, que desempea un papel equivalente al de la media, y la varianza. Esperanza: Sea X v. a. El valor esperado o esperanza matemtica de X, denotada por E(X) o por , se define como:

Probabilidad y Estadstica (I.I.)

Tema 3

E ( X ) = xi f ( xi )
i =1

E(X) no es una funcin de x, es un valor fijo que depende de la distribucin de probabilidad de X. E(X) est medida en las mismas unidades que X. Si X es una v.a. con funcin de probabilidad simtrica respecto a un punto x=a, entonces E(X)=a. Propiedades de la esperanza: (i) Si C es una constante, entonces E(C)=C. (ii) Linealidad: E(aX+b)=aE(X)+b, a, b (iii) Si g(X) es una funcin de X, entonces: E g ( X ) =

] g ( xi ) f ( xi )
i =1

(iv) Si g(X), h(X) son funciones de X, entonces E[g(X)+h(X)]=E[g(X)]+ E[h(X)] (v) |E[g(X)]| E[|g(X)|] (vi) Si X e Y son v. a. independientes E[X.Y]=E[X].E[Y] Varianza: Sea X v. a. La varianza de X se denota con Var(X) o 2 y se define como
Var [X ] = E ( X E [X ]) =
2

] (x E[X ])
i i

f ( xi )

La raz cuadrada positiva de la varianza se llama desviacin tpica y se denota con . Tanto la varianza como la desviacin tpica miden la dispersin de la v.a. respecto a su media. Observaciones: - La varianza y la desviacin tpica son cantidades positivas. - La desviacin tpica est medida en las mismas unidades que la v.a. Propiedades de la varianza: (i) Si C es una constante, Var(C)=0 (ii) Var(X) = E(X2) - E2(X) (iii) Si a y b son constantes: Var(aX + b) = a2 Var(X) (iv) Si X e Si X e Y son v.a. independientes V(X+Y) = V(X) + V(Y) La desviacin media se define como la esperanza de |X-|. 5.- Principales distribuciones de las v. a. discretas: En la prctica, la funcin de probabilidad de la mayora de las variables discretas se ajusta a un modelo terico expresado mediante una frmula concreta. Veremos los ms habituales. Distribucin de Bernouilli Be(p) La distribucin de Bernouilli se aplica cuando se realiza una sola vez un experimento que tiene nicamente dos posibles resultados (xito o fracaso), por lo que la variable slo puede tomar dos valores: el 1 (xito) y el 0 (fracaso). Definimos la v.a.:

Probabilidad y Estadstica (I.I.)

Tema 3

Al haber nicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de xito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificndose que: p + q = 1 As P(X=1)=p y P(X=0)=1-p=q. Adems E(X)=p, Var(X)=pq. Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas) Distribucin Binomial B(n,p) La distribucin binomial parte de la distribucin de Bernouilli. Se aplica cuando se realizan un nmero "n" de veces el experimento de Bernouilli, siendo cada ensayo independiente del anterior. Realizamos el experimento anterior n veces de forma independiente, y definimos la v.a.: X= Nmero de xitos obtenidos en las n realizaciones que puede tomar los valores k=0,1,,n 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido xitos con probabilidades:

La distribucin de probabilidad de este tipo de distribucin expresada de otra forma:

donde " k " es el nmero de aciertos " n" es el nmero de ensayos. " p " es la probabilidad de xito E(X) = n.p Var(X) = n.p.(1-p)=n.p.q

Ejemplo: Cul es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? La frmula quedara:

Luego, P (x = 6) = 0,205

Probabilidad y Estadstica (I.I.)

Tema 3

Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. No siempre es necesario aplicar la frmula para obtener la funcin de probabilidad asociada a un valor de la variable. Existen tablas donde se puede consultar el valor de f (xi). La tabla de la Binomial tiene la siguiente estructura:

Dado X B (x; n; p), para buscar una f (x): 1 columna: valor de n 2 columna: posibles valores de X: 0, 1, , n 3 columna: valor de f(x) bajo diferentes valores de p (aparece en porcentajes, por brevedad. El signo +significa que hay ms de tres ceros) Nota: Cuando n > 17, f (xi) puede aproximarse mediante el modelo normal (lo veremos en el prximo tema) Ejemplo: P(X = 1) = 0,02 bajo X B (x; 2; 0,01) Ejemplo: Un sujeto responde a un test 4 preguntas de tipo V/F al azar. 1) Elabore el modelo de distribucin para la variable X (n de aciertos al azar) X B (n = 4, p= 0,50) X01234 f(x) 0,0625 0,250 0,375 0,250 0,0625 2) Cul es la probabilidad de que acierte al menos 3 preguntas? P(X 3) = P(X = 3) + P(X = 4) = 0,250 + 0,0625 = 0,3125 (coincide con tablas) O tambin P(X 3) = 1- P(X 2) = 1 - (0,062 + 0,250 + 0,375) = 1 - 0,687 = 0,313 3) Valor esperado: E(X) = n p= (4) (0,50) = 2 4) Varianza: s2(X) = n p .(1 - p) = (4) (0,50 0,50) = 1 5) Cul es la probabilidad de que acierte como mximo 2 preguntas? P(X 2) = F(2) = 0,0625 + 0,250 + 0,375 = 0,6875 6) Cul es la probabilidad de que acierte entre 1 y 3 preguntas (ambas inclusive)? P(1 X 3) = F(3) - F(0) = 0,9375 - 0,0625 = 0,875 7) Cul es la probabilidad de que acierte ms de 2 preguntas? P(X > 2) = P(X 3) = 1 - P(X 2) = 1 0,6875 = 0,3125 Distribucin de Poisson P()

Probabilidad y Estadstica (I.I.)

Tema 3

Esta distribucin aparece en algunos procesos que tienen una dimensin temporal o espacial, como el nmero de llamadas telefnicas que recibe un servicio de atencin a urgencias durante un intervalo de tiempo determinado, o el nmero de cultivos infectados por una plaga en una cierta regin geogrfica. En este tipo de experimentos los xitos buscados son expresados por unidad de rea, tiempo, pieza, etc,: - n de defectos de una tela por m2 - n de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc, etc. - n de bacterias por cm2 de cultivo - n de llamadas telefnicas a un conmutador por hora, minuto, etc, etc. - n de llegadas de embarcaciones a un puerto por da, mes, etc, etc. X= Nmero de xitos obtenidos por unidad de tiempo o de espacio Para determinar la probabilidad de que ocurran k xitos por unidad de tiempo, rea, o producto, la frmula a utilizar sera:

donde: p(x=k) = probabilidad de que ocurran k xitos cuando el nmero promedio de ocurrencia de ellos es = media o promedio de xitos por unidad de tiempo, rea o producto e = 2.718 x = variable que nos denota el nmero de xitos que se desea que ocurra E(X)= Var(X)=

Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad de tiempo, rea o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, as como cada rea es independiente de otra rea dada y cada producto es independiente de otro producto dado. En estas condiciones el proceso de Poisson, que mide el nmero de xitos en un intervalo de tiempo t, en lugar de por unidad de tiempo, vendra dado por

A se le llama tasa de emisin (por unidad de tiempo). Ejemplo: Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos?

Probabilidad y Estadstica (I.I.)

Tema 3

a) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un da cualquiera = 0, 1, 2, 3, ....., etc = 6 cheques sin fondo por da

p( x = 4 , = 6 ) =

b) x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das consecutivos = 0, 1, 2, 3, ......, etc = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos Nota: siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar de lo mismo que x.

( 6 )4 ( 2.718 )6 ( 1296 )( 0.00248 ) = = 0.13392 4! 24

p( x = 10 , = 12 ) =

( 12 )10 ( 2.718 )12 ( 6.191736410 )( 0.000006151 ) = = 0.104953 10! 3628800

Ejemplo: En la inspeccin de hojalata producida por un proceso electroltico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfeccin en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando ms una imperfeccin en 15 minutos. a) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc. = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

p( x = 1, = 0.6 ) =

( 0.6 )1( 2.718 )0.6 ( 0.6 )( 0.548845 ) = = 0.329307 1! 1

b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc = 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

( 1 )0 ( 2.718 )1 ( 1 )( 2.718 )1 p( x = 2,3,4,etc.... = 1 ) = 1 p( x = 0,1, = 1 ) = 1 + = 0! 1!


=1-(0.367918+0.367918) = 0.26416 c) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc. = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

p( x = 0,1, = 3 ) = p( x = 0, = 3 ) + p( x = 1, = 3 ) =
= 0.0498026 + 0.149408 = 0.1992106

( 3 )0 ( 2.718 )3 ( 3 )1( 2.718 )3 + = 0! 1!

Probabilidad y Estadstica (I.I.)

Tema 3

Tambin se puede considerar esta distribucin como una aproximacin de la binomial cuando n y p, pero el producto n.p permanece constante. Cuando en una distribucin binomial se realiza el experimento un nmero "n" muy elevado de veces y la probabilidad de xito "p" en cada ensayo es reducida, mantenindose constante n.p, entonces se aplica el modelo de distribucin de Poisson. Realizamos indefinidamente el experimento y definimos la v.a.: X= Nmero de xitos obtenidos que puede tomar los valores k=0,1,2, Al igual que ocurra con la binomial, los valores acumulados de la distribucin de Poisson se encuentran tabulados para que resulte ms fcil su manejo. Ejemplo: En una concurrida interseccin de trfico, la probabilidad de que un automvil tenga un accidente de trfico es muy escasa, digamos de 0,0001. Sin embargo, durante cierta parte del da (entre las 4:00 pm y las 6:00 pm) un gran nmero de automviles pasa por esa interseccin, digamos unos 1000. En dichas condiciones, cual es la probabilidad de que dos o ms accidentes ocurran durante ese perodo? X= n accidentes en 1000 coches XB(1000, 0.0001) P(X 2) Como la probabilidad " p " es menor que 0,1, y n 30, entonces aplicamos el modelo de distribucin de Poisson y podramos aproximar por X P(0.1) P(X 2) = 1 P(X < 2) = 1 P(X 1) = 1 0.9953 = 0.0047 Distribucin Geomtrica G(p) Realizamos el experimento de forma independiente hasta que obtenemos el primer xito, y definimos la v.a.: Y=Nmero de experimentos hasta obtener el primer xito que toma los valores k=1,2,3, con probabilidades:

donde se tiene que E(Y)=1/p y Var(Y)=(1-p)/p2. Ejemplo: Una va de una ciudad tiene seis cruces regulados por semforos. La probabilidad de que al pasar un vehculo un semforo est verde es de 0.60. Cul es la probabilidad de atravesar dicha va en verde, encontrndose rojo solamente el ltimo semforo? Se supone que la regulacin de los semforos es tal que estos son independientes entre s. X = n de semforos que debemos atravesar hasta encontrar el primero rojo X G(0.4) P(X=6) = 0.65 0.4 = 0.0311

Probabilidad y Estadstica (I.I.)

Tema 3

Distribucin Binomial Negativa BN (n,p) Realizamos el experimento de forma independiente hasta obtener n xitos y definimos la v.a.: X= Nmero de fracasos antes del n-simo xito que puede tomar los valores k=0,1,2,

Adems E(X)=n(1-p)/p y Var(X)=n(1-p)/p2. Ejemplo: En los play-off de la NBA americana, el vencedor de cada eliminatoria final es el equipo que logre primero la 4 victoria en un total de 7 confrontaciones. Cul es la probabilidad de que un equipo dispute como mucho 6 partidos, si su porcentaje de partidos ganados es del 60%? P=probabilidad de xito =0.6 X= n fracasos hasta obtener la 4 victoria X BN(4,0.6) P(X 2)=P(X=0) + P(X=1) + P(X=2) = 0.1296 + 0.20736 + 0.20736 = 0.54432 Distribucin Hipergeomtrica H(N,D,n) La distribucin hipergeomtrica es el modelo que se aplica en experimentos donde, al igual que en la distribucin binomial, en cada ensayo hay tan slo dos posibles resultados: xito o fracaso. Pero se diferencia de la distribucin binomial en que los distintos ensayos son dependientes entre s (no hay reemplazamiento). Supongamos que tenemos un lote de N piezas de las cuales D son defectuosas (D N). Extraigo una muestra de n piezas (sin reemplazamiento) y defino la v. a.: X= Nmero de defectuosas en la muestra que puede tomar los valores k=max{0,n+D-N},1,,min{D,n}

Adems E(X) = nD/N y Var(X) = np(1-p)[(N-n)/(N-1)] con p = D/N = proporcin de defectuosas. Nota: Cuando se realiza un muestreo, ste puede ser con o sin reemplazamiento. Si es con reemplazamiento utilizaremos la distribucin binomial para contar el nmero de xitos y si es sin reemplazamiento utilizaremos la distribucin hipergeomtrica. Adems, si N es grande respecto a n, la binomial aproximar a la hipergeomtrica (la aproximacin es buena cuando n/N < 0.1). Ejemplo:

10

Probabilidad y Estadstica (I.I.)

Tema 3

En una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas Cul es la probabilidad de que 3 sean blancas? Entonces: N = 12; N-D = 5; D = 7; k = 3; n = 4 Si aplicamos el modelo:

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%. Pero este modelo no slo se utiliza con experimentos con bolas, sino que tambin se aplica con experimentos similares: Ejemplo: En una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar Cul es la probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan slo del 1,75%. Distribucin Multinomial La distribucin multinomial es similar a la distribucin binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber mltiples resultados: La distribucin multinomial sigue el siguiente modelo:

con n= x1+x2+x3+ Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces n: indica el nmero de veces que se ha repetido el experimento n!: es factorial de n p1: es la probabilidad del suceso X1 Ejemplo: En una fiesta, el 20% de los asistentes son espaoles, el 30% franceses, el 40% italianos y el 10% portugueses. En un pequeo grupo se han reunido 4 invitados: cual es la probabilidad de que 2 sean espaoles y 2 italianos?

11

Probabilidad y Estadstica (I.I.)

Tema 3

Aplicamos el modelo:

Luego P = 0,0384 Por lo tanto, la probabilidad de que el grupo est formado por personas de estos pases es tan slo del 3,84%. Distribucion Multihipergeomtrica La distribucin multihipergeomtrica es similar a la distribucin hipergeomtrica, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber mltiples resultados (en la urna, en lugar de haber nicamente bolas de dos colores, hay bolas de diferentes colores). La distribucin multihipergeomtrica sigue el siguiente modelo:

siendo n = x1 + x2 + x3 + . Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces N1: indica el nmero de elementos del tipo X1 que existen N: es el nmero total de elementos que existen n: es el nmero total de elementos que se extraen Ejemplo: En una caja de lpices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se extraen 7 lpices, cual es la probabilidad de que 5 sean amarillos y 2 rojos? Aplicamos el modelo:

Luego P = 0,0777 Por lo tanto, la probabilidad de que los 5 lpices sean de los colores indicados es del 7,77%.

12

You might also like