You are on page 1of 47

ESTADSTICA APLICADA A

LA ING. AMBIENTAL
Lic. Gildder Caqui Yabar
Captulo 2
DISTRIBUCIONES DE PROBABILIDAD
Distribucin de Probabilidad
Una distribucin o densidad de probabilidad de una
variable aleatoria x es la funcin de distribucin de la
probabilidad de dicha variable.
El rea de la curva entre dos puntos representa la probabilidad
de que ocurra un suceso entre esos dos puntos.
Las distribuciones de probabilidad pueden ser discretas
o continuas.
Hay infinidad de distribuciones de probabilidad, (una
para cada poblacin), pero hay ciertas distribuciones
modelo, estas son:
Normal
Binomial
Chi-cuadrado
"t" de Student
F de Fisher
-1 0 +1
Distribucin binominal
Describe la probabilidad de una variable dicotmica
independiente.

Distribucin Binominal de un hombre en un grupo de 10
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6 7 8 9 10
Nmero de hombres en un grupo de 10
Probabilidad
Utilidad
Se utiliza en situaciones cuya solucin tiene dos
posibles resultados:
Al nacer un beb puede ser varn o mujer.
En el deporte un equipo puede ganar o perder.
Un tratamiento mdico puede ser efectivo o inefectivo.
Vivo / muerto; enfermo / sano; verdadero / falso
Prueba mltiple de 4 alternativas: correcta o incorrecta.
Algo puede considerarse como xito o Fracaso
Experimentos de Bernoulli
Usos:
Estimacin de proporciones
Pruebas de hiptesis de proporciones
Propiedades de un
experimento de Bernoulli
1. En cada prueba del experimento slo hay dos
posibles resultados: xito o Fracaso.
2. El resultado obtenido en cada prueba es
independiente de los resultados obtenidos en
pruebas anteriores.
3. La probabilidad de un suceso (p) es constante y no
vara de una prueba a otra.
4. La probabilidad del complemento (1- p) es q .
Si repetimos el experimento n veces podemos obtener
datos para armar una distribucin binomial.


La Distribucin Binomial
Es un ejemplo de una distribucin de
probabilidad discreta.
Est formada por una serie de
experimentos de Bernoulli.
Los resultados de cada experimento son
mutuamente excluyentes.
Para construirla necesitamos:
1. La cantidad de pruebas n
2. La probabilidad de xitos p
3. Utilizar la funcin matemtica P(x=k).

La funcin P(x=k)
Funcin de la distribucin de Bernoulli:



Donde:
k = nmero de aciertos.
n = nmero de experimentos.
p = probabilidad de xito (como por ejemplo,
que salga "cara" al lanzar la moneda)
1-p = q

Ejemplo 1
Cul es la probabilidad de obtener 6 caras al
lanzar una moneda 10 veces?
El nmero de aciertos k es 6. Esto es x=6
El nmero de experimentos n son 10
La probabilidad de xito p = 0.50
La frmula quedara:


P (k = 6) = 0.205
Es decir, que la probabilidad de obtener 6 caras
al lanzar 10 veces una moneda es de 20.5% .

Ejemplo 2
Cul es la probabilidad de obtener cuatro veces
el nmero 3 al lanzar un dado ocho veces?
El nmero de aciertos k es 4. Esto es x=4
El nmero de experimentos n son 8
Probabilidad de xito p = 1/6 ( 0.1666)
La frmula queda:


P (k = 4) = 0.026
Es decir, probabilidad de obtener cuatro veces el
nmeros 3 al tirar un dado 8 veces es de 2.6%.

Media, Varianza y Desviacin
Estndar en la Distribucin Binomial
q p n
q p n
p n
=
=
=
o
o

2
Ejemplo
Al adivinar al azar un examen de 100
preguntas mltiples, cada una con 4
posibles respuestas, entonces:
3 . 4
4
3
4
1
100
8 . 18
4
3
4
1
100
25
4
1
100
2
= =
= =
= =
o
o

Distribucin Normal
Descubierta en 1733 por el francs Moiure,
descrita tambin por Laplace y Gauss (sinnimo
de la forma grfica de esta distribucin).
Importancia prctica de esta distribucin terica:
Muchos fenmenos distribuidos tienden a ser de la
forma Normal.
Esta distribucin es la base de gran parte de la teora
estadstica usada por los ingenieros.
Distribucin de promedios.
Distribucin de errores.
Caractersticas de la Distribucin Normal
El rea bajo la curva entre 2 puntos representa probabilidad que
ocurra un hecho entre esos dos puntos.
Su dominio va de menos infinito a ms infinito.
Es simtrica con respecto a su media.
Tiene dos colas y es asinttica al eje x por ambos lados.
El valor del rea debajo de toda la curva es igual a 1.
El centro de la curva est representado por la media poblacional
().
Para cualquier curva normal, el rea de -o a +o es igual a 0.6827;
de -2o a +2o de 0,9545 y de -3o a +3o de 0,9973.
Distribucin muestral de varios estadsticos, como x es normal e
independiente de distribucin de la poblacin.

Distribucin Normal Tipificada (estandarizada)
Distribucin especial que representa a todas las variables
aleatorias normales y que es la distribucin de otra variable
normal llamada Z:




NORMALIZACION (x; media; desv. estndar)
Z se la conoce como variable aleatoria estandarizada.
Esta funcin se caracteriza por tener media igual a cero y
desviacin tipificada igual a uno: N(0,1)
Representa a todas las distribuciones Normales. Igual densidad
de probabilidad, si medimos desviaciones de media en base a o.
Valores obtenidos de tabla Normal vlidos para todas las
distribuciones Normal de media = y varianza =o
2
.
Z =
x -
o
Densidad de Probabilidad
N (0,1) y N( ,o
2
)
Tabla Distribucin Z
=DISTR.NORM.ESTAND(Z)
Uso de Tabla Distribucin Z
Para determinar la probabilidad de ocurrencia de un
suceso entre dos puntos debemos determinar el rea bajo
la curva entre dichos puntos.
Depende del tipo de tabla. Usaremos la tabla de - a X,
ya que da la probabilidad acumulada.
Existen otros tipos de tabla
0 a X, X a , etc.
Debemos razonar siempre como determinar el rea.
En nuestra tabla, para determinar P(- a X) o P(Z X):
1. Buscamos en la columna izquierda de la tabla el valor del entero
y primer decimal.
2. Buscamos en la fila superior el valor del segundo decimal.
3. Interceptamos ambos valores obteniendo el valor de P.
4. Interpretamos este valor.

Uso Tabla Normal Estndar (a)
Obtenga la probabilidad de que Z obtenga los siguientes
valores:
P (Z s 1.17)
Buscamos en la columna izquierda de la tabla el valor
1.1, y en la primera fila el valor 0.07, interceptamos
ambos valores obteniendo el valor de 0.8790, que es
el valor que buscbamos:
P(Z s 1.17) = 0.879

Uso Tabla Normal Estndar (b)
P(0s Z s 1.17)
Esto lo podemos escribir de la siguiente forma tambin:
P(Z 1.17) - P(Z s 0)
El primer trmino lo conocemos, por que lo resolvimos en el
literal a.
Para el segundo trmino sabemos que la distribucin normal es
simtrica y que su rea total es igual a 1, por lo tanto el rea que
hay de - a 0 (P(Z s 0)) es igual a 1/2 = 0.5.
Por lo que el valor que buscbamos estar dado por:
P(0 Z s 1.17) = 0.879 - 0.5 = 0.379
Uso Tabla Normal Estndar (c)
P(Z > 1.17)
Sabiendo que el rea total bajo toda la curva Normal de - a +
es igual a 1, y conociendo el valor del rea de - a 1.17, el valor
del rea de 1.17 a + ser:
1 - P(Z s 1.17) = 1 - 0.879 = 0.121
Uso Tabla Normal Estndar (d)
P(Z s -1.17)
Como estamos tratando con una curva simtrica, este valor
ser el mismo que el del literal c:
P(Z s -1.17) = P(Z > 1.17) = 0.121
Uso Tabla Normal Estndar (e)
P(0.42s Z s 1.17)
Al igual que en el literal b, esto lo podemos escribir como:
P(Z 1.17) - P(Z s 0.42).
El primer valor lo conocemos, el segundo lo encontramos en la tabla de la
misma forma:
P( Z s 1.17) P(Z s 0.42)= 0.879-0.6628= 0.2162
Uso Tabla Normal Estndar (f)
h) P(|Z| > 1.17)
Determinar el rea de - a -1.17 y de 1.17 a +. Como la curva es simtrica,
simplemente multiplicamos el valor de P(Z > 1.17) del literal c por 2:
P(|Z| > 1.17) = 2 x P(Z > 1.17) = 2 x 0.121 = 0.242
Uso Tabla Normal Estndar (g)
i) P(|Z| s 1.17)
rea dada por 1 menos valor literal h, ya que el valor total del rea es igual a 1:
P(|Z| s 1.17) = 1- P(|Z|> 1.17) = 1 - 0.242 = 0.758

Tabla Distribucin Z Inversa
Otro caso diferente para el cual podemos utilizar la tabla
es para encontrar el valor de Z despus del cual se
encuentra un o x 100 % del rea de la curva.
Esto equivale a decir buscar el valor de Z cuya
probabilidad de ser mayor sea 100 x o %, o en su
defecto que su probabilidad de ser menor sea de (1-
o)x100 %
Inverso Tabla Normal(0,1) (a)
Hallar el valor de Z antes del cual se encuentra el
0.879 del rea de la curva
Buscamos en el cuerpo de la tabla el valor
correspondiente a 0.8790. Vemos en la columna que
corresponde al valor 1.1, y en la primera fila el valor a
0.07, lo que nos da
Z(1-0.879)=1.17
Inverso Tabla Normal(0,1) (b)
Hallar el valor de Z despus del cual se encuentra el
5% del rea de la curva:
Esto corresponde a un valor de o = 0.05
Esto equivale a decir buscar el valor de Z tal que:
P(Z > x) = 0.05
Buscamos en la tabla el valor de 1 - 0.05 = 0.95
Este se encontrara en la fila correspondiente a 1.6, entre
los valores de las columnas 4 (0.9495) y 5 (0.9505),
interpolamos 4.5, y Z sera igual a 1.645.
Z
(0.05)
= 1.645

Inverso Tabla Normal(0,1) (c)
Hallar el valor de Z tal que el rea sobre el mas el
rea bajo -Z sea igual a 0.05:
Esto equivale a decir buscar el valor de Z tal que:
P(|Z| > x) = 0.05
Como es una curva simtrica: o/2 = 0.05/2=0.025
Buscamos en la tabla el valor de 1 - 0.025 = 0.95
Z
(0.025)
= 1.96

Distribucin Normal (, o)
Lo anterior cumple para curva N (0,1) pero y si
queremos usarlo en poblacin natural con =0 y
o=1?
No hay problema! Tipificamos valor de x en
nuestra distribucin Normal con frmula:


Y procedemos a buscar la probabilidad para este
valor determinado.
Z no es ms que el nmero de desviaciones
estndares a la que se encuentra x de .

Z =
x -
o
Ejercicio
a) Encontrar la probabilidad que al muestrear una
piscina con una poblacin Normal con peso
=5g y o
2
=4 encontremos un valor > 7.78g.
Como o
2
=4, entonces o = 2.
Calculamos el valor de Z:


Y luego calculamos la probabilidad de que Z sea mayor
a este valor en la tabla:
P(Z > 1.39) = 1-0.9177=0.0823

b) En la misma piscina calcular entre que valores
de peso se encuentra el 95% de la poblacin
Z =
7.78 - 5
2
=1.39
Distribucin t de Student
Desarrollada con base en distribuciones de
frecuencia empricas por William Gosset, (a)
Student.
The probable error of a mean Biometrika
1908
Exista un estadstico con dificultades al usar
la distribucin Normal en muestras pequeas.
Sin embargo fue Fisher el que encontr mas
aplicaciones para esta distribucin.
Distribucin t de Student
Distribucin muestral del promedio se ajusta
muy bien a la distribucin Normal cuando se
conoce o. Si n es grande, esto no presenta
ningn problema, aun cuando o sea
desconocida, por lo que en este caso es
razonable sustituirla por s.
Sin embargo, en el caso de usar valores de
n< 30, o sea en el caso de pequeas muestras,
esto no funciona tan bien.

Distribucin t de Student
Definiendo el estadstico t:



Se puede probar que siendo x el promedio de
una muestra tomada de una poblacin normal
con media y varianza o
2
, el estadstico t es el
valor de una variable aleatoria con distribucin
"t" de Student y parmetro v (grados de libertad)
= n-1.

t =
x -
s / n

Caractersticas Distribucin t
Tiene media igual 0, es asinttica al eje x y su
dominio va de - a +;
El rea bajo la curva desde - a + es igual a 1
= 0, o
2
depende parmetro v (grados libertad)
Varianza > 1, pero se aproxima a 1 cuando n
Al aumentar n, la distribucin t se aproxima a la
Normal; n > 30 ms, excelente aproximacin
Entre las aplicaciones:
Estimacin de intervalos de confianza para medias a
partir de muestras pequeas
Pruebas de hiptesis basadas en muestras < 30
Tabla de Distribucin t
Valores de t
o
a la derecha de
los cuales se encuentra el
(100 x o)% rea de la curva.
Localizamos la columna del
valor de o y fila del valor de
v. La interseccin de la fila y
la columna nos dar el valor
de t
o
.
Ejercicios
a) Calcular la probabilidad de obtener un valor
mayor que 2,26 en una distribucin t con 9 gdl.

b) Calcular la probabilidad de obtener un valor
mayor que 2,26 o menor que -2,26 en una
distribucin t con 9 gdl.

c) Calcular el valor de t despus del cual se
encuentre el 5% del rea de la curva con 9 gdl.

d) Calcular el valor de t para a= 0,05 con 9 gdl y
dos colas.
Chi-cuadrado
Distribucin Chi-cuadrado es una funcin de
densidad de probabilidad que representa la
distribucin muestral de la varianza.

Definimos el estadstico Chi-cuadrado (_2)
como:

2
2
2
=
(n-1)
s
_
o
Caractersticas Chi-cuadrado
Asimtrica y asinttica al eje x por la derecha;
Su dominio va de 0 a +
rea bajo la curva desde 0 a + =1
Tiene parmetro v = n-1 (g.d.l.)
Al aumentar n se aproxima a la normal
Representa distribucin muestral de varianza.
Entre las aplicaciones:
Determinacin intervalos confianza para varianzas.
Pruebas de hiptesis para una varianza.
Tablas de contingencia.
El ajuste de datos a una distribucin dada conocida.
Las pruebas de independencia.

Tabla Distribucin _
2
Valores _
2
para varios v
rea a su derecha = o.
1 columna = v
1 fila: reas en la cola a
la derecha de _
2

Cuerpo tabla son los
valores de _
2

Ejercicios

a) Calcular la probabilidad de obtener un
valor mayor de 23.7 en una distribucin
_
2
con v = 14 g.d.l.

b) Calcular el valor de _
2
despus del cual
se encuentre el 5% del rea en una
distribucin Chi-cuadrado con 4 g.d.l.
Distribucin "F de Fisher
Tambin llamada "F de Fisher - Schnedecor
Representa la distribucin muestral de la razn
de dos varianzas. Es decir que se obtiene de la
razn de dos distribuciones Chi-cuadrado.
Definimos el estadstico F como:




El cual es el valor de una variable aleatoria que
tiene distribucin F con parmetros v
1
=n
1
-1 y
v
2
=n
2
-1.
F =
s
s
1
2
2
2
Propiedades de Distribucin F
Asimtrica, y asinttica al eje x por el lado
derecho
Su dominio va de 0 a +
rea bajo curva desde 0 a + =1
Tiene parmetros v
1
=n
1
-1 y v
2
=n
2
-1.
Entre sus aplicaciones:
Pruebas de hiptesis entre 2 varianzas
Anlisis de varianza
Anlisis de covarianza.
Tabla de Distribucin F
Tablas independientes
de valores de F para
o=0.01 y o=0.05 para
varias combinaciones de
v
1
y v
2
.
Se escoge la tabla para
la probabilidad deseada
y se escoge v
1
en la fila
superior y v
2
en la 1
columna. La interseccin
nos da el valor de F
deseado.
Ejercicios

a) Determine la probabilidad de tener un
valor de F mayor que 9.28 en una
distribucin F con v
1
=3 y v
2
=3 g.d.l.

b) Halle la el valor crtico de F
(0.05)
para
v1=3 y v2=15 g.d.l.

You might also like