You are on page 1of 16

Distribuciones continuas

Distribucin normal
Concepto
La distribucin normal (en ocasiones llamada distribucin gaussiana) es la distribucin
continua que se utiliza ms comnmente en estadstica. La distribucin normal es de vital
importancia en estadstica por tres razones principales:

Muchas variables continuas comunes en el mundo de los negocios tienen


distribuciones que se asemejan estrechamente a la distribucin normal.
La distribucin normal sirve para acercarse a diversas distribuciones de
probabilidad discreta, como la distribucin binomial y la distribucin de Poisson.
La distribucin normal proporciona la base para la estadstica inferencial clsica
por su relacin con el teorema de lmite central.
En la distribucin normal, uno puede calcular la probabilidad de que varios valores
ocurran dentro de ciertos rangos o intervalos. Sin embargo, la probabilidad exacta de un
valor particular dentro de una distribucin continua, como la distribucin normal, es cero.
Esta propiedad distingue alas variables continuas, que son medidas, de las variables
discretas, las cuales son contadas. Como ejemplo, el tiempo (en segundos) se mide y no
se cuenta. Por lo tanto, es factible determinar la probabilidad de que el tiempo de
descarga para una pgina principal en un navegador de la Web est entre 7 y 10
segundos o que la probabilidad de que el tiempo de descarga est entre 8 y 9 segundos,
o la probabilidad de que el tiempo de descarga est entre 7.99 y 8.01 segundos. Sin
embargo, la probabilidad de que el tiempo de descarga sea exactamente de 8 segundos
es cero.

La distribucin normal tiene importantes propiedades tericas:

Tiene una apariencia de forma de campana (y, por ende, es simtrica).


Sus medidas de tendencia central (media, mediana y moda) son todas idnticas.
Su 50% central es igual a 1.33 desviaciones estndar. Esto significa que el rango
intercuartil est contenido dentro de un intervalo de dos tercios de una desviacin
estndar por debajo de la media y de dos tercios de una desviacin estndar por
encima de la media.
Su variable aleatoria asociada tiene un rango infinito (- < X < ).
En la prctica, muchas variables tienen distribuciones que se asemejan a las propiedades
tericas de la distribucin normal.
Formula

La funcin de densidad de la v.a. normal X, con media y desviacin estndar es,

Grafica
La grfica de la distribucin normal tiene la forma de una campana, por este motivo tambin es
conocida como la campana de Gauss. Sus caractersticas son las siguientes: Es una distribucin
simtrica. Es asinttica, es decir sus extremos nunca tocan el eje horizontal, cuyos valores
tienden a infinito. En el centro de la curva se encuentran la media, la mediana y la moda. El
rea total bajo la curva representa el 100% de los casos. Los elementos centrales del modelo
son la media y la varianza.

Esta distribucin es un modelo matemtico que permite determinar probabilidades de


ocurrencia para distintos valores de la variable. As, para determinar la probabilidad de
encontrar un valor de la variable que sea igual o inferior a un cierto valor xi, conociendo
el promedio y la varianza de un conjunto de datos, se debe reemplazar estos valores
(media, varianza y xi) en la frmula
matemtica del modelo. El clculo resulta bastante complejo pero, afortunadamente,
existen tablas estandarizadas que permiten eludir este procedimiento.
En el grfico, el rea sombreada corresponde a la probabilidad de encontrar un valor de la
variable que sea igual o inferior a un valor dado. Esa probabilidad es la que aprenderemos a
determinar usando una tabla estandarizada.
La tabla de la distribucin normal presenta los valores de probabilidad para una variable
estndar Z, con media igual a 0 y varianza igual a 1.
Para usar la tabla, siempre debemos estandarizar la variable por medio de la expresin:

Siendo x el valor de inters; la media de nuestra variable y su desviacin estndar.


Recordemos que y corresponden a parmetros, o sea valores en el universo, que
generalmente no conocemos, por lo que debemos calcular Z usando los datos de nuestra
muestra.
En general, el valor de Z se interpreta como el nmero de desviaciones estndar que
estn comprendidas entre el promedio y un cierto valor de variable x. En otras palabras,
se puede decir que es la diferencia entre un valor de la variable y el promedio, expresada
esta diferencia en cantidad de desviaciones estndar.
Aproximacin Normal a binomial

En este caso se estarn calculando probabilidades de experimentos Binomiales de una forma muy
aproximada con la distribucin Normal, esto puede llevarse a cabo si n y p = p(xito) no es
muy cercana a 0 y 1, o cuando n es pequeo y p tiene un valor muy cercano a ; esto es,

x np
P( x ,n , p ) n C x p x q n x p z

npq

Donde:

x = variable de tipo discreto; solo toma valores enteros


= np = media de la distribucin Binomial
npq
= = desviacin estndar de la distribucin Binomial
Cuando ocurren las condiciones anteriores, la grfica de la distribucin Binomial, es muy
parecida a la distribucin Normal, por lo que es adecuado calcular probabilidades con la
Normal en lugar de con la Binomial y de una forma ms rpida.
En resumen, se utiliza la aproximacin Normal para evaluar probabilidades Binomiales
siempre que p no est cercano a 0 o 1. La aproximacin es excelente cuando n es grande
y bastante buena para valores pequeos de n si p est razonablemente cercana a . Una
posible gua para determinar cuando puede utilizarse la aproximacin Normal es tener en
cuenta el clculo de np y nq. S ambos, np y nq son mayores o iguales a 5, la aproximacin
ser buena.
Antes de empezar a resolver problemas con la aproximacin Normal, es bueno aclarar
que se estn evaluando probabilidades asociadas a una variable discreta x, con una
distribucin que evala variables de tipo continuo como es la Normal,
Por lo que z sufre un pequeo cambio como se muestra a continuacin:

( x 1/ 2 )
z

Porqu vamos a sumar o a restar a x?

Este es un factor de correccin debido a que se est evaluando una variable discreta con una
distribucin continua, por lo que hay que delimitar claramente desde que punto se va a evaluar
la variable, dicho de otra forma, en que lmite de la barra (inferior o superior) nos debemos
posicionar para determinar la probabilidad requerida, cada barra de probabilidad a evaluar tiene
como base la unidad, ese es el porqu del .
X2 = 65.5

= 60 X = 65

X1 = 64.5
Ejemplos:
1. La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es
de 0.4. Si se sabe que 100 personas han contrado esta enfermedad, Cul es la
probabilidad de que:
a) al menos 30 sobrevivan?,
b) ms de 46 sobrevivan?,
c) menos de 50 no sobrevivan?

Solucin:

a)
n = 100
p = p(paciente se recupere) = 0.40
q = p(paciente no se recupere) = 1 p = 1 0.40 = 0.60
= np = (100)(0.40) = 40 pacientes se recuperen

= npq = 100( 0.40 )( 0.60 ) 4.899 pacientes que se recuperan


x = variable que nos define el nmero de pacientes que se recuperan
x = 0, 1, 2,....,100 pacientes que se recuperan

X = 29.5 = 40
( x 1/ 2 ) ( 30 1 / 2 ) 40 29.5 40
z 2.1433 2.14
4.899 4.899

p( z = -2.14) =0.4838

p(x 30 ) = p(z = -2.14) +0.5 = 0.4838 + 0.5 = 0.9838


a)
= 40 X = 46.5

( x 1 / 2 ) 40 ( 46 1 / 2 ) 40 46.5 40
z 1.33
4.899 4.899 4.899

p(z = 1.33) = 0.4082


p(x 46) = 0.5 p(z = 1.33) = 0.5 0.4082 = 0.0918

b)
n = 100
p = p(paciente no sobreviva) = 0.60
q = p(paciente sobreviva) = 1 p = 0.40
np ( 100 )( 0.60 ) 60 pacientes que no se recuperan
npq 100( 0.60 )( 0.40 ) 4.899 pacientes que no se recuperan
x = variable que nos define el nmero de pacientes que no sobreviven
x = 0, 1, 2, ....,100

X = 49.5 = 60

( 50 1 / 2 ) 60 49.5 60
z 2.14
4.899 4.899

p( z = -2.14) = 0.4838
p(x 50) = 0.5 p(z = -2.14) = 0.5 0.4838 = 0.0162
distribucion t student
Es una distribucin de probabilidad que surge del problema de estimar la media de una
poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. sta es
la base de la popular prueba t de Student para la determinacin de las diferencias entre
dos medias muestrales y para la construccin del intervalo de confianza para la diferencia
entre las medias de dos poblaciones.
La distribucin t es ms ancha y ms plana en el centro que la distribucin normal
estndar como resultado de ello se tiene una mayor variabilidad en las medias de muestra
calculadas a partir de muestras ms pequeas. Sin embargo, a medida que aumenta el
tamao de la muestra, la distribucin t se aproxima a la distribucin normal estndar.
Condiciones:

Se utiliza en muestras de 30 o menos elementos.


La desviacin estndar de la poblacin no se conoce
Diferencias:

La distribucin t student es menor en la media y mas alta en los extremos que una
distribucin normal.
Tiene proporcionalmente mayor parte de su rea en los extremos que la
distribucin normal.
Formulario:

reas:

Diferencia a probar Desviacin estndar de la diferencia o Error Estndar

Intervalos:
La distribucin t tde studentse puede usar cuando cualquiera cualquierade las siguientes
condiciones se cumplen:

La distribuci La distribuci n de la poblaci n de la poblaci n es normal n es normal



La distribuci La distribuci n de la muestra es sim n de la muestra es sim trica,
unimodal, sin puntos dispersos y trica, unimodal, sin puntos dispersos y alejados ( alejados
(outliers outliers) y el tama ) y el tama o de la muestra es de 15 o menos o de la muestra
es de 15 o menos

La distribuci La distribuci n de la muestra es moderadamente asim n de la muestra es
moderadamente asim trica, unimodal, sin trica, unimodal, sin puntos dispersos ( puntos
dispersos (outliers outliers) y el tama ) y el tama o de la muestra est o de la muestra
est entre 16 y 30 entre 16 y 30

El tama El tama o de la muestra es mayor de 30, sin puntos dispersos (aunque en o de
la muestra es mayor de 30, sin puntos dispersos (aunque en este este caso tambi caso
tambi n se puede usar la distribuci n se puede usar la distribuci n normal).

Ejemplo:

Supongamos que las calificaciones de una prueba estn distribudos normalmente con
una media de 100. Ahora supongamos que seleccionamos 20 estudiantes y les
hacemos un exmen. La desviacin estndar de la muestra es de 15.
Cul es esla la probabilidad de que el promedio en el grupo de muestra sea ms 110?
Veamos el resultado grficamente

Ejemplo 2;
Un ingeniero qumico afirma que el rendimiento medio de cierto proceso en lotes es 500
gramos por milmetro de materia prima. Para verificar esta afirmacin toma una muestra
de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05y t0.05, aceptara su
afirmacin (con 90% de confianza). Quconclusin extraera de una muestra que tiene
una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos?
Suponga que la distribucin de rendimientos es aproximadamente normal.

Sulucion: De la tabla encontramos que t0.05 para 24 grados de libertad es 1.711. Por
tanto, el fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes
rinde un valor t entre 1.711 y 1.711.

Se procede a calcular el valor de t:


Este es un valor muy por arriba de 1.711, por lo que el fabricante dira que no es cierta
la afirmacin. Sin embargo, si se encuentra la probabilidad de obtener un valor de t con
24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente
de 0.02. De aqu que es probable que el fabricante concluya que el proceso produce un
mejor rendimiento de producto que el que supona.
Distribucion chi-cuadrada
El estadstico ji-cuadrado (o chi cuadrado), que tiene distribucin de probabilidad del mismo
nombre, sirve para someter a prueba hiptesis referidas a distribuciones de frecuencias. En
trminos generales, esta prueba contrasta frecuencias observadas con las frecuencias esperadas
de acuerdo con la hiptesis nula. En este artculo se describe el uso del estadstico ji-cuadrado
para probar la asociacin entre dos variables utilizando una situacin hipottica y datos
simulados. Luego se describe su uso para evaluar cun buena puede resultar una distribucin
terica, cuando pretende representar la distribucin real de los datos de una muestra
determinada. A esto se le llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es
ver en qu medida se ajustan los datos observados a una distribucin terica o esperada. Para
esto, se utiliza una segunda situacin hipottica y datos simulados.

La distribucin de probabilidad chi-cuadrado con n grados de libertad (2(n)) es la asociada a una


variable aleatoria que se obtiene como suma de los cuadrados de n variables independientes con
distribucin N(0,1). Por tanto, esta distribucin slo toma valores positivos y adems su funcin
de densidad es muy compleja. En el siguiente grco aparecen representadas las funciones de
densidad de una 2(3) (lnea continua) y una 2(5) (lnea discontinua):

Intuitivamente, esta distribucin es de utilidad para obtener informacin de la varianza


poblacional a partir de un conjunto de datos extrados de una variable normal.

En realidad la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se


extraen todas las muestras posibles de una poblacin normal y a cada muestra se le
calcula su varianza, se obtendr la distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el
estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con
varianza 2, el estadstico:
tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de libertad
y se denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada esta dado por:

donde n es el tamao de la muestra, s2 la varianza muestral y 2 la varianza de la poblacin de


donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede dar con la siguiente
expresin:

Propiedades de las distribuciones ji-cuadrada


1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un
nmero infinito de distribuciones X2.
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se extienden
a la derecha; esto es, estn sesgadas a la derecha.
5. Cuando n>2, la media de una distribucin X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribucin X2 se da en el valor (n-3).
Ejemplos
Distribucion Fisher
La distribucin de probabilidadFdeSnedecorcon n y m grados de libertad (F(n,m)) es la asociada a
una variable aleatoria que se obtiene a partir del cociente de una dos variables chi-cuadrado con
n y m grados de libertad respectivamente. Por tanto, esta distribucin slo tomar valores
positivos. Su funcin de densidad es muy compleja y su grca es parecida a la de la distribucin
chi-cuadrado. En el siguiente grco aparecen representada las funcin de densidad de una F(3,6):

Intuitivamente, esta distribucin es de utilidad para establecer comparaciones entre las varianzas
poblacionales a partir de dos conjuntos de datos extrados de una variable

La distribucin F aparece frecuentemente como la distribucin nula de una prueba estadstica,


especialmente en el anlisis de varianza. Vase el test F.

La funcin de densidad de una F(d1, d2) viene dada por

para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta.

La funcin de distribucin es:


Ejemplos: