You are on page 1of 4

ESTADISTICA INFERENCIAL CON R HERALDO GONZALEZ SERRANO

La distribucin normal Quizs es la ms importante de las distribuciones continuas, se usa profusamente en Inferencia Estadstica dado que muchas estadsticas muestrales convergen a la normal conforme el tamao de la muestra crece. La distribucin normal, fue descrita originalmente por el matemtico francs Abraham de Moivre (1667-1754) en 1733 como el lmite de la binomial , ms tarde fue utilizada por Pierre Simon Laplace en una variedad de fenmenos de la ciencias naturales y sociales, pero fue el Prncipe de los Matemticos, el alemn Karl Gauss (1777-1855) quien aplic la distribucin normal al estudio de la forma de la tierra y los movimientos de los planetas, dicho trabajo fue tan influyente que la distribucin normal se denomina con mucha frecuencia Gaussiana ; en el siglo XIX se aplica extensamente por cientficos que haban notado que los errores al llevar a cabo mediciones fsicas, frecuentemente seguan un comportamiento en forma de campana, propia de la normal

Definicin. Sea X una variable aleatoria con recorrido los nmeros reales, decimos que la variable X tiene distribucin normal o Gaussiana de parmetros

2 si

su funcin de probabilidad es:

f ( x) =
Notacin. Denotamos X ~ N ( , )
2

1 2

1 x 2 ) ( 2

, x, , +

. . .

ESTADISTICA INFERENCIAL CON R HERALDO GONZALEZ SERRANO

Propiedades. 1) El grfico de la normal alcanza su mximo en x =

x=

2) El grfico de la normal es simtrico con respecto del eje

3) El grfico de la normal es asinttico con respecto del eje X 4) El grafico de la normal tiene puntos de inflexin en

x = y x = +

5) La masa de probabilidad tiene valor 1;

f ( x)dx = 1 ( al demostrarlo nos encontramos con la


se calcula con mtodos ms

integral

1 t2 2

dt la cual

no tiene primitiva, sin embargo

sofisticados) 6) Las reas explicadas se muestran en la figura adjunta 7) La esperenza de ka normal es E ( X ) 8) Si

= ,la varianza de la normal es V ( X ) = 2

=0

2 =1

entonces hablamos de una distribucin normal estndar y la denotamos:

Z ~ N (0;1)
9) Para la normal estndar Z esta calculada la funcin de distribucin F(z) para diversos valores de z, desde-3,5 hasta 3,5

10) X ~ N ( , 2 ) entonces

= Z ~ N (0;1)

Observacin En el lenguaje R, el grfico de la distribucin normal estndar se puede conseguir como sigue: > mu <- 0 > sigma <- 1 > x <- c(-400:400)/100 > fx <- (1/sqrt(2*pi*sigma))*exp((x-mu)*(x-mu)/(-2*sigma*sigma)) > plot(x,fx,main="Distribucin normal",type="l")

. . .

ESTADISTICA INFERENCIAL CON R HERALDO GONZALEZ SERRANO

Segn se declaro muchas estadsticas muestrales convergen a la normal conforme el tamao de la muestra crece. El ejemplo que sigue muestra cmo muestras de diferentes tamaos hechas a una poblacin normal, obtenidas con la funcin de R rnorm devuelve una vector de n cantidad de muestras provenientes de una poblacin de nmeros aleatorios con distribucin normal (para ms detalles sobre esta u otra funcin de R puede utilizar la funcin help, para este caso por ejemplo help(rnorm)). > > > > > > > > > par <- par(mfrow=c(2,2)) muestra10 <- rnorm(10) hist(muestra10,main="A.Histograma muestra10",ylab="Frecuencia") muestra50 <- rnorm(50) hist(muestra50,main="B.Histograma muestra50",ylab="Frecuencia") muestra500 <- rnorm(500) hist(muestra500,main="C.Histograma muestra500",ylab="Frecuencia") muestra1000 <- rnorm(1000) hist(muestra1000,main="D.Histograma muestra1000",ylab="Frecuencia")

Los grficos generados por la implementacin anterior se pueden apreciar en la figura precedente, donde muestra10 es la muestra de 10 observaciones, muestra50 tiene 50 observaciones, muestra500 tiene 500 observaciones y finalmente muestra1000 tiene 1000 observaciones. Note que a medida que aumentamos la cantidad de observaciones el histograma presenta una curva en forma de campana, y se parece cada vez ms a la grafica de la distribucin normal. Pudimos ver que muestras de una misma poblacin normal pueden ser diferentes, y por lo tanto la media de las mismas tambin sern diferentes, y dichas medias pueden tambin tener una distribucin distinta, sin embargo, un teorema fundamental de la estadstica dice que las medias de muestras aleatorias provenientes de cualquier distribucin tienen una distribucin normal conforme crece el tamao de la muestra, dicho teorema se conoce con el nombre de Teorema del lmite central, una consecuencia de este teorema es que cuando trabajamos con muestras de cientos de observaciones podemos olvidarnos de la distribucin de la poblacin y asumir que es normal. Una
. . .

ESTADISTICA INFERENCIAL CON R HERALDO GONZALEZ SERRANO

regla prctica muy utilizada dice que muestras con 30 o ms observaciones tienen una distribucin aceptablemente normal, como lo podemos verificar con nuestro experimento en R.

Veamos el uso del lenguaje R Ejemplo1 Supongamos que la capacidad de aireacin de cierto tipo de mquinas esta distribuida como una normal estndar Z ~ N (0;1) Si un puntaje de -1,5 indica baja capacidad Qu porcentaje de las mquinas tendra baja capacidad? La respuesta es P ( Z 1,5) , en lenguaje R se obtiene por: > pnorm(-1.5,0,1) [1] 0.0668072

Aproximadamente el 7% de las mquinas tendra baja capacidad

Ejemplo 2
Otro ejemplo, ahora con una variable normal no estandarizada El gerente de crdito de una gran tienda comercial estima que el monto por deudas impagas en el ao, se distribuye normal con media $ 30.000 y desviacin estndar de $ 4.000 Cul es la probabilidad de que una cuenta impaga, seleccionada aleatoriamente tenga un monto adeudado menos que $ 35.000? Si X = Monto adeudado, en miles de pesos entonces la variable es

X ~ N ( = 30,000; 2 = 4.000 2 ) . Se pide P( X 35.000) ; tenemos:


> pnorm(35.000,30.000,4.000) [1] 0.8943502 Aproximadamente, el 89% de las deudas impagas tiene un monto 35.000 adeudado menor que $

Ejemplo 3 Si ahora estamos interesados en conocer la probabilidad de que una cuenta impaga, seleccionada aleatoriamente tenga un monto adeudado entre $25.000 y $35.000, entonces la pregunta es

P (25.000 X 35.000)

Como esta probabilidad es equivalente a calcular el rea entre 25.000 y 35.000 bajo el grfico de la variable aleatoria X entonces, usando R tenemos: > pnorm(35.000,30.000,4.000)-pnorm(25.000,30.000,4.000) [1] 0.7887005 Aproximadamente, el 79% de las deudas impagas tiene un monto adeudado entre $ 25.000 y %35.000 Ejemplo 4 A partir de que mnimo monto se encuentra el 10% de las cuentas con mayor deuda impaga? Aqu se pide el monto k tal que P( X > k ) = 0,10 , equivalentemente, queremos determinar k tal que P ( X k ) = 0,90 . Con el lenguaje R tenemos: > qnorm(0.9,30000,4000) [1] 35126.21 Es decir, el mnimo monto adeudado por el 10% de las mayores deudas es $ 35.126,21

. . .

You might also like