You are on page 1of 7

GEOESTADSTICA

Tarea#4

Mino Alonso Hugo Cesar

Tipos y usos de los papeles de probabilidad


El empleo de papel probabilstico normal, propuesto por Daniel (1959), es una herramienta
muy til para distintos fines: comprobar la distribucin que siguen los datos de una variable
aleatoria continua, evaluar los efectos significativos en un diseo de experimentos mediante
lo que se denomina Plot de Daniel, o bien en sistemas de control de calidad.
Objetivos del ppn
Construir la grfica del papel probabilstico a partir de un conjunto de datos de la variable
observada.
Detectar el tipo de distribucin que siguen las variables a partir de la representacin en
papel probabilstico.
Identificar datos anmalos.
Estimar media y desviacin tpica en el caso de variables normales.
Definicin y caractersticas del Papel Probabilstico
La representacin de los efectos en papel probabilstico normal (ppn) para analizar su
significacin estadstica (mtodo propuesto por Daniel en 1959) resulta una herramienta
muy til para analizar la significacin estadstica de distintos anlisis: efectos que pueden
considerarse significativos, tipo de distribucin que siguen las variables, presencia de datos
anmalos, etc. As es recogido en libros clsicos en el mbito acadmico como el de Box,
Hunter y Hunter (1978) o el de Montgomery (1997).
Definicin y Caractersticas
Bsicamente consiste en una representacin en el
plano de un conjunto de datos, haciendo corresponder
a la abcisa o eje x los valores de los datos de la
variable estudiada, mientras que a la ordenada o eje y,
le hace corresponder el porcentaje de valores en la
muestra que son menores o iguales que el valor
considerado, es decir, la frecuencia relativa
acumulada.
El formato del papel probabilstico (imagen ) es fijo y
como se aprecia, la escala vertical de dicho papel est
modificada al aplicar una pequea correccin por
continuidad, de manera que si la variable que estamos
representando sigue una distribucin normal, la curva
tpica de la funcin de distribucin de las variables
normales sufre una especie de estiramiento por la parte superior e inferior,

transformndose en una recta. Es decir que cuando los datos que representamos proceden
de una variable que sigue una distribucin normal, los puntos correspondientes se sitan
aproximadamente en torno a una recta (Romero y Znica, 2000). En realidad, lo que
hacemos al representar los valores es asumir que siguen una Normal con parmetros sin
determinar, y a la vista de la disposicin que adoptan los puntos en el ppn juzgamos
correcta o no la suposicin de normalidad. Una vez representados, observamos que algunos
se alinean aproximadamente segn una recta que pasa por el punto (0; 0,5), y estos son los
que consideraremos que siguen una distribucin normal con media cero. Los otros, los que
se alejan de la recta por los extremos, sern considerados como datos anmalos.
Veamos a continuacin como debemos proceder a la hora de representar los datos en papel
probabilstico normal y a continuacin veremos un ejemplo de los aspectos tpicos de
representaciones de las distintas situaciones con las que nos podemos encontrar.
Los distintos aspectos que pueden aparecernos al representar los datos en papel
probabilstico normal ysu interpretacin son los que se muestran a continuacin:

a. Presencia de dato anmalo.


Los datos se sitan aproximadamente en torno
a una recta, pero hay algunos se alejan de ella,
bien en la zona superior derecha, bien en la
zona inferior izquierda.

b. Asimetra Positiva.
Las distribuciones asimtricas positivas presentan un
papel probabilstico con una figura de puntos que
forma una especie de curvatura hacia abajo, como se
muestra en la figura siguiente:

c. Asimetra Negativa.
Las distribuciones asimtricas negativas presentan un
papel probabilstico con una figura de puntos que forma
una especie de curvatura hacia arriba, como se muestra
en la figura siguiente:

d. Mezcla de dos poblaciones.


La mezcla de dos poblaciones con media diferentes,
presenta una forma tpica don dos zonas de crecimiento
rpido separado por un tramo de crecimiento lento
(Romero y Znica,2000)

Tipos de papel probabilstico:


Papel probabilstico Exponencial

Papel probabilstico Normal

Papel probabilstico Log-Normal

Papel probabilstico Weibull

Papel probabilstico de Gumbel

Usos del papel probabilstico.


El papel probabilstico constituye una herramienta extremadamente prctica de anlisis
estadstico, utilizndose en el estudio de distintos tipos de distribuciones. Una
representacin de un conjunto de datos en papel probabilstico hace corresponder a cada
observacin un punto en el plano. La abscisa del punto no es ms que el valor observado,
mientras que la ordenada corresponde al porcentaje de valores en la muestra que son
menores o iguales que el considerado. (En general se aplica una correccin de continuidad,
de forma que una muestra de tamao N a la observacin i-sima, una vez ordenadas de
menor a mayor, le corresponde como ordenada, 100(i-0.5)/N.)

Normalidad y Lognormalidad
La distribucin log-normal se obtiene cuando los logaritmos de una Variable se describen
mediante una distribucin normal. Es el caso en el que las variaciones en la fiabilidad de una
misma clase de componentes tcnicos se representan considerando la tasa de fallos
aleatoria en lugar de una variable constante.

Es la distribucin natural a utilizar cuando las desviaciones a partir del valor del modelo
estn formadas por factores, proporciones o porcentajes ms que por valores absolutos
como es el caso de la distribucin normal.
La distribucin log-normal tiene dos parmetros: m* (media aritmtica del logaritmo de los
datos o tasa de fallos) y (desviacin estndar del logaritmo de los datos o tasa de fallos).
Propiedades
La distribucin log-normal se caracteriza por las siguientes propiedades:
Asigna a valores de la variable < 0 la probabilidad 0 y de este modo se ajusta a las tasas
y probabilidades de fallo que de esta forma slo pueden ser positivas.
Como depende de dos parmetros, segn veremos, se ajusta bien a un gran nmero de
distribuciones empricas.
Es idnea para parmetros que son a su vez producto de numerosas cantidades aleatorias
(mltiples efectos que influyen sobre la fiabilidad de un componente).
La esperanza matemtica o media en la distribucin log-normal es mayor que su
mediana. De este modo da ms importancia a los valores grandes de las tasas de fallo que
una distribucin normal con los mismos percentiles del 5% y 50% tendiendo, por tanto, a ser
pesimista. Esta propiedad se puede apreciar en la figura.

Normalidad; Se utiliza para modelar sistemas donde el 70% de los datos muestreados se
encuentran a una distancia inferior de (desviacin estndar) del valor promedio , y la
frecuencia de aparicin de los datos, se encuentra distribuida simtricamente con respecto
al valor promedio. Un ejemplo para utilizar una funcin de distribucin normal es el
modelado del tiempo de produccin de las maquinas, cuando no se considera la posibilidad
de fallos o errores de diversos tipos.

Permanencia de la normalidad y lognormalidad


Es muy til visualizar las distribuciones de valores, detectar posibles errores y realizar
pruebas de normalidad de los datos antes de realizar un anlisis ms complejo. En estas
prcticas se van a trabajar tanto test de normalidad grficos y numricos. Los test de
normalidad grficos ms utilizados en geoqumica son el histograma, el grfico Q-Q, el
grafico de cajas y bigotes y el papel probabilstico.
El grfico Q-Q normal representa los datos de la variable frente a los datos esperados si la
distribucin fuera normal. Si los puntos estn cerca de la diagonal podemos decir que la
distribucin es normal.
Los grficos de Caja y bigotes se obtienen a partir de la mediana. La caja est definida por el
segundo y tercer cuartil, mientras que los bigotes por el primero y el cuarto, por lo que
dentro de la caja tenemos el 50 % de los datos de la muestra (mediana). Este tipo de
representacin es tambin til para detectar valores atpicos.
La utilizacin papel probabilstico ha sido muy utilizado tradicionalmente en el anlisis de
datos geoqumicos. Se trata de contrastar dos escalas, una es aritmtica normal o bien lognormal y la otra escala es probabilstica. La escala probabilstica est dispuesta de tal forma
que una curva de distribucin acumulada normal (o log-normal) se proyecta como una lnea
recta. Este grfico es bastante sensible a resaltar las distribuciones que se alejan de la
normalidad y sirve tambin para reconocer combinaciones de poblaciones mltiples. Los
valores son acumulados desde los valores ms bajos a los ms altos de este modo quedan
resaltados los valores altos.

R trabaja un grfico probabilstico normal. Para poder estudiar una distribucin log-normal es
necesario, previamente, transformarlos a valores logartmicos. El clculo de valores medios
y anmalos es menos intuitivo si se compara con los grficos probabilsticos normales
usados tradicionalmente debido a la transformacin logartmica de los valores.
El test Kolmogorov-Smirnov (K-S) es un test de normalidad numrico cuya hiptesis nula, H 0,
considera que la distribucin de la variable seleccionada proviene de una distribucin
normal. Por ejemplo, si el nivel de significacin o p-valor (Sig.) obtenido en el test K-S es
0.20, entonces para un nivel de significacin del 0.05 (lo que est fuera del 95 % de
probabilidades) no rechazamos la hiptesis nula, ya que el p-valor es 0.20>0.05. Por tanto,
segn este test, podemos considerar que la distribucin de los datos es normal. En resumen:
Si Sig. (p-valor) > 0.05 aceptamos H 0 (hiptesis nula) distribucin normal
Si Sig. (p-valor) < 0.05 rechazamos H0 (hiptesis nula) distribucin no normal.
Si una variable tiene un comportamiento log-normal, se tendr que realizar previamente la
transformacin logartmica.

Bibliografia:

MTODOS ESTADSTICOS EN INGENIERA, Rafael Romero Villafranca, Luisa Rosa Znica


Ramajo, Ed. Universidad Politcnica de Valencia
Martn Pliego, F.J. (2004). Introduccin a la Estadstica Econmica y Empresarial. (Ed.)

Thomson. Madrid.
Mendenhall, W.; Reinmuth, J.E. (1978). Estadstica para administracin y economa. (Ed.) Grupo

Ed. Iberoamericana. ISBN 9687270136.


Montgomery, D. C. (1997). Design and Analysis of Experiments. John Wiley
Montiel, A.M.; Rius, F.; Barn F.J. (1997). Elementos bsicos de Estadstica Econmica y

Empresarial. (2 Ed.) Prentice Hall, Madrid.


Conceptos Bsicos de Estadstica para Simulacin, Dra Idalia Flores de la Mota, Fi Unam, 2011,
1ra Ed.

You might also like