You are on page 1of 14

I.

INTRODUCCION

II. OBJETIVOS

II.1. ESPECIFICO

Determinar las distribuciones tericas para nuestros datos


Hidrometeoro lgico (datos acumulados) de la subcuenca Quillcay.

II.2. GENERALES

Realizar todas las distribuciones con el mtodo SMIRNOV


KOLMOGOROV.

Realizar la prueba de Chi- Cuadrado X2.

Realizar la distribucin log-normal con 2 y 3 parmetros para los


datos acumulados.

Realizar la distribucin Gumbel y log-Gumbel a los datos acumulados.

Realizar la distribucin Gamma de 2 y 3 parmetros a los datos


acumulados.

III. MARCO TEORICO

III.1. PARMETROS ESTADSTICOS

Los estadsticos extraen informacin de una muestra, indicando las


caractersticas de la poblacin. Los principales estadsticos son los
momentos de primer, segundo y tercer orden correspondiente a la
media, varianza, y asimetra respectivamente.

III.1.1. Media :
es el valor esperado de la variable misma . Primer momento respecto
a la origen. Muestra la tendencia central de la distribucin

el valor estimado de la media a partir de la muestra es

III.1.2. Varianza :
mide la variabilidad de los datos. Es el segundo momento
respecto a la media.
el valor estimado de la varianza a partir de la muestra es

en el cual el divisor es n-1 en lugar de n para asegurar que la


estadstica de la muestra no sea sesgada, es decir, que no tenga
una tendencia, en promedio, a ser mayor o menor que el valor
verdadero. Las unidades de la varianza son la media al cuadrado,
la desviacin estndar es una medida de la variabilidad que
tiene las mismas dimensiones que la media y simplemente es la
raz cuadrada de la varianza, se estima por s. El significado de la
desviacin estndar se ilustra en la siguiente figura

Efectos de la funcin de densidad de probabilidad causados por


cambios en la desviacin estndar.

Coeficiente de variacin es una medida adimensional de la

variabilidad su estimado es
III.1.3. Coeficiente de asimetra
la distribucin de los valores de una distribucin alrededor de la
media se mide por la asimetra. Se obtiene a partir del tercer
momento alrededor de la media, dividindolo por el cubo de la
desviacin estndar para que sea adimensional.

tercer momento respecto a la media

Un estimativo del coeficiente de asimetra est dado por

III.2. ANALISIS DE FRECUENCIA

El anlisis de frecuencia es una herramienta utilizada para, predecir


el comportamiento futuro de los caudales en un sitio de inters, a
partir de la informacin histrica de caudales. Es un mtodo basado
en procedimientos estadsticos que permite calcular la magnitud del
caudal asociado a un perodo de retorno. Su confiabilidad depende
de la longitud y calidad de la serie histrica, adems de la
incertidumbre propia de la distribucin de probabilidades
seleccionada. Cuando se pretende realizar extrapolaciones, perodo
de retorno mayor que la longitud de la serie disponible, el error
relativo asociado a la distribucin de probabilidades utilizada es ms
importante, mientras que en interpolaciones la incertidumbre est
asociada principalmente a la calidad de los datos a modelar; en
ambos casos la incertidumbre es alta dependiendo de la cantidad de
datos disponibles (Ashkar, et al. 1994). La extrapolacin de
frecuencias extremas en una distribucin emprica de crecientes es
extremadamente riesgosa (Garcon, 1994).

Para determinar la magnitud de eventos extremos cuando la


distribucin de probabilidades no es una funcin fcilmente
invertibles se requiere conocer la variacin de la variable respecto a
la media. Chow en 1951 propus determinar esta variacin a partir
de un factor de frecuencia KT que puede ser expresado:
y se puede estimar a partir de los datos

Para una distribucin dada, puede determinarse una relacin entre


K y el perodo de retorno Tr. Esta relacin puede expresarse en
trminos matemticos o por medio del uso de una tabla.

El anlisis de frecuencia consiste en determinar los parmetros de


las distribuciones de probabilidad y determinar con el factor de
frecuencia la magnitud del evento para un perodo de retorno
dado.

A continuacin se describen las principales distribuciones de


probabilidad utilizadas en hidrologa, la forma de estimar sus
parmetros, el factor de frecuencia y los lmites de confianza.
Estos ltimos son indicadores de que tanta incertidumbre se tiene
con las extrapolaciones, puesto que determinar el rango de valores
donde realmente estara la variables, si el rango es muy grande la
incertidumbre es muy alta y si es pequeo, por el contrario, habr
mucha confianza en el valor estimado.

III.3. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES


CONTINUAS

III.3.1. DISTRIBUCION NORMAL

La distribucin normal es una distribucin simtrica en forma de


campana, tambin conocida como Campana de Gauss. Aunque
muchas veces no se ajusta a los datos hidrolgicos tiene amplia
aplicacin por ejemplo a los datos transformados que siguen la
distribucin normal.

III.3.1.1. Funcin de densidad:

La funcin de densidad est dada por

Los dos parmetros de la distribucin son la media y desviacin


estndar para los cuales (media) y s (desviacin estndar) son
derivados de los datos.
III.3.1.2. Estimacin de parmetros:

III.3.1.3. Factor de frecuencia:

1. Si se trabaja con los X sin transformar el K se calcula como

este factor es el mismo de la variable normal estndar

III.3.1.4. Limites de confianza:

donde es el nivel de probabilidad es el cuantil de la


distribucin normal estandarizada para una probabilidad acumulada
de 1- y Se es el error estndar

III.4. DISTRIBUCIN LOGNORMAL DE DOS PARMETROS

Si los logaritmos Y de una variable aleatoria X se distribuyen


normalmente se dice que X se distribuye normalmente.

Esta distribucin es muy usada para el calculo de valores extremos


por ejemplo Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados
en Antioquia). Tiene la ventaja que X>0 y que la transformacin Log
tiende a reducir la asimetra positiva ya que al sacar logaritmos se
reducen en mayor proporcin los datos mayores que los menores.
Limitaciones: tiene solamente dos parmetros, y requiere que los
logaritmos de la variables estn centrados en la media

III.4.1. Funcin de densidad:

y = ln x
donde,
y : media de los logaritmos de la poblacin (parmetro escalar),
estimado y : Desviacin estndar de los logaritmos de la
poblacin, estimado sy.
III.4.2. Estimacin de parmetros:

III.4.3. Factor de frecuencia:

Puede trabajarse en el campo original y en el campo transformado.

Campo transformado: Si se trabaja en el campo transformado se


trabaja con la media y la desviacin estndar de los logaritmos, as:

Ln(XTr) = xTr+KSy
de donde,
XTr = eln (xTr)
con K con variable normal estandarizada para el Tr dado, x y media de
los logaritmos y Sy es la desviacin estndar de los logaritmos.

Campo original: Si se trabaja con los X sin transformar el K se


calcula como
K es la variable normal estandarizada para el Tr dado, es el
coeficiente de variacin, x media de los datos originales y s
desviacin estndar de los datos originales.

III.4.4. Lmites de confianza:

En el campo transformado.

en donde, n nmero de datos, Se error estndar, K T variable normal


estandarizada.

III.5. DISTRIBUCION GUMBEL O EXTREMA TIPO I

Una familia importante de distribuciones usadas en el anlisis de


frecuencia hidrolgico es la distribucin general de valores extremos,
la cual ha sido ampliamente utilizada para representar el
comportamiento de crecientes y sequas (mximos y mnimos).

III.5.1. Funcin de densidad:

En donde y son los parmetros de la distribucin.

III.5.2. Estimacin de parmetros


donde son la media y la desviacin estndar estimadas
con la muestra.

III.5.3. Factor de frecuencia:

Donde Tr es el periodo de retorno. Para la distribucin Gumbel se


tiene que el caudal para un perodo de retorno de 2.33 aos es
igual a la media de los caudales mximos.
III.5.4. Lmites de confianza

Xt t(1-) Se

KT es el factor de frecuencia y t(1-) es la variable normal estandarizada


para una probabilidad de no excedencia de 1-.

III.6. DISTRIBUCION GAMMA DE TRES PARMETROS O


PEARSON TIPO 3

Esta distribucin ha sido una de las ms utilizadas en hidrologa.


Como la mayora de las variables hidrolgicas son sesgadas, la
funcin Gamma se utiliza para ajustar la distribucin de frecuencia de
variables tales como crecientes mximos anuales, Caudales mnimos,
Volmenes de flujo anuales y estacionales, valores de precipitaciones
extremas y volmenes de lluvia de corta duracin. La funcin de
distribucin Gamma tiene dos o tres parmetros.

III.6.1. Funcin de densidad:


donde,

x0 x para 0
x x0 para 0

y son los parmetros de escala y forma, respectivamente , y x 0


es el parmetro de localizacin.

III.6.2. Estimacin de parmetros:

Cs es el coeficiente de asimetra, son la media y la


desviacin estndar de la muestra respectivamente.

III.6.3. Factor de frecuencia:

donde z es la variable normal estandarizada

Este valor de K se encuentra tabulado de acuerdo al valor de Cs


calculado con la muestra.

III.6.4. Intervalos de confianza:

Xt t(1-) Se

Donde S es la desviacin estndar de la muestra, n es el nmero


de datos y se encuentra tabulado en funcin de Cs y Tr.
III.7. DISTRIBUCIN LOG GAMMA O LOGPEARSON DE 3
PARMETROS

Si los logaritmos Y de una variable aleatoria X se ajustan a una


distribucin Pearson tipo III, se dice que la variable aleatoria X se
ajusta a una distribucin Log Pearson Tipo III. Esta distribucin es
ampliamente usada en el mundo para el anlisis de frecuencia de
Caudales mximos. Esta se trabaja igual que para la Pearson Tipo III
pero con Xy y Sy como la media y desviacin estndar de los
logaritmos de la variable original X.
III.7.1. Funcin de densidad:

donde,

y0 y para 0
y y0 para 0

y son los parmetros de escala y forma, respectivamente , y y 0


es el parmetro de localizacin.

III.7.2. Estimacin de parmetros:

Cs es el coeficiente de asimetra, son la media y la


desviacin estndar de los logaritmos de la muestra
respectivamente.
III.7.3. Factor de frecuencia:

donde z es la variable normal estandarizada

Este valor de K se encuentra tabulado de acuerdo al valor de Cs


calculado con la muestra.
III.7.4. Intervalos de confianza:
Xt t(1-) Se

Donde Sy es la desviacin estndar de los logaritmos de la muestra, n


es el nmero de datos y se encuentra tabulado en funcin de Cs y
Tr.

III.8. AJUSTE DE DISTRIBUCIONES

Para la modelacin de caudales mximos se utilizan, entre otras, las


distribuciones Log - Normal, Gumbel y Log-Gumbel principalmente. Para
seleccionar la distribucin de probabilidades de la serie histrica se deben
tener en cuenta algunas consideraciones.

Cuando en la serie histrica se observan outliers 1[1] es necesario


verificar la sensibilidad del ajuste debido a la presencia de estos,
(Ashkar, et al. 1994)

Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-


Pearson se requiere transformar la variable al campo logartmico para
modelarla, con lo que se disminuye la varianza muestral, pero tambin
se filtran las variaciones reales de los datos.

Las distribuciones de dos parmetros fijan el valor del coeficiente de


asimetra, lo que en algunos casos puede no ser recomendable. La
distribucin Log - Normal de dos parmetros slo es recomendable s el
coeficiente de asimetra es cercano a cero. Las distribuciones Gumbel y
Log - Gumbel son recomendables si el coeficiente de asimetra de los
eventos registrados es cercano a 1.13

Para ajustar distribuciones de tres parmetros (Log Normal III, Log


Pearson) se requiere estimar el coeficiente de asimetra de la
distribucin; para ello es necesario disponer de una serie con longitud de
registros larga, mayor de 50 aos, (Kite, 1988). Las distribuciones de
dos parmetros son usualmente preferidas cuando se dispone de pocos
datos, porque reducen la varianza de la muestra, (Ashkar, et al. 1994).

Para seleccionar la distribucin de probabilidades adecuada se debe


tratar de utilizar informacin adicional del proceso hidrolgico que
permita identificar la forma en que se distribuye la variable. Usualmente

1
es muy difcil determinar las propiedades fsicas de los procesos
hidrolgicos para identificar el tipo de distribucin de probabilidad que
es aplicable.

Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre


cual es la distribucin que mejor se ajusta a los caudales mximos y
recomiendan seleccionar el mejor ajuste a criterio del modelador con la
prueba de ajuste grfico o basado en el comportamiento de las pruebas
estadsticas de bondad del ajuste (por ejemplo Chi Cuadrado, Smirnov-
Kolmogorov, Cramer-Von Mises) en las que se calcula un estimador y se
compara con un valor tabulado para determinar si el ajuste es adecuado
o no. En la prueba de ajuste grfica se dibujan los valores registrados en
la serie contra la distribucin terica de probabilidades y de manera
visual (subjetiva) se determina si el ajuste es adecuado o no.

Cuando la informacin es adecuada el anlisis de frecuencia es la


metodologa ms recomendable para la evaluacin de eventos
extremos, ya que la estimacin depende solamente de los caudales
mximos anuales que han ocurrido en la cuenca y no da cuenta de los
procesos de transformacin de la precipitacin en escorrenta.
Obviamente tiene algunas limitaciones relacionadas con el
comportamiento de la serie histrica y con el tamao y calidad de los
datos de la muestra.

Cuando se presenten cambios o tendencias en la serie histrica se


deben utilizar tcnicas estadsticas que permitan removerlos para poder
realizar el anlisis de frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar,
et al. 1994).

La seleccin inadecuada de la distribucin de probabilidades de la serie


histrica arrojar resultados de confiabilidad dudosa, (Ashkar, et al.
1994).

El tamao de la muestra influye directamente en la confiabilidad de los


resultados, as a mayor perodo de retorno del estimativo mayor longitud
de registros necesaria para mejor confiabilidad en los resultados.

El ajuste a distribuciones se puede hacer de dos tcnicas, con el factor


de frecuencia como se refiri en el numeral o hallando la distribucin
emprica de los datos muestrales, por el mtodo de Plotting Position.

III.8.1. Plotting Position


Trabaja con la probabilidad de excedencia asignada a cada valor de la
muestra. Se han propuesto numerosos mtodos empricos. Si n es el
total de valores y m es el rango de un valor en una lista ordenada de
mayor a menor (m=1 para el valor mximo) la probabilidad de
excedencia se puede obtener por medio de las siguientes expresiones

California

Weibull

Hazen

La expresin ms utilizada es la Weibull. Con las anteriores


expresiones se halla lo que se conoce como la distribucin emprica
de una muestra, esta luego se puede ajustar a una de las
distribuciones tericas presentadas anteriormente. Los resultados
pueden ser dibujados en el papel de probabilidad; este es diseado
para que los datos se ajusten a una lnea recta y se puedan comparar
los datos muestrales con la distribucin terica (lnea recta).

III.8.2. Pruebas de Ajuste

Para determinar que tan adecuado es el ajuste de los datos a una


distribucin de probabilidades se han propuesto una serie de pruebas
estadsticas que determinan si es adecuado el ajuste. Estos son
anlisis estadsticos y como tal se deben entender, es decir, no se
puede ignorar el significado fsico de los ajustes.

III.8.3. Prueba Smirnov Kolmogorov

El estadstico Smirnov Kolmogorov D considera la desviacin de la


funcin de distribucin de probabilidades de la muestra P(x) de la
funcin de probabilidades terica, escogida Po(x) tal que
.

La prueba requiere que el valor Dn calculado con la expresin


anterior sea menor que el valor tabulado Dn para un nivel de
probabilidad requerido.

Esta prueba es fcil de realizar y comprende las siguientes etapas:


El estadstico Dn es la mxima diferencia entre la funcin de
distribucin acumulada de la muestra y la funcin de distribucin
acumulada terica escogida.
Se fija el nivel de probabilidad , valores de 0.05 y 0.01 son los
ms usuales.
El valor crtico D de la prueba debe ser obtenido de tablas en
funcin de y n.
Si el valor calculado Dn es mayor que el D, la distribucin
escogida se debe rechazar.

III.8.4. Prueba Chi Cuadrado

Una medida de las discrepancia entre las frecuencias observadas (fo)


y las frecuencias calculadas (fc) por medio de una distribucin terica
esta dada por el estadstico

en donde
si el estadstico =0 significa que las distribuciones terica y
emprica ajustan exactamente, mientras que si el estadstico >0,
ellas difieren. La distribucin del estadstico se puede asimilar a
una distribucin Chi-cuadrado con (k-n-1) grados de libertad,
donde k es el nmero de intervalos y n es el nmero de los
parmetros de la distribucin terica. La funcin se encuentra
tabulada. Supongase que una hiptesis Ho es aceptar que una
distribucin emprica se ajusta a una distribucin Normal. Si el
valor calculado de por la ecuacin anterior es mayor que algn
valor crtico de , con niveles de significancia de 0.05 y 0.01 (el
nivel de confianza es 1-) se puede decir que las frecuencias
observadas difieren significativamente de las frecuencias
esperadas (o calculadas) y entonces la hiptesis Ho se rechaza, si
ocurre lo contrario entonces se acepta.