You are on page 1of 168

Mdulo de estadstica aplicada a la Hidrologa

Apuntes

Estadstica Aplicada a la Hidrologa

ii

Estadstica Aplicada a la Hidrologa

ndice temtico
1

INTRODUCIN Y OBJETIVOS.......................................................................................................13

TEORA DE LA PROBABILIDAD ..................................................................................................15


2.1
2.2
2.2.1
2.2.2
2.2.3
2.2.4
2.3
2.3.1
2.3.2
2.3.3
2.4
2.4.1
2.4.2
2.4.3
2.4.4
2.5
2.5.1
2.5.2
2.5.3
2.5.4
2.5.5
2.5.6
2.6
2.6.1
2.6.2
2.6.3

FENMENOS ALEATORIOS Y DEFINICIONES .................................................................................15


DEFINICIN DE PROBABILIDAD......................................................................................................16
Definicin de Laplace ..............................................................................................................16
Definicin emprica de Von Mises ..........................................................................................17
La probabilidad subjetiva........................................................................................................18
Ley fuerte de los grandes nmeros..........................................................................................18
PROBABILIDAD Y AXIOMAS DE KOLMOGOROV ............................................................................19
Teora de conjuntos..................................................................................................................19
Axiomas de Kolmogorov..........................................................................................................21
Postulado de indiferencia ........................................................................................................22
CONCEPTO DE DEPENDENCIA E INDEPENDENCIA ESTOCSTICA...................................................23
Probabilidad condicionada .....................................................................................................23
Dependencia e independencia de sucesos ..............................................................................24
Teorema de la probabilidad total o compuesta......................................................................25
Teorema de Bayes o de la probabilidad inversa: ..................................................................26
ELEMENTOS DE COMBINATORIA Y PROBABILIDAD .......................................................................28
Variaciones o permutaciones de n elementos tomados de r en r ..........................................28
Permutaciones ..........................................................................................................................28
Variaciones con repeticin ......................................................................................................29
Permutaciones con repeticin .................................................................................................29
Combinaciones .........................................................................................................................29
Combinaciones con repeticin ................................................................................................29
OBSERVACIONES REPETIDAS .........................................................................................................29
Observaciones con reemplazamiento......................................................................................29
Observaciones sin reemplazamiento.......................................................................................30
Otros casos de observaciones repetidas.................................................................................30

ESTADSTICA DESCRIPTIVA ........................................................................................................39


3.1
INTRODUCCIN ..............................................................................................................................39
3.2
ANLISIS UNIVARIADO..................................................................................................................41
3.2.1
Herramientas grficas .............................................................................................................41
3.2.2
Asignacin de frecuencias .......................................................................................................46
3.2.3
Medidas de localizacin. .........................................................................................................50
3.2.3.1
3.2.3.2
3.2.3.3
3.2.3.4
3.2.3.5
3.2.3.6

3.2.4

Medidas de dispersin. ............................................................................................................52

3.2.4.1
3.2.4.2
3.2.4.3

3.2.5

Media aritmtica...................................................................................................................... 50
Mediana................................................................................................................................... 51
Moda. ...................................................................................................................................... 51
Valores mximos y mnimos registrados................................................................................. 51
Primer y tercer cuartiles. ......................................................................................................... 51
Deciles, percentiles y cuantiles. .............................................................................................. 52
Varianza, sx2, y desviacin tpica, sx........................................................................................ 52
Rango intercuartlico ............................................................................................................... 54
Mediana de las desviaciones absolutas.................................................................................... 54

Medidas de forma de la distribucin de valores. ...................................................................54

3.2.5.1
3.2.5.2

Coeficiente de sesgo................................................................................................................ 54
Coeficiente de sesgo cuartlico................................................................................................ 55

3.2.6
Tabla de estadsticos ................................................................................................................55
3.2.7
Grfico caja ..............................................................................................................................55
3.3
ANLISIS BIVARIADO ....................................................................................................................56
3.3.1
Distribuciones conjuntas de frecuencia..................................................................................58
3.3.2
Comparacin de cuantiles .......................................................................................................60
3.3.3
Diagrama de dispersin...........................................................................................................61
3.3.4
Coeficientes de correlacin simple: Pearson y Spearman ....................................................62
3.3.5
El mtodo de las dobles acumulaciones .................................................................................64
3.4
COMPONENTES EN LAS SERIES TEMPORALES ...............................................................................68

iii

Estadstica Aplicada a la Hidrologa

3.4.1
Tendencias, ciclos y estaciones ...............................................................................................68
3.4.2
Consideraciones sobre la autocorrelacin temporal ............................................................74
3.5
CONTEXTO ESPACIAL ....................................................................................................................74
4

VARIABLE ALEATORIA Y FUNCIONES DE DISTRIBUCIN .............................................75


4.1
CONCEPTO DE VARIABLE ALEATORIA ...........................................................................................75
4.2
TIPOS DE VARIABLES ALEATORIAS ................................................................................................75
4.2.1
Variables aleatorias discretas y continuas.............................................................................75
4.2.2
Dimensin de una variable aleatoria .....................................................................................75
4.3
VARIABLE ALEATORIA UNIVARIADA .............................................................................................76
4.3.1
Funcin de distribucin ...........................................................................................................76
4.3.2
Funcin de probabilidad .........................................................................................................77
4.3.3
Expresin de la funcin de distribucin mediante factor de frecuencia ..............................78
4.3.4
Operaciones con variables aleatorias ....................................................................................79
4.3.4.1
4.3.4.2

Suma de variables aleatorias .................................................................................................. 79


Producto de variables aleatorias ............................................................................................ 79

4.3.5
Transformacin de variables aleatorias.................................................................................80
4.4
VARIABLE ALEATORIA BIVARIADA ................................................................................................81
4.4.1
Funcin de distribucin conjunta ...........................................................................................81
4.4.2
Variable aleatoria marginal. Funcin de distribucin marginal .........................................83
4.4.3
Dependencia e independencia de variables aleatorias. Funcin de distribucin
condicionada ...........................................................................................................................................84
4.5
ESPERANZA Y MOMENTOS DE LAS FUNCIONES DE DISTRIBUCIN ..............................................86
4.5.1
Esperanza matemtica .............................................................................................................86
4.5.1.1
4.5.1.2

4.5.2

Varianza....................................................................................................................................87

4.5.2.1
4.5.2.2

4.5.3
4.5.4
5

Definicin ............................................................................................................................... 86
Propiedades ............................................................................................................................. 86
Definicin ............................................................................................................................... 87
Propiedades ............................................................................................................................. 87

Momentos centrales de orden n...............................................................................................88


Momentos respecto al origen y centrales de una variable bidimensional ...........................88

MODELOS DE DISTRIBUCIN UNIVARIADA DE PROBABILIDAD .................................91


5.1
5.1.1
5.1.2
5.1.3
5.1.4
5.1.5
5.2
5.2.1
5.2.2
5.2.3
5.3
5.3.1
5.3.2
5.3.3
5.3.4
5.3.5
5.4
5.4.1

DISTRIBUCIN NORMAL Y ASOCIADAS .........................................................................................91


Teorema central del lmite.......................................................................................................94
Distribucin logartmica normal ............................................................................................95
Distribucin 2 (chi-cuadrado) de Pearson ...........................................................................96
Distribucin t de Student .........................................................................................................98
Distribucin F de Fisher..........................................................................................................99
PROCESO DE BERNOULLI .............................................................................................................100
Distribucin de Bernoulli ......................................................................................................101
Distribucin Binomial............................................................................................................101
Distribucin Geomtrica .......................................................................................................103
PROCESO DE POISSON ..................................................................................................................104
Distribucin de Poisson.........................................................................................................105
Distribucin exponencial.......................................................................................................107
Distribucin Gamma..............................................................................................................108
Distribucin Pearson III........................................................................................................109
Distribucin Log-Pearson III ................................................................................................109
DISTRIBUCIONES DE VALORES EXTREMOS ..................................................................................111
Funciones de distribucin de valores extremos generalizados GEV..................................111

5.4.1.1
5.4.1.2
5.4.1.3

GEV1, distribucin de Gumbel ............................................................................................. 113


GEV2, distribucin de Frechet .............................................................................................. 115
GEV3, distribucin de Weibull ............................................................................................. 115

5.5
OTRAS FUNCIONES DE DISTRIBUCIN....................................................................................117
5.5.1
TCEV.......................................................................................................................................117
5.5.2
Funcin de distribucin SQRT ET-mx................................................................................117
6

COMPLETADO DE SERIES HIDROMETEOROLGICAS...................................................120


6.1
6.2

iv

PROPIEDADES DE LAS SERIES TEMPORALES ...............................................................................120


COMPLETADO DE SERIES MENSUALES SIN PERSISTENCIA.........................................................122

Estadstica Aplicada a la Hidrologa

6.2.1

Regresin simple ....................................................................................................................123

6.2.1.1
6.2.1.2

Posibilidades de ajuste .......................................................................................................... 123


Recta de ajuste por mnimos cuadrados entre dos series ....................................................... 124

6.2.2
Regresin mltiple en series mensuales sin persistencia ....................................................127
6.3
COMPLETADO DE SERIES MENSUALES CON PERSISTENCIA .......................................................130
6.4
GENERACIN DE NMEROS ALEATORIOS....................................................................................131
6.4.1
Generacin de nmeros aleatorios de una funcin de distribucin uniforme. Modelo
lineal. 131
6.4.2
Generacin de nmeros aleatorios de una funcin de distribucin normal ......................132
6.4.3
Generacin de nmeros aleatorios de una funcin de distribucin normal. Transformacin
de Box-Muller........................................................................................................................................132
7

ESTIMACIN DEL MODELO. INFERENCIA ESTADSTICA .............................................133


7.1
7.2
7.2.1
7.2.2
7.3
7.3.1
7.3.2
7.3.3
7.3.4
7.3.5
7.4
7.4.1
7.4.2
7.4.3
7.4.4
7.5
7.6

INTRODUCCIN .............................................................................................................................133
MTODOS DE ESTIMACIN DEL MODELO .....................................................................................133

Mtodos paramtricos ...........................................................................................................133


Mtodos no paramtricos ......................................................................................................133
PROPIEDADES DE LOS ESTIMADORES ...........................................................................................136
Estimadores insesgados .........................................................................................................136
Estimadores consistentes .......................................................................................................137
Estimadores invariantes ........................................................................................................137
Estimadores eficientes ...........................................................................................................138
Estimadores robustos.............................................................................................................138
ESTIMACIN PUNTUAL.................................................................................................................139
Mtodo de los Momentos .......................................................................................................139
Mtodo de los Momentos Ponderados Probabilsticamente ...............................................141
Mtodo de Mxima Verosimilitud .........................................................................................144
Estimadores ms empleados para distintas funciones de distribucin ..............................147
ESTIMACIN POR INTERVALO ......................................................................................................147
ESTIMACIN BAYESIANA .............................................................................................................147

TEST DE CONTRASTE DE HIPTESIS. ....................................................................................149


8.1
INTRODUCCIN. ...........................................................................................................................149
8.2
TESTS ESTADSTICOS DE CONSISTENCIA Y CONTRASTE DE HIPTESIS .....................................149
8.2.1
Teoremas de Fisher................................................................................................................151
8.2.2
Test 2 de bondad de ajuste....................................................................................................155
8.2.3
Tests basados en la distribucin de Kolmogorov-Smirnov .................................................157
8.2.4
Test de Wilcoxon, Mann-Whitney..........................................................................................159
8.2.5
Test de Wilcoxon con signos..................................................................................................160
8.2.6
Test de la de Kendall...........................................................................................................160
8.2.7
Test del coeficiente de Spearman ..........................................................................................161
8.2.8
Test de rachas.........................................................................................................................161
8.2.9
Test de Mann-Kendall............................................................................................................163
8.2.10
Test del ratio de Von Neumann ........................................................................................164
8.2.11
Test de Alexandersson.......................................................................................................165

BIBLIOGRAFA.................................................................................................................................167

Estadstica Aplicada a la Hidrologa

ndice de figuras

FIGURA 1. GRFICA DE SECTORES ....................................................................................................................42


FIGURA 2. GRFICA DE EVOLUCIN TEMPORAL ...............................................................................................43
FIGURA 3. SERIE MENSUAL DE PRECIPITACIONES .............................................................................................43
FIGURA 4. SERIE LOGARTMICA DE PRECIPITACIONES MENSUALES .................................................................44
FIGURA 5. DATOS ANUALES DE PRECIPITACIN Y CURVA SUAVIZADA SUPERPUESTA ...................................45
FIGURA 6. NIVELES PIEZOMTRICOS.................................................................................................................45
FIGURA 7. DIAGRAMA DE PARETO CON UNA VARIABLE CUALITATIVA ...........................................................46
FIGURA 8. DIAGRAMA HISTOGRAMA DE FRECUENCIAS....................................................................................47
FIGURA 9. AGRUPAMIENTO Y ELABORACIN DE UN HISTOGRAMA .................................................................47
FIGURA 10. GRFICO DE FRECUENCIAS ACUMULADAS ....................................................................................48
FIGURA 11. FRECUENCIAS EN PAPEL NORMAL Y LOGARTMICO NORMAL.......................................................50
FIGURA 12. MEDIA ARITMTICA, MEDIANA, MODA Y CUARTILES ...................................................................52
FIGURA 13. SIGNOS COEFICIENTE DE SESGO Y FORMA DE LA FUNCIN DE DENSIDAD....................................55
FIGURA 14. GRFICO EN CAJA...........................................................................................................................56
FIGURA 15. GRFICO DE BARRAS COMPARANDO LAS FRECUENCIAS DE DOS VARIABLES ..............................57
FIGURA 16. GRFICA E EVOLUCIN TEMPORAL CON DOS SERIES ....................................................................57
FIGURA 17. EJEMPLO DE NIVELES PIEZOMTRICOS ..........................................................................................58
FIGURA 18. DISTRIBUCIN CONJUNTA DE LAS VARIABLES ESTACIONALIDAD ................................................59
FIGURA 19. COMPARACIN DE CUANTILES.......................................................................................................61
FIGURA 20. DISPERSIN ENTRE LOS DATOS DE LOS PLUVIMETROS A Y B.....................................................62
FIGURA 21. DIAGRAMAS DE DISPERSIN MLTIPLES ENTRE DIFERENTES VARIABLES. ..................................62
FIGURA 22. CORRELOGRAMA ............................................................................................................................64
FIGURA 23. APLICACIN DEL MTODO DE LAS DOBLES ACUMULACIONES .....................................................65
FIGURA 24. DETECCIN DE INCONSISTENCIAS EN DOBLES ACUMULACIONES ................................................66
FIGURA 25. CHEQUEO DEL CAMBIO DE TENDENCIA .........................................................................................67
FIGURA 26. SERIE ANUAL DE DATOS DE LLUVIA Y TENDENCIA LINEAL ..........................................................69
FIGURA 27. DESVIACIONES UNITARIAS ACUMULADAS (%) Y PRECIPITACIONES ANUALES ............................70
FIGURA 28. SERIE DE PRECIPITACIONES CON VALORES MEDIOS ANUALES Y MEDIA MVIL DE 12 MESES.....71
FIGURA 29. SERIES ESTACIONALES CON MEDIA ESTACIONAL SUPERPUESTA ..................................................71
FIGURA 30. CICLOS MENSUALES EN MEDIA Y DESVIACIN TPICA ..................................................................72
FIGURA 31. TENDENCIA Y CICLOS EN LA DESCOMPOSICIN MACAULEY ........................................................73
FIGURA 32. ESTACIONALIDAD EN LA DESCOMPOSICIN MACAULEY .............................................................73
FIGURA 33. EFECTO DE LA TRANSFORMACIN NORMALIZANTE EN SERIES DE PRECIPITACIN MENSUAL ....74
FIGURA 34. DISTRIBUCIN NORMAL TIPIFICADA Y COMPARACIN CON DESVIACIN TPICA 2. ....................92
FIGURA 35. DENSIDAD NORMAL TIPIFICADA Y COMPARACIN CON DESVIACIN TPICA 2............................92
FIGURA 36. AJUSTE DE UNA DISTRIBUCIN NORMAL A PRECIPITACIONES TOTALES ANUALES ......................93
FIGURA 37. AJUSTE DE UNA DISTRIBUCIN NORMAL EN PRECIPITACIONES MXIMAS ANUALES. .................94
FIGURA 38. FUNCIONES DE DENSIDAD Y DISTRIBUCIN LOGARTMICO NORMALES .......................................96
FIGURA 39. DENSIDADES DE LA CHI-CUADRADO DEPENDIENTES DEL NMERO DE GRADOS DE LIBERTAD ...97
FIGURA 40. FUNCIN DE DISTRIBUCIN CHI-CUADRADO EN FUNCIN DE LOS GRADOS DE LIBERTAD..........98
FIGURA 41. DENSIDAD DE LA T DE STUDENT PARA DIFERENTES GRADOS DE LIBERTAD ................................99
FIGURA 42. DISTRIBUCIONES BINOMIALES DE PROBABILIDAD PARA DISTINTOS PORCENTAJES DE P ..........102
FIGURA 43. DISTRIBUCIONES GEOMTRICAS PARA DISTINTOS VALORES DE P..............................................104
FIGURA 44. DISTRIBUCIONES DE PROBABILIDAD DE POISSON PARA DISTINTOS VALORES DE . .................106
FIGURA 45. DISTRIBUCIONES EXPONENCIALES EN FUNCIN DEL VALOR DE . ............................................107
FIGURA 46. FUNCIONES DE DENSIDAD DE GAMMA.........................................................................................109
FIGURA 47. AJUSTES DE UNA FUNCIN LOG-PEARSON III A LLUVIAS MXIMAS ANUALES .........................110
FIGURA 48. AJUSTES DE UNA FUNCIN LOG-PEARSON III A LLUVIAS MXIMAS ANUALES. ........................110
FIGURA 49. AJUSTES DE UNA FUNCIN LOG-PEARSON III A LLUVIAS MXIMAS ANUALES .........................111
FIGURA 50. FORMA DE LAS DISTRIBUCIONES GEV EN FUNCIN DEL SIGNO DE K. .......................................113
FIGURA 51. FUNCIONES DE DENSIDAD GEV...................................................................................................113
FIGURA 52. AJUSTE DE UNA DISTRIBUCIN DE GUMBEL ...............................................................................114
FIGURA 53. AJUSTE DE UNA DISTRIBUCIN GEV2.........................................................................................115
FIGURA 54. AJUSTE DE UNA DISTRIBUCIN EV3............................................................................................116
FIGURA 55. AJUSTE DE UNA DISTRIBUCIN WEIBULL DE DOS PARMETROS ...............................................117

vi

Estadstica Aplicada a la Hidrologa

FIGURA 56. APLICACIN DE LA SQRT ET-MX A SERIES DE LLUVIAS MXIMAS ANUALES........................118


FIGURA 57. AJUSTE RECTA DE REGRESIN .....................................................................................................123
FIGURA 58. AJUSTE DE UNA RECTA DE REGRESIN POR MNIMOS CUADRADOS. ..........................................124

vii

Estadstica Aplicada a la Hidrologa

ndice de tablas
TABLA 1. ESTACIONALIDAD DE LOS MXIMOS ANUALES DE UNA ESTACIN PLUVIOMTRICA. ....................42
TABLA 2. VALORES ANUALES DE PRECIPITACIN EN UN PLUVIMETRO A. ....................................................43
TABLA 3, TIPOS DE TRANSFORMACIONES .........................................................................................................44
TABLA 4. HISTOGRAMA DE FRECUENCIAS ........................................................................................................47
TABLA 5. HISTOGRAMA DE FRECUENCIAS ACUMULADAS................................................................................48
TABLA 6. FRMULAS NO PARAMTRICAS DE PROBABILIDAD ..........................................................................48
TABLA 7. ASIGNACIN DE PROBABILIDAD DE OCURRENCIA............................................................................49
TABLA 8. ESTADSTICOS DE LA ESTACIN PLUVIOMTRICA ............................................................................55
TABLA 9. ESTADSTICOS DESCRIPTIVOS DE LAS SERIES DE LLUVIA REGISTRADA...........................................56
TABLA 10. COMPARACIN DE FRECUENCIAS RELATIVAS DE CAUDALES Y PRECIPITACIONES MXIMAS ......57
TABLA 11. EVOLUCIN DE LAS SERIES PLUVIOMTRICAS REGISTRADAS EN LOS PLUVIMETROS A Y B.......57
TABLA 12. TABLA DE CONTINGENCIA DE LAS VARIABLES PRECIPITACIN MXIMA, CAUDAL MXIMO.......59
TABLA 13. PROBABILIDAD CONDICIONAL ........................................................................................................60
TABLA 14. COMPARACIN DE CUANTILES ........................................................................................................61
TABLA 15. DEDUCCIN DE LOS RANGOS DE LAS SERIES PLUVIOMTRICAS ....................................................64
TABLA 16. SERIES PLUVIOMTRICAS ACUMULADAS EN LAS ESTACIONES A Y B ...........................................65
TABLA 17. ESTADSTICOS DE LA DISTRIBUCIN NORMAL................................................................................91
TABLA 18. FUNCIN DE DISTRIBUCIN NORMAL .............................................................................................93
TABLA 19. ESTADSTICOS DE LA DISTRIBUCIN LOGARTMICO NORMAL ( Y , MEDIAS Y DESVIACIONES
TPICAS DE LOS LOGARITMOS DE LA VARIABLE X)..................................................................................95
TABLA 20. ESTADSTICOS DE LA DISTRIBUCIN 2 (CHI-CUADRADO) DE PEARSON ........................................97
TABLA 21. ESTADSTICOS DE LA DISTRIBUCIN T DE STUDENT ......................................................................99
TABLA 22. ESTADSTICOS DE LA DISTRIBUCIN F DE FISHER .......................................................................100
TABLA 23. ESTADSTICOS DE LA DISTRIBUCIN DE BERNOULLI ...................................................................101
TABLA 24. ESTADSTICOS DE LA DISTRIBUCIN BINOMIAL ...........................................................................102
TABLA 25. ESTADSTICOS DE LA DISTRIBUCIN GEOMTRICA ......................................................................103
TABLA 26. ESTADSTICOS DE LA DISTRIBUCIN DE POISSON ........................................................................105
TABLA 27. ESTADSTICOS DE LA DISTRIBUCIN EXPONENCIAL.....................................................................107
TABLA 28. ESTADSTICOS DE LA DISTRIBUCIN GAMMA ..............................................................................108
TABLA 29. ESTADSTICOS DE LA DISTRIBUCIN PEARSON III .......................................................................109
TABLA 30. ESTADSTICOS DE LOS LOGARITMOS EN LA DISTRIBUCIN LOG-PEARSON III ............................111
TABLA 31. TIPOS DE FUNCIONES DE DISTRIBUCIN GEV..............................................................................112
TABLA 32. ESTADSTICOS DE LA DISTRIBUCIN DE GUMBEL ........................................................................114
TABLA 33. AJUSTE MEDIANTE UNA CONDICIN POR INTERVALOS ................................................................124
TABLA 34. FRMULAS DE GRFICO ................................................................................................................134
TABLA 35. ESTIMADOR MS EMPLEADO PARA CADA TIPO DE FUNCIN DE DISTRIBUCIN ..........................147
TABLA 36. OPCIONES POSIBLES EN UN CONTRASTE DE HIPTESIS (HENSEL-HIRSCH, 2002).......................150
TABLA 37. CONTRASTES SOBRE LA MEDIA DE UNA POBLACIN NORMAL. ...................................................152
TABLA 38. CONTRASTES SOBRE LA VARIANZA DE UNA POBLACIN NORMAL..............................................153
TABLA 39. DISTRIBUCIN DE KOLMOGOROV-SMIRNOV (SINGH) .................................................................158
TABLA 40. VALORES CRTICOS TEST DE ALEXANDERSSON ...........................................................................165

viii

Estadstica Aplicada a la Hidrologa

ndice de ecuaciones

EC. 1. PROBABILIDAD DE UN SUCESO ELEMENTAL CON SIMETRA ..................................................................16


EC. 2. DEDUCCIN DE LA PROBABILIDAD DE LAPLACE PARA UN SUCESO NO ELEMENTAL ............................16
EC. 3. PROBABILIDAD DE LAPLACE PARA UN SUCESO NO ELEMENTAL ...........................................................16
EC. 4. DEFINICIN DE FRECUENCIA RELATIVA .................................................................................................17
EC. 5. UNIN DE SUCESOS .................................................................................................................................19
EC. 6. INTERSECCIN DE SUCESOS ....................................................................................................................19
EC. 7. DIFERENCIA DE SUCESOS ........................................................................................................................19
EC. 8. PROPIEDAD CONMUTATIVA .....................................................................................................................20
EC. 9. PROPIEDAD ASOCIATIVA .........................................................................................................................20
EC. 10. PROPIEDAD DISTRIBUTIVA ....................................................................................................................20
EC. 11. PROPIEDAD DEL MDULO .....................................................................................................................20
EC. 12. PROPIEDAD IDEMPOTENCIA ..................................................................................................................20
EC. 13. OTRAS PROPIEDADES ............................................................................................................................20
EC. 14. AXIOMA 1 DE KOLMOGOROV ...............................................................................................................21
EC. 15. AXIOMA 2 DE KOLMOGOROV ...............................................................................................................21
EC. 16. AXIOMA 3 DE KOLMOGOROV ...............................................................................................................21
EC. 17. TEOREMA 1 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................21
EC. 18. TEOREMA 2 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................21
EC. 19. TEOREMA 3 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................21
EC. 20. TEOREMA 4 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................21
EC. 21. TEOREMA 5 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................22
EC. 22. TEOREMA 6 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................22
EC. 23. TEOREMA 7 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................22
EC. 24. FRECUENCIA RELATIVA DEL SUCESO B CONDICIONADA A A...............................................................23
EC. 25. EXPRESIN DE LA PROBABILIDAD CONDICIONADA..............................................................................23
EC. 26. EXPRESIN DE LA PROBABILIDAD CONDICIONADA..............................................................................23
EC. 27. RELACIONES ENTRE LA PROBABILIDAD CONDICIONADA Y LA INTERSECCIN DE SUCESOS ...............23
EC. 28. PROBABILIDAD CONDICIONADA ENTRE TRES SUCESOS .......................................................................24
EC. 29. PROBABILIDAD CONDICIONADA ENTRE N SUCESOS .............................................................................24
EC. 30. INDEPENDENCIA DE SUCESOS ...............................................................................................................24
EC. 31. PROPIEDAD DE LOS SUCESOS INDEPENDIENTES ...................................................................................24
EC. 32. DEPENDENCIA DE SUCESOS INCOMPATIBLES .......................................................................................24
EC. 33. PROBABILIDAD TOTAL O COMPUESTA ..................................................................................................25
EC. 34. VARIACIONES DE N ELEMENTOS TOMADOS DE R EN R..........................................................................28
EC. 35. PERMUTACIONES DE N ELEMENTOS ......................................................................................................29
EC. 36. VARIACIONES CON REPETICIN DE N ELEMENTOS TOMADOS DE R EN R .............................................29
EC. 37. PERMUTACIONES CON REPETICIN DE N ELEMENTOS ..........................................................................29
EC. 38. COMBINACIONES ...................................................................................................................................29
EC. 39. COMBINACIONES CON REPETICIN .......................................................................................................29
EC. 40. PROBABILIDAD DE LAS OBSERVACIONES CON REEMPLAZAMIENTO....................................................30
EC. 41. PROBABILIDAD DE LAS OBSERVACIONES CON REEMPLAZAMIENTO Y MS DE DOS CLASES ..............30
EC. 42. PROBABILIDAD DE LAS OBSERVACIONES SIN REEMPLAZAMIENTO .....................................................30
EC. 43. PROBABILIDAD DE LAS OBSERVACIONES SIN REEMPLAZAMIENTO Y MS DE DOS CLASES ...............30
EC. 44. PROBABILIDAD DE QUE SE PRESENTE A SIEMPRE EN N REPETICIONES ................................................31
EC. 45. PROBABILIDAD DE QUE NO SE PRESENTE A EN N REPETICIONES..........................................................31
EC. 46. PROBABILIDAD DE SE PRESENTE A AL MENOS UNA VEZ EN N REPETICIONES ......................................31
EC. 47. PROBABILIDAD DE QUE A SE PRESENTE R VECES DE N .........................................................................31
EC. 48. PROBABILIDAD DE QUE A SE PRESENTE ENTRE R1Y R2 VECES DE N......................................................31
EC. 49. MEDIA ARITMTICA ..............................................................................................................................50
EC. 50. MEDIA PARA DATOS DISCRETOS ...........................................................................................................50
EC. 51. MEDIA CON DATOS AGRUPADOS EN N CLASES .....................................................................................50
EC. 52. VARIANZA Y DESVIACIN TPICA .........................................................................................................52
EC. 53. DESVIACIN TPICA CON DATOS AGRUPADOS EN N CLASES ................................................................52
EC. 54. COEFICIENTE DE VARIACIN.................................................................................................................53
EC. 55. DESIGUALDAD DE TCHEBYCHEV ..........................................................................................................53
EC. 56. RANGO INTERCUARTLICO ....................................................................................................................54

ix

Estadstica Aplicada a la Hidrologa

EC. 57. MEDA ...................................................................................................................................................54


EC. 58. COEFICIENTE DE SESGO .........................................................................................................................54
EC. 59. COEFICIENTE DE SESGO CUARTLICO ....................................................................................................55
EC. 60. EXPRESIN DE LAS VALLAS ..................................................................................................................56
EC. 61. DISTRIBUCIONES MARGINALES .............................................................................................................60
EC. 62. DISTRIBUCIN CONDICIONAL ...............................................................................................................60
EC. 63. COEFICIENTE DE CORRELACIN DE PEARSON ......................................................................................63
EC. 64. COEFICIENTE DE SPEARMAN .................................................................................................................63
EC. 65. CORRECCIN DE LAS HETEROGENEIDADES ..........................................................................................67
EC. 66. EXPRESIONES ASOCIADAS A LA DETECCIN DE TENDENCIAS .............................................................69
EC. 67. DESVIACIONES ACUMULADAS Y UNITARIAS ACUMULADAS ................................................................69
EC. 68. MEDIAS MVILES ..................................................................................................................................70
EC. 69. FUNCIONES APLICABLES A FLUCTUACIONES PERIDICAS ...................................................................72
EC. 70. MODELO ADITIVO DE DESCOMPOSICIN ..............................................................................................72
EC. 71. MODELO MULTIPLICATIVO DE DESCOMPOSICIN ................................................................................72
EC. 72. TRANSFORMACIN NORMALIZANTE.....................................................................................................73
EC. 73. FUNCIN DE DISTRIBUCIN ..................................................................................................................76
EC. 74. PROBABILIDAD EN UN INTERVALO (A,B] ..............................................................................................77
EC. 75. FUNCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA .............................................77
EC. 76. FUNCIN DE DENSIDAD DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA UNIDIMENSIONAL .....77
EC. 77. FUNCIN DE DISTRIBUCIN EXTENDIDA A TODO EL DOMINIO DE LA VARIABLE ALEATORIA ............78
EC. 78. RELACIN ENTRE LAS FUNCIONES DE PROBABILIDAD Y DISTRIBUCIN .............................................78
EC. 79. RELACIN ENTRE LAS FUNCIONES DE DENSIDAD DE PROBABILIDAD Y DISTRIBUCIN ......................78
EC. 80 EXPRESIN DEL CUANTIL EN FUNCIN DEL FACTOR DE FRECUENCIA..................................................79
EC. 81 SUMA DE VARIABLES ALEATORIAS ........................................................................................................79
EC. 82 PRODUCTO DE VARIABLES ALEATORIAS ...............................................................................................80
EC. 83 RELACIN ENTRE LAS FUNCIONES DE DISTRIBUCIN DE UNA VARIABLE Y SU TRANSFORMADA .......80
EC. 84 RELACIN ENTRE FUNCIONES DE DISTRIBUCIN: TRANSFORMACIN MONTONA CRECIENTE .........80
EC. 85 RELACIN ENTRE FUNCIONES DE DISTRIBUCIN. TRANSFORMACIN MONTONA DECRECIENTE .....81
EC. 86 RELACIN ENTRE LAS FUNCIONES DE PROBABILIDAD DE UNA VARIABLE Y SU TRANSFORMADA ......81
EC. 87 RELACIN ENTRE LAS FUNCIONES DE DENSIDAD. TRANSFORMACIN MONTONA CRECIENTE .........81
EC. 88 RELACIN ENTRE LAS FUNCIONES DE DENSIDAD. TRANSFORMACIN MONTONA DECRECIENTE ....81
EC. 89 FUNCIN DE PROBABILIDAD BIVARIADA ...............................................................................................82
EC. 90 PROPIEDADES DE LA FUNCIN DE PROBABILIDAD BIVARIADA .............................................................82
EC. 91 PROPIEDADES DE LA FUNCIN DE DENSIDAD DE PROBABILIDAD BIVARIADA......................................82
EC. 92 FUNCIN DE DISTRIBUCIN BIVARIADA ................................................................................................82
EC. 93. FUNCIONES DE PROBABILIDAD MARGINAL PARA VARIABLE DISCRETA BIDIMENSIONAL...................83
EC. 94. FUNCIONES DE DENSIDAD DE PROBABILIDAD MARGINAL PARA VARIABLE DISCRETA BIDIMENSIONAL
..................................................................................................................................................................83
EC. 95. FUNCIONES DE DISTRIBUCIN MARGINAL PARA VARIABLE CONTINUA BIDIMENSIONAL ...................83
EC. 96 INDEPENDENCIA DE VARIABLES ALEATORIAS .......................................................................................84
EC. 97 FUNCIN DE PROBABILIDAD CONDICIONADA PARA VARIABLE ALEATORIA DISCRETA .......................84
EC. 98 FUNCIN DE DENSIDAD CONDICIONADA PARA VARIABLE ALEATORIA CONTINUA ..............................85
EC. 99 FUNCIN DE DISTRIBUCIN CONDICIONADA.........................................................................................85
EC. 100 FUNCIN DE DISTRIBUCIN CONDICIONADA PARA EL CASO DE VARIABLES INDEPENDIENTES.........85
EC. 101. ESPERANZA DE UNA VARIABLE CONTINUA ........................................................................................86
EC. 102. ESPERANZA DE UNA VARIABLE DISCRETA .........................................................................................86
EC. 103. ESPERANZA DE UNA FUNCIN.............................................................................................................86
EC. 104. ESPERANZA DE UNA CONSTANTE........................................................................................................86
EC. 105. ESPERANZA DE COMBINACIN LINEAL DE VARIABLES ALEATORIAS ................................................87
EC. 106. ESPERANZA DE UNA SUMA DE VARIABLES ALEATORIAS ...................................................................87
EC. 107. ESPERANZA DE UN PRODUCTO DE VARIABLES ALEATORIAS INDEPENDIENTES ................................87
EC. 108. VARIANZA DE LA POBLACIN .............................................................................................................87
EC. 109. VARIANZA DE UNA CONSTANTE .........................................................................................................87
EC. 110. VARIANZA DE UNA COMBINACIN LINEAL ........................................................................................88
EC. 111. VARIANZA DE UNA SUMA DE VARIABLES ALEATORIAS .....................................................................88
EC. 112. MOMENTO CENTRAL DE ORDEN N.......................................................................................................88
EC. 113. MOMENTO RESPECTO AL ORIGEN DE ORDEN (I, J) .............................................................................88
EC. 114. MOMENTO CENTRAL DE ORDEN (I, J) .................................................................................................88
EC. 115. VARIANZAS Y COVARIANZAS .............................................................................................................89

Estadstica Aplicada a la Hidrologa

EC. 116. FUNCIN DE DENSIDAD NORMAL........................................................................................................91


EC. 117. FUNCIN DE DISTRIBUCIN NORMAL .................................................................................................91
EC. 118. VARIABLE TIPIFICADA Y DENSIDAD NORMAL DE LA VARIABLE TIPIFICADA.....................................92
EC. 119. RESOLUCIN NUMRICA DE LA NORMAL ...........................................................................................92
EC. 120. VARIABLE TIPIFICADA.........................................................................................................................94
EC. 121. DENSIDAD LOGARTMICO NORMAL ....................................................................................................95
EC. 122. PLANTEAMIENTO DE LA FUNCIN LOGARTMICA NORMAL DE TRES PARMETROS..........................96
EC. 123. DENSIDAD LOGARTMICO NORMAL DE TRES PARMETROS ...............................................................96
EC. 124. VARIABLE ALEATORIA 2 (CHI-CUADRADO) DE PEARSON .................................................................97
EC. 125. DENSIDAD 2 (CHI-CUADRADO) DE PEARSON .....................................................................................97
EC. 126. ESTADSTICO DE CONTRASTE PARA AJUSTE DE UNA FUNCIN DE DISTRIBUCIN ............................98
EC. 127. VARIABLE ALEATORIA T DE STUDENT................................................................................................99
EC. 128. DENSIDAD T DE STUDENT ...................................................................................................................99
EC. 129. VARIABLE ALEATORIA F DE FISHER.................................................................................................100
EC. 130. FUNCIN DE DENSIDAD DE LA F DE FISHER .....................................................................................100
EC. 131. DISTRIBUCIN DE BERNOULLI ..........................................................................................................101
EC. 132. PROBABILIDAD DE OBTENER R RECHAZABLES EN UN ORDEN DETERMINADO ................................101
EC. 133. DISTRIBUCIN BINOMIAL..................................................................................................................102
EC. 134. DISTRIBUCIN GEOMTRICA ............................................................................................................103
EC. 135. DISTRIBUCIN DE POISSON ...............................................................................................................105
EC. 136. DISTRIBUCIN EXPONENCIAL ...........................................................................................................107
EC. 137. DISTRIBUCIN EXPONENCIAL DE DOS PARMETROS .......................................................................108
EC. 138. DENSIDAD GAMMA ...........................................................................................................................108
EC. 139. DENSIDAD GAMMA EN FUNCIN DEL FACTOR DE ESCALA ..............................................................108
EC. 140. DENSIDAD PEARSON III ....................................................................................................................109
EC. 141. DENSIDAD LOG-PEARSON III ............................................................................................................110
EC. 142. FUNCIONES DE DISTRIBUCIN GEV (NERC, 1975) ........................................................................112
EC. 143. FUNCIONES DE DISTRIBUCIN Y DENSIDAD DE GUMBEL.................................................................114
EC. 144. FUNCIONES DE DISTRIBUCIN Y DENSIDAD DE FRECHET ................................................................115
EC. 145. FUNCIONES DE DISTRIBUCIN Y DENSIDAD DE EV3........................................................................116
EC. 146. EXPRESIN DE LA FUNCIN DE DISTRIBUCIN WEIBULL PARA MNIMOS .......................................116
EC. 147. FUNCIN DE DISTRIBUCIN WEIBULL DE DOS PARMETROS ..........................................................116
EC. 148. FUNCIONES DE DISTRIBUCIN TCEV...............................................................................................117
EC. 149. FUNCIN DE DISTRIBUCIN SQRT ET-MX ....................................................................................118
EC. 150. DESCOMPOSICIN DEL MODELO DE SERIES TEMPORALES ...............................................................121
EC. 151. CONDICIONES PARA EL AJUSTE POR MNIMOS CUADRADOS ............................................................124
EC. 152. AJUSTE POR MNIMOS CUADRADOS ..................................................................................................125
EC. 153. AJUSTE POR MNIMOS CUADRADOS. DISTANCIAS VERTICALES .......................................................125
EC. 154. AJUSTE POR MNIMOS CUADRADOS. DISTANCIAS HORIZONTALES ..................................................126
EC. 155. AJUSTE POR MNIMOS CUADRADOS. MEDIA GEOMTRICA DISTANCIAS VERTICALES-HORIZONTALES
................................................................................................................................................................126
EC. 156. EXPRESIN DE LA RECTA DE REGRESIN CONSIDERANDO EL TRMINO ALEATORIO .....................126
EC. 157. CONDICIN ESPERANZA NULA DEL ERROR.......................................................................................126
EC. 158. TRMINO DE VARIANZA DEL ERROR .................................................................................................126
EC. 159. AJUSTE POR MNIMOS CUADRADOS EN FUNCIN DE LOS RESIDUOS NORMALIZADOS ....................127
EC. 160. AJUSTE POR MC EN FUNCIN DE LOS RESIDUOS NORMALIZADOS Y DISTRIBUCIN GAMMA ........127
EC. 161. SESGO DEL RUIDO..............................................................................................................................127
EC. 162. VARIABLE GAMMA ............................................................................................................................127
EC. 163. TRANSFORMACIN NORMALIZANTE.................................................................................................128
EC. 164. ECUACIN DE REGRESIN MLTIPLE EN LOS RESIDUOS ..................................................................128
EC. 165. COEFICIENTES DE LA ECUACIN DE REGRESIN BIVARIADA POR MNIMOS CUADRADOS ..............128
EC. 166. COEFICIENTE DE CORRELACIN DE PEARSON ..................................................................................129
EC. 167. VARIANZA DEL RUIDO.......................................................................................................................129
EC. 168. COEFICIENTE DE CORRELACIN MLTIPLE ......................................................................................129
EC. 169. MATRIZ DE PRIORIZACIN ................................................................................................................129
EC. 170. DESESTACIONARIZACIN..................................................................................................................130
EC. 171. CLCULOS DE MEDIAS, DESVIACIONES TPICAS Y SESGOS DE LAS SERIES DE APORTACIONES
TRANSFORMADAS MEDIANTE LOGARITMOS ..........................................................................................130
EC. 172. TRANSFORMACIN DE LOS DATOS CONSIDERANDO EL SESGO Y LA COMPONENTE CCLICA
ESTACIONAL ...........................................................................................................................................131

xi

Estadstica Aplicada a la Hidrologa

EC. 173. FRMULAS DE GRFICO ....................................................................................................................134


EC. 174 ESTIMADORES INSESGADOS ...............................................................................................................136
EC. 175 SESGO DE UN ESTIMADOR ..................................................................................................................136
EC. 176 ESTIMADORES CONSISTENTES ...........................................................................................................137
EC. 177 INVARIANZA DE LOS ESTIMADORES...................................................................................................137
EC. 178 EFICIENCIA DE UN ESTIMADOR ..........................................................................................................138
EC. 179 EFICIENCIA RELATIVA ........................................................................................................................138
EC. 180 MTODO DE LOS MOMENTOS .............................................................................................................139
EC. 181 MOMENTOS PONDERADOS PROBABILISTICAMENTE ..........................................................................142
EC. 182 RELACIN ENTRE LOS MOMENTOS PONDERADOS M1J0 Y M10K .........................................................142
EC. 183 MOMENTOS MUESTRALES PONDERADOS PROBABILISTICAMENTE ...................................................142
EC. 184 PROBABILIDAD DEL CONJUNTO DE UNA MUESTRA ...........................................................................145
EC. 185 FUNCIN DE VEROSIMILITUD .............................................................................................................145
EC. 186 MTODO DE MXIMA VEROSIMILITUD ..............................................................................................145
EC. 187 FORMA ALTERNATIVA DEL MTODO DE MXIMA VEROSIMILITUD ..................................................146
EC. 188 TEOREMA DE BAYES PARA VARIABLE ALEATORIA ...........................................................................148
EC. 189. 1ER TEOREMA FISHER .......................................................................................................................151
EC. 190. 2 TEOREMA FISHER ..........................................................................................................................152
EC. 191. CRITERIO PARA CONTRASTES CUANDO ES CONOCIDA ..................................................................152
EC. 192 CRITERIO PARA CONTRASTES CUANDO ES DESCONOCIDA .............................................................152
EC. 193. ESTADSTICO DE PEARSON................................................................................................................155
EC. 194. REGIN CRTICA PARA APLICACIN DEL TEST DE BONDAD DE AJUSTE...........................................156
EC. 195. ESTADSTICO DE PEARSON CORREGIDO PARA FRECUENCIAS PEQUEAS ........................................156
EC. 196. ESTADSTICO DE KOLMOGOROV.......................................................................................................158
EC. 197. TRATAMIENTO DE LA VARIABLE PARA DETECTAR HETEROGENEIDADES EN LA SERIE CON K-S ...158
EC. 198. ESTADSTICO DE KOLMOGOROV-SMIRNOV EN LA IDENTIFICACIN DE HETEROGENEIDADES .......158
EC. 199. ESTADSTICO DEL TEST DE WILCOXON O MANN-WHITNEY ...........................................................159
EC. 200. SUMA DE LOS RANGOS EN EL TEST DE WILCOXON O MANN-WHITNEY..........................................159
EC. 201. VALOR ESPERADO DEL RANGO EN EL TEST DE WILCOXON O MANN-WHITNEY ............................159
EC. 202. MEDIA Y DESVIACIN TPICA DE LA SUMA DE RANGOS ...................................................................159
EC. 203. VALORES ESTANDARIZADOS DE LA SUMA DE RANGOS ....................................................................160
EC. 204. ESTADSTICO DE KENDALL. ...........................................................................................................160
EC. 205. NORMALIZACIN DE LA DE KENDALL...........................................................................................161
EC. 206. ESTANDARIZACIN DEL ESTADSTICO DE SPEARMAN. ....................................................................161
EC. 207. MEDIA Y VARIANZA DEL TEST DE RACHAS. .....................................................................................161
EC. 208. ESTADSTICO DE MANN-KENDALL...................................................................................................163
EC. 209. NORMALIZACIN DE LA VARIABLE ..................................................................................................163
EC. 210. ESTADSTICO DE VON NEUMANN .....................................................................................................164
EC. 211. PARMETROS DE LA DISTRIBUCIN NORMAL DEL RATIO DE VON NEUMANN................................164
EC. 212. ESTADSTICO ESTANDARIZADO DEL TEST DE VON NEUMANN ........................................................164
EC. 213. ESTADSTICO DE VON NEUMANN APLICADO A RESIDUOS (SINGH, 1985) ......................................164
EC. 214. DEFINICIN DE LA REGIN DE ACEPTACIN DEL TEST ....................................................................165
EC. 215. TRATAMIENTO DE LA VARIABLE PARA LA APLICACIN DEL TEST DE ALEXANDERSSON ...............165

xii

Mdulo de Estadstica Aplicada a la Hidrologa

INTRODUCIN Y OBJETIVOS

La estadstica es la ciencia que se ocupa del tratamiento de los datos y la realizacin de


predicciones para la toma de decisiones. Los datos hidrolgicos tienen variabilidad en el
tiempo y en el espacio y estn afectados por incertidumbre o aleatoriedad, lo que hace
que esta disciplina les sea aplicable. En concreto se pueden citar los siguientes
cometidos de la estadstica:
1. Recopilacin y clasificacin de datos
2. Descripcin de datos y encontrar regularidades
3. Anlisis de muestras y realizacin de inferencias
4. Contraste de hiptesis
5. Medicin de las relaciones entre variables
6. Prediccin
Se consideran varios objetivos para la preparacin de unos apuntes de estadstica dentro
del curso de hidrologa. Entre ellos se mencionan los siguientes:
1. Sintetizar las herramientas generales de aplicacin en hidrologa
2. Transcribir conceptos bsicos recogidos de la bibliografa estadstica
3. Seleccin de bibliografa, principalmente en espaol

13

Estadstica Aplicada a la Hidrologa

14

Mdulo de Estadstica Aplicada a la Hidrologa

2
2.1

TEORA DE LA PROBABILIDAD
FENMENOS ALEATORIOS Y DEFINICIONES

La Estadstica trata del estudio de la realidad entendida a partir de los fenmenos


mostrados. Estos fenmenos son estadsticos cuando se define un procedimiento de
medida segn las componentes que se distingan. El objetivo de la Estadstica es pues el
estudio de fenmenos aleatorios, de su organizacin en modelos definidos por sus
componentes y relaciones existentes y de su coherencia con la realidad.
Los fenmenos aleatorios se caracterizan por (Martn Jadraque):
1. Pudiendo repetirse indefinidamente en condiciones anlogas, presentan
resultados distintos, de manera que no existe regularidad determinista sino
estadstica.
2. En los fenmenos aleatorios no se puede predecir el resultado de cada
experiencia particular, ya que una pequea variacin en las condiciones
iniciales da lugar a resultados completamente distintos
3. Ley del azar: si una cierta experiencia se repite n veces y anotamos el
nmero de veces que aparece cierto resultado, n, se observa que el cociente
n/n, frecuencia relativa, tiende a estabilizarse cuando n crece
indefinidamente
Definiciones bsicas:
Universo, poblacin o espacio muestral es un conjunto de valores posibles al que se dota de
estructura algebraica para definir sucesos y probabilidades asociadas. Se define al cumplir una
serie de propiedades comunes. Este conjunto puede ser finito o infinito.
Suceso: subconjunto del espacio muestral. Es un fenmeno con probabilidad de ocurrir. El
conjunto de todos los sucesos posibles forma el universo de sucesos. Los sucesos pueden ser
elementales (siempre ocurre alguno de ellos y son mutuamente excluyentes) o compuestos
(formados a partir de la unin de los sencillos)
Suceso seguro: coincidente con el espacio muestral
Suceso imposible: no ocurre nunca
La poblacin se estudia a partir de las muestras representativas cualitativamente y
cuantitativamente de la misma. Un conjunto de observaciones de una variable aleatoria se
denomina muestra. Las muestras se obtienen de una poblacin con propiedades estadsticas
constantes, mientras que en las muestras s cambian. Y a partir de las muestras se realizan
inferencias sobre la poblacin.
Ejemplo: Como fenmeno aleatorio se puede considerar el constituido por los caudales
mximos anuales. Todos los caudales que forman la poblacin se seleccionan por cumplir esa
caracterstica comn, ser un caudal mximo anual. Un suceso aleatorio sera, por ejemplo, el
registro de un ao.

15

Estadstica Aplicada a la Hidrologa

2.2
2.2.1

DEFINICIN DE PROBABILIDAD
Definicin de Laplace

Algunos experimentos aleatorios sencillos tienen la propiedad de que todos los sucesos
elementales que lo componen tienen la misma probabilidad de ocurrencia. En ese caso
la distribucin de la probabilidad es uniforme y se dice que el experimento posee
simetra. Un ejemplo tpico sera el caso del lanzamiento de un dado. Cada uno de los
sucesos elementales, es decir, cada una de las seis caras del dado posee la misma
probabilidad de ser el resultado de uno de los lanzamientos.
En un experimento dotado de simetra y compuesto por n sucesos elementales (e1, e2, ...,
en) la probabilidad de ocurrencia de cada uno de los sucesos elementales ser igual a la
probabilidad total (uno) dividida por el nmero de sucesos elementales (n):
Ec. 1. Probabilidad de un suceso elemental con simetra

P(ei ) =

1
n

En el caso del ejemplo del dado existen seis sucesos elementales (las seis caras del
dado) y, por lo tanto, la probabilidad de obtener una cara determinada en un
lanzamiento ser:
Punacara =

1
6

Como consecuencia de lo expuesto, la probabilidad de un suceso cualquiera no


elemental, A, se podr determinar como la suma de las probabilidades de cada uno de
los sucesos elementales favorables al suceso A. Si el nmero de casos favorables es m,
se tendr:
Ec. 2. Deduccin de la probabilidad de Laplace para un suceso no elemental

PA = P (U efavorables ei ) =

P (e ) = n =
i

efavorables

i =1

m
n

donde se ha tenido en cuenta que la interseccin de sucesos elementales es el suceso


imposible. Por tanto, la probabilidad de un suceso cualquiera A se podr determinar
como el nmero de sucesos elementales favorables al suceso A dividido por el nmero
total de sucesos elementales:
Ec. 3. Probabilidad de Laplace para un suceso no elemental

P( A) =

n casos favorables
n casos posibles

Esta es la denominada regla de Laplace que, como se ha dicho, es solo aplicable a


fenmenos aleatorios dotados de simetra.

16

Mdulo de Estadstica Aplicada a la Hidrologa

En el caso del dado, la probabilidad de un suceso cualquiera, por ejemplo obtener en un


lanzamiento un valor superior a dos, se calcular como el nmero de casos favorables
(obtener como resultado el 3, 4, 5 6) dividido por el nmero de casos posibles (el 1, 2
3, 4, 5 y 6):
P(obtener un valor mayor que dos ) =

4 2
= = 0,67
6 3

Se puede demostrar que la definicin propuesta por Laplace cumple los axiomas de
Kolmogorov (que se expondrn en el prximo apartado) y, por lo tanto, es una funcin
de probabilidad.
2.2.2

Definicin emprica de Von Mises

La definicin de Laplace de probabilidad descrita en el apartado anterior es solo


aplicable a aquellos experimentos dotados de simetra, es decir, cuando cada uno de los
sucesos elementales que componen el experimento tiene la misma probabilidad de
ocurrencia. Esto limita muchsimo su aplicabilidad puesto que la mayora de los
fenmenos fsicos complejos de carcter estocstico no son simtricos. Por ejemplo, si
consideramos como fenmeno aleatorio el caudal que circula por un ro en un instante
determinado, es evidente que los sucesos elementales que lo componen, cualquier
resultado posible al medir el caudal (en principio, cualquier nmero real no negativo),
no son isoprobables. En general se verificar, que la mayor parte de la probabilidad se
concentrar en determinados valores normales del caudal y ser mucho menor la
probabilidad de medir valores muy grandes o muy pequeos del mismo.
Von Mises propuso que en estos casos la probabilidad de un determinado suceso viene
dada por el lmite de su frecuencia relativa, nmero de ensayos favorables al suceso A
(nA) dividido por el nmero total de ensayos (n), cuando el nmero de ensayos del
experimento tiende a infinito.
P( A) = lim f A = lim
n

nA
n

Entonces se habla de la probabilidad como frecuencia relativa de un suceso respecto al


global. Dada una muestra finita con n elementos y nA elementos seleccionados por
cumplir una caracterstica o ser casos favorables, su probabilidad se podr estimar como
la frecuencia relativa del suceso. El nmero total de elementos de la muestra favorables
al suceso considerado (nA) se denomina frecuencia absoluta.
Ec. 4. Definicin de frecuencia relativa

P=

nA
n

Para Von Mises, la probabilidad de un suceso solo se puede conocer a travs de la


experiencia, es decir, la probabilidad del suceso queda determinada al realizar un gran
nmero de pruebas del experimento y examinar la frecuencia relativa del suceso que nos
interesa. El lmite al que tiende la frecuencia relativa es la probabilidad real del suceso.
Es decir, si la poblacin tuviese un tamao infinito se comprobara que el valor de

17

Estadstica Aplicada a la Hidrologa

probabilidad tiende a un valor lmite en la que se estabilizan las relativas con un nmero
n de casos suficientemente grande. Esta convergencia de la frecuencia relativa hacia el
valor real de la probabilidad no es en absoluto evidente, aunque su existencia es
imprescindible para que se pueda estimar el valor de la probabilidad a partir del estudio
de una muestra. Como se ver en el apartados posteriores, la Ley Fuerte de los Grandes
Nmeros garantiza desde un punto de vista matemtico dicha convergencia.
No obstante, la definicin de Von Mises sigue teniendo dos inconvenientes bsicos
(Pea, 2000). La experimentacin nunca es indefinida, especialmente en aquellos casos
en que est limitada, por lo que se tiene una incertidumbre asociada a la estimacin de
la frecuencia relativa. Adems, a lo largo del tiempo el sistema puede variar y las
frecuencias relativas tambin, con lo que resulta difcil obtener una muestra
suficientemente larga con las propiedades homogneas de la poblacin.
Al igual que para el caso de la definicin de Laplace, se puede demostrar que el criterio
de Von Mises cumple los axiomas de Kolmogorov y, por tanto, constituye una funcin
de probabilidad.
2.2.3

La probabilidad subjetiva

Otros autores como Keynes, Jeffreys, Savage y De Fenetti han propuesto una definicin
de la probabilidad basada en un criterio subjetivo. Esta concepcin de probabilidad no
requiere de repeticin de pruebas, ni de estabilidad de las frecuencias, sino que est
basada en el grado de creencia que un determinado individuo pueda tener en un hecho
determinado o en el resultado de un determinado experimento. La probabilidad de cada
suceso ser diferente para cada persona porque cada uno dispondr de distinta
informacin y la valorar de forma diferente.
Si la valoracin subjetiva se realiza siguiendo determinados axiomas, definidos por De
Fenetti, se puede llegar a una medida cuantitativa de la probabilidad que cumple los
axiomas de Kolmogorov.
2.2.4

Ley fuerte de los grandes nmeros

Como se coment anteriormente, el criterio de Von Mises ser el habitualmente


empleado en hidrologa, puesto que los fenmenos fsicos que estudia dicha ciencia
carecen de la propiedad de simetra. Ser, por tanto, necesaria la obtencin de una
muestra a partir de la cual obtener las frecuencias relativas. No obstante, ya se apunt,
que la definicin de probabilidad de Von Mises presenta ciertas dificultades desde un
punto de vista matemtico. Es necesario garantizar la convergencia de la frecuencia
relativa hacia el valor real de la probabilidad, es decir, que la probabilidad puede ser
estimada partir de la muestra y con tanta precisin como se desee simplemente con
aumentar su tamao. Esta circunstancia puede garantizarse desde un punto de vista
matemtico a partir de la llamada Ley Fuerte de los Grandes Nmeros, la cual afirma
que:

El cociente del nmero de veces que se presenta el suceso A entre el de repeticiones


del fenmeno tiende a la probabilidad del suceso A.

18

Mdulo de Estadstica Aplicada a la Hidrologa

Esta ley garantiza, por tanto, la viabilidad de emplear la definicin de Von Mises como
mtodo para estimar la probabilidad de un suceso. La demostracin matemtica de la
ley no se incluye en este curso debido a su complejidad. La misma demostracin
matemtica permite conocer que la frecuencia relativa, no solo converge hacia el valor
real de la probabilidad, sino que lo hace con bastante rapidez. Debido a esa rapidez en la
convergencia, se la llama ley fuerte, a diferencia de la ley dbil en la que la
convergencia es mucho ms lenta. Esta circunstancia permite realizar estimaciones
bastante precisas de la probabilidad con un nmero no muy elevado de datos.

2.3

PROBABILIDAD Y AXIOMAS DE KOLMOGOROV

2.3.1

Teora de conjuntos

La teora de conjuntos aporta la estructura desde la que se organizan los modelos


probabilsticos. Se ha definido el suceso aleatorio como un subconjunto del universo o
suceso seguro. En la teora de conjuntos se consideran las siguientes definiciones
(Martn Jadraque):

Unin de sucesos. Se llama suceso unin o suma de dos sucesos, A y B, a aquel


cuyas descripciones pertenecen a A o B. Cualquier elemento perteneciente al
conjunto unin pertenece a A o a B.
Ec. 5. Unin de sucesos
S = AU B

Interseccin de sucesos. Se llama suceso interseccin o producto de dos sucesos,


A y B, a aquel cuyas descripciones pertenecen a A y a B. Cualquier elemento
perteneciente al conjunto interseccin pertenece a A y a B
Ec. 6. Interseccin de sucesos
P = AI B

Espacio muestral o universo (suceso seguro). Es aquel suceso que contiene todos
los posibles resultados del fenmeno aleatorio. Se representa como E.

Suceso complementario. Dado el espacio muestral E y un suceso A, el


complementario est formado por todos los elementos que no pertenecen a A
dentro de E. Se representa por A .

Suceso diferencia. Dados dos conjuntos A y B, el suceso diferencia es el que


resulta de la interseccin de A con el complementario de B.
Ec. 7. Diferencia de sucesos
D = AI B

19

Estadstica Aplicada a la Hidrologa

Conjunto vaco (suceso imposible). Es el suceso contrario al cierto. Se


representa con .

Sucesos incompatibles. Dos sucesos son incompatibles cuando la interseccin es


el conjunto vaco.

La unin e interseccin tienen las siguientes propiedades:


1. Conmutativa
Ec. 8. Propiedad conmutativa
AI B = BI A

AU B = BU A

2. Asociativa
Ec. 9. Propiedad asociativa

A I B I C = A I (B I C ) = ( A I B ) I C
A U B U C = A U (B U C ) = ( A U B ) U C
3. Distributiva
Ec. 10. Propiedad distributiva

A I (B U C ) = ( A I B ) U ( A I C )
A U (B I C ) = ( A U B ) I ( A U C )
4. Del mdulo
Ec. 11. Propiedad del mdulo
AI =

A U = A

5. Idempotencia
Ec. 12. Propiedad idempotencia
AI A = A

AU A = A

6. Otras
Ec. 13. Otras propiedades
AI B = AU B

20

AU B = AI B

Mdulo de Estadstica Aplicada a la Hidrologa

2.3.2

Axiomas de Kolmogorov

Apoyndose en el lgebra de conjuntos, la probabilidad es una funcin que asocia a un


suceso A una probabilidad P(A). Para ser una probabilidad, esta funcin debe cumplir
con los siguientes axiomas (axiomas de Kolmogorov):
1. La probabilidad de cualquier suceso es positiva
Ec. 14. Axioma 1 de Kolmogorov
P( A) 0
2. La probabilidad del suceso seguro es 1.
Ec. 15. Axioma 2 de Kolmogorov
P( E ) = 1
3. Si A y B son sucesos incompatibles y los unimos, la probabilidad del suceso
unin es la suma de las probabilidades de los sucesos aislados:
Ec. 16. Axioma 3 de Kolmogorov
A I B = P( A U B ) = P ( A) + P ( B )
De los que se derivan 7 teoremas demostrables en virtud de los anteriores axiomas:
1. Teorema 1. La probabilidad de un suceso es siempre menor o igual que 1.
Ec. 17. Teorema 1 derivado de los axiomas de Kolmogorov
P ( A) 1
2. Teorema 2. La probabilidad de un suceso y la de su complementario suma la
unidad.
Ec. 18. Teorema 2 derivado de los axiomas de Kolmogorov

P( A) = 1 P ( A)
3. Teorema 3. La probabilidad del suceso imposible es nula.
Ec. 19. Teorema 3 derivado de los axiomas de Kolmogorov
P( ) = 0
4. Teorema 4. Si el suceso A es un subconjunto de B, la probabilidad de A es menor
o igual que la de B.
Ec. 20. Teorema 4 derivado de los axiomas de Kolmogorov
A B P ( A) P( B)

21

Estadstica Aplicada a la Hidrologa

5. Teorema 5. La probabilidad de la unin de dos sucesos compatibles es igual a la


de cada uno de los sucesos menos la de la interseccin.
Ec. 21. Teorema 5 derivado de los axiomas de Kolmogorov
P( A U B) = P( A) + P( B ) P ( A I B)
6. Teorema 6. La probabilidad de la unin de ms de dos sucesos incompatibles es
la suma de las probabilidades de cada uno de ellos.
Ec. 22. Teorema 6 derivado de los axiomas de Kolmogorov
Ai I A j = (i j ) P ( A1 U ... An ) = P ( A1 ) + ...P( An )
7. Teorema 7.
Ec. 23. Teorema 7 derivado de los axiomas de Kolmogorov

((

) (

))

P A I B U A I B = P( A) + P( B) 2P( A I B)
2.3.3

Postulado de indiferencia

Mediante el lgebra de probabilidad definido se plantea el postulado de indiferencia


desde el cual se puede llegar a definir la Regla de Laplace expuesta anteriormente. El
postulado de indiferencia dice que si los n sucesos elementales de un fenmeno
aleatorio son incompatibles entre s y no existe ninguna razn que favorezca la
presentacin de uno respecto a los otros, debe admitirse que todos tienen la misma
probabilidad.
U ( Bi ) = E

Bi I B j = (i j )
P( Bi ) = P( B j ) = p
P( B1 ) U ...P( Bn ) = P ( E ) = 1 = n p P( Bi ) =

1
n

Y si se verifica un suceso A cuando se presenta alguno de entre m de los anteriores


sucesos:
P( A) = P( B1 U ...Bm ) = P ( B1 ) + ...P ( Bm ) = m p P ( A) =

m
n

Y queda la regla de Laplace como se haba enunciado anteriormente: si un suceso A se


presenta cuando tiene lugar alguno de los m casos favorables A1, A2, ... Am
incompatibles y equiprobables entre los n casos posibles incompatibles y equiprobables,
la probabilidad del suceso A es el nmero m de casos favorables dividido por el nmero
n de casos posibles.

22

Mdulo de Estadstica Aplicada a la Hidrologa

2.4
2.4.1

CONCEPTO DE DEPENDENCIA E INDEPENDENCIA ESTOCSTICA


Probabilidad condicionada

El anlisis de muchas situaciones lleva a identificar sucesos que condicionan,


probabilsticamente, la aparicin de otros. En la prctica, la identificacin de estos
sucesos se decide en funcin de la experiencia que se tenga sobre la materia en cuestin.
Desde el punto de vista probabilstico se considera la realizacin de un experimento en
el que se identifica n1 veces un suceso A. De la misma manera, se identifica que otro
suceso, B, se presenta n2 veces de esas n1 originales de A. La frecuencia relativa de B,
habindose presentado A es:
Ec. 24. Frecuencia relativa del suceso B condicionada a A

n2
n2
P ( A I B)
P=
= n =
n1 n1
P( A)
n
Tal como aparece en la ecuacin anterior, se puede a su vez considerar la frecuencia de
cada uno de estos sucesos respecto al nmero n total de experimentos y expresar la
probabilidad de B condicionada a A en funcin del cociente entre la probabilidad de la
interseccin de sucesos y la del suceso A (teorema del producto).
Dados dos sucesos A y B, se llama probabilidad del suceso B condicionada por el suceso
A, representado por P(B/A), a la probabilidad del suceso B supuesto que ha ocurrido A.
Ec. 25. Expresin de la probabilidad condicionada

P (B A) =

P( A I B )
P( A)

De la misma manera:
Ec. 26. Expresin de la probabilidad condicionada

P( A B ) =

P( B I A)
P( B )

Quedando:
Ec. 27. Relaciones entre la probabilidad condicionada y la interseccin de sucesos

P( A I B) = P( A)P( B A) = P ( B )P( A B )
En el caso de manejar tres sucesos, se tendra:

23

Estadstica Aplicada a la Hidrologa

Ec. 28. Probabilidad condicionada entre tres sucesos

P(C A I B) =

P(C I A I C ) P(C I A I C )
=

P( A I B)
P( A)P( B A)

P(C I A I C ) = P( A)P( B A)P (C A I B)


Y en el caso general:
Ec. 29. Probabilidad condicionada entre n sucesos

P( A1 I ... An ) = P ( A1 )P( A2 A1 )P( A3 A1 I A2 )...P ( An A1 I ... An 1 )


2.4.2

Dependencia e independencia de sucesos

Si se cumple que para dos sucesos de un experimento aleatorio, A y B,


Ec. 30. Independencia de sucesos

P( A) = P( A B) o P( B) = P( B A)
se dice que los sucesos son independientes. Es decir, la probabilidad de un suceso A es
la misma que condicionada a B, por lo que B no condiciona el suceso A.
Una segunda propiedad de los sucesos independientes es que la probabilidad del suceso
interseccin es el producto de probabilidades de los sucesos individuales:
Ec. 31. Propiedad de los sucesos independientes

P( A I B ) = P( A)P( B A) = P( B)P( A B)

P( B A) = P( B)
P ( A I B) = P ( A)P( B)

P( A B) = P( A)

La ltima propiedad a comentar es la que relaciona los sucesos incompatibles o


excluyentes con la dependencia. Se dice que si dos sucesos son incompatibles, son
dependientes.
Ec. 32. Dependencia de sucesos incompatibles

A I B = P( A I B) = 0 P ( A B) =

P( A I B)
= 0 P( A) P( A B)
P ( B)

Ejemplo: sean A1 y A2 dos sucesos independientes, distintos de E y . Demostrar que sus


complementarios son tambin independientes.

24

Mdulo de Estadstica Aplicada a la Hidrologa

Ind P( A1 I A2 ) = P ( A1 )P( A2 )
P( A1 ) = 1 P( A1 )
P( A1 )P ( A2 ) = 1 P( A1 ) P( A2 ) + P( A1 )P ( A2 )
P( A2 ) = 1 P( A2 )
P ( A1 )P( A2 ) = 1 P ( A1 U A2 ) = P( A1 U A2 ) = P( A1 I A2 )cqd
2.4.3

Teorema de la probabilidad total o compuesta

A partir de los conceptos de dependencia estocstica y de probabilidad condicionada se


han desarrollado una serie de teoremas que permiten realizar el clculo de la
probabilidad de un suceso A a partir del conocimiento de las probabilidades de otros
sucesos Bi y de las probabilidades condicionadas. Uno de estos teoremas es el de la
probabilidad total o compuesta que se expone a continuacin y otro el teorema de
Bayes o de la probabilidad inversa, que se tratar en el prximo apartado.
El teorema de la probabilidad total o compuesta se puede enunciar de la siguiente
forma: sea B un suceso que se puede descomponer en un conjunto de sucesos Bi
incompatibles de tal forma que:

U ( Bi ) = B
i

Bi I B j = (i j )
Sea A un suceso que solo se puede dar dentro de B, para el cual se conocen las
probabilidades condicionadas P(A/Bi) y supongamos que se conocen tambin las
probabilidades P(Bi). Se verifica:
Ec. 33. Probabilidad total o compuesta

P( A) = P( A / Bi ) P ( Bi )
i

Demostracin :Puesto que AB=A, se cumple:

P( A) = P( A I B) = P A I U Bi = P U[A I Bi ]
i

Y por ser los sucesos Bi disjuntos, se tiene aplicando el teorema 5:

P( A) = P( A I Bi )
i

Y, finalmente, a partir de la ecuacin de la probabilidad condicional o teorema del producto:

P( A) = P( A / Bi ) P ( Bi )
i

25

Estadstica Aplicada a la Hidrologa

Ejemplo: Se seleccionan caudales mnimos anuales de una estacin de aforos. Se trata de


obtener una expresin de la probabilidad de la serie de caudales mnimos aplicando el
teorema de la probabilidad total, distinguiendo entre caudales nulos y el resto. Se define
P(Q>q) como la probabilidad asociada a un caudal q de ser menor que uno dado Q.
Entonces,
P(Q q ) = P(Q q Q = 0)P (Q = 0) + P(Q q Q 0)P (Q 0)

P(Q q Q = 0) = 0

P (Q q) = P(Q q Q 0)P(Q 0)

P(Q q ) = k P (Q q Q 0)
m
P(Q 0) = = k

n
donde n es el nmero total de caudales mnimos seleccionados, m es el nmero de
caudales distintos de cero y se cumple que la probabilidad de obtener un caudal q menor
que uno dado Q igual a cero es nula.
2.4.4

Teorema de Bayes o de la probabilidad inversa:

Sea E el universo o espacio muestral que suponemos se puede descomponer en un


conjunto de sucesos Bi de tal forma que:

U( Bi ) = E
i

Bi I B j = (i j )
Sea A un suceso para el cual se conocen las probabilidades condicionadas P(A/Bi). Se
verifica:
Teorema de Bayes
P( Bi / A) =

P ( Bi ) P( A / Bi )
P( Bi ) P( A / Bi )
i

Demostracin : Por la ecuacin de la probabilidad condicional o teorema del producto, se tiene:

P( Bi / A) =

P( Bi A)
P( A)

Y por el mismo teorema:

P( Bi A) = P ( Bi ) P( A / Bi )
Por el teorema de la probabilidad total:

P( A) = P( A / Bi ) P ( Bi )
i

26

Mdulo de Estadstica Aplicada a la Hidrologa

Y sustituyendo las dos ltimas expresiones en la obtenida para P(Bi/A), se obtiene el resultado
buscado:

P( Bi / A) =

P ( Bi ) P( A / Bi )
P( Bi ) P( A / Bi )
i

Ejemplo: En una determinada zona se pueden registrar tormentas generadas por dos
tipos de fenmenos meteorolgicos: lluvias de carcter convectivo y lluvias producidas
por frentes de bajas presiones (ciclones o borrascas). La probabilidad de que la
precipitacin registrada por un pluvimetro durante un aguacero sea una u otra depende
del tipo de fenmeno meteorolgico que ocurra. A partir del estudio de las
precipitaciones producidas por distintos tipos de aguaceros, se ha llegado a determinar
las siguientes probabilidades para las precipitaciones:
P < 100 mm

P > 100 mm

Lluvia convectiva

0,96

0,04

Lluvia ciclnica

0,99

0,01

Tambin se sabe que solo un tercio de los aguaceros de la zona son de tipo ciclnico. Si
la precipitacin registrada en el pluvimetro durante un aguacero es inferior a 100 mm:
a) Calcular la probabilidad de que el aguacero haya sido de tipo convectivo.
b) Lo mismo para un aguacero de tipo ciclnico, si la precipitacin
registrada ha sido mayor de 100 mm.

a) Si llamamos suceso B1 a que el aguacero sea de tipo convectivo y suceso B2 a que sea
de tipo ciclnico, se verifica:

U( Bi ) = E
i

Bi I B j = (i j )
La probabilidad de estos sucesos Bi es:

P( B1 ) = 2 / 3
P ( B2 ) = 1 / 3
Por tanto, si definimos el suceso A1 como el registro de una precipitacin inferior a 100
mm durante un aguacero, se tendr:

27

Estadstica Aplicada a la Hidrologa

P( A1 / B1 ) = 0,96
P( A1 / B2 ) = 0,99
Y, por tanto, aplicando el teorema de Bayes:

P( B1 / A1 ) =

P( B1 ) P( A1 / B1 )
( 2 / 3)0,96
=
= 0,66
P( B1 ) P( A1 / B1 ) + P( B2 ) P( A1 / B2 ) (2 / 3)0,96 + (1 / 3)0,99

b) Si ahora llamamos A2 al registro de una precipitacin superior a 100 mm durante un


aguacero, se tendr:

P( A2 / B1 ) = 0,04
P( A2 / B2 ) = 0,01
Y aplicando el teorema de Bayes:
P( B2 / A2 ) =

2.5

P ( B2 ) P( A2 / B2 )
(1 / 3)0,01
=
= 0,11
P ( B1 ) P( A2 / B1 ) + P( B2 ) P( A2 / B2 ) ( 2 / 3)0,04 + (1 / 3)0,01

ELEMENTOS DE COMBINATORIA Y PROBABILIDAD

La combinatoria sirve de ayuda al clculo de probabilidades al permitir calcular el


nmero de casos que cumplen determinadas condiciones.
2.5.1

Variaciones o permutaciones de n elementos tomados de r en r

Se tienen n elementos y se escogen r de ellos uno a uno. Se desea saber cuntos


resultados posibles se pueden obtener, es decir, cuntas maneras distintas hay de
escoger r considerando el orden de eleccin. Es un problema de variaciones de n
elementos tomados de r en r y se resuelve considerando que en la primera eleccin se
tienen n posibilidades, en la segunda n-1, y as sucesivamente hasta la r-sima, en la que
se tienen n-r+1 posibilidades. La expresin matemtica de las variaciones es la
siguiente:
Ec. 34. Variaciones de n elementos tomados de r en r

Vrn = n( n 1)...( n r + 1) =

2.5.2

n!
(n r )!

Permutaciones

Las permutaciones son el nmero de maneras posibles en que se pueden ordenar n


elementos, es decir, el nmero de variaciones de n elementos tomados de n en n.

28

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 35. Permutaciones de n elementos

Pn = n!
2.5.3

Variaciones con repeticin

Idntica a las variaciones pero admitiendo la repeticin de los elementos. El total de


sucesos posibles es de:
Ec. 36. Variaciones con repeticin de n elementos tomados de r en r

VRrn = n r
2.5.4

Permutaciones con repeticin


Ec. 37. Permutaciones con repeticin de n elementos

PRn = n n
2.5.5

Combinaciones

Si se tiene el mismo caso anterior, pero sin importar el orden en que se escogen los r
elementos, se pasa a un problema de combinaciones. Si se considera que el nmero total
de permutaciones de r elementos es r!, el nmero de combinaciones ser el de
variaciones de n elementos tomados de r en r, dividido entre r!.
Ec. 38. Combinaciones

C rn =

2.5.6

Prn n
n!
= =
r! r r!( n r )!

Combinaciones con repeticin


Ec. 39. Combinaciones con repeticin

n
n 1
n 1
+ ... + n

CRrn = + n
r
r 1
n r + 1
2.6
2.6.1

OBSERVACIONES REPETIDAS
Observaciones con reemplazamiento

Se quiere estimar la probabilidad de extraer de una urna con n1 bolas blancas y n2 negras
(N=n1+n2), r bolas blancas. Siendo n el total de bolas extradas. Considerando las
posibles combinaciones con xito, queda:

29

Estadstica Aplicada a la Hidrologa

Ec. 40. Probabilidad de las observaciones con reemplazamiento

n r
nr
P = p (1 p )
n2
r

1 p = P (negra ) =
N
p = P (blanca) =

n1
N

En el caso de ms de dos opciones, si hay ni bolas de cada clase y se quieren extraer mi


de cada una, la probabilidad queda:
Ec. 41. Probabilidad de las observaciones con reemplazamiento y ms de dos clases
mk
m1
n = ni
n!
n1
nk
...
P =
m1!...mk ! N
mi / clase
N

2.6.2

Observaciones sin reemplazamiento

En este caso el problema vara porque con cada extraccin, cambian las condiciones de
experimentacin. El nmero total de casos posibles de extracciones de r elementos de
N
una urna con un total de N es . Si de estos casos se pretende calcular la
n

n1 n 2
.
probabilidad de que m1 sean blancas, el nmero de casos favorables ser
m1 r m1
La probabilidad buscada es:
Ec. 42. Probabilidad de las observaciones sin reemplazamiento

n1 n 2

m1 n m1

P=
N

n
Este ejemplo se puede extender al caso de ms de dos clases (Gmez Espadas).
Ec. 43. Probabilidad de las observaciones sin reemplazamiento y ms de dos clases

n1 n 2 nk
...
mk
m m
P = 1 2
N

n
2.6.3

Otros casos de observaciones repetidas

Para un fenmeno aleatorio cualquiera se tendrn las siguientes probabilidades


asociadas a la presentacin de un suceso aleatorio A durante n experimentos. La

30

Mdulo de Estadstica Aplicada a la Hidrologa

presentacin de cada suceso A es independiente entre los distintos ensayos y tiene


probabilidad p.
1. La probabilidad de que A se presente en las n repeticiones del experimento es:
Ec. 44. Probabilidad de que se presente A siempre en n repeticiones

P( A I ... A) = p p.. p = p n
2. La probabilidad de que A no se presente en ninguno de los n ensayos es:
Ec. 45. Probabilidad de que no se presente A en n repeticiones

P( A I ... A) = (1 p)(1 p )..(1 p ) = (1 p ) n


3. La probabilidad de que A se presente al menos una vez es:
Ec. 46. Probabilidad de se presente A al menos una vez en n repeticiones

1 P( A I ... A) = 1 (1 p ) n
4. La probabilidad de que A se presente r veces del total n es, como se ha indicado
en el apartado 2.6.1:
Ec. 47. Probabilidad de que A se presente r veces de n

n r
p (1 p ) n r
r
5. La probabilidad de que A se presente entre r1 y r2 veces es:
Ec. 48. Probabilidad de que A se presente entre r1y r2 veces de n
r2

r = r1

r p

(1 p) n r

Ejemplo: Calcular el riesgo de que un caudal mximo anual con periodo de retorno
asociado T sea superado alguna vez durante los t aos siguientes.
1. Probabilidad de que en un ao esa avenida sea superada si corresponde a un
periodo de retorno de T aos
P(Q QT ) =

1
T

2. Probabilidad de no ser superada en un ao


P(Q QT ) = 1

1
T

31

Estadstica Aplicada a la Hidrologa

3. Probabilidad de no ser superada durante t aos consecutivos


1

P = 1
T

4. Riesgo o probabilidad de ser superada alguna vez durante t aos consecutivos


1

R = 1 1
T

32

Mdulo de Estadstica Aplicada a la Hidrologa

PRCTICA I
Se tienen los siguientes datos de caudal mximo anual medidos en una estacin de
aforos:
AO

CAUDAL (m3/s)

376

464

454

254

120

105

186

398

1600

10

410

11

142

12

80

13

100

14

380

15

214

16

137

17

207

18

464

19

138

20

964

1.Cul es el espacio muestral del fenmeno aleatorio?


2.Utilizando el criterio de Von Mises, calcular:
a)La probabilidad de que durante un ao se superen los 200 m3/s.
b)La probabilidad de que no se superen los 500 m3/s.
c)A partir de los dos resultados anteriores, la probabilidad de que el
mximo caudal medido durante un ao se site entre 200 m3/s. y 500
m3/s.
3.Calcular la probabilidad de los siguientes sucesos:
a)Que se superen los 200 m3/s. durante cinco aos consecutivos.
b)Que durante cinco aos consecutivos no se supere ningn ao los 200
m3/s.
c)Que durante cinco aos consecutivos se superen los 200 m3/s. al menos
una vez.
d)Que durante cinco aos consecutivos se superen los 200 m3/s. en tres
de los aos.

33

Estadstica Aplicada a la Hidrologa

Solucin:
1. El espacio muestral ser cualquier resultado posible al realizar una medida de caudal
en un ro, es decir, todos los nmeros reales positivos y el cero:
E = + + {0}
2. a) A partir de los datos de la tabla, se divide el nmero de aos en los que se ha
medido un caudal superior a 200 m3/s. por el nmero total de datos:
P(Q > 200) =

12
= 0,6
20

b) Igual que el apartado anterior pero considerando el nmero de aos en los que se ha
medido un caudal inferior a 500 m3/s.:
P(Q < 500) =

18
= 0,9
20

c) El suceso Q<500 se puede expresar como la unin de:


(Q < 500) = (Q < 200) ( 200 < Q < 500)
Como los sucesos (Q<200) y (200<Q<500) son incompatibles, se tiene:
P(Q < 500) = P (Q < 200) + P (200 < Q < 500)
P( 200 < Q < 500) = P (Q < 500) P (Q < 200)
Como (Q<200) es el complementario de (Q>200):
P(Q < 200) = 1 P(Q > 200) = 1 0,6 = 0,4
Por tanto:
P( 200 < Q < 500) = P (Q < 500) P(Q < 200) = 0,9 0,4 = 0,5
3. a) La probabilidad de superar los 200 m3/s. a lo largo de un ao se ha calculado
anteriormente y es igual a 0,6. Que se supere durante cinco aos consecutivos ser igual
a la interseccin de los sucesos correspondientes a que se supere el caudal en cada uno
de los cinco aos, y como los sucesos son independientes:
P( 200 < Q5 aos ) = P(i =1 200 < Qaoi ) = i =1 P( 200 < Qaoi ) = 0,6 5 = 0,078
5

b) Se resuelve igual que el apartado anterior pero con las probabilidades del suceso
complementario:
P( 200 > Q5aos ) = P (i =1 200 > Qaoi ) = i =1 P( 200 > Qaoi ) = (1 0,6) 5 = 0,01
5

34

Mdulo de Estadstica Aplicada a la Hidrologa

c) El suceso que durante cinco aos se supere el caudal de 200 m3/s. al menos una vez
es el complementario del suceso que no se supere nunca en los cinco aos. Por tanto, su
probabilidad se puede obtener como:
P( 200 < Qalmenosunao ) = 1 P (200 > Q5 aos ) = 1 0,01 = 0,99
d) Se resuelve aplicando la frmula expuesta en el apartado 2.6.1. o en el 2.6.3., para el
caso de que el nmero de experimentos sea 5 y el nmero de casos favorables 3.

n
5
P( 200 < Q3aos ) = p r (1 p ) nr = 0,6 3 (1 0,6) 2 = 0,346
r
3

35

Estadstica Aplicada a la Hidrologa

PRCTICA II
Junto con los datos de caudal del ejercicio anterior, se tienen los siguientes datos de
precipitacin mxima diaria medidos en un pluvimetro:
AO

PRECIPITACIN (mm)

120

205

180

100

50

40

105

125

400

10

210

11

55

12

20

13

35

14

150

15

95

16

70

17

155

18

220

19

75

20

310

1.Calcular la probabilidad de que la precipitacin medida en el pluvimetro sea superior


a 200 mm. si se sabe que el caudal medido en la estacin de aforos ha superado los 300
m3/s. Lo mismo para el caso en que no se hayan superado los 300 m3/s.
2.Calcular la probabilidad de que durante el mismo ao el caudal supere los 300 m3/s. y
la precipitacin los 200 mm.
3.Utilizando la informacin obtenida en los dos apartados anteriores calcular la
probabilidad de que el caudal sea mayor de 300 m3/s. si la medida del pluvimetro es
superior a los 200 mm.
Solucin:
1. Se obtiene a partir de los datos de las tablas, dividiendo el nmero de aos en los que
simultneamente el caudal ha superado los 300 m3/s. y la precipitacin los 200 mm, por
el nmero de aos en los que el caudal ha superado los 300 m3/s. El segundo caso se
resuelve igual pero considerando el nmero de aos en los que el caudal no ha superado
los 300 m3/s. y la precipitacin s ha superado los 200 mm.

36

Mdulo de Estadstica Aplicada a la Hidrologa

P( 200 < P / 300 < Q ) =

5
= 0,556
9

P( 200 < P / 300 > Q) =

0
=0
11

2. La probabilidad pedida es la de la interseccin de los sucesos (300<Q) y (200<P). A


partir de la definicin de probabilidad condicionada:
P( 200 < P / 300 < Q) =

P (300 < Q 200 < P)


P (300 < Q)

P(300 < Q 200 < P ) = P (200 < P / 300 < Q )P(300 < Q )
La probabilidad condicionada se ha calculado en el primer apartado y la probabilidad
P(300<Q) se puede obtener a partir de los datos de caudal de la prctica I.
P(300 < Q) =

9
= 0,45
20

P(300 < Q 200 < P ) = P (200 < P / 300 < Q)P(300 < Q ) = 0,5560,45 = 0,25
3. Se resuelve mediante el teorema de Bayes, dividiendo el espacio muestral en dos
sucesos disjuntos: (300<Q) y (300>Q).
E = (300 < Q) (300 > Q)
(300 < Q) (300 > Q) =
Por tanto, se tendr:
P (300 < Q / 200 < P ) =

P(300 < Q )P( 200 < P / 300 < Q)


0,450,556
=
=1
P (300 < Q)P( 200 < P / 300 < Q) + P(300 > Q)P( 200 < P / 300 > Q) 0,450,556 + (1 0,45)0

37

Estadstica Aplicada a la Hidrologa

38

Mdulo de Estadstica Aplicada a la Hidrologa

3
3.1

ESTADSTICA DESCRIPTIVA
INTRODUCCIN

En los apartados siguientes se revisan procedimientos para la descripcin estadstica de


variables. Los datos se manejan para obtener informacin. Esta descripcin se realiza
mediante estadsticos calculados con los valores numricos de la muestra, grficos y
resmenes para presentar la informacin. Estos procedimientos se han escogido de la
generalidad de tcnicas que aparecen en los manuales de estadstica consultados,
aplicndolos sobre ejemplos de variables hidrolgicas.
Los datos hidrolgicos suelen tener una serie de propiedades destacadas por Hensel y
Hirsch (2002):
1. Las variables hidrolgicas suelen ser positivas y tienen como lmite inferior
cero. Es el caso de caudales medios anuales, caudales mximos, precipitacin
mensual, evapotranspiracin anual, etc.
2. Dentro del conjunto de datos registrados hay valores extremos, alejados de la
concentracin de datos normales.
3. Las distribuciones de frecuencia suelen estar sesgadas con signo positivo como
consecuencia de la aparicin de datos extremos con valor superior a los del
dominio central.
4. La consecuencia de tener distribuciones de frecuencia sesgadas es no seguir
funciones de distribucin normal.
5. Los datos que constituyen las muestras pueden haber sido recogidos con la
condicin de superar un umbral, por ejemplo el de sensibilidad del equipo de
medida
6. Hay presencia de patrones estacionales y de otras fluctuaciones que hacen que
los datos tengan diferentes propiedades en funcin del momento en el que se
registran.
7. Hay autocorrelacin, es decir, a un valor alto tiende a sucederle otro alto, y a uno
bajo, otro bajo.
8. Hay una dependencia de variables no controladas
Adems, se registran en un determinado momento y en un determinado lugar. Por
constituir series temporales, el orden del registro aporta informacin sobre el proceso.
Otra de las caractersticas bsicas de las variables hidrolgicas es su contexto espacial.
Los datos hidrolgicos estn influidos por caractersticas fisiogrficas y locales por lo
que el estudio del contexto espacial tambin ofrece claves para comprensin. En este
sentido hay que destacar la importancia que tiene la referencia geogrfica de los datos y
la ayuda que supone la utilizacin de sistemas de informacin geogrfica.

39

Estadstica Aplicada a la Hidrologa

El objetivo de la descripcin de las variables es, en primer lugar, conocer, extraer y


presentar informacin de los datos registrados. A medida que se avanza en el
conocimiento del fenmeno, se va pasando a problemas de inferencia o prediccin, por
ejemplo, a la aplicacin de tests estadsticos para el reconocimiento de determinadas
caractersticas, para la deteccin de inconsistencias en las series, para la interpretacin
de los resultados o para su utilizacin posterior, por ejemplo, en modelos hidrolgicos,
en el relleno de lagunas, etc.
El anlisis organiza los datos segn diferentes patrones que permitan extraer de ellos
informacin. No se debe olvidar que la aplicacin de ciertos patrones de estudio y la
abstraccin de los datos en grficos, estadsticos, etc. puede filtrar parte de la
informacin que se encuentra en los datos. La aplicacin de modelos y pautas de estudio
supone imponer una estructura a los datos que puede llegar a sustituir a la propia
realidad, seleccionando aspectos particulares y simplificando su complejidad.
Previamente a todo el anlisis se debe disponer y preparar un conjunto de datos (base de
datos) en el que hay varios aspectos a considerar (Kundzewicz et al., 2000). En estos
apuntes se destacan:
1. La calidad de los datos registrados y el conocimiento del proceso de medida de
las variables utilizadas. El control de la calidad con la que se registran los datos,
cmo se han registrado, con qu medios y la historia de la medicin ha de ser
anterior a su utilizacin y han de considerarse los efectos que tengan incidencia
en los aspectos que se estudien. En concreto, es de inters conocer cuando sea
posible:
a. Medios utilizados
b. Calidad de las medidas
c. Historia de los registros: hay cambio de tcnicas y tecnologa de la
medicin a lo largo del tiempo?
Estos aspectos relacionados con la calidad de la medida son muy importantes
porque permiten dar explicacin a problemas que surgen en la utilizacin de las
series. Normalmente, es difcil conocer estos detalles de las mediciones, sobretodo
cuando se manejan importantes volmenes de informacin, como en el caso de la
simulacin hidrolgica, en la que se han de manejar datos meteorolgicos e
hidromtricos de varias estaciones distintas. No obstante, tambin hay tcnicas que
permiten identificar heterogeneidades e inconsistencias en las series.
2. Existen tambin otros aspectos relacionados con la disponibilidad de datos
temporales y con el intervalo temporal de referencia escogido para el estudio.
As se puede destacar la importancia que tienen los siguientes aspectos de cara a
la utilizacin de las variables:
a. Longitud de las series de registros.
b. Existencia de lagunas y periodos intermedios sin datos. Lgicamente, la
abundancia de lagunas dificulta la derivacin de las caractersticas de las
series

40

Mdulo de Estadstica Aplicada a la Hidrologa

c. Frecuencia de los datos e intervalo temporal de trabajo, horario, diario,


mensual, anual,... con la consiguiente aparicin de distintas fluctuaciones
similares a la estacionalidad dependientes de ese intervalo temporal de
trabajo
3. Los procesos seguidos para la estimacin de la variable en estudio. Es decir, en
el caso de una variable como la humedad relativa media mensual, conocer cmo
se ha derivado un valor mensual a partir de los datos diarios u horarios y la
posibilidad de introducir sesgos en las estimaciones.
4. Por ltimo, en los textos consultados tambin se considera previo al inicio de la
descripcin de los datos, el conocimiento de las posibilidades que ofrece el uso
de transformaciones que simplifiquen su utilizacin posterior.
En los siguientes apartados se repasan elementos bsicos del anlisis univariado y del
bivariado, as como tcnicas sencillas para el anlisis de los efectos de la temporalidad
en las series. El caso del anlisis del contexto espacial se deja para el mdulo de
estadstica.

3.2

ANLISIS UNIVARIADO

Este apartado se centra en la descripcin de los datos de una variable. Con generalidad,
las variables pueden ser cualitativas o cuantitativas, discretas o continuas. Cada tipo de
variable permite un tipo de ordenacin para trabajar numricamente con ellas. Las
ordenaciones y escalas se establecen en funcin de criterios como mayor/menor que,
igualdad/desigualdad, valoracin numrica de las diferencias entre dos modalidades y
distancias al origen absoluto de la variable (Bosque Sendra, 1997). Estos criterios
constituyen las herramientas sobre las que se basan las descripciones de elementos.
3.2.1

Herramientas grficas

Con variables cualitativas o cuantitativas, el primer paso para su descripcin puede ser
la ordenacin de los registros en tablas. Estas tablas se construyen al conocer una
cualidad y ordenar el nmero de casos registrados para cada caso de la cualidad
identificada. Por ejemplo, si se piensa en conocer qu estacin es la ms proclive a la
presentacin de mximos anuales, se pueden ordenar los datos en una tabla donde
aparezcan el nmero de mximos asociados a cada mes y utilizar un diagrama circular
para su descripcin. En la figura se aprecia que la mayora de los casos se dan entre los
meses de septiembre a diciembre, con nula aparicin de mximos, en la serie disponible,
durante los meses de junio a agosto.
Mes
Nmero de mximos

Oct Nov Dic Ene Feb Mar Abr May Jun Jul Ago Sep TOTAL
12

36

41

Estadstica Aplicada a la Hidrologa

Oct Nov Dic Ene Feb Mar Abr May Jun Jul Ago Sep TOTAL

Mes

Junio
0%

Julio
0%

Mayo
3%

Agosto
0%
Septiembre
8%

Abril
8%

Octubre
34%

Marzo
8%

Febrero
0%

Enero
6%

Diciembre
14%

Noviembre
19%

Figura 1. Grfica de sectores


Tabla 1. Estacionalidad de los mximos anuales de una estacin pluviomtrica.

En el caso anterior se ilustra un concepto importante sobre el estudio de lluvias


mximas. Los grficos son tambin herramientas inductivas que permiten analizar los
datos en busca de caractersticas, Con una serie temporal, lo ms sencillo es representar
los valores en funcin del orden en que se van tomando. La representacin grfica de
los datos en su evolucin temporal (Tabla 2), permite extraer unas primeras
consecuencias sobre la informacin subyacente. En el siguiente ejemplo, realizado con
valores anuales de precipitacin registrados en la estacin pluviomtrica A, se pueden
extraer unas primeras conclusiones acerca de los diferentes periodos, de la diferente
variabilidad, etc.
Ao 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958

Pluvio
31
20
21
23
22
21
29
34
22
17
22
38
18
15
12
33
22
27
(mm)
Ao 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976

Pluvio
(mm)

42

34

29

32

26

35

34

25

27

27

28

36

23

34

26

35

36

25

24

Mdulo de Estadstica Aplicada a la Hidrologa

Periodo de medidas 1941-1976.


Nmero total de datos: 36

Precipitacin registrada (mm)

40
35
30
25
20
15
10
1976
1975
1974
1973
1972
1971
1970
1969
1968
1967
1966
1965
1964
1963
1962
1961
1960
1959
1958
1957
1956
1955
1954
1953
1952
1951
1950
1949
1948
1947
1946
1945
1944
1943
1942
1941

Tiempo (aos)

Figura 2. Grfica de evolucin temporal


Tabla 2. Valores anuales de precipitacin en un pluvimetro A.

En el caso anterior se ha dibujado una serie anual de 36 datos por lo que hay espacio
suficiente para poder contemplar las propiedades generales de la serie. Si se dispone de
una serie mensual con un mayor nmero de datos, se puede, bien utilizar los datos
anuales para obtener conclusiones desde la escala superior o bien, utilizar una o varias
grficas, dividiendo el dominio en varios tramos a costa de impedir la visin general.
800
700
600
500
400
300
200
100

ene-00

ene-97

ene-94

ene-91

ene-88

ene-85

ene-82

ene-79

ene-76

ene-73

ene-70

ene-67

ene-64

ene-61

ene-58

ene-55

ene-52

ene-49

ene-46

ene-43

ene-40

ene-37

ene-34

ene-31

ene-28

Figura 3. Serie mensual de precipitaciones

Cuando se dibuja una serie puede plantearse la posibilidad de utilizar alguna


transformacin de los datos, por ejemplo logartmica, til cuando hay valores extremos

43

Estadstica Aplicada a la Hidrologa

que imponen una variabilidad dominante. La transformacin logartmica reduce la


variabilidad de los datos y destaca los valores ms bajos, pero no se pueden utilizar con
valores nulos en la serie.
1000

100

10

ene-00

ene-96

ene-92

ene-88

ene-84

ene-80

ene-76

ene-72

ene-68

ene-64

ene-60

ene-56

ene-52

ene-48

ene-44

ene-40

ene-36

ene-32

ene-28

Figura 4. Serie logartmica de precipitaciones mensuales

Las transformaciones se usan con tres objetivos (Hensel y Hirsch, 2002): reducir la
asimetra de las variables, linealizarlas o buscar la homocedasticidad, es decir, hacer de
la variabilidad en la variacin algo constante. Utilizando la informacin de estos dos
autores, las caractersticas de las principales transformaciones son:
Tipo de
transformacin

Utilizada para

x3
x2

x 3
log(x )
1
x
1

x2

Efecto sobre las variables

Reducir el sesgo
negativo
Reducir el sesgo
negativo
Reducir el sesgo
positivo
Reducir el sesgo
positivo
Reducir el sesgo
positivo
Reducir el sesgo
positivo

Comprime los valores bajos;


expande los valores altos
Comprime los valores bajos;
expande los valores altos
Expande los valores bajos;
comprime los valores altos
Expande los valores bajos;
comprime los valores altos
Expande los valores bajos;
comprime los valores altos
Expande los valores bajos;
comprime los valores altos

Reducir el sesgo
positivo

Expande los valores bajos;


comprime los valores altos

Reducir el sesgo
positivo

Expande los valores bajos;


comprime los valores altos

Tabla 3, Tipos de transformaciones

44

Comentarios

No se puede utilizar con datos


nulos.
No se puede utilizar con datos
nulos.
El signo preserva el orden de
las observaciones
No se puede utilizar con datos
nulos.
El signo preserva el orden de
las observaciones
No se puede utilizar con datos
nulos.
El signo preserva el orden de
las observaciones

Mdulo de Estadstica Aplicada a la Hidrologa

Si la serie tiene muchos puntos, puede ser conveniente agregar los datos en valores o
elegir estadsticos que simplifiquen la serie. En el caso del ejemplo de la Figura 4, se
pueden agregar los datos en totales anuales. Para tener una primera idea de cules son
los movimientos que hay en la serie, se puede aadir una curva suavizada que destaque
adecuadamente los cambios en la serie. La Figura 5 incorpora una curva suavizada
obtenida a partir de una media mvil de 11 aos. Esta lnea suavizada permite
contemplar una oscilacin y definir las caractersticas de un periodo. La determinacin
de este tipo de curvas se tantea buscando describir adecuadamente la serie analizada.
1800
1600
1400
1200
1000
800
600
400
200

19

40
19 41
43
19 44
46
19 47
49
19 -50
52
19 53
55
19 56
58
19 59
61
-6
19 2
64
19 65
67
19 68
70
19 71
73
-7
19 4
76
19 77
79
19 80
82
19 -83
85
19 86
88
-8
19 9
91
19 92
94
19 95
97
-9
20 8
00
-0
1

Figura 5. Datos anuales de precipitacin y curva suavizada superpuesta

En resumen, se recomienda la utilizacin de transformaciones, divisiones del dominio


de los datos y el uso de estadsticos y agregaciones para ir destacando las caractersticas
ms importantes de la serie.
En el caso de que los datos se registren con cierta erraticidad, es recomendable
dibujarlos con grficos de puntos. A los puntos se les puede aadir una curva de
tendencia suavizada que destaque la evolucin de la serie. Es el caso aplicable a series
piezomtricas que no se registran de forma regular. El ajuste para ver la tendencia y
evolucin de la serie puede realizarse con medias mviles.
224,50

224,50

224,00

224,00

223,50

223,50

223,00

223,00

222,50

222,50

222,00

222,00

221,50

221,50

221,00
28/08/76

221,00
17/09/78

06/10/80

26/10/82

14/11/84

04/12/86

23/12/88

12/01/91

31/01/93

20/02/95

11/03/97

28/08/76

17/09/78

06/10/80

26/10/82

14/11/84

04/12/86

23/12/88

12/01/91

31/01/93

20/02/95

11/03/97

Figura 6. Niveles piezomtricos.

45

Estadstica Aplicada a la Hidrologa

3.2.2

Asignacin de frecuencias

Ya aparece en los ejemplos anteriores y es una de las formas ms sencillas de describir


un conjunto de datos. Las frecuencias relativas se definen como el cociente entre el
nmero de veces que se observa un suceso y el nmero total de datos (Ec. 4). En
variables cualitativas se pueden posteriormente representar en un diagrama de Pareto,
clases frente a frecuencias, para identificar las frecuencias mximas, las mnimas o la
forma de la distribucin de frecuencias.
35

Frecuencia relativa (%)

30

25

20

15

10

Se

pt
ie
m
br
e

go
sto

io
Ju
l

io
Ju
n

M
ay
o

br
il
A

o
M
ar
z

o
Fe
br
er

En
er
o

br
e

iem

br
e

ov

ctu
N

ici
em
br
e

Figura 7. Diagrama de Pareto con una variable cualitativa

El grfico anterior se aplica tambin sobre variables cuantitativas. En el caso de


variables cuantitativas, hay que realizar una operacin previa de agrupamiento en
clases. Se ha de dividir el rango de la serie en intervalos discretos, contando el nmero
de medidas que se encuentran en cada uno de ellos y transformando stas en
porcentajes. Para determinar la amplitud y localizacin de los intervalos, se suelen
utilizar estadsticos como la media y desviacin tpica, etc., o fijar amplitudes
constantes en funcin del recorrido de la variable y del nmero de clases total, que el
usuario debe ir adaptando a cada situacin. Algunas reglas hacen depender el nmero de
clases del tamao de la muestra, n, como por ejemplo ent ( n ) ent ( 2 n ) y
ent (1 + 3,3 log n ) siendo ent la funcin parte entera. Convienen probar con diferente
nmero de clases (entre 5 y 20 est recomendado) hasta alcanzar la descripcin ms
clara. Tal como se puede comprobar, en el ejemplo de las precipitaciones anuales, con
un tamao de muestra de 36, se han tomado 8 clases de igual amplitud, 3, distribuidas
entre los valores mximo y mnimo. El resultado final se dibuja como un grfico de
barras denominado histograma de frecuencias (Tabla 4). Las hojas de clculo tienen
implementada la posibilidad del tanteo y ajuste de un histograma a un nmero de clases
con unos lmites definidos por el usuario.

46

Intervalo

Nmero de ocurrencias

Frecuencia observada

x < 17

5,6

Mdulo de Estadstica Aplicada a la Hidrologa

Intervalo

Nmero de ocurrencias

Frecuencia observada

17 x < 20
20 x < 23
23 x < 26
26 x < 29
29 x < 32
32 x < 35
35 x

2
7
5
6
3
6
5

5,6
19,4
13,9
16,7
8,2
16,7
13,9

Frecuencia observada (%)

25

20

15

10

0
<17

17-20 20-23 23-26 26-29 29-32 32-35

> 35

Figura 8. Diagrama histograma de frecuencias


Tabla 4. Histograma de frecuencias

El proceso completo para la estimacin de un histograma de frecuencias puede


resumirse en la siguiente figura.
Redondeo

Tanteo del nmero


de clases

Definicin de los
lmites de clase

Estimacin de
frecuencias relativas

Figura 9. Agrupamiento y elaboracin de un histograma

Una vez elaborado el histograma de frecuencias se puede intentar contestar a las


siguientes preguntas:
1. La distribucin es simtrica o asimtrica respecto a los valores de mxima
frecuencia?
2. Qu variabilidad hay en la muestra?
3. Hay mezcla de distribuciones o mximos de frecuencia separados por clases
intermedias?
4. Existen truncamientos en la muestra o, por el contrario, la frecuencia de los
extremos se va reduciendo suavemente?
De la misma manera se pueden obtener las frecuencias acumuladas como aquellas que
representan el nmero de casos ocurridos con valor menor que cada uno de los umbrales
escogidos. La traduccin de estas frecuencias al concepto de probabilidades de

47

Estadstica Aplicada a la Hidrologa

ocurrencia es inmediata: la probabilidad de que se recoja un valor menor a otro dado


coincide con la frecuencia acumulada correspondiente.
Intervalo

Nmero de ocurrencias

x < 17
x < 20
x < 23
x < 26
x < 29
x < 32
x < 35
x < 38

Frecuencia acumulada
2
4
11
16
22
25
31
36

5,6
11,2
30,6
44,5
61,2
69,4
86,1
100,0

100

Frecuencia acumulada (%)

90
80
70
60
50
40
30
20
10
> 35

32-35

29-32

26-29

23-26

20-23

17-20

< 17

Intervalos de precipitacin (mm)

Figura 10. Grfico de frecuencias acumuladas


Tabla 5. Histograma de frecuencias acumuladas

Es tambin usual utilizar frmulas que asignan una probabilidad de igualar o superar un
valor de la serie xm en funcin del orden m que ocupa en la misma. Es decir, asignan la
probabilidad a cada uno de los valores de la serie y no por intervalos. Para ello, se ha de
proceder a ordenar la serie de mayor a menor y aplicar una de las frmulas existentes
que, con carcter general, pueden expresarse en funcin de un parmetro b (Chow,
1994). Como se puede comprobar, estas frmulas corrigen la asignacin de
probabilidades a los extremos por otras ligeramente distintas, tal y como se puede
comprobar en el ejemplo donde se ha aplicado la formulacin de Gringorten:

P( X < x m ) = 1

mb
n +1 2b

Mtodo
Hazen
Chegodayev

Valor de b
0,5
0,3

Weibull

Blom

3/8

Tukey

1/3

Gringorten

0,44

Tabla 6. Frmulas no paramtricas de probabilidad

A partir de la asignacin de frecuencias y probabilidades realizada, puede ser de inters


comprobar en qu grado la muestra puede o no ajustarse a distribuciones de

48

Mdulo de Estadstica Aplicada a la Hidrologa

probabilidad conocidas. Para este propsito se utilizan papeles probabilsticos como el


normal, logartmico normal, de Gumbel, etc. En ellos, las abscisas y ordenadas se han
escalado adecuadamente para linealizar la funcin de distribucin asociada. De esta
manera, si una muestra se ajusta a determinada funcin de distribucin, sus datos
aparecern alineados en la correspondiente grfica, facilitando la realizacin de
interpolaciones y extrapolaciones.
Serie de valores

P(X<xm)
Serie de valores
P(X<xm)
Gringorten, %
Gringorten, %

38
36
36
35
35
34
34
34
34
33
32
31
29
29
28
27
27
27

98
96
93
90
87
85
82
79
76
74
71
68
65
62
60
57
54
51

26
26
25
25
24
23
23
22
22
22
22
21
21
20
18
17
15
12

49
46
43
40
38
35
32
29
26
24
21
18
15
13
10
7
4
2

40
35

Precipitacin (mm)

30
25
20
15
10
5
0
0

20

40

60

80

100

120

Frecuencia acumulada (%)

Tabla 7. Asignacin de probabilidad de ocurrencia

49

Estadstica Aplicada a la Hidrologa

40

100

35

Precipitacin (mm)

Precipitacin (mm)

30
25
20
15

10

10
5
1

0
-3

-2

-1

-3

-2

-1

Figura 11. Frecuencias en papel normal y logartmico normal.

Otra posibilidad de estudio de una muestra consiste en obtener resmenes numricos de


la misma. Son las medidas de localizacin, dispersin y forma:
3.2.3

Medidas de localizacin.

Son valores estadsticos que pretenden dar una idea de cul es el rango de valores
ocupado por la muestra y, en los casos de la media aritmtica, mediana y moda, de la
tendencia central de la distribucin:
3.2.3.1 Media aritmtica.
Es el equivalente al centro de gravedad de la muestra. Para calcularla se utiliza el
sumatorio sobre todos los valores de la muestra, n:
Ec. 49. Media aritmtica
n

mx =
i =1

xi
n

En la frmula anterior, el trmino 1/n es el peso asociado a cada valor xi y coincide con
su frecuencia. Cuando se disponga de datos discretos, la media puede calcularse
utilizando la frecuencia relativa de cada uno de ellos:
Ec. 50. Media para datos discretos
n

i =1

i =1

mx = xi f ( xi ) = xi

ni
n

Y cuando los datos estn agrupados en clases, se calcula tomando un valor central de
cada clase, mi:
Ec. 51. Media con datos agrupados en n clases
n

i =1

i =1

mx = mi f ( xi ) = mi

50

ni
n

Mdulo de Estadstica Aplicada a la Hidrologa

Por tanto, la media aritmtica es muy sencilla de obtener, pero es sensible a valores
extremos con lo que puede dar una idea errnea del centro de la muestra cuando existen
valores extremos dispersos y distantes respecto al cuerpo central de la misma.
3.2.3.2 Mediana.
Es el valor tal que ordenada la muestra, deja a cada lado la mitad de observaciones. Es
decir, es el valor que presenta una probabilidad del 50%. Si el nmero total de datos en
la muestra es impar, coincidir con el que ocupa la posicin (n+1)/2, mientras que en
las muestras con un nmero de datos par, se puede obtener como la media de los valores
anterior y posterior al centro, (xn/2+x1+n/2)/2.
Al trabajar con rangos, esta medida filtra la sensibilidad a los valores de extremos. Se
tiene entonces una medida robusta de la tendencia central. Adems, las diferencias entre
media y mediana describen la asimetra de la muestra. Con muestras simtricas,
tendern a dar valores similares, mientras que cuanto ms asimtrica sea una
distribucin de valores, ms diferirn sus valores.
3.2.3.3 Moda.
Es el valor que se presenta con mayor frecuencia. Como la mediana es ms robusta ante
la presencia de valores extremos, pero su estimacin se dificulta con variables continuas
para las que hay que definir los intervalos en los que agrupar los datos. Su utilidad es
mayor cuando se trabaja con variables discretas.
3.2.3.4 Valores mximos y mnimos registrados.
3.2.3.5 Primer y tercer cuartiles.
Los cuartiles son valores representativos de la divisin en cuartos del rango de
frecuencias. Es decir, son los valores que tienen una probabilidad de ocurrencia del 25%
(primer cuartil) y 75% (cuartil superior).

51

Funcin de densidad

Estadstica Aplicada a la Hidrologa

50%

50%

25%

25%

modax ax

mx

Valores de x

Figura 12. Media aritmtica, mediana, moda y cuartiles

3.2.3.6 Deciles, percentiles y cuantiles.


De la misma forma que en el caso anterior representan la divisin en 10, 100 y cualquier
fraccin del rango de frecuencias respectivamente.
3.2.4

Medidas de dispersin.

Son variables para describir la variabilidad de la muestra respecto a la tendencia central:


3.2.4.1 Varianza, sx2, y desviacin tpica, sx.
Definidas por medio del sumatorio del cuadrado de las distancias de cada valor de la
serie respecto a la media. En el caso de la desviacin tpica se calcula la raz cuadrada
de la varianza para obtener unidades comparables a los estadsticos de tendencia central
Ec. 52. Varianza y desviacin tpica
n

s x2 =
i =1

( xi m x ) 2
n

sx =

( xi m x ) 2

n
i =1
n

Como en el caso de las medias, cuando los datos estn agrupados se pueden aplicar las
siguientes frmulas:
Ec. 53. Desviacin tpica con datos agrupados en n clases

sx =

(mi mx )2 f ( xi ) =
i =1

52

ni

(m m ) n
2

i =1

Mdulo de Estadstica Aplicada a la Hidrologa

Ambas, como en el caso de la media aritmtica y, si cabe, an ms al manejar


diferencias elevadas al cuadrado, son sensibles a la presencia de valores errticos, por lo
que pueden resultar medidas inadecuadas en esos casos.
A partir de ellas tambin se define el coeficiente de variacin como el valor relativo de
la desviacin tpica respecto a la media
Ec. 54. Coeficiente de variacin

CV =

sx
mx

Coeficientes de variacin superiores a uno nos indicarn la posible existencia de valores


extremos altos, mientras que coeficientes de variacin ms reducidos indicarn cierta
concentracin alrededor de la media.
La desigualdad de Tchebychev expresa que entre la media y un nmero k veces la
desviacin tpica existe, como mnimo, el
1

1001 2 %
k
de las observaciones (Pea, 2000).
Ec. 55. Desigualdad de Tchebychev

f ( xi m x k s x ) 1

1
k2

Demostracin: se basa en seleccionar las observaciones que estn a una distancia respecto a
la media mayor que ksx de las que estn a menos distancia y aplicar la definicin de
varianza:

( xi m x ) 2
( xi m x ) 2
( xi m x ) 2
( xi m x ) 2
=
+

n
n
n
n
i : x i m x > k s x
i : xi m x k s x
i : x i m x > k s x
I =1

2
2
2 2

xi m x > k s x ( xi m x ) > k 2 s x2
(
x

m
)
>
n

s
i x
i
x
i : xi m x > k s x

s x2 =

s x2

( xi m x ) 2
1
> k 2 s x2 f ( xi m x > k s x ) f ( xi m x > k s ) < 2
n
k
i : x i m x > k s x

f ( x i m x k s ) 1

1
k2

De lo que se sigue que entre la media y dos desviaciones tpicas estn al menos el 75% de las
observaciones; y entre la media y 3 desviaciones tpicas, el 89%.

53

Estadstica Aplicada a la Hidrologa

3.2.4.2 Rango intercuartlico


Definido como la diferencia entre el tercer y primer cuartil, trabajando nicamente con
el cuerpo de valores que abarca el 50% de las frecuencias. Al evitar la dependencia
respecto a la media, puede lograr medidas consistentes de la dispersin cuando la
muestra presente extremos.
Ec. 56. Rango intercuartlico

IQR = Q3 Q1
3.2.4.3 Mediana de las desviaciones absolutas
Tampoco se ve afectada por los valores extremos de las desviaciones respecto a la
media. Se calcula como la mediana de las desviaciones absolutas respecto a la mediana.
Ec. 57. MEDA

MEDA = mediana xi a x
3.2.5

Medidas de forma de la distribucin de valores.

3.2.5.1 Coeficiente de sesgo.


Es til para describir la simetra/asimetra de la distribucin alrededor de la media. Su
expresin matemtica responde a la siguiente expresin:
Ec. 58. Coeficiente de sesgo

CS =

1 n ( xi m x ) 3

n i =1
3

Un valor positivo del coeficiente de sesgo indicar la existencia de una cola con valores
superiores a la media y, al contrario, un valor negativo, la existencia de una cola con
valores inferiores a la media. En caso de existir una simetra alrededor de la media, el
coeficiente de sesgo tendr valor nulo. Como desventaja hay que citar la elevada
sensibilidad de este estadstico a la presencia de valores extremos y al escaso nmero de
datos.

54

Funcin de densidad

Mdulo de Estadstica Aplicada a la Hidrologa

Valores de x

mx

Figura 13. Signos coeficiente de sesgo y forma de la funcin de densidad

3.2.5.2 Coeficiente de sesgo cuartlico.


Y finalmente, para eliminar la sensibilidad a la presencia de valores extremos, se puede
optar por una medida ms resistente que la anterior, funcin de los cuartiles, mediana y
rango intercuartlico. El coeficiente de sesgo cuartlico conserva el criterio de signos
anterior, con signo positivo para las distribuciones con cola hacia la derecha y el
negativo, al contrario.
Ec. 59. Coeficiente de sesgo cuartlico

CSQ =

3.2.6

(Q3 a ) (Q1 a )
IRQ

Tabla de estadsticos

En el ejemplo escogido se tendran los siguientes parmetros:


Media aritmtica
Mediana

27
26

Tercer cuartil
Varianza

33
42,4

Moda

22

Desviacin tpica

6,5

Mximo

38

Coeficiente de variacin

0,24

Mnimo

12

Rango intercuartlico

11

Primer cuartil

22

Coeficiente de sesgo

-0,19

Tabla 8. Estadsticos de la estacin pluviomtrica

3.2.7

Grfico caja

Con estas variables se pueden construir los denominados grficos en caja donde
aparecen de forma ms intuitiva las caractersticas mencionadas anteriormente a
propsito de la localizacin, tendencia central, existencia de valores errticos,
dispersin y forma. Para ello se indica sobre un eje convenientemente escalado entre los
valores mximo y mnimo, la posicin de la media aritmtica m y mediana a, los dos
cuartiles y para los casos de distribuciones normales, las denominadas vallas inferior y
superior, utilizadas como referencia de valores anmalos (outliers) que hay que estudiar
con especial detenimiento. Sus expresiones son:

55

Estadstica Aplicada a la Hidrologa

Ec. 60. Expresin de las vallas

3
Vi = Q1 IQR
4

3
Vs = Q3 + IQR
4

El grfico en caja parece indicar la existencia de una cola hacia los valores mnimos. En
este mismo sentido se manifiesta el coeficiente de sesgo o asimetra, negativo, aunque
posiblemente manifieste cierta la sensibilidad a los valores extremos bajos.

Figura 14. Grfico en caja

3.3

ANLISIS BIVARIADO

El estudio de las relaciones entre dos series de valores facilita y ampla el conocimiento
de fenmenos que en el apartado anterior solo se contemplaban unilateralmente. Este
nuevo terreno es el del anlisis bivariado y la extensin a ms de dos variables el
multivariado.
Como en el caso anterior, el primer paso consiste en la organizacin de los datos en
tablas. Estas tablas se pueden acompaar de los estadsticos obtenidos mediante un
anlisis univariado de cada una de las variables. La comparacin permite empezar a
extraer consecuencias.
Parmetros estadsticos
Media aritmtica
Mediana

Pluvimetro A Pluvimetro B
27
29
26
28

Moda

22

23

Mximo

38

39

Mnimo

12

23

Primer cuartil

22

25

Tercer cuartil

33

32

42,4

24,9

Varianza
Desviacin tpica

6,5

5,0

0,24

0,17

Rango intercuartlico

11

7,50

Coeficiente de sesgo

-0,19

0,53

Coeficiente de variacin

Tabla 9. Estadsticos descriptivos de las series de lluvia registrada

Tambin las frecuencias pueden compararse mediante tablas o con ayuda de grficos
buscando comprobar si hay o no concordancia entre las series. La Tabla 10 compara las
frecuencias asignadas a series de mximos de precipitacin y caudales en funcin de su
estacionalidad.
Mes
N mximos
anuales de
precipitacin
N caudales
mximos
anuales

56

Oct
12

Nov
7

Dic
5

Ene
2

Feb
0

Mar
3

Abr
3

May
1

Jun
0

11

Jul
0

Ago
0

Sep TOTAL
3
36

44

Mdulo de Estadstica Aplicada a la Hidrologa

Mes

Oct

Nov

Dic

Ene

Feb

Mar

Abr

May

Jun

Jul

Ago

Sep

TOTAL

35

Frecuencia relativa (%)

30
25
20
15
10
5

io
Ju
l

go
sto
Se
pt
ie
m
br
e

Ju
ni
o

A
br
il
M
ay
o

ctu
br
N
e
ov
ie
m
br
e
D
ici
em
br
e
En
er
o
Fe
br
er
o
M
ar
zo

Figura 15. Grfico de barras comparando las frecuencias de dos variables


Tabla 10. Comparacin de frecuencias relativas de caudales y precipitaciones mximas

En el caso de manejar dos series temporales, una posibilidad sencilla consiste en


organizar los datos en tablas donde se ordenen los datos contemporneos segn su
sucesin. En el ejemplo mostrado se comprueba que la mayor dispersin se da en el
primer pluvimetro, que alcanza valores menores durante el primer periodo.
Ao 1941
Pluvimetro A
31
(mm)
Pluvimetro B
34
(mm)
Ao 1959
Pluvimetro A
34
(mm)
Pluvimetro B
31
(mm)

1942
20

1943
21

1944
23

1945
22

1946
21

1947
29

1948
34

1949
22

1950
17

1951
22

1952
38

1953
18

1954
15

1955
12

1956
33

1957
22

1958
27

28

32

28

31

23

35

30

27

27

28

36

28

25

24

39

23

36

1960
29

1961
32

1962
26

1963
35

1964
34

1965
25

1966
27

1967
27

1968
28

1969
36

1970
23

1971
34

1972
26

1973
35

1974
36

1975
25

1976
24

23

23

23

33

26

25

28

29

23

37

23

35

28

30

39

23

26

40

Precipitacin (mm)

35
30
25
20
Pluvimetro A

15

Pluvimetro B
10
1940

1945

1950

1955

1960

1965

1970

1975

Figura 16. Grfica e evolucin temporal con dos series


Tabla 11. Evolucin de las series pluviomtricas registradas en los pluvimetros A y B.

Siempre que sea posible se deben comparar series registradas en distintos puntos con
cierta proximidad geogrfica. Esto facilita y da consistencia a la identificacin de
patrones comunes. Y al contrario, tambin permite la deteccin de errores. La
comparacin de varias series se puede realizar con varias grficas temporales, con las
mismas escala en abscisas y ordenadas. Cuando los valores de las series sean

57

Estadstica Aplicada a la Hidrologa

sustancialmente distintos, se puede recurrir a la estandarizacin de los valores, por


ejemplo, utilizando la normalizacin clsica. Siguen siendo vlidas las mismas
recomendaciones citadas con el anlisis univariado, es decir, utilizacin de curvas
suavizadas que den una idea de las fluctuaciones de las series, la agregacin o el uso de
estadsticos cuando se tengan numerosos datos, la divisin del dominio temporal para
mejorar la visualizacin y el uso de transformaciones.
En la siguiente figura se muestra un ejemplo de niveles piezomtricos en cuatro puntos
cercanos. Aparecen tendencias similares en los cuatro piezmetros, con rectas de
regresin cuasi-horizontales excepto en el ltimo caso. Haber utilizado la misma escala
permite obtener una idea de la distinta localizacin y variabilidad de cada fenmeno en
cada piezmetro. Evidentemente, esta informacin ofrecida por las cuatro grficas tiene
que ser completada con el conocimiento de la zona, del acufero, de las acciones sobre
el mismo y de su localizacin relativa.
226,00

226,00

224,00

224,00

222,00

222,00

220,00

220,00

218,00

218,00

216,00

216,00
214,00

214,00

212,00

212,00

210,00

210,00

28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997

28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997

226,00

226,00

224,00

224,00

222,00

222,00

220,00

220,00

218,00

218,00

216,00

216,00

214,00

214,00

212,00

212,00

210,00

210,00

28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997

28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997

Figura 17. Ejemplo de niveles piezomtricos

3.3.1

Distribuciones conjuntas de frecuencia

En el caso univariado se calculan las frecuencias relativas de los sucesos mediante el


cociente entre casos favorables y totales. Cuando se contempla la distribucin de dos
variables, los casos favorables hacen referencia al cumplimiento de las dos condiciones
referidas a cada una de las variables. En una tabla de contingencia (variables
cualitativas) o en una tabla de distribucin conjunta de frecuencia (variables
cuantitativas) se ordenan todas estas frecuencias. En el caso de considerar como
variables la estacionalidad de las precipitaciones mximas anuales y de los caudales

58

Mdulo de Estadstica Aplicada a la Hidrologa

mximos instantneos anuales (Tabla 12), en las filas y columnas se tendrn cada uno
de los meses considerados (clases de cada variable) y en cada cuadrcula de la matriz, la
frecuencia relativa calculada como cociente del nmero de casos en los que se dan a la
vez precipitaciones mximas y caudales mximos de cada combinacin de meses entre
el total de meses. La interpretacin de estos resultados tiene que hacer referencia a la
similitud existente en la estacionalidad del fenmeno.

caudales

oct
oct
nov
dic
ene
feb
mar
abr
may
jun
jul
ago
sep

nov

dic

ene

feb

precipitaciones
mar
abr
may

jun

jul

ago

sep

21%
0%
0%
3%
3%
0%
0%
0%
0%
0%
3%
0%

0%
14%
3%
3%
0%
0%
0%
0%
0%
0%
0%
0%

3%
0%
3%
0%
0%
3%
0%
0%
0%
0%
0%
0%

0%
0%
3%
3%
0%
0%
0%
0%
0%
0%
0%
0%

0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%

0%
3%
0%
0%
0%
7%
0%
0%
0%
0%
0%
0%

0%
0%
0%
0%
0%
3%
3%
3%
0%
0%
0%
0%

0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
3%

0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%

0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%

0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%

0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
7%

31%

21%

10%

7%

0%

10%

10%

3%

0%

0%

0%

7%

24%
17%
10%
10%
3%
14%
3%
3%
0%
0%
3%
10%

Tabla 12. Tabla de contingencia de las variables precipitacin mxima, caudal mximo.

25%

20%

15%

10%

5%

sep
ago
jul
jun
may
abr
mar
feb
ene
dic
nov
oct

0%
oct nov
dic ene
feb mar
abr may
jun

jul ago
sep

Figura 18. Distribucin conjunta de las variables estacionalidad

La distribucin conjunta de las dos variables expresada en la tabla anterior sirve para
definir la distribucin marginal de cada una de las variables. Esta distribucin marginal
expresa las frecuencias de una de las variables independientemente de la ocurrencia o
no de la segunda variable. Como se expresa en la tabla anterior, estas distribuciones
marginales se pueden calcular por suma de las frecuencias correspondientes a la
variabilidad de la segunda variable en cada clase de la primera. Es decir,:

59

Estadstica Aplicada a la Hidrologa

Ec. 61. Distribuciones marginales


m

j =1

i =1

f ( xi ) = f ( xi , y j ) f ( y j ) = f ( xi , y j )
As, en la ltima fila de la Tabla 12 se tiene la distribucin marginal de la estacionalidad
de las precipitaciones mximas; y en la ltima columna, la distribucin marginal de la
estacionalidad de los caudales mximos.
La distribucin condicional ser expresin de las frecuencias correspondientes a una
variable supuesto el cumplimiento de una clase de la segunda:
Ec. 62. Distribucin condicional

f ( y j xi ) =

f ( xi , y j )
f ( xi )

Por tanto, supuesta una precipitacin mxima en octubre, las correspondientes


frecuencias condicionadas sern las que aparecen en la siguiente tabla.
Mes Probabilidad condicional
P/PMAX(OCT)
67%
oct
0%
nov
0%
dic
11%
ene
11%
feb
0%
mar
0%
abr
0%
may
0%
jun
0%
jul
11%
ago
0%
sep

Clculo
=0,21/0,31

=0,03/0,31
=0,03/0,31

=0,03/0,31

Tabla 13. Probabilidad condicional

3.3.2

Comparacin de cuantiles

Un grfico interesante es el que compara cuantiles de las distribuciones de frecuencias


de ambas series. Representando las parejas de puntos correspondientes a cada uno de
ellos se obtienen grficas del siguiente tipo:

60

Mdulo de Estadstica Aplicada a la Hidrologa

Cuantil
(%)
c0
c5

Pluvimetro A (mm)
12
17

Pluvimetro B (mm)
23
23

c10

19

23

c15

21

23

40

c20

22

23

35

c25

22

25

c30

23

26

c35

23

26

c40

25

27

c45

26

28

c50

26

28

c55

27

28

c60

28

29

c65

29

30

c70

32

31

c75

33

32

c80

34

34

c85

34

35

c90

35

36

c95

36

38

c100

38

39

Comparacin de cuantiles

Pluvimetro B

45

30
25
20
15
10
10

15

20

25

30

35

40

45

Pluvimetro A

Figura 19. Comparacin de cuantiles

Tabla 14. Comparacin de cuantiles

Si los puntos se alinean sobre la recta x=y, se puede deducir que las dos series siguen
idntica funcin de distribucin. Si el alineamiento sigue otra recta cualquiera, se
deduce la existencia de una funcin de distribucin similar, pero con distintos
parmetros estadsticos. En otros casos expresar la relacin no lineal entre las
distribuciones de ambas series.
3.3.3

Diagrama de dispersin

La forma de representacin ms usual es el denominado diagrama de dispersin.


Dibujando las parejas de puntos muestrales, se puede contemplar cualitativamente qu
tipo de correspondencias o correlaciones se pueden establecer entre las variables,
adems de destacar puntos errticos que puedan deberse a errores durante el proceso de
medicin.

61

Estadstica Aplicada a la Hidrologa

Diagrama de dispersin
45

Pluvimetro B (mm)

40
35
30
25
20
15
10
10

15

20

25

30

35

40

45

Pluvimetro A (mm)

Figura 20. Dispersin entre los datos de los pluvimetros A y B.

Con carcter general, las correlaciones entre variables pueden ser positivas, negativas o
inexistentes. Dos variables estn positivamente correlacionadas cuando a los valores
altos de una corresponden valores altos en la segunda, y a los valores bajos de una, los
valores bajos de la segunda. Cuando la correlacin es negativa, a los valores altos de
una, corresponden los valores bajos en la otra. Por ltimo, las variables no estarn
correlacionadas cuando no se pueden estimar tendencias como las anteriores.
Los diagramas de dispersin se pueden utilizar de mltiples maneras para ver diferentes
correlaciones con diferentes variables. En el siguiente ejemplo se muestran las
dispersiones entre distintas series de tres en tres, lo que permite comparar las distintas
correlaciones.

Figura 21. Diagramas de dispersin mltiples entre diferentes variables.

3.3.4

Coeficientes de correlacin simple: Pearson y Spearman

Un indicador del grado de ajuste de las variables es el coeficiente de correlacin simple


de Pearson, definido como el cociente entre la covarianza y las desviaciones tpicas de
las variables:

62

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 63. Coeficiente de correlacin de Pearson


n

rxy =

( x i m x ) ( yi m y )
n

i =1

x y

El numerador o covarianza entre x e y refleja el sentido de las correlaciones, positiva o


negativa, anteriormente especificadas, creciendo en valor absoluto cuando la
correspondencia entre las variables es mayor. Al dividirla por las desviaciones tpicas,
los valores que puede adoptar el coeficiente de correlacin pasan a pertenecer al
intervalo [-1,1]. Cuando el valor de rxy es +1, el diagrama de dispersin estar alineado
segn una recta de pendiente positiva y si el valor de rxy es 1, las series seguirn una
recta de pendiente negativa, con el resto de casos comprendidos entre estos dos
extremos. Un valor nulo indicar independencia entre las variables.
Hay que advertir que el coeficiente de correlacin de Pearson es sensible a los valores
extremos de las series. Pueden conseguirse altos coeficientes de correlacin cuando los
extremos marcan una tendencia alineada y, al contrario, tambin pueden ocultar una
buena alineacin del cuerpo central del diagrama de dispersin cuando estos extremos
con valores altos se localizan errticamente. Para poder llegar a mejores conclusiones se
recomienda combinar este coeficiente con otras medidas de asociacin como el
coeficiente de correlacin de Spearman. La expresin matemtica de este es similar a la
anterior, pero en vez de manejar los valores de las series, se introduce el orden o rango
que ocupan estos en las mismas ordenadas de menor a mayor, siendo el rango del menor
valor, 1, y el del mximo valor, n:
Ec. 64. Coeficiente de Spearman
n

rRxy =

( R xi mRx ) ( Ryi mRy )


n

i =1

Rx Ry

As definido este nuevo coeficiente de Spearman no es sensible a los valores extremos.


Adems, informa sobre el carcter montono de la relacin, dando valores positivos de
rRxy cuando la correspondencia sea creciente y negativos cuando sea decreciente, pero
sin estar influido por la posible linealidad que sigan las variables. En el ejemplo, se han
calculado unos coeficientes de Pearson y Spearman de 0,57 y 0,50 respectivamente
teniendo en cuenta que a los grupos de rangos idnticos se les asocia el rango
intermedio correspondiente:
Ao

1941
1942

Rangos en el
pluvimetro A (mm)
25,0
5,0

1943

7,0

1944

12,0

1945

8,5

Rangos en el
pluvimetro B (mm)

Ao

Rangos en el
pluvimetro A (mm)

Rangos en el
pluvimetro B (mm)

29,0 1959
18,5 1960
27,0 1961

28,5
24,0

25,5
4,5

26,0

4,5

18,5 1962
25,5 1963

17,0

4,5

32,5

28,0

28,5

12,5

16,0

10,5

20,5

18,5

19,0

22,0

1946

6,0

1947

23,0

1948

30,5

4,5 1964
30,5 1965
23,5 1966

1949

10,0

14,5 1967

63

Estadstica Aplicada a la Hidrologa

Ao

Rangos en el
pluvimetro A (mm)

Rangos en el
pluvimetro B (mm)

1950
1951

3,0
8,5

1952

36,0

1953

4,0

1954

2,0

1955

1,0

1956

27,0

1957

11,0

1958

20,5

Ao

Rangos en el
pluvimetro A (mm)

Rangos en el
pluvimetro B (mm)

14,5 1968
18,5 1969
32,5 1970

22,0
34,0

4,5
34,0

13,0

4,5

18,5 1971
10,5 1972

30,5

30,5

18,0

18,5

9,0 1973
35,5 1974

32,5

23,5

35,0

35,5

4,5 1975
32,5 1976

15,0

4,5

14,0

12,5

Tabla 15. Deduccin de los rangos de las series pluviomtricas

Al tratar con series temporales se pueden calcular coeficientes de correlacin de una


serie consigo misma adoptando un desfase temporal entre los trminos. Se definen
entonces los coeficientes de autocorrelacin, dependientes del paso temporal escogido
en cada paso. Un correlograma ser la expresin grfica de los valores del coeficiente
de autocorrelacin cuando se van considerando sucesivos desfases temporales (k=1, 2,
3, etc.). En la figura siguiente se muestra un correlograma de una serie hidrolgica en el
que se ve cmo se va perdiendo informacin a medida que aumenta el paso, desfase
mensual, de clculo.
1,00

coeficiente de autocorrelacin

0,80
0,60
0,40
0,20
0,00
-0,20
-0,40
0

10

11

12

13

14

m eses

Figura 22. Correlograma

3.3.5

El mtodo de las dobles acumulaciones

El mtodo de las dobles acumulaciones es una tcnica sencilla cuyo objetivo es valorar
la consistencia de una serie temporal en funcin de otra serie de referencia. Para su
aplicacin se toman las dos series de datos durante el periodo comn de registro,
comparndose en un diagrama x, y sus series acumuladas. Si la relacin entre las dos
series se ha mantenido estable, es decir, a los incrementos de una corresponden los
proporcionales en la de referencia, la representacin mostrar una tendencia lineal. En
caso contrario, la presencia de quiebros y saltos indica cambios en la relacin entre las
series de datos.

64

Mdulo de Estadstica Aplicada a la Hidrologa

Ao

1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958

Estacin
pluviomtrica
A
(mm)

Serie
acumulada
estacin A
(mm)

36
25
26
28
27
26
34
39
27
22
27
43
23
20
22
33
27
27

36
62
87
115
142
168
202
240
268
290
317
360
384
403
425
458
485
513

Serie
Serie
pluviomacumulada
trica
de (mm)
referencia
(mm)

34
28
32
28
31
23
35
30
27
27
28
36
28
25
24
39
23
36

34
62
94
122
153
176
211
241
268
295
323
359
387
412
436
475
498
534

Ao

Estacin
pluviomtrica
A
(mm)

Serie
acumulada
estacin A
(mm)

34
29
32
26
35
34
25
27
27
28
36
23
34
26
35
36
25
24

546
575
607
633
667
701
726
754
780
808
844
867
901
926
961
997
1021
1045

1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976

Serie
Serie
pluviomacumulada
trica
de (mm)
referencia
(mm)

31
23
23
23
33
26
25
28
29
23
37
23
35
28
30
39
23
26

565
588
611
634
667
693
718
746
775
798
835
858
893
921
951
990
1013
1039

Tabla 16. Series pluviomtricas acumuladas en las estaciones A y B


1200

1000

800

600

400

200

0
0

200

400

600

800

1000

1200

Figura 23. Aplicacin del mtodo de las dobles acumulaciones

Los quiebros en la pendiente reflejan inconsistencias sistemticas y cambios en las


condiciones de medicin, instrumentacin, etc. Los saltos y escalones entre rectas de la
misma pendiente se deben a errores accidentales como los debidos a lecturas errneas,
fallos en los medidores, etc. Un caso que suele aparecer con frecuencia es la presencia
de quiebros, entre pendientes inicial y final paralelas que puede corresponder a cambios

65

Estadstica Aplicada a la Hidrologa

temporales en la localizacin del medidor, que registra durante el periodo intermedio un


fenmeno proporcionalmente diferente respecto a la estacin de referencia.
1200

1200

1000

1000

800

800

600

600

400

400

200

200

0
0

200

400

600

800

1000

1200

200

400

600

800

1000

1200

Figura 24. Deteccin de inconsistencias en dobles acumulaciones

Para evitar falsas interpretaciones respecto a los cambios de pendiente y la aleatoriedad


propia de los datos, se deben considerar cambios que afecten a un grupo significativo de
puntos, unos cinco como mnimo. Se recomienda trabajar con una escala temporal
mnima consistente que en el caso de las precipitaciones es del mes, ya que la
erraticidad de los datos a escalas menores puede ocultar las tendencias entre las
estaciones. Adems, con series temporales de datos que presenten cambios estacionales
muy pronunciados, es conveniente desglosar la aplicacin del mtodo a las series
obtenidas en cada estacin climtica, trabajando con series obtenidas por ejemplo de los
eneros, etc.
Existen mtodos para mejorar la seleccin de los puntos de quiebro de las dobles
acumulaciones. Un mtodo que aparece en la bibliografa consultada (Allen et al., 1998)
es el siguiente:
-

Hallar la recta de regresin de los datos acumulados de la estacin Yi en


funcin de los de la de referencia Xi
xi =

yi =

j: j i

j: j i

y est _ i = b xi

Calcular los residuos en funcin de la recta de regresin hallada

i = y i b xi
-

66

Representar la serie de residuos en un grfico donde se pueda contemplar su


evolucin. Si sta aparece errtica, se tendr homogeneidad entre las series.
En caso contrario, cuando aparezca una evolucin definida, se tendr una
relacin inconsistente. Los cambios en la tendencia de los residuos indican
los momentos de quiebro buscados

Mdulo de Estadstica Aplicada a la Hidrologa

90
80
70
60
50
40
30
20
10
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978

Figura 25. Chequeo del cambio de tendencia

Una vez se ha identificado la fuente de error, se puede homogeneizar la serie estudiada


respecto a la de referencia. Para ello, se utilizan los resultados de las dobles
acumulaciones. Siendo c la nueva pendiente a la que se va a ajustar la serie estudiada
en el periodo a corregir, r la pendiente a la que se ajustan las dobles acumulaciones en
el mismo periodo y Pr los valores originales a corregir, los nuevos Pc se obtienen
aplicando la frmula siguiente:
Ec. 65. Correccin de las heterogeneidades

Pc =

c
P
r r

Normalmente, la serie de referencia se obtiene de la media de un grupo representativo


del periodo, admitiendo la hiptesis de que la serie de las medias de un grupo de
registros, es poco sensible a los cambios en los registros individuales debido a la
compensacin de errores entre estos. Por tanto, para analizar la heterogeneidad en los
registros, por ejemplo de un pluvimetro en particular, se tomaran otros de la misma
regin climtica y se obtendra una serie de referencia media a partir de datos
contemporneos.
Este grupo debe estar constituido por un nmero suficiente de estaciones con series de
registros de comportamiento en media similar y cierta continuidad temporal. La serie
media queda desvirtuada si alguna de estas series tuviera un peso pronunciado sobre las
dems o si solo se dispusiera de un nmero reducido de estaciones pluviomtricas, ya
que surgirn dudas acerca de su consistencia.
Por ejemplo, en el caso del anlisis de series pluviomtricas, se forma una serie de
referencia a partir de un grupo lo ms numeroso posible de estaciones, atendiendo a
caractersticas climticas uniformes y factores que puedan ser de utilidad como la
distancia y diferencia de altitud entre estaciones, exposicin a los frentes hmedos, etc.

67

Estadstica Aplicada a la Hidrologa

Tambin pueden ser de utilidad criterios basados en parmetros estadsticos como la


media y desviacin tpica, recomendndose que entre las estaciones del grupo no se
superen diferencias en media entre el 10% y 15%.
La aplicacin de las dobles acumulaciones a series de caudales conlleva la aparicin de
problemas particulares relativos al funcionamiento hidrolgico de las cuencas. Con
carcter general, hay que considerar la disposicin de la red hidrogrfica, que determina
la eleccin de la serie ms consistente, tericamente la de aguas abajo, con una mayor
agregacin de caudales y compensacin de errores. As, se pueden detectar, aparte de
los cambios en los sistemas de medicin y errores accidentales ya mencionados,
derivaciones de caudales, alteraciones y fugas.

3.4
3.4.1

COMPONENTES EN LAS SERIES TEMPORALES


Tendencias, ciclos y estaciones

Se define una serie temporal como la coleccin ordenada de datos registrados a


intervalos regulares de una variable, destacando la importancia dada al intervalo de
medida seleccionado y al orden en que se registran. En funcin del intervalo temporal
escogido, en la serie temporal aparecen distintos tipos de movimientos o fluctuaciones,
crecientes o decrecientes, de carcter sistemtico o estocstico. Por ejemplo, si se est
tratando con una serie de temperaturas a escala horaria, aparecen como mnimo los
ciclos diarios con una evolucin de temperaturas desde las mnimas alcanzadas durante
la noche y las mximas dadas al medioda. Si esta serie se trata desde una escala
mensual, aparecer como mnimo el ciclo estacional. Desde el punto de vista
hidrolgico interesa conocer cmo identificar y manejar las fluctuaciones e ir filtrando
estas fuentes de variacin de las series originales para facilitar el conocimiento del
estado hidrolgico.
Desde la escala temporal superior se distingue en primer lugar la tendencia suave,
montona e indiferente de otros movimientos crecientes o decrecientes, similar a la que
pueden dar polinomios de grado bajo. Para poder apreciar esta componente son
necesarias series lo suficientemente largas, i.e. un nmero grande de aos con datos, que
comprendan al menos 2 3 ciclos o fluctuaciones de orden inmediatamente inferior.
Cuando la disponibilidad de datos de las series es menor, estas tendencias se asocian a
cambios bruscos en las condiciones.

68

Mdulo de Estadstica Aplicada a la Hidrologa

Figura 26. Serie anual de datos de lluvia y tendencia lineal

Para ajustar la tendencia persistente se pueden utilizar varios modelos. Lo ms simple es


recurrir a la representacin de una tendencia lineal utilizando, por ejemplo, mnimos
cuadrados. En la literatura econmica se encuentran otras opciones como es la
utilizacin de una curva logstica. Este tipo de curvas da una tendencia curva en S. Se
representan utilizando una tasa de crecimiento o decrecimiento constante de la
pendiente en papel logartmico. Siendo t la variable tiempo y a, b y c parmetros
Ec. 66. Expresiones asociadas a la deteccin de tendencias

lineal : y = at + b

polinmica : y = a + bt + ct 2

exp onencial : y = ae bt

potencial : y = at b

log stica : y =

a
1 + e b t

La identificacin de estas tendencias montonas en hidrologa est dificultada por la


longitud y presencia de lagunas en las series adems de la presencia de episodios
extremos como las crecidas y su influencia en la estimacin de los parmetros de las
expresiones anteriores.
Las fluctuaciones y ciclos plurianuales tienen el inconveniente de la falta de una
frecuencia constante, lo que dificulta su manejo. Por esto, las tcnicas grficas son
bsicas al permitir explorar el carcter de las series. Para destacar los ciclos se pueden
emplear medias mviles o curvas de desviaciones respecto a la media acumuladas.
En las desviaciones acumuladas se representan como serie temporal los valores
acumulados de las desviaciones respecto a la media o los valores acumulados de estas
desviaciones estandarizadas por la media. Se maneja as informacin sobre el carcter,
hmedo o seco del ciclo en funcin del signo de la desviacin.
Ec. 67. Desviaciones acumuladas y unitarias acumuladas

yi =

(x
j: j i

yi =

j : j i

(x

69

Estadstica Aplicada a la Hidrologa

Figura 27. Desviaciones unitarias acumuladas (%) y precipitaciones anuales

Las medias mviles se calculan utilizando los datos adyacentes a uno dado con una
ponderacin adecuada. Siendo m el orden de la media mvil y utilizando como ndice i,
con recorrido total de m valores, distribuidos, mitad y mitad, entre anteriores y
posteriores, la estimacin centrada de la media mvil es:
Ec. 68. Medias mviles

yi =

i
j(i ,i + k 1)

yi = i xi
i =1

Los pesos asociados a los valores intervinientes en una media mvil suelen ser
decrecientes conforme aumenta la distancia al punto central o iguales a la inversa del
total de valores utilizados, que es el caso de la media aritmtica. Por otro lado, a medida
que el orden de la media mvil es mayor, ms suavizada ser la curva finalmente
obtenida y mayor ser la componente de fluctuacin cclica filtrada. Esto puede ser
interesante si lo que se intenta es filtrar conjuntamente el ciclo y la componente de
tendencia.
Al no tener los ciclos una frecuencia fija se ha de trabajar con datos anuales, medias
anuales o medias mviles sobre un ao completo, 12 meses que filtren el efecto
estacional, o mltiplos enteros de ese ciclo bajo la hiptesis de que los residuos no
tendrn componentes con autocorrelacin y que la media de varios datos eliminar las
fluctuaciones aleatorias. Por ejemplo, se pueden utilizar medias calculadas desde el
inicio del ciclo hidrolgico durante cada doce meses.

70

Mdulo de Estadstica Aplicada a la Hidrologa

350

300

250

200

150

100

50

oc
t -8
0
oc
t -8
1
oc
t -8
2
oc
t -8
3
oc
t -8
4
oc
t -8
5
oc
t -8
6
oc
t -8
7
oc
t -8
8
oc
t -8
9
oc
t -9
0
oc
t -9
1
oc
t -9
2
oc
t -9
3
oc
t -9
4
oc
t -9
5
oc
t -9
6
oc
t -9
7
oc
t -9
8
oc
t -9
9
oc
t -0
0
oc
t -0
1

Figura 28. Serie de precipitaciones con valores medios anuales y media mvil de 12 meses.

En el siguiente paso aparecen las variaciones estacionales de cada ao. Esta fluctuacin
es regular y se da como consecuencia del giro de la Tierra alrededor del Sol, as como el
ciclo diario aparece como efecto de la rotacin terrestre. Estas componentes se
identifican de distintas maneras y aparecern en los residuos que queden del filtrado de
la informacin anterior. La forma en que aparece esta estacionalidad es variable,
dependiendo de las condiciones hidrolgicas. Por ejemplo, los caudales o series
hidrolgicas agregadas (Figura 30) de grandes cuencas dan un ciclo anual bien definido
por la agregacin de factores implicados. Si se trabaja con muestras individualizadas
(Figura 29), la sensibilidad a condiciones particulares con eventos extremos y la
aleatoriedad es mayor, por lo que podra deducirse un ciclo estacional menos definido.
200,0
150,0
100,0
50,0
0,0
0

100

200

300

400

500

600

700

-50,0
-100,0
-150,0
OCT

NOV

DIC

ENE

FEB

M AR

ABR

M AY

JUN

JULIO

AGO

SEP

Figura 29. Series estacionales con media estacional superpuesta

71

Estadstica Aplicada a la Hidrologa

Figura 30. Ciclos mensuales en media y desviacin tpica

Las funciones peridicas de senos, cosenos y parmetros como la frecuencia, f, nmero


de ciclos por unidad de tiempo (1/12 para el caso de series mensuales; 1/365 para series
diarias,...), amplitud, A, o fase, son tambin usadas para la representacin de estos
ciclos.
Ec. 69. Funciones aplicables a fluctuaciones peridicas

y = Aseno(2 f t + )
Tratadas las componentes de tendencia, ciclo y estacin, queda un trmino residual de
que como aleatorio, con una variabilidad que obedece a causas desconocidas o
incontrolables. Existen varias posibilidades para descomponer una serie temporal en
cada uno de los trminos anteriores y obtener el residuo. Son clsicos los modelos
aditivos, multiplicativos o mixtos. Siendo xi el dato original, ti el correspondiente a la
tendencia, ci el del ciclo plurianual, ei el estacional y ri el residuo final, la expresin de
estos modelos es la siguiente:
Ec. 70. Modelo aditivo de descomposicin

xi = ti + ci + ei + ri
Ec. 71. Modelo multiplicativo de descomposicin

xi = ti ci ei ri

Para valorar la eleccin entre uno y otro modelo hay que tener en cuenta la interaccin
impuesta entre los trminos de las expresiones anteriores. En el modelo aditivo no hay
interaccin, mientras que en el modelo multiplicativo hay una relacin proporcional
entre los trminos.
Un procedimiento de descomposicin basado en la utilizacin del modelo multiplicativo
es el conocido como de Macauley. Se resume en los siguientes puntos para valores
mensuales:
1. Estimacin de una tendencia por ajuste lineal a la serie completa.

72

Mdulo de Estadstica Aplicada a la Hidrologa

2. Clculo de la media mvil centrada de 12 meses


3. Divisin de la media mvil entre el dato correspondiente a la tendencia. Con
este cociente se obtiene una visin de la componente cclica
Ciclo

Tendencia
50.00

50.00

5.00

q8005
Componente cclica

q8005
Lineal (q8005)

45.00

45.00

4.50

40.00

40.00

4.00

35.00

35.00

3.50

30.00

30.00

3.00

25.00

2.50

20.00

20.00

2.00

15.00

15.00

1.50

10.00

10.00

1.00

5.00

5.00

0.50

0.00

0.00

0.00

25.00

y = -0.0085x + 10.252
2

R = 0.1359

Figura 31. Tendencia y ciclos en la descomposicin Macauley

4. Clculo del ratio entre el valor real de cada mes y el valor de la media mvil. La
componente estacional se obtiene como el promedio de estos ratios
correspondientes a cada mes; es decir, seleccionando los ratios de cada mes y
calculando su media.
Estacionalidad

Ratio ValorActual/MediaMvil
1.20

3.50
Ratio ValorActual/MediaMvil
3.00

1.00

2.50

0.80

2.00

0.60
1.50

0.40
1.00

0.20
0.50

0.00
Oct

0.00

Nov

Dic

Ene

Feb

Mar

Abr

May

Jun

Jul

Ago

Sep

Figura 32. Estacionalidad en la descomposicin Macauley

La transformacin normalizante se utiliza para el caso de filtrado de la componente


estacional. sta se refleja en medias y desviaciones tpicas, por lo que es usual utilizar
una transformacin normalizante que permita el estudio de otros efectos en las series.
Ec. 72. Transformacin normalizante

zi , j =

yi , j i

donde i y i son la media y desviacin tpica del mes i.

73

Estadstica Aplicada a la Hidrologa

3.4.2

Consideraciones sobre la autocorrelacin temporal

El coeficiente de autocorrelacin temporal sirve para evaluar la propensin de la


variable a que a un valor alto siga un valor alto o a un valor bajo, uno bajo (o al
contrario), separados un intervalo de duracin k. La secuencia de coeficientes de
autocorrelacin conforme aumenta el desfase entre datos se denomina correlograma.
Los coeficientes de autocorrelacin de una serie completa antes de la descomposicin y
los de la serie de los residuos son distintos. En la descomposicin se va filtrando
informacin con autocorrelacin y los residuos que finalmente se obtienen dan valores
reducidos. Un efecto que se refleja en el correlograma es de las fluctuaciones
estacionales. En la siguiente figura se muestra cmo ha cambiado la autocorrelacin
entre las series mensuales (en rojo) antes y despus de la transformacin. Las series de
coeficientes de autocorrelacin en verde y azul corresponden a datos trimestrales y
anuales. Antes de la transformacin normalizante, las precipitaciones mensuales
muestran un ciclo regular correspondiente a las estaciones meteorolgicas. Despus de
la transformacin, ese efecto ha sido filtrado.

Figura 33. Efecto de la transformacin normalizante en series de precipitacin mensual

3.5

CONTEXTO ESPACIAL

Objetivo: definir tcnicas que permitan identificar componentes espaciales e identificar


la correlacin espacial en los datos.

74

Mdulo de Estadstica Aplicada a la Hidrologa

VARIABLE ALEATORIA Y FUNCIONES DE DISTRIBUCIN

4.1

CONCEPTO DE VARIABLE ALEATORIA

Cada uno de los sucesos probabilsticos que hemos definido en el captulo anterior se
representa matemticamente mediante una variable, que se denomina aleatoria porque
sus valores vienen determinados por el azar. Es decir, una variable aleatoria es la
representacin matemtica de los posibles resultados de un determinado experimento
probabilstico.
Cada vez que se realice el experimento, la variable adquirir un determinado valor que
ser el resultado del mismo y al que corresponder una determinada probabilidad.

4.2
4.2.1

TIPOS DE VARIABLES ALEATORIAS


Variables aleatorias discretas y continuas

Una variable aleatoria se denomina discreta cuando el nmero de valores que se pueden
obtener como resultado del experimento aleatorio asociado a la misma es finito1. Un
ejemplo tpico de variable aleatoria discreta es la asociada al resultado obtenido en el
lanzamiento de un dado. Dicha variable solo puede tomar seis valores diferentes, los
correspondientes a las seis caras del dado.
Una variable aleatoria ser continua cuando tenga un nmero infinito de valores
posibles, es decir, el nmero de resultados posibles de su experimento aleatorio
asociado es infinito. Las variables aleatorias habitualmente empleadas en hidrologa son
de tipo continuo. Por ejemplo, la variable aleatoria asociada a la medida del caudal en
un punto determinado de un ro es continua puesto que existe un nmero infinito de
resultados posibles (cualquier nmero real positivo).
4.2.2

Dimensin de una variable aleatoria

La descripcin cuantitativa de un experimento aleatorio no siempre es descrita por una


nica caracterstica numrica, sino que en determinadas circunstancias es necesario
tener en cuenta ms de una. El nmero de caractersticas numricas que es necesario
considerar para describir el resultado de un experimento es igual a la dimensin de la
variable aleatoria asociada al mismo.
Por ejemplo, en el caso del experimento comentado en el apartado anterior (medida del
caudal en un ro) la dimensin de su variable aleatoria es igual a uno puesto que solo es
necesario un nico valor numrico para definir el resultado del experimento. En este
caso se dice que la variable aleatoria es unidimensional o univariada.

Estrictamente tambin sera una variable aleatoria discreta aquella que tiene un nmero infinito de
resultados posibles si ese infinito es numerable.

75

Estadstica Aplicada a la Hidrologa

En el caso de que el suceso probabilstico considerado fuese la ocurrencia de una


avenida en un ro y describisemos el hidrograma de avenida mediante su caudal punta
y su volumen, se necesitaran dos caractersticas numricas para describir el resultado
de cada experimento y, por tanto, la dimensin de la variable aleatoria sera igual a dos.
En este caso se dira que la variable aleatoria es bidimensional o bivariada. En general,
una variable aleatoria con dimensin mayor que uno se dice que es multidimensional o
multivariada. Las variables aleatorias con dimensin mayor que uno se denominan
habitualmente en la literatura vectores aleatorios.
Una variable aleatoria n-dimensional ser discreta si cada una de las n caractersticas
numricas que la definen es discreta. Ser continua si cada una de ellas es continua. Si
alguna de las caractersticas es discreta y otras continuas, la variable aleatoria es mixta.

4.3

VARIABLE ALEATORIA UNIVARIADA

Una vez definida la variable aleatoria correspondiente a un determinado suceso


probabilstico, el inters de la estadstica se centra en determinar la probabilidad
correspondiente a cada posible valor de la variable. Veremos en este apartado como se
define la probabilidad para el caso de una variable aleatoria univariada.
4.3.1

Funcin de distribucin

La forma ms habitual de relacionar los valores de la variable aleatoria con sus


probabilidades es mediante la denominada funcin de distribucin (F(x)), cuyo valor en
cada valor xo de la variable se define como la probabilidad de que la variable aleatoria x
tome un valor menor o igual que xo.
Ec. 73. Funcin de distribucin

F ( xo ) = P( x xo )

Cualquier funcin de distribucin debe verificar:


1. F ( ) = P(x ) = 0
2. F ( ) = P(x ) = 1
3. La funcin de distribucin es montona no decreciente.
4. En el caso de variable aleatoria continua la funcin de distribucin es
continua.
La propiedad 1. debe verificarse puesto que el obtener un valor menor que - es el
suceso imposible cuya probabilidad es cero, y la 2. puesto que el obtener un valor
inferior a + es el suceso seguro cuya probabilidad es uno.
Si se escoge un intervalo comprendido entre los lmites a y b, la probabilidad
correspondiente a un valor de la variable comprendido entre dichos lmites, a<xb es
entonces:

76

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 74. Probabilidad en un intervalo (a,b]

P( a < x b) = F (b) F (a )
Demostracin:
Teniendo en cuenta que los sucesos ax y a<xb son mutuamente excluyentes,

P( x a) = F (a)

P( x b) = P( a x a < x b) = P ( x a ) + P( a < x b) = F (b)


P (a < x b) = F (b) F ( a)
Adems, como la probabilidad es no negativa y la funcin de distribucin se define
como montona no decreciente, se tiene que
F (b) F (a ) 0

4.3.2

Funcin de probabilidad

La funcin de probabilidad (p(xo)) nos dice la probabilidad de obtener un valor concreto


de la variable xo:
Ec. 75. Funcin de probabilidad de una variable aleatoria discreta

p ( xo ) = P( x = xo )

Esta definicin es vlida para una variable aleatoria discreta, para la cual solo son
posibles determinados valores aislados. En el caso de una variable aleatoria continua se
define la funcin de probabilidad en el punto xo como la que, multiplicada por dx, nos
da la probabilidad de que la variable tome un valor en un entorno diferencial del valor xo
(entre xo y xo+d x). Por este motivo, a la funcin de probabilidad en el caso de variable
aleatoria continua se la denomina funcin de densidad de probabilidad (f(xo)).
Ec. 76. Funcin de densidad de probabilidad para una variable aleatoria unidimensional

f ( xo ) = P( xo x < x o + dx )

Las funciones de probabilidad y densidad de probabilidad cumplen:


1. Se tiene que verificar que:
0 p ( xo ) 1
0 f ( xo ) 1
puesto que los valores de la probabilidad estn comprendidos entre cero y uno.
2. La funcin de distribucin asociada al extender la integral o el sumatorio a todo el
dominio de la variable aleatoria es uno.

77

Estadstica Aplicada a la Hidrologa

Ec. 77. Funcin de distribucin extendida a todo el dominio de la variable aleatoria


+

F ( +) F ( ) =

f ( x)dx = 1

F ( +) F ( ) = f ( x ) = 1

3. La funcin de densidad o cuanta es no negativa en cualquier punto del dominio de


la variable aleatoria.
4. Con una variable aleatoria continua, el valor de la probabilidad de obtener un valor
en el entorno diferencial de un punto determinado es una cantidad infinitesimal.
En el caso de una variable aleatoria discreta el valor de la funcin de distribucin en un
punto xo ser igual a la suma de los valores de la funcin de probabilidad en todos los
puntos xi menores que xo.
Ec. 78. Relacin entre las funciones de probabilidad y distribucin

F ( xo ) = P( x xo ) =

p( x )
i

xi xo

Para el caso de una variable aleatoria continua la expresin anterior se transforma en la


siguiente:
Ec. 79. Relacin entre las funciones de densidad de probabilidad y distribucin

F ( xo ) = P( x xo ) = f ( x )dx
xo

o lo que es lo mismo:
f (x ) =

dF (x )
dx

Es decir, la funcin de densidad de probabilidad es la derivada de la funcin de


distribucin.
4.3.3

Expresin de la funcin de distribucin mediante factor de frecuencia

El clculo de los valores de la variable aleatoria que corresponden a determinadas


probabilidades acumuladas (o ms habitualmente en hidrologa, a determinados
periodos de retorno), los denominados cuantiles, requiere que la funcin de distribucin
sea invertible, es decir, que se pueda expresar la variable x en funcin de F. Algunas de
las funciones de distribucin ms habitualmente empleadas (normal, Pearson III,
logPearson III, ...) o bien no disponen de expresin analtica para la funcin de
distribucin o bien, an existiendo, es muy difcil despejar la variable, por lo que el
clculo de los cuantiles a partir de las mismas resulta bastante complicado.

78

Mdulo de Estadstica Aplicada a la Hidrologa

Para resolver este problema se ha definido un mtodo alternativo de expresar la relacin


entre la variable y la probabilidad, que facilita la obtencin de los cuantiles. Este
mtodo, denominado del factor de frecuencia, consiste en expresar la variable
correspondiente a un determinado periodo de retorno como la media mas una desviacin
respecto a la misma:

xT = + xT
La desviacin respecto a la media es expresable como la desviacin tpica multiplicada
por un determinado factor (factor de frecuencia), que ser funcin del periodo de
retorno y del tipo de distribucin que siga la poblacin.

xT = K T
Por tanto:
Ec. 80 Expresin del cuantil en funcin del factor de frecuencia

xT = + K T
La ecuacin del factor de frecuencia fue propuesta por Chow en 1951 y se aplica a
muchas funciones de distribucin empleadas en hidrologa. Para cada funcin de
distribucin se puede calcular el factor de frecuencia en funcin del periodo de retorno,
bien expresndolo como una expresin matemtica, bien mediante una tabla. Una vez
que se conoce el factor de frecuencia, se estima el valor de la media y la desviacin
tpica a partir de la muestra y se aplica la expresin anterior.
4.3.4

Operaciones con variables aleatorias

4.3.4.1 Suma de variables aleatorias

Se define la variable aleatoria suma de las variables x e y, como la variable s que es


igual a:
Ec. 81 Suma de variables aleatorias

s = x+ y

El experimento aleatorio asociado a la variable s es el conjunto de los experimentos


asociados a las variables x e y, siendo el valor del experimento asociado a s la suma de
los resultados obtenidos para los dos experimentos parciales.
4.3.4.2 Producto de variables aleatorias

Se define la variable aleatoria producto de las variables x e y, como la variable s que es


igual a:

79

Estadstica Aplicada a la Hidrologa

Ec. 82 Producto de variables aleatorias

s = x y
El experimento aleatorio asociado a la variable s es el conjunto de los experimentos
asociados a las variables x e y, siendo el valor del experimento asociado a s el producto
de los resultados obtenidos para los dos experimentos parciales.
4.3.5

Transformacin de variables aleatorias

Se denomina transformacin de la variable aleatoria x a una nueva variable aleatoria


y cuyos valores vienen dados por una funcin de la variable x. Es decir, dada la variable
x se obtiene la variable y mediante:
y = h(x)
donde h es una funcin conocida de x.
El experimento aleatorio asociado a la variable aleatoria y es el mismo que para la
variable aleatoria x, obtenindose el valor de y para cada realizacin del experimento
aplicando la funcin h al valor obtenido de x.
La funcin de distribucin de y se puede obtener a partir de la de x. Si llamamos G(y)
a la funcin de distribucin de la variable y, se verificar:
Ec. 83 Relacin entre las funciones de distribucin de una variable y su transformada

G ( y o ) = P ( y y o ) = P[h( x) y o ] = P ( x A)
siendo A el conjunto de valores de x para los cuales h(x)=yo.
En el caso de que la funcin h(x) sea montona creciente la relacin anterior se puede
concretar algo ms. El conjunto A de valores x para los cuales h(x)yo, sern:
x xo
siendo:
x o = h 1 ( y o )
Por lo tanto:
Ec. 84 Relacin entre funciones de distribucin: Transformacin montona creciente

G ( y o ) = P [x x o ] = F ( x o )
por lo que las funciones de distribucin de x e y son idnticas.
En el caso de que la funcin h(x) sea montona decreciente se tendr:

80

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 85 Relacin entre funciones de distribucin. Transformacin montona decreciente

G ( y o ) = P ( x x o ) = 1 P ( x xo ) = 1 F ( x o )
En cuanto a la funcin de probabilidad, la probabilidad de obtener un valor de yo
para la variable y ser igual a la probabilidad de obtener uno de los valores de x para los
cuales h(xo)=yo.
Ec. 86 Relacin entre las funciones de probabilidad de una variable y su transformada

P( y o ) = P( y = y o ) =

P( x )
i

y o = h ( xi )

En el caso de variables continuas, la funcin de densidad de probabilidad se puede


obtener como derivada de la funcin de distribucin:
Ec. 87 Relacin entre las funciones de densidad. Transformacin montona creciente

dG ( y )
dF ( x ) dx
dx
= g ( y) =
= f ( x)
dy
dx dy
dy
f ( x) = g ( y )h '
si la funcin h(x) es montona creciente. Y:
Ec. 88 Relacin entre las funciones de densidad. Transformacin montona decreciente

dG ( y )
dF ( x ) dx
dx
= g ( y) =
= f ( x)
dy
dx dy
dy
f ( x) = g ( y )h '
si la funcin h(x) es montona decreciente.

4.4
4.4.1

VARIABLE ALEATORIA BIVARIADA


Funcin de distribucin conjunta

Al igual que se definan las funciones de distribucin, probabilidad y densidad de


probabilidad para el caso de variables univariadas, se pueden generalizar las
definiciones dadas anteriormente para el caso de variables bivariadas o, en general,
multivariadas. Estas funciones representarn, como en el caso univariado, la relacin
entre los valores de la variable y sus probabilidades.
Si la variable es discreta, llamaremos funcin de probabilidad conjunta a la
probabilidad de obtener un valor concreto para la variable bidimensional:
x = ( x, y )

81

Estadstica Aplicada a la Hidrologa

Ec. 89 Funcin de probabilidad bivariada

P ( x o ) = P [x = x o = ( x o , y o ) ]
Al igual que en el caso univariado se debe verificar:
Ec. 90 Propiedades de la funcin de probabilidad bivariada

P( xo ) 0

P( x ) = 1
i

La probabilidad de cualquier valor de la variable debe ser mayor o igual que cero y la
suma de las probabilidades de todos los posibles valores de la variable debe ser igual a
uno, como consecuencia de la definicin de probabilidad.
Si la variable es continua, se emplear la funcin de densidad de probabilidad
conjunta, que se define como la que multiplicada por dxdy da la probabilidad de que la
variable adopte un valor en un entorno diferencial de xo e yo.
Es decir:
x o = ( x o , y o ) x x o + dx = ( x o + dx, y o + dy )
Como antes, se verifica:
Ec. 91 Propiedades de la funcin de densidad de probabilidad bivariada

f ( x ) = f ( x, y ) 0

f ( x, y )dxdy = 1

La funcin de distribucin conjunta se obtiene por integracin de la funcin de


densidad de probabilidad y viene definida como la probabilidad de que la variable
x=(x,y) tome un valor tal que:
x xo
y yo
Se tendr.
Ec. 92 Funcin de distribucin bivariada

F ( x o ) = F [x ( x o , y o ) ] =

xo

yo

82

f ( x, y ) dxdy

Mdulo de Estadstica Aplicada a la Hidrologa

4.4.2

Variable aleatoria marginal. Funcin de distribucin marginal

Si x es una variable aleatoria bidimensional x=(x,y), se llama variable aleatoria marginal


referida a la componente xi a la variable unidimensional que se obtiene cuando se
considera la variable aleatoria aisladamente.
Para una variable bidimensional existen dos variables marginales. Si partisemos de una
variable n-dimensional, se tendrn n variables marginales.
Se pueden obtener las funciones de probabilidad y distribucin para cada una de las
variables marginales a partir de las de la variable bivariada, sumando los valores de
probabilidad de la variable x, manteniendo xi fijo y variando la otra componente xj a
todos sus valores posibles. Estas funciones se denominan marginales.
La funcin de probabilidad marginal se obtendr como:
Ec. 93. Funciones de probabilidad marginal para variable discreta bidimensional

P ( x ) = P ( x, y )
y

P ( y ) = P ( x, y )
x

Para variable continua, la funcin de densidad de probabilidad marginal vendr dada


por:
Ec. 94. Funciones de densidad de probabilidad marginal para variable discreta bidimensional

f ( x, y )dy

f ( x) =

f ( x, y)dx

f ( y) =

Por ltimo, la funcin de distribucin marginal se obtiene por integracin de la


funcin de densidad:
Ec. 95. Funciones de distribucin marginal para variable continua bidimensional
xo

xo

F ( x o ) = P ( x xo ) =

f ( x )dx =

yo

yo

F ( y o ) = P( y y o ) =

f ( x, y)dxdy

f ( y ) dy =

f ( x, y )dxdy

La palabra marginal proviene de que en el caso de manejar una variable


bidimensional discreta y tener escritas las probabilidades de cada valor de x=(x,y) en
una tabla de doble entrada, las probabilidades de la variable aislada x o y se obtienen en
los mrgenes de la tabla al sumar por filas o columnas.

83

Estadstica Aplicada a la Hidrologa

4.4.3

Dependencia e independencia de variables aleatorias. Funcin de distribucin


condicionada

Las definiciones de dependencia e independencia estadstica y de probabilidad


condicionada definidas en el captulo 2 para sucesos aleatorios, puede generalizarse para
el caso de variables aleatorias.
Se dice que dos variables aleatorias son independientes si se cumple:
Ec. 96 Independencia de variables aleatorias

F ( x, y ) = F ( x )F ( y )

al igual que para sucesos se verificaba:


P( A B) = P( A)P ( B)

Es decir, la funcin de distribucin conjunta es el producto de las funciones de


distribucin marginales.
Ejemplo:
El resultado anterior, derivado de la independencia de las variables aleatorias, se puede aplicar a
la estimacin de funciones de distribucin. Supongamos que la funcin H(y) representa la
funcin de distribucin de las intensidades de precipitacin mximas anuales. Por otro lado G(z)
representa la funcin de distribucin de las duraciones de los chubascos mximos. La funcin
de distribucin de las precipitaciones mximas, supuesta la independencia de las variables
aleatorias anteriores, intensidad de precipitacin y duracin del chubasco, sera el producto de
las funciones de distribucin anteriores, H(y) G(z).

A partir de las dos variables x e y se puede definir la variable aleatoria condicionada


como la variable x/y que representa los posibles valores de la variable x sabiendo que la
variable y ha adquirido un determinado valor de y=yo.
Para esta nueva variable se pueden definir las funciones de probabilidad, densidad y
distribucin que reciben el nombre de condicionadas.
La variable aleatoria condicionada x es la univariada que se obtiene al darle un valor
concreto yo a la variable y.
La funcin de probabilidad condicionada viene dada por:
Ec. 97 Funcin de probabilidad condicionada para variable aleatoria discreta

P ( x, y ) =
donde:

84

P ( x, y o )
P( yo )

Mdulo de Estadstica Aplicada a la Hidrologa

P ( y o ) = P ( x, y o )
x

Se divide por P(y) para que la suma de todas las probabilidades de los valores de x sea
igual a uno, condicin que debe cumplir cualquier funcin de probabilidad.

P ( x, y

P ( x, y
o

)=

P( yo )

)
=

P( y o )
=1
P( y o )

La funcin de densidad de probabilidad condicionada, para el caso de variable


aleatoria continua, es:
Ec. 98 Funcin de densidad condicionada para variable aleatoria continua

f ( x, y o ) =

f ( x, y o )
f ( yo )

con:

f ( x, y )dx

f ( yo ) =

Al igual que antes, al dividir por f(yo) se consigue que:

f ( x / y o ) dx =

f ( yo )
1
=1
f ( x, y o )dx =

f ( y o )
f ( yo )

Por ltimo, la funcin de distribucin condicionada se obtiene, como anteriormente,


a partir de la funcin de densidad:
Ec. 99 Funcin de distribucin condicionada
x

F ( x / yo ) =

f ( x, y o )
dx
f ( yo )

Si las variables x e y son independientes, se verifica:


Ec. 100 Funcin de distribucin condicionada para el caso de variables independientes

F ( x / y) =

F ( x )F ( y )
= F ( x)
F ( y)

y la funcin de distribucin condicionada de la variable x respecto a y coincide con la


funcin de distribucin de x.

85

Estadstica Aplicada a la Hidrologa

4.5

ESPERANZA Y MOMENTOS DE LAS FUNCIONES DE DISTRIBUCIN

Al considerar la funcin de distribucin, densidad y cuanta como expresiones de la


probabilidad en el dominio de la variable aleatoria, vuelve a tener sentido encontrar las
expresiones de las medidas de centralidad, dispersin, asimetra o curtosis que
anteriormente se haban mencionado al describir las muestras. En aquel caso se conoca
una muestra tomada de la variable aleatoria. Aqu, a travs de la funcin de probabilidad
y el dominio de la variable se tiene completamente conocido el fenmeno aleatorio.
4.5.1

Esperanza matemtica

4.5.1.1 Definicin
Se denomina esperanza matemtica de una variable aleatoria al valor medio ponderado
por su probabilidad:
Ec. 101. Esperanza de una variable continua
+

E ( x) =

x f ( x)dx

Ec. 102. Esperanza de una variable discreta


+

E ( x) = x f ( x )

Esta definicin se puede extender a la consideracin de una funcin g(x):


Ec. 103. Esperanza de una funcin

E [g ( x ) ] =

g ( x) f ( x)dx

E [g ( x)] = g ( x) f ( x)

4.5.1.2 Propiedades
1. La esperanza de una constante es la constante
Ec. 104. Esperanza de una constante
+

E (b) = b f ( x ) = b f ( x) = b1 = b

2. La esperanza de una variable aleatoria funcin lineal de otra es la combinacin


lineal de la esperanza.

86

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 105. Esperanza de combinacin lineal de variables aleatorias

y = a x + b
+

E ( y ) = E ( a x + b) = (a x + b) f ( y ) = a x f ( x) + b f ( x) = aE ( x ) + b

3. La esperanza de una variable aleatoria suma de otras, independientes o no, es la


suma de las esperanzas de cada una de ellas
Ec. 106. Esperanza de una suma de variables aleatorias

y = x1 + .. + xn
+

E ( y ) = E ( x1 + .. + xn ) = ( x1 + .. + xn ) p ( x1 ,..., xn ) = x1 p( x1 ) + .. xn p ( xn )
= E ( x1 ) + .. + E ( xn )

4. La esperanza de una variable aleatoria producto de otras es el producto de las


esperanzas siempre que sean independientes
Ec. 107. Esperanza de un producto de variables aleatorias independientes

y = x1 .. x n
E ( y ) = E ( x1 .. x n ) = E ( x1 )..E ( x n )

4.5.2

Varianza

4.5.2.1 Definicin
La medida de la dispersin de la poblacin conocidas la funcin de probabilidad y el
dominio de la variable viene dada por la esperanza de las desviaciones cuadrticas sobre
la media:
Ec. 108. Varianza de la poblacin

V ( x) = E ( x E ( x)) 2 = E ( x 2 ) (E ( x) )

4.5.2.2 Propiedades
1. La varianza de una constante es nula
Ec. 109. Varianza de una constante

V (b) = E (b E (b)) 2 = E (b b) 2

2. La varianza de una variable aleatoria funcin lineal de otra es:

87

Estadstica Aplicada a la Hidrologa

Ec. 110. Varianza de una combinacin lineal

y = a x + b

V ( y ) = V (a x + b) = E ((a x + b) ( aE ( x) + b)) 2 = E a 2 ( x E ( x)) 2 = a 2 V ( x)

3. La varianza de una suma de variables aleatorias es la suma de las varianzas si


hay independencia.
Ec. 111. Varianza de una suma de variables aleatorias

y = x1 + .. + x n
V ( y ) = V ( x1 + .. + x n ) = V ( x1 ) + .. + V ( x n )

4.5.3

Momentos centrales de orden n

En general se expresa como momentos centrales de orden n a la siguiente expresin:


Ec. 112. Momento central de orden n

M n ( x ) = E ( x E ( x)) n = ( x E ( x)) n p ( x )

M n ( x ) = E ( x E ( x)) n = ( x E ( x)) n f ( x )dx

4.5.4

Momentos respecto al origen y centrales de una variable bidimensional

Las expresiones anteriores se amplan al caso de variables aleatorias bidimensionales o


multidimensionales. En el caso bidimensional, el orden del momento tiene dos
coordenadas, (i, j), quedando las siguientes expresiones:
Ec. 113. Momento respecto al origen de orden (i, j)
+

i , j = x i y j p ( x, y )

++

i, j =

x y
i

f ( x, y )dxdy

Ec. 114. Momento central de orden (i, j)

M i , j = E ( x 10 ) i ( y 01 ) j = ( x 10 ) i ( y 01 ) j p ( x, y )

+ +

M i , j = E ( x 10 ) ( y 01 )
i

) = (x

88

10

) i ( y 01 ) j f ( x, y )dxdy

Mdulo de Estadstica Aplicada a la Hidrologa

De los ltimos tienen especial inters las varianzas y covarianzas:


Ec. 115. Varianzas y covarianzas

M 2, 0 = 20 102
2
M 0, 2 = 02 01

M 1,1 = 11 10 01

89

Estadstica Aplicada a la Hidrologa

90

Mdulo de Estadstica Aplicada a la Hidrologa

MODELOS DE DISTRIBUCIN UNIVARIADA DE PROBABILIDAD

En los siguientes apartados se exponen diferentes funciones de distribucin y sus


caractersticas ms importantes. La expresin matemtica de tales funciones de
distribucin depende de parmetros, que podran coincidir con estadsticos sencillos
como la media, desviacin tpica, coeficiente de sesgo, etc. Sin embargo, en muchos
casos la expresin matemtica de las funciones de distribucin no se hace depender de
estos estadsticos, sino de otros parmetros que simplifican su expresin. As, se recurre
a parmetros como los denominados factores de localizacin, de escala o de forma, que
vuelven a hacer referencia conceptos similares que los que describen la media,
desviacin tpica y sesgo respectivamente, aunque no coinciden exactamente.
El parmetro de localizacin se identifica con una abscisa de referencia de la
distribucin. Puede coincidir con la media y una medida central de localizacin, pero no
siempre es as. El parmetro de escala est definido como la posicin de un punto
respecto a otro de referencia, normalmente el parmetro de localizacin. Como
ejemplos se pueden citar la desviacin tpica. Por ltimo, el parmetro de forma sirve
para clasificar la geometra de las distribuciones.

5.1

DISTRIBUCIN NORMAL Y ASOCIADAS

La funcin de distribucin normal o de Gauss se asocia a un gran nmero de fenmenos


naturales. Depende de dos parmetros: , que es adems media, mediana y moda, y ,
que coincide con la desviacin tpica. No tiene sesgo y es simtrica. Se denota por N
(,), siendo sus funciones de densidad y distribucin de probabilidad las que se
exponen a continuacin. La funcin de densidad no es integrable y las probabilidades se
calculan resolviendo la integral por mtodos numricos.
Ec. 116. Funcin de densidad normal

f ( x) =

1 x 2


2

Ec. 117. Funcin de distribucin normal


1 x 2


2
1
P(Y y ) = F ( y ) =
e
2

dx

Media

Desviacin tpica

Sesgo

Curtosis

Tabla 17. Estadsticos de la distribucin normal

El efecto de la variacin de la media en una funcin de densidad o distribucin es


equivalente al desplazamiento sobre el eje de abscisas de la variable aleatoria de la
misma funcin de densidad. En las siguientes grficas se comprueba el efecto que
produce, tanto en la funcin de distribucin como en la de densidad, el aumento de la
desviacin tpica. Aumentar la desviacin tpica supone aumentar la variabilidad de la
muestra por lo que la concentracin de valores de la campana de Gauss se reduce.

91

Estadstica Aplicada a la Hidrologa

-4

-3

-2

-1

1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00

Funcin de distribucin

Funcin de distribucin

1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00

-7

-6

-5

-4

-3

-2

-1

Variable

Desviacin tpica= 1
Desviacin tpica= 2
0

Variable

Figura 34. Distribucin normal tipificada y comparacin con desviacin tpica 2.

-4

-3

-2

-1

Funcin de densidad

Funcin de densidad

1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0

-7

-6

-5

-4

-3

-2

1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-1
0

Desviacin tpica= 1
Desviacin tpica= 2

Variable

Variable

Figura 35. Densidad normal tipificada y comparacin con desviacin tpica 2.

Se conoce como variable tipificada a la transformada de la variable original en funcin


de su media y desviacin tpica. La variable aleatoria tipificada tiene una distribucin de
probabilidad distinta, N(0,1), que se usa como referencia para el clculo de
probabilidades de otras variables aleatorias normales, pero con parmetros y , en
general distintos de 0 y 1. Transformando los valores de las variables normales del caso
que se considere, se transfiere el problema al clculo de probabilidades de la N(0,1), de
la que se dispone de tablas.
Ec. 118. Variable tipificada y densidad normal de la variable tipificada

z=

f ( z) =

1
2

1 2
z
2

F ( z) =

x
1
e 2 dx
2

En Chow (1994) se tienen las expresiones para la resolucin de esta integral en la


variable tipificada.
Ec. 119. Resolucin numrica de la normal

1
2
3
4
B = 1 + 0,196854 z + 0,115194 z + 0,000344 z + 0,019527 z
2
z < 0 P (Z z ) = F ( z ) = B

z 0 P (Z z ) = F ( z ) = 1 B

92

Mdulo de Estadstica Aplicada a la Hidrologa

En la siguiente tabla se muestran los valores de probabilidad tipificados obtenidos por


medio de la hoja Excel y la utilizacin del comando DISTR.NORM.ESTAND()
Valor x Funcin de Valor x Funcin de Valor x Funcin de
Distribucin
Distribucin
Distribucin
-3,0
-2,8
-2,6
-2,4
-2,2
-2,0
-1,8
-1,6
-1,4
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2

0,0013
0,0026
0,0047
0,0082
0,0139
0,0228
0,0359
0,0548
0,0808
0,1151
0,1587
0,2119
0,2743
0,3446
0,4207

0,0

0,5000

0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0

0,5793
0,6554
0,7257
0,7881
0,8413
0,8849
0,9192
0,9452
0,9641
0,9772
0,9861
0,9918
0,9953
0,9974
0,9987

Tabla 18. Funcin de distribucin normal

La distribucin normal se utiliza en hidrologa con variables de las que cabe esperar
simetra alrededor de la media. Es una funcin de distribucin muy utilizada para
multitud de procesos. En la siguiente figura se muestra un ejemplo con el ajuste de
precipitaciones totales anuales de una estacin pluviomtrica.

Figura 36. Ajuste de una distribucin normal a precipitaciones totales anuales

Sin embargo, en muchas situaciones el sesgo de las poblaciones que se estudian en


hidrologa es pronunciado por lo que el ajuste de la distribucin normal no es adecuado,
tal como se puede observar de su aplicacin a casos de lluvias mximas como el que se
representa en la siguiente figura. Otro inconveniente para su utilizacin es que el
dominio de la normal abarca tambin valores negativos y muchas variables hidrolgicas
son estrictamente positivas como la precipitacin o el caudal.

93

Estadstica Aplicada a la Hidrologa

Figura 37. Ajuste de una distribucin normal en precipitaciones mximas anuales.

Papel normal:
Para poder dibujar una funcin de distribucin normal como una recta, se transforman
adecuadamente los valores del eje de abscisas, probabilidad. Se tendran que despejar los
valores de z en funcin de la probabilidad, pero debido a la imposibilidad de manejar una
expresin explcita de la integral de la distribucin, se manejan expresiones aproximadas.
A continuacin se muestran las expresiones utilizadas para transformar las abscisas en
funcin de la probabilidad de excedencia, p, y de una variable auxiliar w (Chow, 1994).

p = 1 F ( z) =

1
T

1
0 < p 0,5 w = ln 2
p

p > 0,5 w = ln
2
(1 p )
5.1.1

z = w
1

2,515517 + 0,802853w + 0,010328w2


1 + 1,432788w + 0,189269w2 + 0,001308w3

2,515517 + 0,802853w + 0,010328w 2


z = w

1 + 1,432788w + 0,189269w 2 + 0,001308w3

Teorema central del lmite

Este teorema establece (Pea, 2000) que si x1, ..., xn son variables aleatorias
independientes con media i, desviacin tpica i y distribucin cualquiera, sin ser
necesariamente la misma, entonces, si n crece, la variable Y= x1+ ...+ xn tiende a una
funcin de distribucin N(,2). La variable Y se tipifica y quedara ZN(0,1):
Ec. 120. Variable tipificada

Z=

94

Mdulo de Estadstica Aplicada a la Hidrologa

La aplicacin de este teorema en hidrologa es inmediata. Cuando se disponga de


variables aleatorias fruto de la composicin de otras como ocurre con las precipitaciones
totales anuales, se puede presuponer su ajuste segn una normal. Otro ejemplo directo
es la generacin de nmeros aleatorios. Se pueden generar nmeros segn una funcin
de distribucin uniforme y despus sumarlos para obtener una normal.
Otras distribuciones asociadas a la normal son la logartmica normal, la 2 de Fisher, la t
de Student y la F de Snedecor.
5.1.2

Distribucin logartmica normal

Se dice que una variable aleatoria x sigue una funcin de distribucin logartmica
normal si sus logaritmos siguen una distribucin normal. La variable x tiene que ser
estrictamente positiva. La normal, al contrario, admite un dominio de valores positivo y
negativo. Utilizando los logaritmos neperianos y los parmetros y , media y
desviacin tpica de los logaritmos de la variable transformada y, la expresin de la
funcin de densidad es la que sigue.
Ec. 121. Densidad logartmico normal

x LN y = ln x N ( , )
1 ln x 2


2
1
f ( x) =
e
x 2
x>0

Media

Desviacin tpica

e(

+ 2

) (e

) e 1
2

Sesgo
2

+2 e

Curtosis
2

Tabla 19. Estadsticos de la distribucin logartmico normal ( y , medias y desviaciones


tpicas de los logaritmos de la variable x)

Las siguientes grficas muestran la asimetra de la distribucin logartmico normal,


aunque los logaritmos s se mantienen simtricos alrededor de su media. La
transformacin logartmica se aplica para reducir la asimetra positiva de variables
hidrolgicas (Chow, 1994), ampliando la resolucin en los valores bajos de la variable.

95

Estadstica Aplicada a la Hidrologa

2,40
2,20

Funcin de dis tribucin

2,00
Funcin de densidad

1,80
1,60
1,40
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0,0

0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

4,5

5,0

5,5

1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00

6,0

2,40
Desviacin tpica de la muestra= 0,2

2,20

Desviacin tpica de la muestra= 0,4

Funcin de distribucin

2,00
Funcin de densidad

1,80
1,60
1,40
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0,0

0,5

1,0

1,5

2,0

2,5

3,0

Variable

Variable

3,5

4,0

4,5

5,0

5,5

6,0

1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00

Desviacin tpica de la muestra= 0,2


Desviacin tpica de la muestra= 0,4
0

Variable

Variable

Figura 38. Funciones de densidad y distribucin logartmico normales

Esta distribucin ampla el campo de aplicacin del teorema central del lmite al caso de
variables generadas como el producto de n variables aleatorias independientes, x1, ..., xn,
Y= x1 ... xn. Entonces, el logaritmo de Y seguir una poblacin normal.
En hidrologa se utiliza tambin una funcin de distribucin logartmica normal de tres
parmetros (NERC, 1975). Al tomar logaritmos se puede aadir un lmite inferior que
pasa a denominarse factor de localizacin.
Ec. 122. Planteamiento de la funcin logartmica normal de tres parmetros

z = ln( x xo )
Quedando una funcin de densidad:
Ec. 123. Densidad logartmico normal de tres parmetros
1 ln ( x x )
o
z

z
2

1
f ( x) =
e
( x xo ) z 2

5.1.3

Distribucin 2 (chi-cuadrado) de Pearson

Si x1, ..., xn son variables aleatorias independientes, con distribucin N(0,1), la variable
aleatoria suma de los cuadrados de las n variables sigue la distribucin chi-cuadrado de
96

Mdulo de Estadstica Aplicada a la Hidrologa

Pearson. El nmero de sumandos n se denomina grados de libertad y es el nico


parmetro del que depende la funcin de distribucin.
Ec. 124. Variable aleatoria 2 (chi-cuadrado) de Pearson

y = x12 + ... + xn2

xi N (0,1)

Ec. 125. Densidad 2 (chi-cuadrado) de Pearson

n 1
2

y
2

e
f ( y) = n
2 2 n

( 2)

y>0
Media

Desviacin tpica

Sesgo

2n

Curtosis

3 + 12

Tabla 20. Estadsticos de la distribucin 2 (chi-cuadrado) de Pearson

La siguiente grfica muestra distintas funciones de densidad de la chi-cuadrado,


observndose cmo la funcin va hacindose simtrica a medida que aumenta el
nmero de grados de libertad.
0,25
Grados de libertad 2
Grados de libertad 6

Funcinde densidad

0,20

Grados de libertad 10
Grados de libertad 30

0,15

0,10

0,05

0,00
0,0

5,0

10,0

15,0

20,0

25,0

30,0

35,0

40,0

Figura 39. Densidades de la chi-cuadrado dependientes del nmero de grados de libertad

La funcin de distribucin ha de calcularse por integracin numrica. Los resultados


pueden consultarse en diferentes tablas existentes en la bibliografa, con entradas en
funcin del nmero de grados de libertad y la probabilidad acumulada. Las hojas de
clculo tienen esas funciones implementadas.

97

Estadstica Aplicada a la Hidrologa

1,0000
0,9000
0,8000

Probabilidad

0,7000
Grados de libertad 1
2
3
4
5
6
7
8
9
10
15
20
30
40
50
60
70
80
90
100

0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

150

Variable aleatoria

Figura 40. Funcin de distribucin Chi-cuadrado en funcin de los grados de libertad

Otros teoremas relativos a la chi-cuadrado que aparecen en la bibliografa consultada


son los siguientes:
1. (Spiegel, 1990) Sean U1,...Uk variables aleatorias con distribucin chi-cuadrado
y v1,...vk los grados de libertad respectivos. Su suma W= U1+,...+Uk tiene
distribucin chi-cuadrado con v1+...+vk grados de libertad.
2. (Spiegel, 1990) Sean U1 y U2 variables aleatorias independientes. Si U1 tiene
distribucin chi-cuadrado con v1 grados de libertad, mientras que U=U1+U2
tiene distribucin chi-cuadrado con v grados de libertad, siendo v>v1, entonces U2
tiene distribucin chi-cuadrado con v-v1 grados de libertad.

Esta funcin de distribucin tiene una aplicacin importante, que es la comprobacin


del ajuste de una serie de datos a una determinada distribucin (Gmez Espadas). Para
ello se comparan las frecuencias observadas con las frecuencias tericas de la
distribucin que se supone que se ajusta a los datos. Las frecuencias observadas se
calculan dividiendo el dominio de la variable, inicialmente cualitativa, en n clases. El
estadstico de comparacin siguiente sigue una distribucin chi-cuadrado con n-1
grados de libertad. Si el valor obtenido con el estadstico es superior al valor de
referencia tomado de las tablas de la chi-cuadrado para un nivel de significacin dado,
se rechaza la hiptesis de ajuste. Si ocurre lo contrario, el valor del estadstico es menor
que el terico dado por las tablas, el ajuste se acepta.
Eliminado: estadstico

Ec. 126. Estadstico de contraste para ajuste de una funcin de distribucin


n

( f ri f ti )2

i =1

f ti

5.1.4

n21

Distribucin t de Student

Dadas n+1 variables aleatorias independientes, x, x1, ..., xn con distribucin idntica
N(0,), Gosset plante la siguiente variable aleatoria:

98

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 127. Variable aleatoria t de Student

tn =

1 n 2
xi
n i =1

Esta variable aleatoria depende del nmero de grados de libertad, n del denominador.
Tiene la ventaja de que la distribucin no depende de la varianza comn 2, adems de
ser simtrica, a diferencia de la chi-cuadrado.
Ec. 128. Densidad t de Student

n +1
1
2
f ( y) =

n n
2
< y <
Media

( )

Desviacin tpica

)1 + y

Sesgo

Curtosis

( n +1)

3+ 6

n4
n>4

n2
n>2

Tabla 21. Estadsticos de la distribucin t de Student

En la siguiente figura se observa la simetra de la funcin de densidad, que tiende a la


normal conforme aumenta el nmero de grados de libertad.
0,45
Grados de libertad 2
0,40

Grados de libertad 5

Funcinde densidad

0,35

Grados de libertad 10
Grados de libertad 100

0,30
0,25
0,20
0,15
0,10
0,05
0,00
-9 -8 -7 -6 -5 -4 -3 -2 -1 0

Figura 41. Densidad de la t de Student para diferentes grados de libertad

5.1.5

Distribucin F de Fisher

Dadas n1+n2 variables aleatorias independientes, x1, ..., xn1 y y1, ..., yn2 con distribucin
idntica N(0,), se plantea la siguiente variable aleatoria:

99

Estadstica Aplicada a la Hidrologa

Ec. 129. Variable aleatoria F de Fisher

Fn1 ,n2

1 n1 2
xi
n1 i =1
=
1 n2 2
y j
n 2 j =1

Ec. 130. Funcin de densidad de la F de Fisher

n + n2
1
n1 n2 n1
n1 + n2
1
2

f ( x) =
n12 n22 x 2 (n2 + n1 x ) 2
n n
1 2
2 2
x>0
Esta variable aleatoria depende del nmero de grados de libertad del numerador y
denominador. Su funcin de distribucin no depende de , aunque s de los grados de
libertad mencionados.
Media

n2

n2 2

n2 > 2

Desviacin tpica

2n (n1 + n 2 2)
2
2

Sesgo

Curtosis

n1 (n 2 2 ) (n 2 4)
2

n2 > 4

Tabla 22. Estadsticos de la distribucin F de Fisher

5.2

PROCESO DE BERNOULLI

El proceso de Bernoulli es aquel que cumple las siguientes caractersticas (Pea, 2000):
1. Para cualquier suceso solo existen dos posibles resultados, verdadero o falso,
aceptable o defectuoso, llueve o no llueve.
2. La proporcin de elementos de cada categora (V o F) en la poblacin se mantiene
constante.
3. Las observaciones son independientes unas de otras y cada realizacin no contiene
informacin sobre la siguiente.
Se asume que son procesos de Bernoulli aquellos en los que se dan observaciones con
reemplazamiento en una poblacin finita o infinita que cumpla las condiciones
anteriores, estabilidad e independencia en las observaciones. En este proceso se pueden
definir diferentes variables aleatorias de inters, con sus funciones de distribucin
asociadas.

100

Mdulo de Estadstica Aplicada a la Hidrologa

5.2.1

Distribucin de Bernoulli

La variable aleatoria es en este caso la definida por los posibles resultados, verdadero o
falso, 0 1, llueve o no llueve. Cada una de las dos posibilidades tiene una probabilidad
de ocurrencia constante. Si el resultado es aceptable, la probabilidad de ocurrencia es el
porcentaje fijo de sucesos aceptables o verdaderos, q. El caso contrario se define por el
porcentaje asociado, p, igual al complementario del anterior, 1-q. Considerando la
variable aleatoria definida con 0 para el caso del suceso aceptable y con 1 para el falso o
rechazable, la funcin de probabilidad puede expresarse:
Ec. 131. Distribucin de Bernoulli

P( x) = p x q 1 x
x = 0,1
Esta funcin de distribucin tienen los estadsticos asociados a la poblacin:
Media Desviacin tpica

pq

Sesgo

Curtosis

q p
pq

Tabla 23. Estadsticos de la distribucin de Bernoulli

Clculo del coeficiente de sesgo o asimetra de la distribucin de Bernoulli

CA( X ) =
=
=

E (x E (x ))

] = ((x p ) P( x )) =
3

(0 p )3 q + (1 p )3 p = p3 + p 4 + p 3 p 2 + 3 p3 p 4

pq

p 1 3 p + 2 p 2

5.2.2

pq

pq

p 3 p 2 + 2 p 3

) = p(1 p )( 1 2 p ) = pq(q p ) = (q p )

pq

pq

pq

pq

Distribucin Binomial

En el mismo proceso (Pea, 2000) puede definirse otra variable aleatoria, distinta de la
anterior, que represente el nmero de elementos rechazables (valor 1 y con probabilidad
de ocurrencia p) al observar n. Entonces, la nueva variable aleatoria puede tomar
valores desde 0, es decir, todas las observaciones de n son aceptables, hasta n, todas
rechazables. La probabilidad de que dadas las n observaciones, r sean rechazables,
supuesta la independencia entre las observaciones, ser:
Ec. 132. Probabilidad de obtener r rechazables en un orden determinado

P( x = r ) = p r q n r

Pero como el nmero de posibilidades para obtener r elementos rechazables de n


coincide con el nmero de combinaciones posibles de r elementos en n, la funcin de
probabilidad queda:

101

Estadstica Aplicada a la Hidrologa

Ec. 133. Distribucin binomial

n
P( x = r ) = p r q n r
r
Con los estadsticos asociados que se muestran en la siguiente tabla:
Media

Desviacin tpica

n p

Sesgo

Curtosis

q p

n pq

3+

n pq

1 6 pq
n pq

Tabla 24. Estadsticos de la distribucin binomial

Ejemplo: estimar el valor de la media y varianza de la distribucin binomial.


Aprovechando el clculo para la de Bernoulli,

E ( X ) = E ( X 1 + X 2 + ... + X n )
E ( X ) = n p
E ( X i ) = 0q + 1 p = p

V ( X ) = E ( X 1 + X 2 + ... + X n )

V ( X i ) = E ( X i E ( X i ))

V ( X ) = n pq
= (0 p ) q + (1 p ) p = p q + q p = q p
2

En las siguientes figuras se muestra la distribucin de probabilidad para diferentes


proporciones de elementos rechazables, siguiendo los ejemplos de Pea (2000). Con p
igual al 50% la distribucin es simtrica; en otros casos, asimtrica.
p= 0,2

p= 0,1
0,12

0,14
0,12

0,1
Probabilidad

Probabilidad

0,1
0,08
0,06
0,04

0,08
0,06
0,04

0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100

0,02

0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100

0,02

Nmero de elementos rechazables

Nmero de elementos rechazables

p= 0,5

0,09

0,09

0,08

0,08

0,07

0,07

0,06

0,06

Probabilidad

Probabilidad

p= 0,4

0,05
0,04
0,03

0,05
0,04
0,03

0,02

0,02

0,01

0,01

0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100

0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100

Nmero de elementos rechazables

Nmero de elementos rechazables

Figura 42. Distribuciones binomiales de probabilidad para distintos porcentajes de p

102

Mdulo de Estadstica Aplicada a la Hidrologa

Ejemplo: se estima como criterio de diseo un probabilidad de que se produzca una


crecida de 0,2 (5 aos de periodo de retorno). La construccin de la obra va a durar 5
aos. Cul es la probabilidad de que aparezca una crecida anual al menos una vez
durante la construccin de la presa.
La probabilidad de que se produzca al menos una vez es la suma de las probabilidades
de ocurrencia de una vez, dos veces, tres veces, cuatro veces y cinco veces.
5
5
P = 0,2 i 0,8 5i = 0,67
i =1 i

5.2.3

Distribucin Geomtrica

En el caso en que se quiera calcular la probabilidad de obtener un nmero de elementos


dado hasta el primero rechazable (Pea, 2000), se tiene la distribucin geomtrica.
Tomando n como nmero total de observaciones, n-1 ser el nmero de observaciones
aceptables, con probabilidad q, y 1 el nmero de las rechazables con probabilidad p que
pone fin al suceso. La funcin de distribucin se muestra a continuacin:
Ec. 134. Distribucin geomtrica

P( x = n) = pq n 1
Media

Desviacin tpica

q
p

Sesgo

1+ q

Curtosis

3+

p 2 + 6q
q

Tabla 25. Estadsticos de la distribucin geomtrica

Clculo de la media de la distribucin geomtrica,

= (iP( x = i )) = p + 2 pq + 3 pq 2 + ... + n pq n 1 + ...


i =1

(1 q ) = pq + pq 2 + pq 3 + ... + pq n + ... = 1 + q + q 2 + q 3 + ... + q n + ...


(1 q ) = 1 =

1
p

Tambin en este caso se muestran grficas representativas de la distribucin de


probabilidad para diferentes valores del porcentaje p de elementos rechazables. Al
aumentar p, se comprueba la concentracin de la densidad de probabilidad alrededor de
los primeros valores y la disminucin de probabilidad para casos con n grandes.

103

Estadstica Aplicada a la Hidrologa

p= 0,1

p= 0,4

0,12

0,45
0,40

0,10
Probabilidad

Probabilidad

0,35
0,08
0,06
0,04

0,30
0,25
0,20
0,15
0,10

0,02
0,05
36

40

44

48

40

44

48

32

28

24

36

Nmero de elementos

20

16

12

48

44

40

36

32

28

24

20

16

12

0,00
0

0,00

Nmero de elementos

p= 0,5

p= 0,7

0,60

0,80
0,70

0,50
Probabilidad

Probabilidad

0,60
0,40
0,30
0,20

0,50
0,40
0,30
0,20

0,10

0,10

Nmero de elementos

32

28

24

20

16

12

48

44

40

36

32

28

24

20

16

12

0,00
0

0,00

Nmero de elementos

Figura 43. Distribuciones geomtricas para distintos valores de p.

Ejemplo: calcular la probabilidad de que la crecida de 5 aos de periodo de retorno se


produzca por primera vez el quinto ao.
Aplicando la funcin de distribucin geomtrica

P( x = 5) = pq 51 = 0,20,8 4 = 0,08

5.3

PROCESO DE POISSON

Todas las variables del proceso anterior son discretas. El proceso de Poisson
corresponde a la observacin de sucesos puntuales sobre un soporte continuo, tiempo,
longitud, rea, etc. (Pea, 2000). Por ejemplo, se podran considerar as la ocurrencia de
tormentas en el tiempo. Este proceso se caracteriza por:
1. El nmero medio de sucesos es constante por unidad de observacin. Es decir, el
nmero de tormentas por unidad de tiempo es constante. La proporcin se
representa por en la formulacin que sigue.
2. Los sucesos aparecen aleatoriamente de forma independiente y un nmero de
tormentas no condiciona la aparicin de otras.

104

Mdulo de Estadstica Aplicada a la Hidrologa

5.3.1

Distribucin de Poisson

En este caso, la variable aleatoria considerada es el nmero de sucesos en un intervalo


de longitud fija (Pea, 2000). Para hallar su funcin de distribucin se parte de una
funcin de distribucin binomial, suponiendo que el nmero n de elementos es infinito,
ya que las observaciones puntuales se producen sobre un continuo. Adems se ha de
suponer que la probabilidad de observar una caracterstica determinada, p, es reducida
(por ejemplo la presentacin de una tormenta). La constante definida anteriormente
como el nmero medio de sucesos por unidad de observacin, ser igual al producto del
nmero total de elementos que constituyen esa unidad de observacin, por el porcentaje
de elementos seleccionados np. Mientras n tiende a (ya que trabajamos sobre un
intervalo infinitesimal) este porcentaje p es tendente a cero. Aplicando la condicin de
lmite a la funcin de distribucin binomial se llega a la definicin final de la
distribucin de probabilidad para esta nueva variable aleatoria.
Ec. 135. Distribucin de Poisson

P( x = r ) =

r
r!

Demostracin:
r

n
P( x = r ) = 1
n
r n

nr

n
lim 1
n r
n n

nr


1
n
r
n( n 1)...(n r + 1)
r

n(n 1)...(n r + 1) n

= lim
= lim

r
1 n =
r! n
r! n
(n ) r
nr

1
n

r
r!

Los estadsticos bsicos de esta funcin de distribucin son:


Media

Desviacin tpica

Sesgo

Curtosis

3+

Tabla 26. Estadsticos de la distribucin de Poisson

En las siguientes grficas se puede apreciar cmo la distribucin de probabilidad tiende


hacia la simetra, a medida que aumenta el valor de ,. La variable aleatoria sigue
siendo discreta y los valores de mayor frecuencia se concentran alrededor de .

105

Estadstica Aplicada a la Hidrologa

landa= 2

0,70

0,30

0,60

0,25

45

50
50

0,20

45

landa= 10

40

landa= 5

35

Nmero de elementos

40

Nmero de elementos

35

30

50

45

40

35

30

25

20

15

0,00
10

0,05

0,00
0

0,10

25

0,10

20

0,20

0,15

15

0,30

0,20

10

0,40

0,50

Probabilidad

Probabilidad

landa= 0,5

0,14

0,18

0,12

0,14

Probabilidad

Probabilidad

0,16
0,12
0,10
0,08
0,06

0,10
0,08
0,06
0,04

0,04
0,02

0,02

Nmero de elementos

30

25

20

15

10

50

45

40

35

30

25

20

15

10

0,00
0

0,00

Nmero de elementos

Figura 44. Distribuciones de probabilidad de Poisson para distintos valores de .

Ejemplo: suponiendo un nmero medio de tormentas durante la primavera de 20,


calcular la probabilidad de que se produzcan 10 tormentas en esa estacin

P( x = r ) =

= 20
r = 10

e
r!

2010 20
e = 0,006
P ( x = 10) =
10!

Calcular la probabilidad de que se produzcan 5 tormentas en 46 das (1 mes y medio


suponiendo que la duracin de la primavera es de tres meses, 92 das).

e
r!

20
10 5 10

=
= 10
e = 0,038
P( x = 5) =
2
5!

r =5

P( x = r ) =

106

Mdulo de Estadstica Aplicada a la Hidrologa

5.3.2

Distribucin exponencial

En este caso la variable aleatoria se define como el intervalo de tiempo entre dos
ocurrencias consecutivas. En este caso ya se trata de una variable continua. Para hallar
la funcin de probabilidad de la variable continua tiempo se utiliza la anterior
distribucin de Poisson. Para ello, se considera que la probabilidad de tener un intervalo
de tiempo entre dos ocurrencias consecutivas de duracin mayor que t, es igual que la
probabilidad de que no tengamos ningn suceso en el intervalo t. La constante de
Poisson ser ahora t y r es 0, quedando:
Ec. 136. Distribucin exponencial

F (t ) = P(T t ) = 1 e t
Demostracin: utilizando la funcin de distribucin de Poisson,

e P( x = 0) = P(T > t ) = e t F (t ) = P(T t ) = 1 e t


r!
F
f (t ) =
= e t
t
P( x = r ) =

Los estadsticos de la funcin se muestran en la siguiente tabla:


Media
1/

Desviacin tpica
1/

Sesgo

Curtosis

Tabla 27. Estadsticos de la distribucin exponencial

La siguiente grfica muestra la funcin de densidad de la exponencial para distintos


valores de la constante . El inverso de esta constante es el factor de escala.
0,80
0,70
0,5

0,60

2
f(x)

0,50

0,2

0,40
0,30
0,20
0,10

30

25

20

15

10

0,00
Tiempo

Figura 45. Distribuciones exponenciales en funcin del valor de .

Las expresiones anteriores se pueden transformar para considerar la presencia de un


factor de localizacin x0 y de escala =1/

107

Estadstica Aplicada a la Hidrologa

Ec. 137. Distribucin exponencial de dos parmetros

F ( x) = 1 e

x x0

Con lo que la media ahora pasa a ser x0+


5.3.3

Distribucin Gamma

Ahora se considera la distribucin de la variable aleatoria x, tiempo que transcurre hasta


el r-simo xito (Pea, 2000). Aplicando que la probabilidad de que la variable aleatoria
supere un tiempo t es igual a la probabilidad de obtener r-1 sucesos Poisson en t, se
tiene,
Ec. 138. Densidad Gamma

f (t ) =

1
r t r 1 e t
(r 1)!

r>0
Demostracin:
r 1

F (t ) = 1 P( x > t ) = 1
x=0

f (t ) =

( t )x e t F (t ) = 1 r 1 ( t )x e t

x!

x =0

x!

1
F
=
r t r 1e t
t (r 1)!

Los estadsticos de la funcin se muestran en la siguiente tabla:


Media

Desviacin tpica

Sesgo

Curtosis

Tabla 28. Estadsticos de la distribucin Gamma

Si se definen los factores de escala, =1/ y forma, k, igual a r, sin factor de


localizacin, la funcin de densidad quedara:
Ec. 139. Densidad Gamma en funcin del factor de escala

f (t ) =

1
t k 1e
( )
k

k >0

En la siguiente figura se aprecian los cambios en la forma de la funcin de densidad


Gamma al variar los valores de los parmetros de escala y forma.

108

Mdulo de Estadstica Aplicada a la Hidrologa

0,12
k=5;alfa=2
k=10;alfa=2

0,10

k=5;alfa=4

f(x)

0,08

0,06

0,04

0,02

0,00
0

10

15

20

25

30

35

40

45

50

Figura 46. Funciones de densidad de gamma.


Esta funcin de distribucin con dos parmetros tiene lmite inferior cero, lo que puede dar
problemas para utilizarla con variables hidrolgicas que tengan como lmite inferior un valor
superior (Chow, 1994).

5.3.4

Distribucin Pearson III

Una funcin de distribucin utilizada en hidrologa es la Pearson III. Procede de la


consideracin de una distribucin Gamma a la que se aade un factor de localizacin u.
Ec. 140. Densidad Pearson III

f ( x) =

1
k 1
( x u ) e
k
(k )

( x u )

k >0
Los estadsticos en funcin de los parmetros de localizacin, escala y forma, se
muestran en la siguiente tabla:
Media

Desviacin tpica

u + k

Sesgo

Curtosis
-

2
k

Tabla 29. Estadsticos de la distribucin Pearson III

5.3.5

Distribucin Log-Pearson III

Si los logaritmos de la variable aleatoria siguen la distribucin de Pearson III, la


variable aleatoria se dice que sigue la denominada funcin de log-Pearson III, que ha
sido utilizada para el anlisis de mximos anuales de avenidas desde su recomendacin
por Water Resources Council (WRC) de EE.UU. La funcin de distribucin logPearson III tiene 3 parmetros. En la siguiente ecuacin, u, y k representan los
factores de localizacin, escala y forma de los logaritmos.

109

Estadstica Aplicada a la Hidrologa

Ec. 141. Densidad log-Pearson III

f ( x) =

1
ln x u

x (k )

k 1

ln x u

Al tener 3 parmetros, su ajuste se hace muy sensible a los valores observados y a la


longitud de las series. Para evitar las incertidumbres asociadas al ajuste se pueden
regionalizar factores como el coeficiente de sesgo, que se tomara entonces como dato
en estaciones pertenecientes a cada regin hidrolgica. En la siguiente figura se
comprueban las diferentes familias segn el ajuste alcanzado.

Media
Desviacin tpica
Sesgo

68,71
35,04
3,53

1,80
0,15
1,70

Figura 47. Ajustes de una funcin log-Pearson III a lluvias mximas anuales

Media
Desviacin tpica
Sesgo

1525,33 3,17
354,11 0,11
0,02 -0,43

Figura 48. Ajustes de una funcin log-Pearson III a lluvias mximas anuales.

110

Mdulo de Estadstica Aplicada a la Hidrologa

Media
Desviacin tpica
Sesgo

2569,58 3,40
428,20 0,08
-1,37 -1,94

Figura 49. Ajustes de una funcin log-Pearson III a lluvias mximas anuales

La forma de la funcin ajustada puede ser en J, J invertida, U, U invertida. Cualquier


resultado no es vlido para aplicarlo en hidrologa. Kite (1981) recomienda controlar su
aplicacin a aquellos casos en los que el coeficiente de forma es mayor que 1 y el de
escala es positivo, con lo que resulta una funcin unimodal sin lmite superior. Es decir,
se seleccionan las situaciones que tienen sesgo positivo y mayor que uno para que la
transformacin logartmica no imponga un lmite superior. En el caso de las figuras
anteriores solo la primera lo cumplira.
Los estadsticos, en el espacio logartmico, se muestran en la tabla siguiente:
Media

u + k

Desviacin tpica

Sesgo

Curtosis

2signo( )

k
Tabla 30. Estadsticos de los logaritmos en la distribucin log-Pearson III

5.4

DISTRIBUCIONES DE VALORES EXTREMOS

Hay una serie de funciones de distribucin utilizadas para sucesos extremos en


hidrologa, mximos o mnimos, seleccionados de un conjunto de datos. Es el caso de
los mximos anuales, caudales y precipitacin, sobre los que se aplican funciones de
distribucin que daran un soporte terico del fenmeno. Funciones de distribucin de
este tipo son las derivadas de la familia de valores extremos generalizados, GEV, o la
SQRT et max.
5.4.1

Funciones de distribucin de valores extremos generalizados GEV

La familia de funciones de valores extremos generalizados GEV son la solucin del


problema de mximos o mnimos de series de datos independientes e idnticamente
distribuidos, planteado de la siguiente manera (Kite, 1981; Llamas, 1993).
Sea una variable aleatoria cuya funcin de distribucin es

111

Estadstica Aplicada a la Hidrologa

G ( x) = P( X x)
La serie anterior puede estar representada por precipitaciones mensuales. Se divide la
serie total en subseries de longitud fija, k, para elegir el mximo o mnimo de cada una
de ellas. La longitud total de la serie es n y las longitudes parciales son k por lo que se
tiene un nmero n/k de mximos y mnimos.
Las funciones de distribucin de los mximos y mnimos se denotan por M(x) y m(x).
M ( x ) = P( X Mx x)
m( x) = P( X mn x)
Tanto el mximo y mnimo de cada subserie, son mximos o mnimos de todos los
valores de cada subserie, por lo que:

M ( x ) = P ( X Mx x) = P( X 1 x;... X k x) = P(( X i x)) = P( X i x) = G ( x) k


m( x) = P ( X mn x ) = 1 P ( X mn > x) = 1 P ( X 1 > x;... X k > x) = 1 P(( X i > x )) =

= 1 P (X i x) = 1 (1 G ( x ) )

quedando planteada la condicin sobre mximos y mnimos

El conjunto de las familias se expresa segn la funcin de distribucin siguiente:


Ec. 142. Funciones de distribucin GEV (NERC, 1975)

F ( x) = e

k
1 k x u

0,6 < k < 0,6


Cada funcin de distribucin est caracterizada por el valor de los parmetros, u de
localizacin, de escala y k de forma. Los tres grupos de funciones dependen del valor
de k, positivo, negativo y nulo cuyas denominaciones se presentan en la siguiente tabla.
Denominacin
GEV1 Fisher-Tippet o Gumbel
GEV2
Frechet
GEV3
Weibull

Valor de k Forma en papel


extremo Gumbel
nulo
negativo
positivo

recta
cncava
convexa

Tabla 31. Tipos de funciones de distribucin GEV.

112

Mdulo de Estadstica Aplicada a la Hidrologa

Periodo de retorno (aos)


2

10000

10

25

50 100

200 500 1000

5000 10000

9000
GEV2

8000
7000
mm

6000
GEV1

5000
4000
3000

GEV3

2000
1000
0

Figura 50. Forma de las distribuciones GEV en funcin del signo de k.

En la siguiente figura se muestra la forma de las distintas funciones de densidad. Las


tres aparecen con sesgo positivo, pero la GEV2 es la que da ms peso a la cola de la
derecha.
0,0012
GEV3
GEV2
0,0010

GEV1

densidad

0,0008

0,0006

0,0004

0,0002

0,0000
0

500

1000

1500

2000

2500

3000

3500

4000

4500

Figura 51. Funciones de densidad GEV.

5.4.1.1 GEV1, distribucin de Gumbel


El valor de k es nulo y la funcin de distribucin tiene un sesgo de 1,14. Tomando
lmites, la expresin anterior para la familia GEV queda:

113

Estadstica Aplicada a la Hidrologa

Ec. 143. Funciones de distribucin y densidad de Gumbel

F ( x) = e
f ( x) =

x u
e

x u

x u e

Figura 52. Ajuste de una distribucin de Gumbel


Media

u + 0,5772

Desviacin tpica Sesgo Curtosis

1,14

6
Tabla 32. Estadsticos de la distribucin de Gumbel

La funcin de distribucin Gumbel se puede derivar de la condicin de funciones de


distribucin de mximos expuesta anteriormente.

G( y) = 1 e
= 1 e P( X Mx x) = P( X Mx y + ln( k )) = 1 e y ln( k

x = y + ln( k )

M ( x ) = G ( x) k

ey
= 1
k

x u

lim P( X Mx x) = e e = e e
k

Una caracterstica interesante de la distribucin Gumbel es que el parmetro de


localizacin u coincide con la moda, valor de mxima frecuencia.
Se puede plantear la estandarizacin de la funcin de distribucin utilizando como
variable reducida la que considera el factor de escala y localizacin de la misma manera
que en la normalizacin. Adems, el cuantil se puede expresar fcilmente en funcin del

114

Mdulo de Estadstica Aplicada a la Hidrologa

periodo de retorno T

1
y

F ( x) = e e y = ln ln

F ( x) y = ln ln T
T 1

F ( x) = P( x < X T ) F ( x) = 1

y=

xu

5.4.1.2 GEV2, distribucin de Frechet


La funcin de Frechet toma ahora valores negativos para el parmetro de forma k y la
variable x tiene un lmite inferior. El parmetro de escala es positivo (NERC, 1975).
Ec. 144. Funciones de distribucin y densidad de Frechet

F ( x) = e

k
1 k x u

1
xu
f ( x) = 1 k


k < 0, > 0, u +

1 1
k

k
1 k x u

A continuacin se muestra un ajuste sobre datos de precipitacin mxima. La forma de


la distribucin se ajusta a la curvatura cncava de los mximos de forma tal que no
encuentra asntota.

Figura 53. Ajuste de una distribucin GEV2

5.4.1.3 GEV3, distribucin de Weibull


Por ltimo, esta funcin GEV3 tiene forma convexa, con valores del factor de forma y
escala, k y , positivos y un lmite superior en la variable.

115

Estadstica Aplicada a la Hidrologa

Ec. 145. Funciones de distribucin y densidad de EV3

F ( x) = e
f ( x) =

k
1 k x u

1
xu
1 k

1 1
k

k > 0, > 0, x u +

k
1 k x u

Figura 54. Ajuste de una distribucin EV3.

En el ajuste de caudales mnimos, se utiliza la siguiente expresin de la distribucin de


Weibull.
Ec. 146. Expresin de la funcin de distribucin Weibull para mnimos

F ( x) = 1 e

x u 1k

k > 0, > 0, u x
en funcin de los parmetros de forma k, escala y lmite inferior u. Se supone que este
lmite mnimo tiene un valor positivo. Si se toma un valor nulo, queda la distribucin
Weibull de dos parmetros:
Ec. 147. Funcin de distribucin Weibull de dos parmetros

F ( x) = 1 e

x 1k

> 0, u x

116

Mdulo de Estadstica Aplicada a la Hidrologa

Caudal mnimo (m/s)

10

25

50 100

200

400
380
360
340
320
300
280
260
240
220
200
180
160
140
120
100
80
60
40
20
0

500 1000

5000 10000

Periodo de retorno (aos)

Figura 55. Ajuste de una distribucin Weibull de dos parmetros

5.5

OTRAS FUNCIONES DE DISTRIBUCIN

5.5.1

TCEV

La ley TCEV, Two Component Extreme Value, se plantea con la posibilidad de resolver
el problema de la condicin de separacin de sesgo (Ferrer, 1996). Este problema
consiste en que las desviaciones tpicas de los coeficientes de sesgo de los valores
observados son mayores que los correspondientes a las derivadas de la utilizacin de
modelos tradicionales. La ley TCEV depende de cuatro parmetros y su expresin
deriva de la consideracin de dos mecanismos generadores de las tormentas,
denominados bsico y extraordinario (Ferrer, 1996). Ambos se modelan con una
distribucin de Gumbel y suponiendo la independencia de procesos, la distribucin
TCEV queda como producto de dos funciones Gumbel y 4 parmetros.
Ec. 148. Funciones de distribucin TCEV

F ( x) = e
5.5.2

x u1
e 1

x u 2
e 2

Funcin de distribucin SQRT ET-mx

La funcin de distribucin SQRT ET-mx da un esquema terico para el anlisis de


mximos de lluvia anual segn las siguientes hiptesis (Ferrer, 2000):
1. la duracin y la intensidad de un fenmeno tormentoso son fenmenos
independientes

117

Estadstica Aplicada a la Hidrologa

2. la duracin de lluvia se distribuye segn una exponencial y la intensidad segn


una ley Gamma
3. la cantidad total de lluvia de un fenmeno tormentoso es proporcional al
producto de duracin por intensidad
4. la ocurrencia de grandes chubascos sigue la distribucin de Poisson
Queda una funcin de distribucin segn la siguiente ley de 2 parmetros, k de forma y
de escala. Los momentos no se pueden obtener de forma analtica por lo que hay que
aplicar integraciones numricas para el ajuste (Ferrer, 1996).
Ec. 149. Funcin de distribucin SQRT ET-mx

F ( x) = e k [(1+

x e

x0

Figura 56. Aplicacin de la SQRT ET-mx a series de lluvias mximas anuales

Esta funcin de distribucin es de fcil manejo por tener nicamente dos parmetros y
eleva los valores de los cuantiles de precipitacin mxima respecto a los dados por la
Gumbel gracias a la raz cuadrada del segundo trmino exponencial (Etoh, 1987).

118

Mdulo de Estadstica Aplicada a la Hidrologa

119

Estadstica Aplicada a la Hidrologa

COMPLETADO DE SERIES HIDROMETEOROLGICAS

Uno de los problemas que frecuentemente se encuentran en hidrologa es la existencia de


lagunas en las series de datos registrados de una estacin pluviomtrica o hidromtrica y la
necesidad de pronosticar sus valores. Estas lagunas pueden extenderse durante un periodo largo
de tiempo porque la estacin haya dejado de funcionar, o bien pueden tener un carcter puntual,
debido a que el aparato se haya estropeado, que la persona encargada de la medicin no las haya
realizado, o haya existido un problema de trascripcin de datos.
Para completar las lagunas de estas series existen dos alternativas. En primer lugar, se podran
estimar reproduciendo el fenmeno fsico relativo al dato en cuestin, procedimiento que puede
complicarse por la dificultad intrnseca para la simulacin de algunos fenmenos. Es el caso de
las precipitaciones, cuya simulacin fsica depende del conocimiento que se posea sobre la
circulacin atmosfrica, humedad, temperatura, etc. Otros procesos, como la generacin de
escorrenta, muy ligada a la ocurrencia de precipitaciones, admiten la simulacin del ciclo
hidrolgico conforme a leyes conceptuales o fsicamente basadas.

Tambin se pueden rellenar las lagunas utilizando la informacin subyacente en la


propia serie de datos de cada estacin y en la relacin que estos datos mantengan con
los de otras estaciones con las que comparten factores como la pertenencia a la misma
regin climtica, mismos regmenes de caudales etc. (modelos de interpolacin
temporal, autorregresivos y de regresin en general).
El diseo de la estructura del modelo estocstico hace que se manejen conceptos
similares a la hora de hablar de la generacin de series sintticas. stas son de utilidad
cuando se trata de calcular algn estadstico, ligado a una frecuencia segn patrones de
diseo. En ellas, los datos se asumen como pertenecientes a un fenmeno aleatorio que se
puede manejar por medio del conocimiento de una serie suficientemente larga o de su funcin
de distribucin. Las propiedades estadsticas bsicas describen su tendencia central, su
variabilidad, el sesgo, la correlacin con otras series o la autocorrelacin, que intenta describir
el hecho de que caudales altos o bajos en series hidrometeorolgicas tienden a ser seguidos por
caudales altos o bajos, respectivamente. Tal como se expondr, la aplicacin de estas tcnicas
exige admitir hiptesis dependientes del tipo de dato, por las cuales usualmente se distingue
entre datos meteorolgicos e hidromtricos.
La eleccin de un intervalo temporal de trabajo tiene influencia en el tipo de modelo a utilizar.
En los apartados siguientes se realiza una exposicin de las tcnicas estocsticas de completado
de series meteorolgicas y de caudales con escala mnima mensual, que es generalmente la
escala temporal de trabajo utilizada en estudios de recursos.

6.1

PROPIEDADES DE LAS SERIES TEMPORALES

Tal como se avanz en el captulo dedicado a la estadstica descriptiva, las series


temporales son secuencias de datos histricos o sintticos producidos por un proceso
aleatorio durante sucesivos intervalos de tiempo. En los apartados siguientes se
considera que el trmino i-simo, xi, de una serie temporal est constituido por una parte
determinista, di, y una parte aleatoria, ei,

120

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 150. Descomposicin del modelo de series temporales

xi = di + ei
La parte determinista es funcin de las caractersticas que extraigamos de la serie como
la media, la variabilidad de la muestra y los tipos de correlacin que mantenga la propia
serie consigo misma o con otras registradas en el entorno. La parte aleatoria tiene
asociada una funcin de distribucin, por ejemplo, una funcin uniforme, la normal,
logartmico normal, etc. Es decir, este diseo, vlido para completado y generacin de
series sintticas, ha de considerar las siguientes cuestiones (Fiering-Jackson, 1971):
a. Un valor anterior guarda o no informacin del siguiente o siguientes
valores?. Si es as cmo?. Es el inmediatamente anterior o es una serie de
valores anteriores?. Los modelos han de considerar la informacin
contenida en cuntos pasos anteriores?
b. Qu variables se pueden seleccionar con informacin sobre una dada?.
Podemos disear un modelo estocstico que permita prever, por ejemplo,
una serie de caudales con los registrados en otros puntos del territorio o con
series de precipitacin?. Se pueden aprovechar las caractersticas regionales
del fenmeno?.
Una serie temporal quedara caracterizada con el conocimiento de las funciones de
distribucin correspondientes a cada paso t en que se realiza y las relaciones entre ellas.
En cada paso, son posibles multitud de resultados con una distribucin de probabilidad
asociada. Con suficientes realizaciones a lo largo del tiempo, podramos manejar la
distribucin conjunta, la de dos variables consecutivas o la de cualquier subconjunto de
variables. En la prctica esta caracterizacin se simplifica a conocer el vector de las
medias correspondientes a cada instante, las varianzas y las covarianzas.
La estacionariedad hace referencia al mantenimiento de estas propiedades en el tiempo
y, en concreto, se denomina estacionariedad dbil cuando media y varianza se
mantienen constantes y las covarianzas solamente dependen del paso o intervalo de
tiempo considerado:
1. Media: (t)=
2. Desviacin tpica: (t)=
3. Covarianzas, (xt+k,xt)= k o si se prefiere en trminos del coeficiente de
autocorrelacin, k= k/ o.
Otro estadstico de la serie temporal es el coeficiente de sesgo, representativo de la falta
de simetra de las distribuciones hidrolgicas. Desde la perspectiva en que se estudian
aqu las series temporales, su influencia es importante para elegir el tipo de funcin de
distribucin o la transformacin necesaria en los datos. Se suele tener como referencia
por aplicacin del teorema central del lmite la funcin de distribucin normal o la
logartmico normal y cuando los sesgos son pronunciados, se recurre a funciones tipo
gamma como las expuestas en captulos anteriores.
En Fiering-Jackson (1971) se destaca el papel que tiene la persistencia de los datos
hidrolgicos en la seleccin del nmero de datos para estimar las propiedades

121

Estadstica Aplicada a la Hidrologa

anteriores. Aparte de la influencia negativa que tiene en la estimacin de los estadsticos


anteriores la posible actividad humana, se menciona el que el hecho de que los datos
hidrolgicos tiendan a parecerse a los anteriores. Series con una alta persistencia,
requerirn mayor cantidad de valores a la hora de estimar la media. Otras con
persistencias bajas, tienen menor necesidad de valores., Los autores mencionados
refieren necesidades entre los 30 y 50 datos.
En el captulo dedicado a la estadstica descriptiva se trat la existencia de ciclos y
movimientos en las series temporales. Estos cambios hacen que no se cumpla la
propiedad de estacionariedad. Sin embargo, la consideracin de ciclos constantes
permite sortear este problema utilizando los asociados a los ciclos en cuestin y
transformaciones como la normalizante u otras similares. Una vez estimado el paso
temporal y el tratamiento de los ciclos estacionales, el procedimiento a seguir constara
de las siguientes fases
1. Elegir el periodo de completado en funcin de las necesidades del estudio y
de las caractersticas de los datos existentes como problemas por
alteraciones, disponibilidad suficiente de datos, etc.
2. Calcular estadsticos como la media, desviaciones tpicas, coeficientes de
sesgo y coeficientes de autocorrelacin.
3. Tanteo de funciones de distribucin adecuadas a los datos. Primero se tantea
el posible ajuste segn una normal o una logartmico normal. Si se estima
que el sesgo es importante, habr que ir a una distribucin gamma.
4. Transformacin de las series hidrometeorolgicas para filtrar
componentes estacionales o eliminar los sesgos.

las

5. Establecimiento de la ecuacin de regresin y decisin sobre el grado de


correlacin: simple, doble, triple, etc.
6. Proceder al completado estableciendo criterios de orden y priorizacin en las
variables transformadas.
7. Deshacer las transformaciones realizadas sobre las series completadas.

6.2

COMPLETADO DE SERIES MENSUALES SIN PERSISTENCIA.

Con carcter general, el completado de datos meteorolgicos se puede realizar


utilizando una serie de tcnicas que abarcaran desde la consideracin de la media
aritmtica, que permite rellenar datos entre series bajo determinadas condiciones de
similitud; el ratio normal, para el relleno de series homogneas, mediante el uso de
expresiones como:

Pi , 4 =

P
P
1 P4
Pi ,1 + 4 Pi , 2 + 4 Pi , 3
3 P1
P2
P3

en la que el subndice i es indicativo del dato a rellenar en una estacin 4 a partir de los
datos contemporneos registrados en las estaciones 1, 2 y 3 y de las relaciones entre las

122

Mdulo de Estadstica Aplicada a la Hidrologa

medias de las series registradas en cada uno de las cuatro estaciones; el inverso
distancia al cuadrado y aquellos mtodos que aprovechan superficies de interpolacin
representativas del dato en una regin, como las isoyetas para las precipitaciones; hasta
los mtodos de regresin simple y mltiple, que permiten la obtencin de los valores
incgnita en funcin del grado de asociacin entre series de datos.
6.2.1

Regresin simple

6.2.1.1 Posibilidades de ajuste


Estudiada la correlacin entre dos variables el paso que ahora se trata es el de encontrar
una curva de ajuste a la nube de dispersin que permita expresar la variable dependiente
en funcin de la independiente y estimar los valores de una en funcin de los de la otra.
Para este propsito se emplean las tcnicas de regresin y la curva de ajuste mencionada
se denomina curva o ecuacin de regresin.
El ajuste de una curva a un diagrama de dispersin entre dos variables puede realizarse
de diversas maneras. En primer lugar cabe mencionar la validez de un ajuste a
sentimiento que permitira introducir la experiencia del autor en la estimacin. Sin
embargo, la falta de una expresin analtica reduce la utilidad de esta tcnica.
Otra opcin es utilizar una expresin matemtica predefinida. Elegido el tipo de
relacin, lineal o polinmica y de qu grado, exponencial, logartmica, etc. queda
encontrar el mejor ajuste en funcin de los datos disponibles. En el caso de la regresin
lineal una recta expresa la relacin entre las dos variables. Y esta recta depende de dos
parmetros, a, pendiente, y b, trmino independiente.
45

Trmino independiente

40
Pluvimetro B (mm)

Pendiente

yest = a x + b

35
30
25
20
15

Variable independiente
Variable dependiente

10
10

15

20

25

30

35

40

45

Pluvimetro A (mm)

Figura 57. Ajuste recta de regresin

Son tambin posibles otros mtodos de ajuste, como asignar valores medios de la
variable dependiente y a cada intervalo de la independiente x. Viene a ser una condicin
que determina una curva de ajuste discontinua, por escalones, pero con mejor
adaptacin a la nube de puntos. En todo caso, una vez realizado el proceso previo, se
pueden buscar polinomios de aproximacin que suavicen las discontinuidades.

123

Estadstica Aplicada a la Hidrologa

Intervalo de
precipitaciones en el
pluvimetro A (mm)

Valor medio de la
precipitacin en el
pluvimetro B (mm)

x < 17
17 x < 20
20 x < 23
23 x < 26
26 x < 29
29 x < 32
32 x < 35
35 x

24,5
27,5
27,4
25,0
27,8
30,7
30,7
35,0

Ajuste por condicin de intervalos


45
40
35
30
25
20
15
10
10

15

20

25

30

35

40

45

Pluvimetro A (mm)

Tabla 33. Ajuste mediante una condicin por intervalos

6.2.1.2 Recta de ajuste por mnimos cuadrados entre dos series


El mtodo de los mnimos cuadrados que se basa en la minimizacin del error
cuadrtico medio de la curva de ajuste respecto a la nube de dispersin. Este error
cuadrtico medio se define como el sumatorio de las diferencias al cuadrado entre el
valor de y muestral y el estimado yest mediante la ecuacin de ajuste para el
correspondiente valor de x. Por tanto, la condicin de minimizacin para una funcin de
ajuste entre x e y, yest=f(x) dependiente de unos parmetros ak, se expresa como:
Ajuste lineal por mnimos cuadrados
45

(yi-yesti)
n

ECM = ( yi yesti )2
i =1

ECM
=0
a
ECM
=0
b

Pluvimetro B (mm)

40

yest = a x + b

35
30
25
20
15
10
10

15

20

25

30

35

40

Pluvimetro A (mm)

Figura 58. Ajuste de una recta de regresin por mnimos cuadrados.

En general, las expresiones se deducirn de:


Ec. 151. Condiciones para el ajuste por mnimos cuadrados
n

ECM = ( yi y esti ) 2
i =1

124

k (1, n )

ECM
=0
ak

45

Mdulo de Estadstica Aplicada a la Hidrologa

Permitiendo obtener los parmetros ak de la funcin f(x). Las siguientes expresiones dan
la estimacin de los coeficientes a y b aplicando la condicin de mnimos cuadrados si
se adopta una relacin lineal entre x e y.
Ec. 152. Ajuste por mnimos cuadrados
n

i =1

i =1

ECM = ( yi yesti ) 2 = ( yi (axi + b )) =

yest = a x + b

= yi2 + (a xi + b ) 2 yi (a xi + b )
2

i =1
n
n
ECM
= (2(a xi + b )xi 2 yi xi ) = 2 a xi2 + b xi yi xi = 0
a
i =1
i =1

i =1

i =1

i =1

i =1

a xi2 + bn x xi yi = 0 a xi2 + bnx = xi yi


n
ECM
= 2(axi + b ) 2 yi = 0 ax + b = y b = y a x
b
i =1

i =1

i =1

a xi2 + bn x = xi yi a xi2 + n yx na x = xi yi
i =1

x y
i

i =1

a=

i =1
n

xi2
i =1
n

y x

2
x

x y
i

i =1

b= y

xi2
i =1
n

y x

2
x

Finalmente,

a = rxy

y COV ( x, y ) y COV ( x, y )
=
=
x
x y x
x2
b = m y a mx

En el caso anterior se ha ajustado la curva utilizando como medida de error las


distancias verticales. Queda una expresin del tipo:
Ec. 153. Ajuste por mnimos cuadrados. Distancias verticales

yest y =

COV ( x, y )

x2

xx

Aplicando estas frmulas al ejemplo propuesto resultara una ecuacin de regresin


entre los pluvimetros A y B, yPB=0,43xPA+17,3. Si se toman distancias horizontales, la
expresin del ajuste es distinta e igual a:

125

Estadstica Aplicada a la Hidrologa

Ec. 154. Ajuste por mnimos cuadrados. Distancias horizontales

(x x) = COV( x, y) (y
2
y

est

Y la media geomtrica de ambas expresiones es:


Ec. 155. Ajuste por mnimos cuadrados. Media geomtrica distancias verticales-horizontales

= rxy =

COV ( x, y )
=
2x 2y

( x i mx ) ( yi m y )

i =1

x y

El uso de estas relaciones debe considerar varios factores. El primero hace referencia a
que no se deben extrapolar los resultados fuera de los lmites de estudio. Por ejemplo, si
las relaciones se han planteado con 200 nios entre 8 y 14 aos y una correlacin
positiva edad altura; se puede extrapolar esta relacin para calcular la altura de una
persona 80 aos?. En segundo lugar tambin hay que destacar que las dependencias han
de plantearse razonablemente: una buena relacin puede surgir entre dos variables
independientes pero relacionadas con una tercera, pero puede no ser razonable plantear
la regresin entre la primera y la tercera. Por ejemplo, hay buena correlacin entre
nmero de enfermedades y nivel econmico; lo mismo cabe decir entre el parque
automovilstico y nivel econmico; habr una buena relacin entre el nmero de
enfermedades y el parque automovilstico?, es razonable plantearla en estos trminos?.
Las expresiones anteriores sobre un ajuste por mnimos cuadrados se pueden ampliar al
caso de considerar un elemento aleatorio en la relacin entre dos variables. Entonces, la
ecuacin de regresin se expresa como sigue,
Ec. 156. Expresin de la recta de regresin considerando el trmino aleatorio

yest ,i = a xi + b + i
La distribucin del error est condicionada a las de las variables utilizadas. Para una
distribucin simtrica, se estimaran la tendencia central y desviacin tpica, del error,
dependiente de las condiciones de ajuste. En el caso del ajuste por mnimos cuadrados,
la esperanza del error es nula y la varianza depende de la desviacin tpica de la variable
dependiente y del coeficiente de correlacin.
Ec. 157. Condicin esperanza nula del error

E [yi yest ,i ] = E [ yi b a xi ] = y b a x = 0
Ec. 158. Trmino de varianza del error

E ( yi yest ,i ) = y2 (1 rxy2 )
Es decir, partiendo de unas variables x e y pertenecientes a una distribucin normal, el
2

trmino de error queda caracterizado por pertenecer a una N(0, y 1 rxy2 ).

126

Mdulo de Estadstica Aplicada a la Hidrologa

Las ecuaciones anteriores se han obtenido utilizando los datos sin transformacin
alguna. Sin prdida de generalidad, se pueden expresar los resultados anteriores en
funcin de los residuos normalizados:
Ec. 159. Ajuste por mnimos cuadrados en funcin de los residuos normalizados

yest y =

COV ( x, y )

2
x

x x +

yest y

= rxy

xx

(1 r ) ) al haber dividido entre la desviacin tpica de


2
xy

Con perteneciente a una N(0,

y. Con distribuciones de tres parmetros, normalizadas las variables, y con la notacin


Ec. 160. Ajuste por MC en funcin de los residuos normalizados y distribucin Gamma

yest y

= rxy

xx

+ 1 rxy2

se tendra perteneciente a una Gamma(0, 1, ) tal que el coeficiente de sesgo del


ruido, , es funcin del de la variable independiente y del coeficiente de correlacin de
Pearson, (Fiering-Jackson, 1971)
Ec. 161. Sesgo del ruido

1 rxy3

(1 r )

2 1, 5
xy

Y la variable que se puede generar de una t perteneciente a N(0,1)


Ec. 162. Variable gamma
3

2
2 t
2
1 +


6
36
cuya utilizacin est desaconsejada (Fiering-Jackson, 1971) por la sensibilidad de los
coeficientes de sesgo a la informacin disponible.

6.2.2

Regresin mltiple en series mensuales sin persistencia

En la siguiente deduccin se aade la consideracin de los ciclos estacionales en una


serie sin persistencia y la deduccin de una formulacin bivariada. Los factores y la
forma de filtrar estas componentes cclicas caractersticas de cada estacin
individualizada se establecen en funcin de la hiptesis que se establezca sobre la
estructura que tienen los datos. Suele ser habitual considerar que los datos
meteorolgicos se mantienen estacionarios durante el ciclo de completado y que su
estructura se puede asimilar a la de datos distribuidos normalmente. De acuerdo a esto,
una normalizacin en funcin de la media y desviacin tpica de cada uno de los meses
bastara para eliminar la componente cclica, homogeneizando la totalidad de los datos
de cada estacin segn una funcin de distribucin normal de media 0 y desviacin
tpica 1. Es decir, se pueden obtener las series de residuos aleatorios de acuerdo a las
medias y desviaciones tpicas correspondientes a las doce series mensuales:

127

Estadstica Aplicada a la Hidrologa

Ec. 163. Transformacin normalizante

tij =

xij x j

Sj
2
1
1
xij x j ;
xij ; S j =

N 1 i =1
N i =1
donde j es el ndice mensual de 1 a 12, xij es el dato meteorolgico correspondiente al
ao i y mes j, x j media de los datos del mes j, N nmero de aos de la serie, Sj
xj =

desviacin tpica de la serie correspondiente al mes j. La serie de residuos


correspondiente se obtiene en tij, estacionaria en media y varianza.
En la prctica, tratndose de datos xij meteorolgicos mensuales, y la correspondiente
serie de residuos tij, no suele presentar autodependencia temporal y as se supone al
plantear los modelos de completado. A continuacin se expone la metodologa de
clculo para el caso particular en que se realice una regresin bivariada. El proceso que
se describe sera prcticamente idntico si se considerasen ms estaciones en la
ecuacin de regresin. Para el establecimiento de la ecuacin de regresin, los valores tij
correspondientes a una estacin se expresan como una funcin lineal de los de otra
pareja de estaciones mediante la ecuacin estocstica de regresin bivariada siguiente:
Ec. 164. Ecuacin de regresin mltiple en los residuos

tij3 = t 3 + a1 (tij1 t 1 ) + a 2 (tij2 t 2 ) + ij


donde los superndices 1, 2 representan a las estaciones de referencia para completar la
estacin nmero 3; a1 y a2 son los coeficientes de regresin parcial que se pueden
expresar en funcin de los coeficientes de correlacin simple r13, r23 y r12 al aadir la
condicin de error cuadrtico mnimo y ij es un ruido independiente y normalmente
distribuido de media 0 y desviacin tpica S . Los valores medios de los residuos tij en
cada estacin (t 1 , t 2 , t 3 ) son de valor 0 ya que corresponden a series normales
previamente estacionarizadas.
De acuerdo a la mencionada condicin de error cuadrtico mnimo, las expresiones de
los coeficientes de regresin a1 y a2 son:
Ec. 165. Coeficientes de la ecuacin de regresin bivariada por mnimos cuadrados

s3 r13 r23 r12


s r r r


a 2 = 3 23 13 2 12
2
s1 1 r12
s2 1 r12
donde s1, s2 y s3 son las desviaciones tpicas de las series tij correspondientes a cada
estacin y, dado que estas series han sido previamente estacionarizadas, su valor ser 1,
r12 es el coeficiente de correlacin simple entre los residuos de las estaciones 1 y 2; r13
es el coeficiente de correlacin simple entre los residuos de las estaciones 1 y 3; r23 es el
coeficiente de correlacin simple entre los residuos de las estaciones 2 y 3, segn la
expresin siguiente donde m y n representaran las diferentes combinaciones entre las
estaciones mencionadas:
a1 =

128

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 166. Coeficiente de correlacin de Pearson

(t
rmn =

m
ij

t m ) (tijn t n )

ij

(t
ij

m
ij

tm)
2

(t

n
ij

tn)

ij

Se puede comprobar que la media del ruido ij es cero, mientras que su desviacin tpica
sera funcin del error cuadrtico cometido en la ecuacin de regresin. Se puede
estimar a partir de la expresin:
Ec. 167. Varianza del ruido

S2 = S 32 (1 ( R123 ) 2 )
siendo R123 el coeficiente de correlacin mltiple entre las estaciones 1 y 2 con la
nmero 3, que para valores de desviacin tpica s1, s2 y s3 unitarios toma la expresin:
Ec. 168. Coeficiente de correlacin mltiple

r 2 + r 2 2 r12 r13 r23

R123 = 13 23
1 r122

con valores comprendidos entre 0 y 1.


La ecuacin de regresin se plantea para cada pareja de estaciones que pueden
correlacionarse con la estacin que se desea completar. En el momento de rellenar un
dato se debe elegir aquella pareja de estaciones que proporcione el completado ms
satisfactorio. El criterio seguido para realizar esta eleccin se basa en la formacin de
una matriz de priorizacin para cada estacin a completar, funcin de los coeficientes de
correlacin mltiple entre las series de residuos y del nmero de datos comunes entre
las tres estaciones.
Los trminos de la matriz de priorizacin para la estacin a completar k es la siguiente,
para cada pareja de estaciones de referencia m y n,:
Ec. 169. Matriz de priorizacin
a

k
Pmn = Rmn
mnk
12

donde Pmn es el elemento (m,n) de la matriz de priorizacin correspondiente a la


k
estacin a completar k, Rmn
el coeficiente de correlacin mltiple entre la estacin k y
las estaciones m y n de referencia y Nmnk el nmero de datos mensuales registrados a la
vez en las tres estaciones m, n y k. El exponente a suele ser un dato que se introduce en
base a ponderar la importancia que tiene en el completado el nmero de datos comunes
entre las tres estaciones, aunque se puede determinar experimentalmente bajo el criterio
de generar series con mnimo error cuadrtico.

Halladas las matrices de priorizacin de cada estacin, se puede elegir cul es la mejor
pareja para rellenar un mes en cuestin. En principio se escoger para cada estacin k la
pareja de referencia con un mayor valor de priorizacin, pero la existencia de los

129

Estadstica Aplicada a la Hidrologa

valores en el mes de completado en esas estaciones m y n, origina que se tengan que


elegir sucesivas parejas de estaciones de acuerdo a valores decrecientes de priorizacin.
Dado que las series completadas han sido las tij, se precisa deshacer la transformacin
para obtener la serie desestacionarizada y completada xij. Ello se consigue aplicando la
siguiente expresin a los residuos completados de la estacin k:
Ec. 170. Desestacionarizacin

xij = x j + S j tij
Para aplicar esta metodologa es preciso agrupar previamente las estaciones
meteorolgicas en grupos homogneos o afines, estableciendo un control previo de las
estaciones que sirven de referencia para el completado de una dada. Se evita as la
transmisin de heterogeneidades y errores de unas estaciones a otras.

6.3

COMPLETADO DE SERIES MENSUALES CON PERSISTENCIA

El planteamiento del caso de regresin simple con persistencia es idntico al del


apartado anterior considerando que la serie x corresponde a la desplazada, por ejemplo,
un intervalo de tiempo. Los modelos estocsticos multivariados de regresin utilizados
para rellenar lagunas en series de aportaciones mensuales consideran, a diferencia del
caso anterior, la existencia de una estructura de autocorrelacin temporal en la serie de
datos de cada estacin, permitiendo adems extraer informacin a travs de la
correlacin espacial con otras estaciones.
A continuacin se pasa a exponer la metodologa propuesta por el Cuerpo de Ingenieros
de los EE.UU., que se ha estandarizado bajo la denominacin del modelo HEC-4. Este
modelo permite rellenar lagunas en secuencias de aportaciones basndose en la
autocorrelacin de una estacin y de sus relaciones estadsticas con otras (correlacin
espacial).
Como en el caso anterior, el primer paso consiste en extraer la serie de residuos de
acuerdo a la estructura segn la cual se distribuyen los datos de las series de
aportaciones. El programa plantea como hiptesis que las series se comportan de
acuerdo a una distribucin LogPearson III con lo que, habiendo transformado las series
originales en series de los logaritmos de los aportaciones mensuales, el programa
considera la media, desviacin tpica y coeficiente de sesgo del logaritmo de la serie
segn las expresiones siguientes:
Ec. 171. Clculos de medias, desviaciones tpicas y sesgos de las series de aportaciones
transformadas mediante logaritmos

y ij = log xij
N

y
yj =

i =1

ij

j =

(y
i =1

yj)

ij

N
gj =
(N 1) (N 2)

(y

yj)

ij

i 1

j
N 1
N ;
;
donde yij es el logaritmo de las aportaciones en el mes j del ao i, y j es la media de la
serie logartmica de las aportaciones en el mes j y N es el nmero de aos de la serie.

130

Mdulo de Estadstica Aplicada a la Hidrologa

Posteriormente, se estacionarizan las series de acuerdo a las expresiones:


Ec. 172. Transformacin de los datos considerando el sesgo y la componente cclica estacional

gj
6 g j tij
3
+ 1 1 +
gj 2
j
6

;
donde tij es una serie estacionaria a la que se han suprimido las tendencias estacionales.
A sus valores podra ajustarse, en primera aproximacin una distribucin normal, ya
que los xij han sufrido una transformacin logartmica normalizante previa. Este
tratamiento se debe al hecho suficientemente conocido de que las aportaciones no
siguen una distribucin normal. A los valores tij, el modelo HEC-4 no les ajusta una
normal, sino una distribucin Pearson-III en la que se hace intervenir el coeficiente de
sesgo peridico g j , resultando una nueva variable ki,j.
tij =

y ij y j

k ij =

El modelo de regresin planteado sobre la serie de residuos es del tipo


M

k ijo = bo k ijo1 + b1 k ij1 + ij


1=1

donde kijo es el valor en el mes j del ao i de la variable transformada (Pearson-III) en la


estacin a completar o, k ijo1 es el valor en el mes j-1 del ao i de la variable
transformada (Pearson-III) en la estacin a completar o, bo es el coeficiente
autorregresivo (temporal), b1 es el coeficiente de regresin entre las estaciones o y 1, k i1, j
es el valor en el mes j del ao i de la variable transformada (Pearson-III) en la estacin
de referencia 1, M es el nmero de estaciones consideradas en la regresin, ij es el ruido
de media 0 y desviacin tpica
El proceso de completado de datos es similar al expuesto en el mtodo de completado
de precipitaciones. Como se observa en el planteamiento de ecuaciones, las diferencias
bsicas estriban en la propiedad de autocorrelacin de las series de caudales y en la
necesidad de transformaciones normalizantes de las mismas.

6.4

GENERACIN DE NMEROS ALEATORIOS

Los ordenadores personales tienen la posibilidad de generar nmeros pseudoaleatorios.


Son mquinas deterministas y utilizando los mismos datos, dan idnticos resultados.
Los nmeros aleatorios se construyen entonces respetando propiedades de series
aleatorias. Pertenecen a una funcin de distribucin uniforme, desde la que se pueden
derivar nmeros pertenecientes a otras poblaciones.
Una funcin de distribucin uniforme es aqulla para la que los casos posibles, dentro
del dominio [0,1], son independientes unos de otros y son equiprobables.
6.4.1

Generacin de nmeros aleatorios de una funcin de distribucin uniforme.


Modelo lineal.

Parmetros:

131

Estadstica Aplicada a la Hidrologa

a. Valor inicial x0, nulo o positivo


b. Multiplicador a, nulo o positivo
c. Incremento c, nulo o positivo
d. Divisor m, mayor que todos los trminos anteriores
Generar los valores de la serie xi utilizando el resto de la divisin del modelo lineal axi1+c entre m.

(a xi 1 + c )
xi = resto

6.4.2

Generacin de nmeros aleatorios de una funcin de distribucin normal

La generacin de nmeros aleatorios normales se puede basar en la aplicacin del


teorema central del lmite, es decir, en que la suma de nmeros aleatorios pertenecientes
a una funcin de distribucin idntica (tambin se puede extender al caso contrario), con
media y varianza finitas, 2, es aproximadamente normal, con media n y varianza
n2. Si se generan nmeros normales utilizando 12 valores de la funcin de
distribucin uniforme a los que se restan 6 unidades, se tendr una normal de media
cero y desviacin tpica unidad.
6.4.3

Generacin de nmeros aleatorios de una funcin de distribucin normal.


Transformacin de Box-Muller

Esta transformacin utiliza dos nmeros uniformemente distribuidos con media 0 y


varianza, 12, para generar nmeros normales de media 0 y varianza, 12.
ti = ln

132

1
cos(2 u2 )
u1

Mdulo de Estadstica Aplicada a la Hidrologa

ESTIMACIN DEL MODELO. INFERENCIA ESTADSTICA

7.1

INTRODUCCIN

La expresin inferencia estadstica hace referencia a la estimacin o construccin de


los modelos estadsticos. Se denomina modelo estadstico a la representacin
matemtica del comportamiento probabilstico de la muestra. La inferencia estadstica
trata de estimar a partir de un conjunto de resultados obtenidos mediante la realizacin
repetida de un experimento aleatorio (muestra) la representacin matemtica del
fenmeno aleatorio subyacente, es decir, trata de conocer las propiedades de la
poblacin a partir de la muestra.
Existen diversos tipos de mtodos de estimacin (denominados habitualmente
estimadores) que emplean distintas magnitudes obtenidas a partir de la muestra como
representativas de la poblacin y que aprovechan en mayor o menor medida la
informacin que esta proporciona. Hay una primera divisin bsica entre los mtodos de
estimacin, los denominados mtodos paramtricos y no paramtricos, como se ver a
continuacin. Los primeros suponen que la poblacin se comporta segn una funcin de
distribucin predefinida, con una expresin matemtica conocida (alguna de las
expuestas en el captulo anterior), y tratan de determinar el valor de sus parmetros. Los
distintos procedimientos de estimacin que se presentarn a lo largo del captulo
corresponden a este tipo de mtodos.
Tambin se expondr a lo largo del captulo las principales propiedades de los
estimadores, las que deben poseer para estimar con la mayor precisin posible la
poblacin, y que permitirn decidir que mtodos de estimacin se deben seleccionar en
cada ocasin.

7.2
7.2.1

MTODOS DE ESTIMACIN DEL MODELO


Mtodos paramtricos

Son aquellos mtodos que asumen que la funcin de distribucin de la poblacin se


corresponde con una expresin matemtica predefinida que contiene una serie de
parmetros cuyo valor es diferente para cada poblacin.
La construccin del modelo consta, por tanto, de dos fases: seleccin de la funcin de
distribucin predefinida y estimacin del valor de los parmetros de la misma a partir de
la muestra para la poblacin que se est estudiando. La estimacin de los parmetros se
realizar mediante la aplicacin de diversas tcnicas matemticas (estimadores) que se
describirn a lo largo del captulo.
7.2.2

Mtodos no paramtricos

Los mtodos no parmetricos, al contrario que los anteriores, no suponen que la


distribucin de probabilidad en la poblacin se corresponda con expresiones algebraicas

133

Estadstica Aplicada a la Hidrologa

basadas en unos parmetros que es preciso ajustar a partir de la muestra, sino que
suponen que esa expresin matemtica es desconocida.
El mtodo no parmetrico ms simple consiste en el ajuste grfico de una curva a los
datos de la muestra representados en papel de probabilidad, aunque tiene el
inconveniente de su subjetividad.
La aplicacin de este mtodo exige asignar a cada uno de los datos una determinada
probabilidad muestral que permita representarlos en un determinado papel de
probabilidad (habitualmente papel Gumbel). Esta asignacin se realiza, como se
coment en el captulo 3, mediante las denominadas frmulas de grfico que
corresponden a la expresin general:
Ec. 173. Frmulas de grfico

F ( xi ) = Pr ob( x xi ) =

i
N + 1 2

siendo:

xi = dato de la muestra que ocupa el lugar i de la serie ordenada de menor a


mayor.
N = nmero total de datos de la muestra.

= parmetro de la frmula.
Distintos valores del parmetro conducen a distintas expresiones, siendo algunas de
las ms empleadas las mostradas en la tabla siguiente (tambin en captulo 3).

Nombre

Expresin

Weibull

Gringorten

0,44

Hazen

0,5

i
N +1
i 0.44
F ( xi ) =
N + 0.12
i 0 .5
F ( xi ) =
N
F ( xi ) =

Tabla 34. Frmulas de grfico

Con independencia del empleo o no del mtodo grfico, es siempre recomendable


comparar grficamente los resultados obtenidos por otros procedimientos, con los datos
representados grficamente.
Ejemplo: Se dispone de los siguientes datos referentes a caudales mximos anuales registrados
en una estacin de aforos.

134

Mdulo de Estadstica Aplicada a la Hidrologa

Comprobar si la poblacin a la que pertenece la muestra se ajusta a una funcin de distribucin


tipo Gumbel.
Solucin: Una forma de comprobar si un determinado tipo de funcin de distribucin se ajusta a
las propiedades estadsticas de una poblacin de la cual conocemos una muestra es representar
grficamente los datos asignndoles probabilidad mediante una frmula de grfico y
dibujndolos sobre el papel de probabilidad de dicha distribucin. Si la representacin de los
datos se ajusta sensiblemente a una recta significa que la poblacin corresponde a esa
distribucin.
En primer lugar es necesario asignar probabilidades muestrales, para lo cual se emplear la
formula de Gringorten:

F ( xi ) =

i 0.44
N + 0.12

En la tabla adjunta se indica la probabilidad muestral de cada dato de la serie una vez ordenada
de menor a mayor.

Estas parejas de caudalprobabilidad muestral se representan en papel Gumbel dando como


resultado el grfico adjunto en el que se observa que la poblacin se ajusta muy bien a dicha

135

Estadstica Aplicada a la Hidrologa

distribucin.

7.3
7.3.1

PROPIEDADES DE LOS ESTIMADORES


Estimadores insesgados

Se dice que un estimador T es insesgado (o centrado) respecto a un determinado


parmetro de la poblacin cuando la media de diversas estimaciones del parmetro a
partir de distintas muestras tiende al valor real del parmetro en la poblacin:
Ec. 174 Estimadores insesgados

E [ est ] =
Esta es una propiedad deseable en cualquier estimador puesto que significa que la
distribucin del valor del parmetro obtenida a partir de las muestras esta centrada en el
valor real. No obstante, no es la nica propiedad a tener en cuenta, puesto que tan
importante como el valor alrededor del cual est centrada la distribucin de las
estimaciones es la dispersin o varianza de las mismas.
Se denomina sesgo del estimador respecto al parmetro a la magnitud:
Ec. 175 Sesgo de un estimador

sesgo( est ) = E[ est ]


En el caso de que el estimador sea centrado respecto a ese parmetro, su sesgo ser cero.

136

Mdulo de Estadstica Aplicada a la Hidrologa

7.3.2

Estimadores consistentes

Se dice que un estimador T es consistente respecto a un parmetro cuando la media de


las estimaciones realizadas sobre muestras de tamao n tiende al valor real de la
variable en la poblacin al crecer el tamao de la muestra:
Ec. 176 Estimadores consistentes

[ ]

n
E est

Esta propiedad representa un nivel de exigencia inferior al de la propiedad anterior. No


se exige que el estimador sea centrado para un tamao de muestra cualquiera pero s que
tienda a serlo cuando el tamao de la muestra crece. Es decir, lo sera para una muestra
de tamao infinito. Cuando no se pueda exigir que un estimador sea insesgado, al
menos debera exigirse que fuese consistente.
7.3.3

Estimadores invariantes

Se dice que un estimador T es invariante cuando la estimacin del parmetro se


transforma de forma coherente al cambiar el sistema de referencia en que se expresan
los elementos de la muestra.
El cambio en el sistema de referencia puede ser de dos tipos:
Cambio de origen: Desplazamiento del origen de tal forma que los valores de la
muestra se ven modificados al sumarles o restarles un valor constante. Si el
nuevo cero corresponde al valor que anteriormente era c, los nuevos valores de
la muestra sern x1-c, x2-c, x3-c, ...
Cambio de escala: Los valores de la muestra se ven multiplicados o divididos
por una constante. La muestra se transformar en cx1, c x2,c x3, ...
Segn el estimador sea invariante ante el primer tipo de cambio o el segundo, se dice
que es invariante por traslacin o invariante por cambio de escala.
La expresin matemtica de la invariancia en ambos supuestos es:
Ec. 177 Invarianza de los estimadores

T ( x1 + c, x 2 + c, x3 + c,..., x n + c ) = T ( x1 , x 2 , x3 ,..., x n ) + c
T (cx1 , cx 2 , cx3 ,..., cx n ) = cT ( x1 , x 2 , x3 ,..., x n )
Esta propiedad no es imprescindible para un estimador, ni tiene relacin con la bondad
de sus estimaciones, simplemente puede ser interesante en algunas situaciones en las
que se prevea la necesidad de revisar las estimaciones ante cambios en el sistema de
referencia.

137

Estadstica Aplicada a la Hidrologa

7.3.4

Estimadores eficientes

Se define la eficiencia (o precisin) de un estimador T respecto al parmetro como la


inversa de la varianza de sus estimaciones a partir de diversas muestras:
Ec. 178 Eficiencia de un estimador

eficiencia( est ) =

Var ( est )

Es decir, un estimador es ms eficiente o preciso cuanto menos dispersas estn sus


estimaciones respecto al valor medio. Un valor grande de la varianza representa un
valor pequeo de la eficiencia y a la inversa.
Si un estimador es centrado, un valor grande de la eficiencia significa que todas las
estimaciones del parmetro sern muy prximas al valor real del parmetro en la
poblacin. Obviamente, entre dos estimadores centrados ser preferible aquel que es
ms preciso.
Lo ptimo, y lo exigible siempre que sea posible, es que los estimadores sean
insesgados y altamente eficientes, lo que significar que sus estimaciones sern siempre
muy prximas al valor real del parmetro.
Se denomina eficiencia relativa de dos estimadores T1 y T2 al cociente entre sus
eficiencias:
Ec. 179 Eficiencia relativa

ER =

7.3.5

( )
( )

( )
( )

2
1
eficiencia est
Var est
=
1
2
eficiencia est
Var est

Estimadores robustos

Se dice que un estimador T es robusto respecto al parmetro cuando disminuye poco


su eficiencia cuando el modelo experimenta una pequea modificacin. Es decir, si al
estimar el modelo hemos supuesto que la estructura probabilstica de la poblacin
corresponde a una determinada funcin de distribucin, pero la funcin de distribucin
real fuese ligeramente diferente, el estimador no perdera prcticamente eficiencia. Es
decir, disminuira poco la bondad de sus estimaciones.
La robustez es una propiedad muy deseable en un estimador puesto que de poco sirve
un estimador muy eficiente pero muy poco robusto puesto, que ante cualquier error en
la estimacin del modelo perdera por completo su eficiencia. En ese tipo de situaciones
es preferible un estimador algo menos eficiente pero robusto, que mantendr su
eficiencia aunque la estimacin del modelo no sea demasiado buena.

138

Mdulo de Estadstica Aplicada a la Hidrologa

7.4

ESTIMACIN PUNTUAL

Supongamos que se dispone de una muestra de una variable aleatoria x, que sigue una
distribucin de probabilidad correspondiente a una expresin matemtica conocida,
aunque dependiente de unos parmetros desconocidos, y que no disponemos de ninguna
informacin inicial sobre el valor de dichos parmetros. Veremos a continuacin
diferentes tcnicas matemticas que permitirn estimar el valor de los parmetros ms
apropiado para reflejar las caractersticas estadsticas de la muestra
7.4.1

Mtodo de los Momentos

Este estimador para los parmetros de la distribucin fue propuesto por K. Pearson a
finales del siglo XIX. Consiste en suponer que el valor de los momentos de la poblacin
(media, varianza, sesgo, ...) es igual al de los momentos muestrales. El valor de los
parmetros se obtiene planteando el sistema de ecuaciones que resulta de igualar la
expresin terica de los momentos de la poblacin en funcin de los parmetros y los
valores obtenidos a partir de la muestra. Es necesario disponer de tantas ecuaciones
como parmetros se quiere estimar, por lo que ser necesario igualar los momentos
hasta un orden igual al nmero de parmetros desconocidos. Una funcin de
distribucin dependiente de un solo parmetro requerir igualar nicamente el valor de
la media, mientras que una dependiente de cuatro parmetros necesitar igualar el valor
de la media, varianza, sesgo y curtosis.
Si hay que estimar k parmetros (1, ... , k) y se conocen los k primeros momentos
muestrales de la poblacin (m1, ... , mk), se plantear el siguiente sistema de ecuaciones:
Ec. 180 Mtodo de los momentos

M 1 (1 ,..., k ) = m1

M
M k (1 ,..., k ) = mk
Siendo Mi(1, ... , k) la expresin terica de los momentos de la poblacin que son
funcin de los parmetros.
Una ventaja importante de este mtodo es su sencillez aunque no aprovecha toda la
informacin disponible en la muestra. Otra ventaja es que el resultado es menos sensible
que en otros mtodos a una eleccin incorrecta de la funcin de distribucin.
Ejemplo: Ajustar a la serie de caudales mximos del ejemplo del apartado 6.2.2. una funcin de
distribucin tipo Gumbel mediante el mtodo de los momentos y calcular el valor del caudal
correspondiente a un periodo de retorno de 200 aos.

139

Estadstica Aplicada a la Hidrologa

Solucin: La expresin matemtica de la funcin de distribucin Gumbel depende de dos


parmetros u y .

F ( x) = e e

xu

El valor de los parmetros en el mtodo de los momentos se determina igualando las


expresiones tericas de los momentos de la poblacin, funcin de los parmetros, a los
momentos muestrales. Como en este caso se necesita conocer dos parmetros, basta con
plantear la igualdad de los dos primeros momentos, la media y la varianza (o la desviacin
tpica).
En primer lugar es necesario calcular los momentos muestrales a partir de los datos de la
muestra. La media muestral ser:

x
M =

16887
= 844.4
20

donde xi son los datos de la muestra y N el nmero total de datos.


En cuanto a la desviacin tpica muestral, su valor viene dado por la siguiente expresin:

(x
=

(x

M ) 2

N 1

844.4) 2

19

5280872.6
= 527,2
19

La expresin correspondiente a la media de la poblacin es:

M = u + 0.5772
Y la desviacin tpica:

Igualando las expresiones anteriores al valor de los momentos muestrales, se tiene:

140

Mdulo de Estadstica Aplicada a la Hidrologa

M = u + 0.5772 = 844.4

= 527.2

De donde se obtiene:

u = 844.4 0.5772411.1 = 607.1

527.2 6

= 411.1

Por lo que la funcin de distribucin buscada ser:

F ( x) = e

x 607.1
411,1

El valor de F(x) para el cuantil de 200 aos de periodo de retorno es:

F ( x) = 1

1
1
= 1
= 0.995
T
200

Por tanto, el cuantil ser:

F ( x) = e

x 607.1
411,1

= 0.995

x = 607.1 411.1ln( ln 0.995) = 2784m 3 / s

7.4.2

Mtodo de los Momentos Ponderados Probabilsticamente

El Mtodo de los Momentos Ponderados Probabilsticamente fue desarrollado por


Greenwood en 1979 para poblaciones en las cuales la funcin de distribucin F(x) sea
expresable de forma explcita en forma inversa, es decir:
x = x(F )
Este mtodo calcula unas funciones lineales (los momentos ponderados
probabilsticamente) de los datos e iguala dichas cantidades con las expresiones tericas
en funcin de los parmetros para la ley considerada, de forma anloga al mtodo de los
momentos. Este mtodo confiere un mayor peso a los mayores valores de la serie,
resultando valores ms conservadores.
Los momentos ponderados probabilsticamente corresponden a la siguiente expresin:

141

Estadstica Aplicada a la Hidrologa

Ec. 181 Momentos ponderados probabilisticamente

M ijk = E x i F j (1 F )

siendo i, j, k nmeros enteros y F la probabilidad de que x no sea superada.


En el caso particular de i=1 y bien j=0 k=0, M10k y M1j0 son lineales y pueden ser
utilizados en la estimacin de los parmetros de funciones de distribucin invertibles.
M10k y M1j0 estn relacionados entre s, mediante las expresiones:
Ec. 182 Relacin entre los momentos ponderados M1j0 y M10k
k
k
M 10 k = ( 1) j M 1 j 0
j =0 j
j
j
M 1 j 0 = (1) k M 10 k
k =0 k

La expresin del momento M1j0=E[x, Fj] realiza la ponderacin de la variable por la


probabilidad que tienen de no ser superada, con lo que tienen mayor influencia los
valores ms altos.
La estimacin de los valores de M10k y M1j0 a partir de la muestra se realiza con las
expresiones:
Ec. 183 Momentos muestrales ponderados probabilisticamente

1
M 10 k =
N

i 0.35
x i 1

i =1

1
M 1 j 0 =
N

i 0.35

x
i

i =1

donde los xi son los N valores de la muestra ya ordenados siendo i=1 el menor valor.
A partir de las expresiones anteriores, la estimacin de los parmetros se realiza de
forma similar a la empleada en el mtodo de los momentos convencionales siguiendo
los siguientes pasos:

142

Deduccin terica de la expresin de M1j0 en funcin de los parmetros para el


tipo de funcin de distribucin seleccionada.

Estimacin de los momentos ponderados a partir de la muestra.

Obtencin de un sistema de tantas ecuaciones como parmetros tenga la funcin


de distribucin seleccionada, que resulta de igualar los valores muestrales y las
expresiones tericas, variando j desde cero hasta el nmero de parmetros menos
uno.

Mdulo de Estadstica Aplicada a la Hidrologa

Resolucin del sistema de ecuaciones planteado.

Ejemplo: Ajustar a la siguiente serie de precipitaciones mximas una funcin de distribucin


tipo GEV mediante el mtodo de los momentos ponderados probabilsticamente.

Solucin: La expresin matemtica de la funcin de distribucin GEV depende de tres


parmetros u, y k.

F ( x) = e


x u k

1 k

El valor de los parmetros en el mtodo de los momentos ponderados probabilsticamente se


determina igualando las expresiones tericas de los momentos ponderados de la poblacin,
funcin de los parmetros, a los momentos muestrales. Como en este caso se necesita conocer
tres parmetros es necesario plantear la igualdad de los tres primeros momentos: M100, M110 y
M120.
En primer lugar es necesario calcular los momentos muestrales a partir de los datos de la
muestra. Vienen dados por la expresin:

1
M 1 j 0 =
N

i 0.35
xi

N
i =1
N

donde xi son los datos de la muestra, i el puesto que ocupa el dato en la serie ordenada de menor
a mayor y N el nmero total de datos.
El valor de los tres primeros momentos para la muestra es:

143

Estadstica Aplicada a la Hidrologa

M 100 = 59,989
M 110 = 38,243
M 120 = 29,167
La expresin terica de los momentos para una poblacin tipo GEV es:

M 1 j0 =

1
1+

1 ( j + 1) k (1 + k )
u +

j
k

Igualando las expresiones anteriores al valor de los momentos muestrales se tiene un sistema de
tres ecuaciones que nos permitir conocer el valor de los parmetros. La resolucin de dicho
sistema de ecuaciones es compleja por lo que se han establecido unas expresiones que permiten
encontrar su solucin:

C=

2M 110 M 100 log10 2

3M 120 M 100 log10 3

k = 7,8590C + 2,9554C 2

(2M 110 M 100 )k


(1 + k )(1 2 k )

u = M 100 +

((1 + k ) 1)
k

De donde se obtiene:

u = 44,0020

= 17,9668
k = 0,2430
Por lo que la funcin de distribucin buscada ser:

F ( x) = e

7.4.3

x 44 , 0020 0 , 2430


1+ 0 , 2430

17
,
9668

Mtodo de Mxima Verosimilitud

El mtodo de mxima verosimilitud fue propuesto por Fisher, y consiste en determinar


el valor de los parmetros imponiendo que la probabilidad de obtener todo el conjunto
de la muestra sea la mxima posible.
El mtodo parte de la denominada funcin de verosimilitud. Supongamos que se
dispone de una muestra de tamao N, X=(x1, ..., xN), que se supone pertenece a una
poblacin que se asume sigue una determinada funcin de distribucin, F(x,). La
funcin de densidad de probabilidad asociada a la funcin de distribucin es f(x,), que
al igual que la funcin de distribucin depende de los parmetros .

144

Mdulo de Estadstica Aplicada a la Hidrologa

Como hemos dicho, el objeto del mtodo de mxima verosimilitud es obtener el valor
de los parmetros que hace mxima la probabilidad de obtener el conjunto de los N
valores de la muestra. La probabilidad conjunta de los N valores de la muestra, al ser
cada uno de los N valores independiente del resto, ser:
Ec. 184 Probabilidad del conjunto de una muestra
N

P( X , ) = f ( x1 , ) f ( x 2 , )... f ( x N , )dx1 dx 2 ...dx N = f ( xi , ) dxi


i =1

Al entrar en la expresin anterior con distintos conjuntos de valores X y un conjunto de


parmetros fijos, se obtendr la probabilidad de obtener distintas muestras. Como en
nuestro caso lo que conocemos es la muestra y desconocemos los parmetros , si
variamos y mantenemos fijo X, obtendremos la probabilidad de obtener la muestra de
la que disponemos ante distintos valores de los parmetros.
Es decir, podemos definir la funcin:
Ec. 185 Funcin de verosimilitud

L( , X ) = L( ) = P( X , )
con X fijo y variable. A esta funcin L se la denomina funcin de verosimilitud.
Una vez definida la funcin de verosimilitud, el valor de los parmetros se obtiene
derivando dicha funcin respecto a cada uno de los parmetros e igualando las
derivadas a cero (condicin matemtica para maximizar el valor de la funcin y, por
tanto, de la probabilidad conjunta de la muestra). Se obtendr de esta manera un sistema
de ecuaciones, tantas como parmetros tenga la funcin de distribucin, cuya resolucin
proporcionar el valor buscado de los parmetros:
Ec. 186 Mtodo de mxima verosimilitud

L( , X )
=0
1
L( , X )
=0
2

M
Puesto que el mximo de una funcin y el de su logaritmo se alcanza en el mismo
punto, es frecuente maximizar el logaritmo de la funcin de verosimilitud en lugar de la
propia funcin, lo que frecuentemente conduce a expresiones ms sencillas. Por tanto,
un sistema de ecuaciones equivalente ser:

145

Estadstica Aplicada a la Hidrologa

Ec. 187 Forma alternativa del mtodo de mxima verosimilitud

ln L( , X )
=0
1
ln L( , X )
=0
2

M
El mtodo de mxima verosimilitud es considerado habitualmente como el ms
eficiente, es decir, aquel que produce una varianza menor en los parmetros estimados,
pero tiene el inconveniente de ser bastante sensible a una incorrecta eleccin de la
funcin de distribucin. Otro inconveniente de este mtodo es la mayor dificultad
numrica frente a otro tipo de mtodos.
En general puede decirse que este mtodo proporciona estimadores con las siguientes
propiedades:

Asintticamente centrados

Con distribucin asintticamente normal

Eficientes o de varianza mnima

Suficientes

Invariantes

Ejemplo: Supongamos que se dispone de una muestra X=(x1, ..., xN) que se supone sigue
una distribucin exponencial. Calcular el valor del parmetro de la distribucin mediante
el mtodo de mxima verosimilitud.
Solucin: La funcin de distribucin exponencial corresponde a la siguiente expresin:

F ( x ) = 1 e x
Y la de densidad de probabilidad a:

f ( x ) = e x
La funcin de verosimilitud ser, por tanto:
N

i =1

i =1

L( , X ) = f ( xi , ) = e xi
Tomando el logaritmo de la funcin de verosimilitud:
N

i =1

i =1

ln L( , X ) = ln f ( xi , ) = ln e xi = N ln xi
Derivando el logaritmo del funcional respecto a e igualndolo a cero:

146

i =1

Mdulo de Estadstica Aplicada a la Hidrologa

ln L( , X ) N N
= xi = 0

i =1
Resolviendo la ecuacin se obtiene el valor buscado para el parmetro :

1
N

=x

i =1

Por tanto:

7.4.4

1
x

Estimadores ms empleados para distintas funciones de distribucin

Aunque cada modelo de ley puede ajustarse por varios mtodos, existen ciertas
combinaciones que son las ms habitualmente empleadas. Estas combinaciones se
detallan en la tabla adjunta.
DISTRIBUCIN
Normal
Gumbel
Valores Extremos Generalizados
(GEV)
Log Pearson III (LP3)
SQRT-ET max
Valores extremos de dos componentes
(TCEV)

MTODO
Momentos
Momentos y Mxima Verosimilitud
Momentos ponderados
probabilsticamente
Momentos en el espacio de los
logaritmos
Mxima verosimilitud
Mxima verosimilitud

Tabla 35. Estimador ms empleado para cada tipo de funcin de distribucin

7.5

ESTIMACIN POR INTERVALO

Al contrario que en la estimacin puntual, el mtodo de estimacin por intervalo no


asocia un nico valor a la estimacin de cada cuantil sino que le asocia uno o varios
intervalos que permiten precisar la incertidumbre existente en la estimacin. El
resultado de la estimacin del parmetro no es un nico valor sino que para cada cuantil
se definen los intervalos de confianza.
Se llama intervalo de confianza del parmetro con nivel de confianza 1- al intervalo
[1,2] tal que si se estima el parmetro a partir de distintas muestras del mismo tamao,
el (1-a)100% de las veces la estimacin se encuentra en dicho intervalo. Al valor se
le denomina nivel de significancia.

7.6

ESTIMACIN BAYESIANA

En el caso de la estimacin bayesiana no se estima un nico valor para los parmetros


de los cuales depende la funcin de distribucin de la poblacin, sino que los

147

Estadstica Aplicada a la Hidrologa

parmetros se consideran variables aleatorias y su estimacin proporciona su


distribucin de probabilidad.
En la estimacin bayesiana se parte de una distribucin inicial o a priori f(q) y se
calcula la distribucin final o a posteriori mediante el teorema de Bayes.
Ec. 188 Teorema de Bayes para variable aleatoria

f ( , X ) =

f ( X , ) f ( )
f ( X , ) f ( )d

La estimacin puntual y por intervalo se pueden considerar casos particulares de la


estimacin bayesiana, puesi se desea realizar una estimacin puntual se tomar la media
o la moda de la distribucin como valor nico de los parmetros, y si se desea un
intervalo de confianza se tomar el intervalo de los parmetros que encierre una
probabilidad fijada en su distribucin y a partir de l el intervalo de la variable
correspondiente a un determinado cuantil.

148

Mdulo de Estadstica Aplicada a la Hidrologa

8
8.1

TEST DE CONTRASTE DE HIPTESIS.


INTRODUCCIN.

Los tests de contraste de hiptesis constituyen una herramienta numrica para comparar
las hiptesis realizada con la realidad y evaluar el acierto de las primeras. Esta tcnica
es apropiada cuando las hiptesis planteadas son simples y cuando haya variabilidad en
los datos que induzca a manejar criterios estadsticos. Las hiptesis que normalmente se
plantean se refieren a la distribucin de la muestra, a la independencia de los datos o a la
homogeneidad-heterogeneidad de los grupos de datos.
Ejemplo: se pueden plantear contrastes sobre la consistencia y homogeneidad de las
series meteorolgicas que se utilizan en un estudio de recursos. Las razones a las que
obedece la aparicin de heterogeneidades en las series son mltiples, dependientes de
factores tales como alteraciones naturales o inducidas por el hombre (cambio en la
instrumentacin, cambios de las instrucciones y momento de observacin o en las
condiciones de medicin por crecimiento de la vegetacin, colocacin de
construcciones, vallas, etc..., deterioro del equipo, errores en la calibracin del equipo,
cambios en la localizacin de los sensores, etc.) que habrn de ser corregidas. El efecto
en los datos de casos como stos debe ser detectado y considerado si se pretende
obtener conclusiones vlidas acerca del comportamiento de una variable. Las dobles
acumulaciones sirven para identificar estos efectos, pero si nicamente se utiliza la
herramienta grfica, queda como decisin basada en la propia experiencia del tcnico
el decidir qu grado de cambio es el que ha de corregirse. Mediante los tests de
contraste de hiptesis se puede establecer un procedimiento objetivo y una medida que
sirva para rechazar o aceptar la homogeneidad de una serie.

8.2

TESTS ESTADSTICOS DE CONSISTENCIA Y CONTRASTE DE


HIPTESIS

El contraste de hiptesis es el procedimiento que permite valorar el acierto de una


hiptesis simple, hiptesis nula, Ho. Aceptar o rechazar esa hiptesis supone rechazar o
aceptar la alternativa, hiptesis alternativa, H1. Esta decisin se basa en estadsticos de
los que se conoce su distribucin de probabilidad. El estadstico toma para la muestra
dada un valor determinado y mediante la probabilidad asociada a la presentacin de este
valor, se obtiene un criterio para aceptar o no una hiptesis. Es decir, es necesaria la
utilizacin de un estadstico como medida y de una distribucin de probabilidad que
permita valorar cmo de raro, funcin de los datos de la muestra, es el resultado
obtenido. Esto se realiza dividiendo el dominio de valores posibles del estadstico en
regiones que permitan aceptar (regin de aceptacin) o rechazar la hiptesis (regin
crtica).
En la eleccin de hiptesis se pueden cometer dos tipos de errores:
-

rechazar la hiptesis nula Ho cuando es cierta (error tipo I)

aceptar la hiptesis nula Ho cuando es falsa (error tipo II).

149

Estadstica Aplicada a la Hidrologa

El nivel de significacin, , es la probabilidad de rechazar la hiptesis nula cuando es


cierta lo que nos permite definir un umbral de aceptacin / rechazo de una hiptesis y
dividir el dominio de valores del estadstico. Conocida la distribucin del estadstico
seleccionado, se escoge una probabilidad pequea (0,01 a 0,05) para definir el rango
de valores con los que rechazaremos la hiptesis nula (regin crtica) o la aceptaremos
(regin de aceptacin). Por otro lado, los tests tambin estn caracterizados por su
potencia, probabilidad complementaria a la de aceptar la hiptesis nula cuando es falsa.
El test que tenga la menor probabilidad de cometer un error tipo II se dice que es ms
potente.
Ho es verdadera
Aceptacin P(decisin correcta)=1-
Rechazo

Error tipo I
P(error tipo I)=
Nivel de significacin

Ho es falsa
Error tipo II
P(error tipo II)=
P(decisin correcta)=1-
Potencia del test

Tabla 36. Opciones posibles en un contraste de hiptesis (Hensel-Hirsch, 2002)

Ejemplo:
1. Planteamiento de hiptesis:
a. Hiptesis nula: en la serie temporal no hay tendencias
b. Hiptesis alternativa: hay tendencia en la serie temporal
2. Seleccin de un estadstico: pendiente de la recta de regresin ajustada a la serie
temporal
3. Nivel de significacin: probabilidad de que el test detecte una tendencia cuando
no la hay
a. Al estadstico se le debe asociar una probabilidad sobre los valores de la
pendiente (baja para valores bajos de la pendiente; alta para valores altos
de la pendiente). Esta probabilidad representa el % de sucesos que tienen
tendencia dado un valor de la pendiente.
b. Nivel de significacin: probabilidad anterior
4. Errores y potencia del test:
a. Error tipo I: se toma como referencia un valor de pendiente asociado al
nivel de significacin o riesgo que aceptamos. Con pendientes mayores,
rechazar la hiptesis nula, aunque puede que tenga un valor raro
asociado al error tipo I y nivel de significacin.
b. Potencia del test: probabilidad de detectar una tendencia cuando est
presente. Para pendientes pequeas, la probabilidad de cometer un error
tipo II aumenta. Un contraste alternativo puede discriminar mejor estas
situaciones y tener mayor potencia.

150

Mdulo de Estadstica Aplicada a la Hidrologa

Con carcter general, los denominados test paramtricos se aplican planteando


previamente en la elaboracin del test qu distribuciones siguen los datos de la muestra.
Es el caso tpico de test basados en poblaciones normales. La poblacin normal depende
de dos parmetros que se calculan en funcin de los datos de la muestra y el estadstico
se calcula en funcin de estos parmetros. En otras situaciones para las que no se
pueden realizar consideraciones previas sobre las distribuciones tericas de los datos, se
plantean los denominados test no paramtricos. Mediante estos ltimos se valoran
hiptesis basadas en la ordenacin de frecuencias y rangos de los datos como la
independencia entre series, la bondad del ajuste a una distribucin terica o la
homogeneidad y la comparacin de tendencias centrales y posicin de dos series. En los
textos de la OMM (Kundzewicz, 2000) se distingue entre tests dependientes o no de
funciones de distribucin y tests paramtricos y no paramtricos. Una de las formas de
elaborar tests sin asumir funcin de distribucin alguna es trabajar con los rangos o
generando muestras sintticas por permutacin o muestreo con reemplazamiento. El test
paramtrico sera aquel en que el contraste se efecta por medio de parmetros, mientras
que el no paramtrico efecta el contraste, pero sin cuantificar, por ejemplo, el cambio.
Ejemplo: clculo del nivel de significacin asociado a una muestra y un estadstico sin
depender de una funcin de distribucin previa (Kundzewicz, 2000)
1. Aplicacin de un nmero s (entre 100 y 2000, en un nmero suficientemente
grande) de permutaciones o muestreo con reemplazamiento.
2. De la muestra original se calcula el valor del estadstico T.
3. De cada una de las series generadas se calculan los estadsticos Ti, i=1,s.
4. Se ordenan de menor a mayor los valores calculados de Ti y se obtiene el valor
de k tal que Tk<To<Tk+1.
5. Por tanto, a la muestra original le corresponde un nivel de significacin asociado
a la probabilidad p:
p=

8.2.1

k
k + 0,5
k +1
p=
p=
s
s +1
s+2

Teoremas de Fisher

Los teoremas de Fisher se aplican para la obtencin de criterios en los problemas de


inferencia estadstica sobre poblaciones normales. Si x1, ...xn es una muestra aleatoria
simple de una poblacin N(,) y x y s2 son respectivamente la media y cuasivarianza
muestral, se cumple:
1. Teorema de Fisher
Ec. 189. 1er teorema Fisher

x N ( ,

2. Teorema de Fisher

151

Estadstica Aplicada a la Hidrologa

Ec. 190. 2 teorema Fisher

(x
n

( n 1)s

n21 con s 2 =

i =1

(n 1)

3. x y n21 son independientes


Con lo que se pueden obtener criterios para la aplicacin de tests paramtricos:
Ec. 191. Criterio para contrastes cuando es conocida

x
N (0,1)
n
Ec. 192 Criterio para contrastes cuando es desconocida

x
n
( n 1)s /
n 1
2

tn 1

x
tn 1
s
n

Esto se puede aplicar a los siguientes contrastes de hiptesis:


Ttulo

Muestra

Poblacin

Contraste sobre la media de una


poblacin

x1,...xn

N(,)

Contraste

Condiciones

Bilateral. Ho: =o; H1 <>o

Regin crtica
conocida

desconocida

Unilateral. Ho: =<o; H1 >o

conocida

desconocida

Unilateral. Ho: =>o; H1 <o

conocida

desconocida

C = x o > z
2
n

C = x o > tn 1,
2
n

C = x o > z
n

C = x o > tn 1,
n

C = x o < z1
n

C = x o < tn 1,1
n

Para muestras grandes (n>30) la t de Student se aproxima a una normal

Tabla 37. Contrastes sobre la media de una poblacin normal.

En el siguiente ejemplo se valora la homogeneidad de una serie de caudales anuales. Se


supone que se comportan como una funcin de distribucin normal y se sospecha que
puede existir un cambio en las propiedades de la serie.

152

Mdulo de Estadstica Aplicada a la Hidrologa

Ejemplo: Problema:
Se tiene caracterizada una serie de caudales anuales de una cuenca A mediante una
distribucin normal de media 3,56 m3/s y desviacin tpica 2,14 m3/s.
Durante un periodo reciente (27 aos) se han extrado por bombeo caudales en una
cuenca prxima B y no se conoce si este hecho ha afectado o no a la hidrologa de A. La
media de caudales anuales en A durante los ltimos 27 aos es de 1,51 m3/s. Se pide
contrastar si hay o no un cambio significativo en la media.
Ho: no hay cambio en la media; H1 hay cambio en la media. Se toma como nivel de
significacin 5%, repartido en dos tramos de 2,5% ambos lados de la media, por lo que
la regin de aceptacin se encuentra comprendida entre (-1,96, 1,96). Al realizar las
operaciones, el valor del estadstico queda fuera de esta regin, es decir, cae en la regin
crtica:
1,51 3,56
= 4,96 > 1,96 = z 2,5%
2,14
27
por lo que no se puede aceptar la hiptesis de la homogeneidad de la serie.
Evidentemente, se ha comprobado la falta de homogeneidad, pero no la causa.

Ttulo

Muestra

Poblacin

Contraste sobre la varianza de una


poblacin

x1,...xn

N(,)

Contraste

Condiciones

Regin crtica

Bilateral. Ho: = o; H1 <> o

desconocida

2 o2 ;

desconocida

Unilateral. Ho:

H1

> o2

2 o2 ;
2
2
H1 < o

Unilateral. Ho:

Con conocida, cambiar

desconocida

(n 1)s 2

(n 1)s 2 2

n 1,1 , n21,
C=
2

2
2

2
(n 1)s

C=
< n21,
2
o

(n 1)s 2

C=
< n21,1
2
o

2
( xi )

por

o2

Tabla 38. Contrastes sobre la varianza de una poblacin normal.

En el siguiente ejemplo se vuelve a plantear un test de homogeneidad, pero esta vez en


trminos de la diferencia de medias de dos poblaciones normales independientes, entre
dos periodos, caracterizados por sus medias y desviaciones tpicas.

153

Estadstica Aplicada a la Hidrologa

Ejemplo: bajo la hiptesis de apoyarse en series que siguen distribuciones normales sin
una varianza conocida, una forma de valorar si hay cambios en la media significativos
entre dos periodos distintos es plantear el siguiente contraste de hiptesis:
Ho: 1=2; H1: 12
La aplicacin del primer teorema de Fisher nos dara:
x

N (0,1)

n
Del segundo teorema
( n 1)s 2

n21

Y el cociente de los trminos anteriores ser por definicin una t de Student con n-1
grados de libertad, que queda:
x
t n 1
S
n
Al plantear el test sobre la diferencia de las medias se tiene:

(x

x 2 ( 1 2 )
S12 S 22
+
n1 n2

tf

La regin crtica para un nivel de significacin , se define como


2

S12 S 22

+
n1 nn
S12 S 22

+
} siendo f =
{ x1 x2 > tf, /2
2
2
2
n1 n2
1 S12
1 S 22
+

n1 + 1 n1 n2 + 1 n2
tf /2 es el cuantil correspondiente al valor de probabilidad /2 de la distribucin t de
Student para f grados de libertad dados por la aproximacin de Welch, el entero ms
prximo a la expresin anterior. Esta correccin tiene en cuenta el efecto de la
simplificacin realizada en las varianzas que han desaparecido del cociente que define la
variable aleatoria t de Student en una diferencia de variables aleatorias. Con muestras
grandes se puede simplificar y tomar la distribucin normal estndar z/2 por la
distribucin de Student tf, /2.
Este test se puede aplicar al ejemplo siguiente para el contraste de medias entre dos
periodos de mediciones en una misma estacin pluviomtrica:

154

Mdulo de Estadstica Aplicada a la Hidrologa

Estacin
pluviomtrica C
(mm)

40
35
30
25
20
15
10
1974

1971

1968

1965

1962

1959

1956

1953

1950

34
29
32
26
35
34
25
27
27
28
36
23
34
26
35
36
25
24

1947

1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976

Estacin pluviomtrica C.
Periodo de medidas 1941-1976.
Nmero total de datos: 36

1944

31
20
21
23
22
21
29
34
22
17
22
38
18
15
12
33
22
27

Estacin
pluviomtrica C
(mm)

1941

1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958

Ao

Precipitacin registrada (mm)

Ao

Tiempo (aos)

Tomando una t de Student de 25 grados de libertad dados por el valor de f como


distribucin del estadstico, se obtendra un valor lmite de 2,06, mientras que el cociente
1 2
da un valor de 2,6, lo que supone aceptar la hiptesis alternativa. Es decir,
S12 S 22
+
n1 n2
existe una diferencia significativa entre las medias al 5% del nivel de significacin
siempre que las poblaciones sean normales.
Test 2 de bondad de ajuste

8.2.2

El test de 2 se utiliza para valorar la bondad del ajuste con una funcin de distribucin
comparando las frecuencias de la muestra clasificada en clases con las de la distribucin
terica. Es un contraste aplicable a variables discretas o continuas.
Como hiptesis nula, Ho, se toma el que la variable x sigue una determinada funcin de
distribucin terica F(x) o que tiene al menos su forma. El estadstico que se utiliza es el
de Pearson:
Ec. 193. Estadstico de Pearson
k

=
i =1

k
n ni
(n n pi )2 = k ni2 n = k (Observadasi Tericasi )2

pi = i

pi n
n pi
Tericasi

i =1
i =1 n pi
i =1

siendo k el nmero total de clases, ni el nmero de elementos por clase de la muestra, n


el total de la muestra y pi la probabilidad terica correspondiente a ese intervalo de clase
y funcin de distribucin F. Lgicamente, cuanto mayor sea , menos se parecern las
distribuciones muestral y terica. Este estadstico sigue una distribucin 2 con k-1
grados de libertad y la regin crtica est dada por:

155

Estadstica Aplicada a la Hidrologa

Ec. 194. Regin crtica para aplicacin del test de bondad de ajuste

C = > k21,

Si los datos de la muestra se utilizan para calcular m parmetros, el nmero de grados de


libertad ser k-m-1. Es decir, el contraste tambin se aplica sobre la hiptesis de que la
muestra tiene una forma correspondiente a la funcin de distribucin, por ejemplo,
normal, de la que, a partir de la muestra, se calculan sus parmetros.
Este estadstico aparece al considerar que en cada intervalo del histograma una binomial
con una media npi y una desviacin tpica n pi qi (i es el subndice de clase).
Suponiendo que n es suficientemente grande y que p es pequeo, se tiene una Poisson
de la que queda como media npi y como desviacin tpica n pi . Al normalizar se
considera que la variable es una N(0,1) y la suma del cuadrado de k-1 variables
aleatorias independientes N(0,1), una 2 con k-1 grados de libertad. Para su aplicacin
se recomienda:

El nmero de clases del histograma de la muestra afecta a la aplicacin del test.


Se requiere un mnimo de 5 6 clases, con un nmero similar de datos en las
clases y como mnimo entre 3 y 10 datos por clase.

El tamao muestral debe ser, por tanto, grande, n > 25, 30 elementos.

El estadstico es sensible a la presencia de valores extremos, por lo que es bueno


revisar los sumandos parciales (frecuencias observadas menos tericas al
cuadrado).

No olvidar que en realidad se est contrastando el ajuste de la funcin de


distribucin terica a la muestra con el histograma construido.

Si las frecuencias son pequeas y no se pueden reagrupar las clases, se aplica la


correccin de Yates (Garca et al., 1998):
Ec. 195. Estadstico de Pearson corregido para frecuencias pequeas
k

=
i =1

( n n p
i

0,5)

n pi

Ejemplo:
Contrastar el posible ajuste de una funcin de distribucin normal a una serie de
mximos anuales registrados en una estacin pluviomtrica. El ejercicio se puede
realizar utilizando las herramientas del anlisis de datos de la hoja excel. Para activarlas
se debe ir al men Complementos dentro del correspondiente de Herramientas. Una vez
activado el anlisis de datos, se utiliza la aplicacin Histograma, que a su vez pide
seleccionar la matriz de los datos cuyas frecuencias hay que ordenar y la matriz con los
lmites de los intervalos. En la solucin que se muestra a continuacin, se han tomado
finalmente 6 intervalos.

156

Con formato

Mdulo de Estadstica Aplicada a la Hidrologa

Media
63,83 (calculadas de la muestra)
Desviacin tpica
25,06 Nmero total de datos: 53
Nmero de clases
6
Nmero de grados de libertad
3
Clases Observadas Probabilidad Probabilidad
Puntos Aplicacin Probabilidad
npi
acumulada
parcial
medio
de la
parcial Tericas
por
normal
intervalo
40
7
13,21%
13,21%
32,5
10,56%
10,56%
5,60
55
18
47,17%
33,96%
47,5
25,73%
15,17%
8,04
70
11
67,92%
20,75%
62,5
47,88%
22,15%
11,74
85
7
81,13%
13,21%
77,5
70,73%
22,85%
12,11
100
5
90,57%
9,43%
92,5
87,37%
16,64%
8,82
y
5
100,00%
9,43%
107,5
95,93%
8,56%
4,54
mayor...
SUMA
Referencia chi cuadrado al 5% alfa

Estadstico de
Pearson

0,352
12,337
0,047
2,156
1,654
0,047
16,593
7.815

Histograma inicial

Frecuencia

40%
35%

% Observado

30%

% Terico-Normal

25%
20%
15%
10%
5%
0%
menor 40

40-55

55-70

70-85

85-100

100-y
mayor...

Clase

8.2.3

Tests basados en la distribucin de Kolmogorov-Smirnov

Este test se puede aplicar como la 2 para conocer si unos datos siguen una funcin de
distribucin determinada. Tambin es til cuando se quiere contrastar la falta de
homogeneidad de las distribuciones de datos entre dos periodos. Para aplicar este test la
funcin de distribucin debe ser continua.
Considerando como hiptesis nula el que la muestra siga una distribucin terica, FT, se
procede de la siguiente manera:
1. Ordenar la muestra de menor a mayor y asociar una frecuencia observada
correspondiente al orden de observacin (para el orden r, probabilidad r/n)
2. Obtener las diferencias de estas probabilidades de los valores observados con las
correspondientes a la funcin de distribucin terica. El estadstico del test de
Kolmogorov-Smirnov es el mximo valor absoluto de estas diferencias. Sigue
una distribucin de Kolmogorov-Smirnov que se puede consultar en tablas para
la que hay que considerar el trmino n .

157

Estadstica Aplicada a la Hidrologa

Ec. 196. Estadstico de Kolmogorov

n max ( FO ( x) FT ( x) ) Kolmogorov
siendo n el tamao de la muestra, FO las frecuencias acumuladas de los valores
observados y FT las tericas. Si el estadstico calculado es mayor que el correspondiente
a las tablas, se rechaza la hiptesis de comportamiento de la muestra segn la
distribucin seleccionada.

dividir los siguientes valores por n


para contrastar con el mximo valor
absoluto de las diferencias de frecuencias
90%
95%
99%

10
20
30
40
50
100

1,05
1,10
1,12
1,13
1,14
1,17
1,22

1,14
1,22
1,24
1,26
1,27
1,29
1,36

1,29
1,42
1,46
1,50
1,52
1,55
1,63

Tabla 39. Distribucin de Kolmogorov-Smirnov (Singh)


Cuando se contrasta la normalidad de una muestra y con ella se calculan los parmetros,
los valores de la tabla de referencia se corrigen por los de Lilliefors, bastante ms
restrictivos. La correspondiente distribucin se denomina Kolmogorov-SmirnovLilliefors.
En el texto de Singh (1985) se expone una tcnica para utilizar el test de KolmogorovSmirnov en la deteccin de heterogeneidades en las series temporales. Para ello se
calculan las diferencias, yi, entre los valores de la estacin a comprobar y los de la
estacin de referencia. A continuacin, se calcula la serie de desviaciones acumuladas
estandarizadas por la desviacin tpica de la serie de diferencias tal como se indica a
continuacin:
Ec. 197. Tratamiento de la variable para detectar heterogeneidades en la serie con K-S
k

S k = ( yi y )
i =1

S2 =

1 n
( yi y ) 2
n i =1

S ka =

Sk
S

que permite detectar la falta de homogeneidad si se alcanzan valores demasiado altos. El


estadstico de referencia sigue siendo el mximo de los valores absolutos alcanzados,
que, en trminos de las expresiones anteriores, queda:
Ec. 198. Estadstico de Kolmogorov-Smirnov en la identificacin de heterogeneidades

P = mx S ka
0 k n

que puede valorarse segn las tablas de Kolmogorov-Smirnov ( P

158

).

Mdulo de Estadstica Aplicada a la Hidrologa

8.2.4

Test de Wilcoxon, Mann-Whitney

El test de Wilcoxon o Mann-Whitney contrasta si dos muestras independientes (xi, yj)


(i=1..n, j=1..m, nm) son heterogneas y entre ellas hay un cambio de localizacin,
mediana, provengan o no de una misma poblacin no necesariamente normal. Es un test
que trabaja sobre los rangos de las series ordenadas y se aplica con independencia de la
funcin de distribucin a la que pertenezcan. La hiptesis nula es que las dos series
tienen la misma mediana.

Para aplicar el test, se mezclan las dos muestras y se asigna un rango a cada uno de los
valores de la nueva serie nica. Siendo el estadstico Rx la suma de los rangos ocupados
por la serie xi:
Ec. 199. Estadstico del test de Wilcoxon o Mann-Whitney
n

Rx =

xi

i =1

Este ndice sigue aproximadamente una distribucin normal si el tamao de las


muestras no es pequeo (n y m > 5). Como la suma de los rangos de n+m datos es:
Ec. 200. Suma de los rangos en el test de Wilcoxon o Mann-Whitney
n+m

i =
i =1

1+ n + m
N +1
(n + m ) = N

el valor esperado del rango de una observacin xi que puede tomar los valores de 1..N
con idntica probabilidad

1
es:
N

Ec. 201. Valor esperado del rango en el test de Wilcoxon o Mann-Whitney


E [r ( xi )] =

i N
1

i =1

por lo que la media y desviacin tpica de Rx quedan:


Ec. 202. Media y desviacin tpica de la suma de rangos
= n

N +1
n m
y 2 =
(N + 1)
2
12

Estos resultados permiten estandarizar el valor de Rx obtenido de la muestra y


determinar los lmites de las regiones de aceptacin y crtica segn los valores normales.
Segn Kundzewicz (2000) se pueden tomar como valores estandarizados los de las
siguientes expresiones

159

Estadstica Aplicada a la Hidrologa

Ec. 203. Valores estandarizados de la suma de rangos

Rx < Rx =

Rx + 0,5

Rx = Rx = 0
Rx > Rx =

Rx 0,5

En el caso planteado como ejemplo, con dos muestras de 18 valores tal y como aparecen
en el ejemplo del apartado 8.2.1, Rx toma un valor de 237, de 333 y 2 de 999 con lo
que el valor estandarizado es 3,07, entre los lmites de confianza al 95% de la normal,
(-1,96, +1,96) y la homogeneidad no se puede aceptar.
8.2.5

Test de Wilcoxon con signos

Una variacin del anterior es el denominado test de Wilcoxon con signos, que tambin
se plantea sobre la homogeneidad de la serie. Esta vez el estadstico de referencia se
obtiene como suma de los rangos de los valores negativos de las diferencias entre datos
de dos series. Estas diferencias han de ser ordenadas de forma ascendente segn el valor
absoluto de las mismas.
8.2.6

Test de la de Kendall

Este test mide la correlacin entre dos series de variables utilizando los rangos de los
valores de las mismas. El estadstico se obtiene contabilizando el nmero de veces en
que a un incremento de una variable, y, le corresponde un aumento en la otra, x, P; y el
nmero de veces en que a un decremento de y le corresponde un incremento de x, M. Es
decir, estas dos cantidades se calculan ordenando las series de parejas de manera
creciente en x y contabilizando, para cada valor de y, el nmero de veces en que los
valores subsiguientes de la serie y son mayores y menores. La diferencia entre ambas
cantidades, S=P-M, permite obtener el estadstico , valor estandarizado de S por el
nmero total de comparaciones posibles de n pares de datos,
Ec. 204. Estadstico de Kendall.

PM
n(n 1) )
2

Este se puede asumir normal N(0,1) al transformarlo con,

160

Mdulo de Estadstica Aplicada a la Hidrologa

Ec. 205. Normalizacin de la de Kendall.

S 1

S > 0 :

z = S = 0 : 0

S +1
S < 0 :

8.2.7

n
(n 1)(
2n + 5)
18

Test del coeficiente de Spearman

Este es un test basado tambin en los rangos para determinar si la correlacin entre dos
variables es significativa. La hiptesis nula es que las series son independientes y no
hay correlacin entre los pares de rangos.
El estadstico es el coeficiente de Spearman (Ec. 64) de las series. Para determinar la
regin de aceptacin y regin crtica se considera que, con muestras de ms de 20
valores, el estadstico siguiente sigue una normal de media nula y desviacin tpica
unidad (Kundzewicz, 2000).
Ec. 206. Estandarizacin del estadstico de Spearman.

rRxy n 1
8.2.8

Test de rachas

Este test se aplica para conocer si la muestra est constituida por datos aleatorios e
independientemente distribuidos contrastando el nmero de rachas. Una racha est
constituida por una sucesin de valores por encima o por debajo de un determinado
nivel, por ejemplo la mediana. Longitud de una serie es el nmero de valores de cada
racha.
Se supone que los datos hidrolgicos de partida son independientes y se contrasta como
hiptesis nula la independencia de los registros utilizando el estadstico constituido por
el nmero de rachas de la serie, que para un nmero suficientemente alto de valores, 40,
se aproxima a una normal. La hiptesis alternativa es que los datos no son
independientes. Si n es el nmero total de datos en la serie, los valores de la media y
varianza del numero de rachas para un nmero total de datos par e impar son los
siguientes,
Ec. 207. Media y varianza del test de rachas.

=1+

n
2

2 =

n(n 2 )
4(n 1)

=1+

(n 1)( n 3)
n 1
2 =
2
4(n 2)

161

Estadstica Aplicada a la Hidrologa

Estos valores permiten estandarizar el nmero total de rachas de la serie y calcular las
regiones de aceptacin y crticas por medio de una normal de media 0 y desviacin
tpica 1.
Se dispone de una serie de caudales mximos anuales y se desea aplicar un test de
rachas para comprobar si las presas construidas en cabecera a mediados de los aos 60
tienen influencia en la reduccin de avenidas. Se supone que la existencia de lagunas no
afecta a la aplicacin del test.
Ao
1946-47
1947-48
1948-49
1949-50
1950-51
1951-52
1952-53
1953-54
1954-55
1955-56
1956-57
1957-58
1958-59
1959-60
1960-61
1961-62

m3/s
464,2
447,0
880,0
181,0
860,0
315,0
92,9
375,0
134,2
177,3
954,0
440,4
800,0
302,0
114,0
143,5

Racha
+
+
+
+
+
+
+
+
+
+
-

Ao
1962-63
1963-64
1964-65
1965-66
1966-67
1967-68
1968-69
1969-70
1970-71
1971-72
1972-73
1973-74
1974-75
1975-76
1976-77
1977-78

m3/s
207,4
128,3

Racha
-

362,0
161,0
154,7
161,4
460,5
133,6
556,5
377,5
163,2
70,9
347,8
319,5
524,2

+
+
+
+
+
+
+

Ao
1978-79
1979-80
1980-81
1981-82
1982-83
1983-84
1984-85
1985-86
1986-87
1987-88
1988-89
1989-90
1990-91

m3/s
87,0
226,2
87,0
45,5

Racha
-

270,1
311,4
413,0
800,1
208,2
372,7
221,1

+
+
+
+
-

1200,0

1000,0

m /s

800,0

600,0

400,0

200,0

1946-47
1947-48
1948-49
1949-50
1950-51
1951-52
1952-53
1953-54
1954-55
1955-56
1956-57
1957-58
1958-59
1959-60
1960-61
1961-62
1962-63
1963-64
1964-65
1965-66
1966-67
1967-68
1968-69
1969-70
1970-71
1971-72
1972-73
1973-74
1974-75
1975-76
1976-77
1977-78
1978-79
1979-80
1980-81
1981-82
1982-83
1983-84
1984-85
1985-86
1986-87
1987-88
1988-89
1989-90
1990-91

0,0

Si las presas causan una disminucin en las avenidas, durante el segundo periodo habr
un predominio de rachas negativas, es decir, valores por debajo de esa media. El
contraste es unilateral. El total de datos es 42, las rachas son 20 y el valor crtico para un
nivel de significacin del 2,5% es 16, asumiendo que el nmero de rachas sigue una
normal y despreciando las lagunas existentes en la serie. De lo anterior se sigue que los
datos son aleatorios y la influencia de presas de cabecera no es significativa.
McCuen (2003) destaca dos factores a considerar en la aplicacin del test de rachas:
1. La aplicabilidad del test depende de si el cambio introducido es suficientemente
importante respecto a la variabilidad introducida por otros componentes
aleatorios. En el caso del ejemplo aplicado a la generacin de avenidas, es
posible que el test no pueda detectar efectos sobre los cambios de usos de suelo

162

Mdulo de Estadstica Aplicada a la Hidrologa

si la variabilidad introducida por la variable precipitacin es relativamente


grande.
2. La aplicabilidad tambin est influida por la manera en que se introducen los
cambios. Si stos ocurren de forma gradual y durante un periodo largo respecto
al total disponible, ser ms difcil identificar su efecto. Por el contrario, cuando
los cambios se producen de manera repentina y centrados en el periodo
temporal de estudio, es esperable que sus efectos sean ms claros en la serie.
8.2.9

Test de Mann-Kendall

Un test aplicado para la deteccin de tendencias en los datos y la consecuente falta de


homogeneidad temporal es el de Mann-Kendall. Es un test no paramtrico
originalmente desarrollado por Mann en 1945, para posteriormente Kendall aportar la
distribucin del estadstico en 1975. La hiptesis nula es que no hay tendencia en los
datos, independientes y pertenecientes a la misma poblacin. La idea que subyace en l
es tambin ver cmo estn entremezclados los valores de una serie a partir del siguiente
estadstico:
Ec. 208. Estadstico de Mann-Kendall
n

u = ni
i =1

donde ni es el nmero de veces que los elementos precedentes en la serie a xi le son


inferiores. Es decir, xj < xi para todo j < i. Valores anormalmente bajos o altos de este
estadstico permiten inferir que hay cierta concentracin de valores altos o bajos en la
serie y, consecuentemente cierta falta de homogeneidad o una tendencia marcada.
El valor del cuantil correspondiente al nivel de significacin escogido se determina
mediante permutaciones de la serie original. Por cada permutacin se calcula el
estadstico u, lo que finalmente permite manejar su distribucin.
McCuen (2003) incluye las expresiones para transformar la variable anterior en normal
con muestras de 30 ms elementos. V es la desviacin tpica, funcin del nmero total
de datos, n, y del nmero de grupos con medida idntica, g, siendo ti el nmero de
medidas con igual valor de cada uno de los grupos. El estadstico S conserva el signo de
las diferencias entre cada elemento y el resto considerado.
Ec. 209. Normalizacin de la variable

u 1

S > 0 : V

z = 0

u +1
S < 0 :
V

n(n 1)(
2n + 5) ti (ti 1)(
2ti + 5)
V=

i =1

18

163

Estadstica Aplicada a la Hidrologa

8.2.10 Test del ratio de Von Neumann


Este es un no paramtrico para contrastar la independencia de los datos de una serie
temporal. La hiptesis nula supone la independencia en la serie. Para su aplicacin esta
serie ha de consistir en al menos 30 datos (Kundzewicz, 2000). Si N es el nmero total
de datos, el estadstico de Von Neumann tiene la siguiente expresin:
Ec. 210. Estadstico de Von Neumann
n 1

N ( xi xi +1 ) 2
V=

i =1
n

(N 1) ( xi x )2
i =1

Este estadstico tiene distribucin normal con los siguientes parmetros:


Ec. 211. Parmetros de la distribucin normal del ratio de Von Neumann

V =

2N
N 1

2 =

4(N 2)
(N 1)2

Entonces, el estadstico estandarizado sigue una normal de media nula y desviacin


tpica uno, lo que facilita el manejo de las regiones de aceptacin y crtica segn los
correspondientes a los niveles (1-/2).
Ec. 212. Estadstico estandarizado del test de Von Neumann

2 N
N 1 = V (N 1) 2 N
4(N 2)
2 N 2
2
(N 1)

V
v=

En la publicacin de Singh (1985) este test se presenta para la deteccin de


heterogeneidades en la serie respecto a otra de referencia. La hiptesis nula es que se
mantiene la homogeneidad. Su aplicacin se plantea sobre una serie de residuos (yi=xixref_i siendo i=1..n) respecto a valores de una estacin de referencia, por ejemplo, las
medias de un grupo de estaciones pertenecientes a la misma regin climtica. El test del
ratio de Von Neumann permite introducir informacin de carcter regional como se
haca en las dobles acumulaciones. De la serie de residuos, se calcula el estadstico V,
que en la referencia aparece ligeramente modificado respecto al anteriormente
presentado:
Ec. 213. Estadstico de Von Neumann aplicado a residuos (Singh, 1985)
n 1

( y
V=

( y
i =1

164

yi +1 ) 2

i =1
n

y )2

Mdulo de Estadstica Aplicada a la Hidrologa

tal que para que sea aceptada la hiptesis de homogeneidad en los datos, V debe estar
comprendido entre un valor correspondiente al nivel escogido y 2, es decir la
pertenencia a un intervalo {V, 2},
Ec. 214. Definicin de la regin de aceptacin del test

V = 2 2

N 2
( N 1) ( N + 1)

siendo N el tamao de la muestra y el percentil de la distribucin normal


estandarizada.
Aplicando este criterio a la serie dada en el apartado 8.2.1 y calculando la serie de
residuos a partir de la informacin contenida en la serie de medias anuales de 25
estaciones pertenecientes a la misma regin (coincidentes con la estacin de referencia
del ejemplo de las dobles acumulaciones) y un nivel de significacin del 5%, resultara
un valor de VP igual a 1,46 para un estadstico V igual a 1,13. Se concluye la falta de
homogeneidad de la serie pluviomtrica
8.2.11 Test de Alexandersson
De forma similar al anterior se plantea el test de Alexandersson, basado en construir la
x
serie de cocientes qi = i , que una vez estandarizados permiten definir el estadstico
xref _ i
T de la forma siguiente (Almarza et al., 1996):
Ec. 215. Tratamiento de la variable para la aplicacin del test de Alexandersson
n

q=

i =1

S2 =

1 n
(qi q ) 2
n i =1

zi =

1 n
1 k
t k = zi +
zi
k i =1 n k i =k +1

qi q
S

Valores crticos. Alexandersson.


Nivel de confianza 95%

T = mx t k

25

50

75

100

150

200

Valor
crtico

7,75

8,85

8,95

9,15

9,35

9,55

0 k n

Tabla 40. Valores crticos test de Alexandersson

165

Estadstica Aplicada a la Hidrologa

166

Mdulo de Estadstica Aplicada a la Hidrologa

BIBLIOGRAFA

Allen, R.G., Pereira, L.S., Raes, D. y Smith, M. 1998. Anejo IV, Statistical Analisis of
Weather data sets en Crop Evapotranspiration. Guidelines for computing crop water
requirements. FAO Irrigation and Drainage Paper 56. Roma.
Almarza Mata, C, Lpez Daz, J. A., Flores Herrez C. 1996. Homogeneidad y
variabilidad de los registros histricos de precipitacin de Espaa. Direccin General
del Instituto Nacional de Meteorologa.
Bosque Sendra, J., 1997. Sistemas de Informacin Geogrfica. Segunda edicin. Ed.
Rialp, S.A. Madrid.
Bras R. L, Rodriguez-Iturbe I. 1985. Random Functions and Hydrology. Reading,
Massachusetts: Addison-Wesley.
CEDEX. Estudio de recursos hidrulicos del Per, Zona Titicaca.

Chow Ven Te, Maidment, D. R.; Mays, L. W., 1994. Hidrologa Aplicada. McGrawHill Interamericana. Santaf de Bogot, Colombia.
Etoh Takeraku, Murota, Akira, Nakanishi, Masanori, 1987. SQRT Exponential Type
Distribution of Maximum. En Hydrologic Frequency Modelling. Proceedings of the
International Symposium on Flood Frequency an d Risk Analyses, 14-17 Amy, 1986.
Louisiana State University, Baton Rouge, USA. Pginas 253-264. Editado por Vijay P
Singh. Reidel Publishing Company.
Ferrer Polo, Javier, 1992. Anlisis Estadstico de Caudales de Avenida. Centro de
Estudios Hidrogrficos del CEDEX. Serie Monografas del MOPT, Ministerio de Obras
Pblicas y Transportes, n 26. Madrid
Ferrer Polo, Javier, 1996. El modelo de funcin de distribucin SQRT-ET MAX en el
anlisis regional de mximos hidrolgicos: aplicaciones a las lluvias diarias. Tesis
Doctoral. Universidad Politcnica de Madrid. Escuela Tcnica Superior de Ingenieros
de Caminos, Canales y Puertos.
Fiering, Myron B; Jackson, Brbara B, 1971. Synthetic Streamflows. Water Resources
Monograph, 1. American Geophysical Union. Washington, D.C.

Garca Prez, A., Navarro Veguillas, H., Vlez Ibarrola, R. 1995. Estadstica II.
Universidad Nacional de Educacin a Distancia. Madrid.
Gmez Espadas, J. L. Estadstica. Curso Internacional de Hidrologa General y
Aplicada. CEDEX. Madrid.
HEC-4. U.S. Army Corps of Engineers. The Hydrologic Engineering Center. California.
EE.UU.

167

Estadstica Aplicada a la Hidrologa

Helsel, D.R. y Hirsch, R.M. 2002. Statistical Methods in Water Resources. Book 4.
Hydrologic Analysis and Interpretation. Techniques of Water Resources Investigations
of the United States Geological Survey. USGS
Kite, G.W., 1977. Frequency and Risk Analyses in Hydrology. Water Resources
Publications, Fort Collins, Colorado.
Kundzewicz, Z.W.; Robson, A. 2000. Detecting trend and other changes in hydrological
data. World Climate Programme Water. WMO/TD-N 1013. United Nations
Educational Scientific and Cultural Organization. World Meteorological Organization.
Ginebra, mayo 2000.
Llamas, Jos, 1993. Hidrologa General, Principios y Aplicaciones. Servicio Editorial
Universidad del Pas Vasco.
Martn Jadraque, V. Estadstica Matemtica. Recordatorio de conceptos bsicos. CSIC.
Instituto de Hidrologa. Escuela de Hidrologa.
McCuen, Richard. 2003. Modeling Hydrologic Change: Statistical Methods. Lewis
Publishers. CRC Press Company.
NERC, 1975. Flood Studies Report. Volume I. Hydrological Studies. Natural
Environmental Research Council. London
Rodrguez Barrera, R., Llasat Botija, C. y Martn Vide J.. Anlisis de series temporales
en climatologa: modelizacin y homogeneidad. Universitat de Barcelona. Textos
Docentes 165.
Salas, J.D., Delleur, J. W., Yevjevich, V., Lane W. L. 1988. Applied Modeling of
Hydrologic Time Series. Water Resources Publications.
San Miguel, J. M., 1990. Estadstica Radical. Servicio de Publicaciones de la ETSI
Caminos, Canales y Puertos de la Universidad Politcnica de Madrid.
Singh V. P.,1985. Hydrologic Systems. Volume II. Watershed Modelling. Prentice Hall,
Englewood Cliffs, New Jersey.
Pea, D. 2000. Estadstica, Modelos y mtodos. 2 tomos. 1. Fundamentos. Alianza
universidad textos. Alianza Editorial, Madrid.
Spiegel, M. R. 1990. Probabilidad y Estadstica. Teora y 760 problemas resueltos. Serie
Schaum. McGraw-Hill.

168

You might also like