Curso Estad

Mdulo de estadstica aplicada a la Hidrologa
Apuntes
Estadstica Aplicada a la Hidrologa
ii
ndice temtico
1
INTRODUCIN Y OBJETIVOS.......................................................................................................13
TEORA DE LA PROBABILIDAD ..................................................................................................15

2.1
2.2
2.2.1
2.2.2
2.2.3
2.2.4
2.3
2.3.1
2.3.2
2.3.3
2.4
2.4.1
2.4.2
2.4.3
2.4.4
2.5
2.5.1
2.5.2
2.5.3
2.5.4
2.5.5
2.5.6
2.6
2.6.1
2.6.2
2.6.3
FENMENOS ALEATORIOS Y DEFINICIONES .................................................................................15

DEFINICIN DE PROBABILIDAD......................................................................................................16
Definicin de Laplace ..............................................................................................................16
Definicin emprica de Von Mises ..........................................................................................17
La probabilidad subjetiva........................................................................................................18
Ley fuerte de los grandes nmeros..........................................................................................18
PROBABILIDAD Y AXIOMAS DE KOLMOGOROV ............................................................................19
Teora de conjuntos..................................................................................................................19
Axiomas de Kolmogorov..........................................................................................................21
Postulado de indiferencia ........................................................................................................22
CONCEPTO DE DEPENDENCIA E INDEPENDENCIA ESTOCSTICA...................................................23
Probabilidad condicionada .....................................................................................................23
Dependencia e independencia de sucesos ..............................................................................24
Teorema de la probabilidad total o compuesta......................................................................25
Teorema de Bayes o de la probabilidad inversa: ..................................................................26
ELEMENTOS DE COMBINATORIA Y PROBABILIDAD .......................................................................28
Variaciones o permutaciones de n elementos tomados de r en r ..........................................28
Permutaciones ..........................................................................................................................28
Variaciones con repeticin ......................................................................................................29
Permutaciones con repeticin .................................................................................................29
Combinaciones .........................................................................................................................29
Combinaciones con repeticin ................................................................................................29
OBSERVACIONES REPETIDAS .........................................................................................................29
Observaciones con reemplazamiento......................................................................................29
Observaciones sin reemplazamiento.......................................................................................30
Otros casos de observaciones repetidas.................................................................................30
ESTADSTICA DESCRIPTIVA ........................................................................................................39

3.1
INTRODUCCIN ..............................................................................................................................39
3.2
ANLISIS UNIVARIADO..................................................................................................................41
3.2.1
Herramientas grficas .............................................................................................................41
3.2.2
Asignacin de frecuencias .......................................................................................................46
3.2.3
Medidas de localizacin. .........................................................................................................50
3.2.3.1
3.2.3.2
3.2.3.3
3.2.3.4
3.2.3.5
3.2.3.6
3.2.4
Medidas de dispersin. ............................................................................................................52
3.2.4.1
3.2.4.2
3.2.4.3
3.2.5
Media aritmtica...................................................................................................................... 50
Mediana................................................................................................................................... 51
Moda. ...................................................................................................................................... 51
Valores mximos y mnimos registrados................................................................................. 51
Primer y tercer cuartiles. ......................................................................................................... 51
Deciles, percentiles y cuantiles. .............................................................................................. 52
Varianza, sx2, y desviacin tpica, sx........................................................................................ 52
Rango intercuartlico ............................................................................................................... 54
Mediana de las desviaciones absolutas.................................................................................... 54
Medidas de forma de la distribucin de valores. ...................................................................54
3.2.5.1
3.2.5.2
Coeficiente de sesgo................................................................................................................ 54
Coeficiente de sesgo cuartlico................................................................................................ 55
3.2.6
Tabla de estadsticos ................................................................................................................55
3.2.7
Grfico caja ..............................................................................................................................55
3.3
ANLISIS BIVARIADO ....................................................................................................................56
3.3.1
Distribuciones conjuntas de frecuencia..................................................................................58
3.3.2
Comparacin de cuantiles .......................................................................................................60
3.3.3
Diagrama de dispersin...........................................................................................................61
3.3.4
Coeficientes de correlacin simple: Pearson y Spearman ....................................................62
3.3.5
El mtodo de las dobles acumulaciones .................................................................................64
3.4
COMPONENTES EN LAS SERIES TEMPORALES ...............................................................................68
iii
3.4.1
Tendencias, ciclos y estaciones ...............................................................................................68
3.4.2
Consideraciones sobre la autocorrelacin temporal ............................................................74
3.5
CONTEXTO ESPACIAL ....................................................................................................................74
4
VARIABLE ALEATORIA Y FUNCIONES DE DISTRIBUCIN .............................................75

4.1
CONCEPTO DE VARIABLE ALEATORIA ...........................................................................................75
4.2
TIPOS DE VARIABLES ALEATORIAS ................................................................................................75
4.2.1
Variables aleatorias discretas y continuas.............................................................................75
4.2.2
Dimensin de una variable aleatoria .....................................................................................75
4.3
VARIABLE ALEATORIA UNIVARIADA .............................................................................................76
4.3.1
Funcin de distribucin ...........................................................................................................76
4.3.2
Funcin de probabilidad .........................................................................................................77
4.3.3
Expresin de la funcin de distribucin mediante factor de frecuencia ..............................78
4.3.4
Operaciones con variables aleatorias ....................................................................................79
4.3.4.1
4.3.4.2
Suma de variables aleatorias .................................................................................................. 79

Producto de variables aleatorias ............................................................................................ 79
4.3.5
Transformacin de variables aleatorias.................................................................................80
4.4
VARIABLE ALEATORIA BIVARIADA ................................................................................................81
4.4.1
Funcin de distribucin conjunta ...........................................................................................81
4.4.2
Variable aleatoria marginal. Funcin de distribucin marginal .........................................83
4.4.3
Dependencia e independencia de variables aleatorias. Funcin de distribucin
condicionada ...........................................................................................................................................84
4.5
ESPERANZA Y MOMENTOS DE LAS FUNCIONES DE DISTRIBUCIN ..............................................86
4.5.1
Esperanza matemtica .............................................................................................................86
4.5.1.1
4.5.1.2
4.5.2
Varianza....................................................................................................................................87
4.5.2.1
4.5.2.2
4.5.3
4.5.4
5
Definicin ............................................................................................................................... 86
Propiedades ............................................................................................................................. 86
Definicin ............................................................................................................................... 87
Propiedades ............................................................................................................................. 87
Momentos centrales de orden n...............................................................................................88

Momentos respecto al origen y centrales de una variable bidimensional ...........................88
MODELOS DE DISTRIBUCIN UNIVARIADA DE PROBABILIDAD .................................91

5.1
5.1.1
5.1.2
5.1.3
5.1.4
5.1.5
5.2
5.2.1
5.2.2
5.2.3
5.3
5.3.1
5.3.2
5.3.3
5.3.4
5.3.5
5.4
5.4.1
DISTRIBUCIN NORMAL Y ASOCIADAS .........................................................................................91

Teorema central del lmite.......................................................................................................94
Distribucin logartmica normal ............................................................................................95
Distribucin 2 (chi-cuadrado) de Pearson ...........................................................................96
Distribucin t de Student .........................................................................................................98
Distribucin F de Fisher..........................................................................................................99
PROCESO DE BERNOULLI .............................................................................................................100
Distribucin de Bernoulli ......................................................................................................101
Distribucin Binomial............................................................................................................101
Distribucin Geomtrica .......................................................................................................103
PROCESO DE POISSON ..................................................................................................................104
Distribucin de Poisson.........................................................................................................105
Distribucin exponencial.......................................................................................................107
Distribucin Gamma..............................................................................................................108
Distribucin Pearson III........................................................................................................109
Distribucin Log-Pearson III ................................................................................................109
DISTRIBUCIONES DE VALORES EXTREMOS ..................................................................................111
Funciones de distribucin de valores extremos generalizados GEV..................................111
5.4.1.1
5.4.1.2
5.4.1.3
GEV1, distribucin de Gumbel ............................................................................................. 113

GEV2, distribucin de Frechet .............................................................................................. 115
GEV3, distribucin de Weibull ............................................................................................. 115
5.5
OTRAS FUNCIONES DE DISTRIBUCIN....................................................................................117
5.5.1
TCEV.......................................................................................................................................117
5.5.2
Funcin de distribucin SQRT ET-mx................................................................................117
6
COMPLETADO DE SERIES HIDROMETEOROLGICAS...................................................120

6.1
6.2
iv
PROPIEDADES DE LAS SERIES TEMPORALES ...............................................................................120

COMPLETADO DE SERIES MENSUALES SIN PERSISTENCIA.........................................................122
6.2.1
Regresin simple ....................................................................................................................123
6.2.1.1
6.2.1.2
Posibilidades de ajuste .......................................................................................................... 123

Recta de ajuste por mnimos cuadrados entre dos series ....................................................... 124
6.2.2
Regresin mltiple en series mensuales sin persistencia ....................................................127
6.3
COMPLETADO DE SERIES MENSUALES CON PERSISTENCIA .......................................................130
6.4
GENERACIN DE NMEROS ALEATORIOS....................................................................................131
6.4.1
Generacin de nmeros aleatorios de una funcin de distribucin uniforme. Modelo
lineal. 131
6.4.2
Generacin de nmeros aleatorios de una funcin de distribucin normal ......................132
6.4.3
Generacin de nmeros aleatorios de una funcin de distribucin normal. Transformacin
de Box-Muller........................................................................................................................................132
7
ESTIMACIN DEL MODELO. INFERENCIA ESTADSTICA .............................................133

7.1
7.2
7.2.1
7.2.2
7.3
7.3.1
7.3.2
7.3.3
7.3.4
7.3.5
7.4
7.4.1
7.4.2
7.4.3
7.4.4
7.5
7.6
INTRODUCCIN .............................................................................................................................133
MTODOS DE ESTIMACIN DEL MODELO .....................................................................................133
Mtodos paramtricos ...........................................................................................................133

Mtodos no paramtricos ......................................................................................................133
PROPIEDADES DE LOS ESTIMADORES ...........................................................................................136
Estimadores insesgados .........................................................................................................136
Estimadores consistentes .......................................................................................................137
Estimadores invariantes ........................................................................................................137
Estimadores eficientes ...........................................................................................................138
Estimadores robustos.............................................................................................................138
ESTIMACIN PUNTUAL.................................................................................................................139
Mtodo de los Momentos .......................................................................................................139
Mtodo de los Momentos Ponderados Probabilsticamente ...............................................141
Mtodo de Mxima Verosimilitud .........................................................................................144
Estimadores ms empleados para distintas funciones de distribucin ..............................147
ESTIMACIN POR INTERVALO ......................................................................................................147
ESTIMACIN BAYESIANA .............................................................................................................147
TEST DE CONTRASTE DE HIPTESIS. ....................................................................................149

8.1
INTRODUCCIN. ...........................................................................................................................149
8.2
TESTS ESTADSTICOS DE CONSISTENCIA Y CONTRASTE DE HIPTESIS .....................................149
8.2.1
Teoremas de Fisher................................................................................................................151
8.2.2
Test 2 de bondad de ajuste....................................................................................................155
8.2.3
Tests basados en la distribucin de Kolmogorov-Smirnov .................................................157
8.2.4
Test de Wilcoxon, Mann-Whitney..........................................................................................159
8.2.5
Test de Wilcoxon con signos..................................................................................................160
8.2.6
Test de la de Kendall...........................................................................................................160
8.2.7
Test del coeficiente de Spearman ..........................................................................................161
8.2.8
Test de rachas.........................................................................................................................161
8.2.9
Test de Mann-Kendall............................................................................................................163
8.2.10
Test del ratio de Von Neumann ........................................................................................164
8.2.11
Test de Alexandersson.......................................................................................................165
BIBLIOGRAFA.................................................................................................................................167
ndice de figuras
FIGURA 1. GRFICA DE SECTORES ....................................................................................................................42

FIGURA 2. GRFICA DE EVOLUCIN TEMPORAL ...............................................................................................43
FIGURA 3. SERIE MENSUAL DE PRECIPITACIONES .............................................................................................43
FIGURA 4. SERIE LOGARTMICA DE PRECIPITACIONES MENSUALES .................................................................44
FIGURA 5. DATOS ANUALES DE PRECIPITACIN Y CURVA SUAVIZADA SUPERPUESTA ...................................45
FIGURA 6. NIVELES PIEZOMTRICOS.................................................................................................................45
FIGURA 7. DIAGRAMA DE PARETO CON UNA VARIABLE CUALITATIVA ...........................................................46
FIGURA 8. DIAGRAMA HISTOGRAMA DE FRECUENCIAS....................................................................................47
FIGURA 9. AGRUPAMIENTO Y ELABORACIN DE UN HISTOGRAMA .................................................................47
FIGURA 10. GRFICO DE FRECUENCIAS ACUMULADAS ....................................................................................48
FIGURA 11. FRECUENCIAS EN PAPEL NORMAL Y LOGARTMICO NORMAL.......................................................50
FIGURA 12. MEDIA ARITMTICA, MEDIANA, MODA Y CUARTILES ...................................................................52
FIGURA 13. SIGNOS COEFICIENTE DE SESGO Y FORMA DE LA FUNCIN DE DENSIDAD....................................55
FIGURA 14. GRFICO EN CAJA...........................................................................................................................56
FIGURA 15. GRFICO DE BARRAS COMPARANDO LAS FRECUENCIAS DE DOS VARIABLES ..............................57
FIGURA 16. GRFICA E EVOLUCIN TEMPORAL CON DOS SERIES ....................................................................57
FIGURA 17. EJEMPLO DE NIVELES PIEZOMTRICOS ..........................................................................................58
FIGURA 18. DISTRIBUCIN CONJUNTA DE LAS VARIABLES ESTACIONALIDAD ................................................59
FIGURA 19. COMPARACIN DE CUANTILES.......................................................................................................61
FIGURA 20. DISPERSIN ENTRE LOS DATOS DE LOS PLUVIMETROS A Y B.....................................................62
FIGURA 21. DIAGRAMAS DE DISPERSIN MLTIPLES ENTRE DIFERENTES VARIABLES. ..................................62
FIGURA 22. CORRELOGRAMA ............................................................................................................................64
FIGURA 23. APLICACIN DEL MTODO DE LAS DOBLES ACUMULACIONES .....................................................65
FIGURA 24. DETECCIN DE INCONSISTENCIAS EN DOBLES ACUMULACIONES ................................................66
FIGURA 25. CHEQUEO DEL CAMBIO DE TENDENCIA .........................................................................................67
FIGURA 26. SERIE ANUAL DE DATOS DE LLUVIA Y TENDENCIA LINEAL ..........................................................69
FIGURA 27. DESVIACIONES UNITARIAS ACUMULADAS (%) Y PRECIPITACIONES ANUALES ............................70
FIGURA 28. SERIE DE PRECIPITACIONES CON VALORES MEDIOS ANUALES Y MEDIA MVIL DE 12 MESES.....71
FIGURA 29. SERIES ESTACIONALES CON MEDIA ESTACIONAL SUPERPUESTA ..................................................71
FIGURA 30. CICLOS MENSUALES EN MEDIA Y DESVIACIN TPICA ..................................................................72
FIGURA 31. TENDENCIA Y CICLOS EN LA DESCOMPOSICIN MACAULEY ........................................................73
FIGURA 32. ESTACIONALIDAD EN LA DESCOMPOSICIN MACAULEY .............................................................73
FIGURA 33. EFECTO DE LA TRANSFORMACIN NORMALIZANTE EN SERIES DE PRECIPITACIN MENSUAL ....74
FIGURA 34. DISTRIBUCIN NORMAL TIPIFICADA Y COMPARACIN CON DESVIACIN TPICA 2. ....................92
FIGURA 35. DENSIDAD NORMAL TIPIFICADA Y COMPARACIN CON DESVIACIN TPICA 2............................92
FIGURA 36. AJUSTE DE UNA DISTRIBUCIN NORMAL A PRECIPITACIONES TOTALES ANUALES ......................93
FIGURA 37. AJUSTE DE UNA DISTRIBUCIN NORMAL EN PRECIPITACIONES MXIMAS ANUALES. .................94
FIGURA 38. FUNCIONES DE DENSIDAD Y DISTRIBUCIN LOGARTMICO NORMALES .......................................96
FIGURA 39. DENSIDADES DE LA CHI-CUADRADO DEPENDIENTES DEL NMERO DE GRADOS DE LIBERTAD ...97
FIGURA 40. FUNCIN DE DISTRIBUCIN CHI-CUADRADO EN FUNCIN DE LOS GRADOS DE LIBERTAD..........98
FIGURA 41. DENSIDAD DE LA T DE STUDENT PARA DIFERENTES GRADOS DE LIBERTAD ................................99
FIGURA 42. DISTRIBUCIONES BINOMIALES DE PROBABILIDAD PARA DISTINTOS PORCENTAJES DE P ..........102
FIGURA 43. DISTRIBUCIONES GEOMTRICAS PARA DISTINTOS VALORES DE P..............................................104
FIGURA 44. DISTRIBUCIONES DE PROBABILIDAD DE POISSON PARA DISTINTOS VALORES DE . .................106
FIGURA 45. DISTRIBUCIONES EXPONENCIALES EN FUNCIN DEL VALOR DE . ............................................107
FIGURA 46. FUNCIONES DE DENSIDAD DE GAMMA.........................................................................................109
FIGURA 47. AJUSTES DE UNA FUNCIN LOG-PEARSON III A LLUVIAS MXIMAS ANUALES .........................110
FIGURA 48. AJUSTES DE UNA FUNCIN LOG-PEARSON III A LLUVIAS MXIMAS ANUALES. ........................110
FIGURA 49. AJUSTES DE UNA FUNCIN LOG-PEARSON III A LLUVIAS MXIMAS ANUALES .........................111
FIGURA 50. FORMA DE LAS DISTRIBUCIONES GEV EN FUNCIN DEL SIGNO DE K. .......................................113
FIGURA 51. FUNCIONES DE DENSIDAD GEV...................................................................................................113
FIGURA 52. AJUSTE DE UNA DISTRIBUCIN DE GUMBEL ...............................................................................114
FIGURA 53. AJUSTE DE UNA DISTRIBUCIN GEV2.........................................................................................115
FIGURA 54. AJUSTE DE UNA DISTRIBUCIN EV3............................................................................................116
FIGURA 55. AJUSTE DE UNA DISTRIBUCIN WEIBULL DE DOS PARMETROS ...............................................117
vi
FIGURA 56. APLICACIN DE LA SQRT ET-MX A SERIES DE LLUVIAS MXIMAS ANUALES........................118

FIGURA 57. AJUSTE RECTA DE REGRESIN .....................................................................................................123
FIGURA 58. AJUSTE DE UNA RECTA DE REGRESIN POR MNIMOS CUADRADOS. ..........................................124
vii
ndice de tablas
TABLA 1. ESTACIONALIDAD DE LOS MXIMOS ANUALES DE UNA ESTACIN PLUVIOMTRICA. ....................42
TABLA 2. VALORES ANUALES DE PRECIPITACIN EN UN PLUVIMETRO A. ....................................................43
TABLA 3, TIPOS DE TRANSFORMACIONES .........................................................................................................44
TABLA 4. HISTOGRAMA DE FRECUENCIAS ........................................................................................................47
TABLA 5. HISTOGRAMA DE FRECUENCIAS ACUMULADAS................................................................................48
TABLA 6. FRMULAS NO PARAMTRICAS DE PROBABILIDAD ..........................................................................48
TABLA 7. ASIGNACIN DE PROBABILIDAD DE OCURRENCIA............................................................................49
TABLA 8. ESTADSTICOS DE LA ESTACIN PLUVIOMTRICA ............................................................................55
TABLA 9. ESTADSTICOS DESCRIPTIVOS DE LAS SERIES DE LLUVIA REGISTRADA...........................................56
TABLA 10. COMPARACIN DE FRECUENCIAS RELATIVAS DE CAUDALES Y PRECIPITACIONES MXIMAS ......57
TABLA 11. EVOLUCIN DE LAS SERIES PLUVIOMTRICAS REGISTRADAS EN LOS PLUVIMETROS A Y B.......57
TABLA 12. TABLA DE CONTINGENCIA DE LAS VARIABLES PRECIPITACIN MXIMA, CAUDAL MXIMO.......59
TABLA 13. PROBABILIDAD CONDICIONAL ........................................................................................................60
TABLA 14. COMPARACIN DE CUANTILES ........................................................................................................61
TABLA 15. DEDUCCIN DE LOS RANGOS DE LAS SERIES PLUVIOMTRICAS ....................................................64
TABLA 16. SERIES PLUVIOMTRICAS ACUMULADAS EN LAS ESTACIONES A Y B ...........................................65
TABLA 17. ESTADSTICOS DE LA DISTRIBUCIN NORMAL................................................................................91
TABLA 18. FUNCIN DE DISTRIBUCIN NORMAL .............................................................................................93
TABLA 19. ESTADSTICOS DE LA DISTRIBUCIN LOGARTMICO NORMAL ( Y , MEDIAS Y DESVIACIONES
TPICAS DE LOS LOGARITMOS DE LA VARIABLE X)..................................................................................95
TABLA 20. ESTADSTICOS DE LA DISTRIBUCIN 2 (CHI-CUADRADO) DE PEARSON ........................................97
TABLA 21. ESTADSTICOS DE LA DISTRIBUCIN T DE STUDENT ......................................................................99
TABLA 22. ESTADSTICOS DE LA DISTRIBUCIN F DE FISHER .......................................................................100
TABLA 23. ESTADSTICOS DE LA DISTRIBUCIN DE BERNOULLI ...................................................................101
TABLA 24. ESTADSTICOS DE LA DISTRIBUCIN BINOMIAL ...........................................................................102
TABLA 25. ESTADSTICOS DE LA DISTRIBUCIN GEOMTRICA ......................................................................103
TABLA 26. ESTADSTICOS DE LA DISTRIBUCIN DE POISSON ........................................................................105
TABLA 27. ESTADSTICOS DE LA DISTRIBUCIN EXPONENCIAL.....................................................................107
TABLA 28. ESTADSTICOS DE LA DISTRIBUCIN GAMMA ..............................................................................108
TABLA 29. ESTADSTICOS DE LA DISTRIBUCIN PEARSON III .......................................................................109
TABLA 30. ESTADSTICOS DE LOS LOGARITMOS EN LA DISTRIBUCIN LOG-PEARSON III ............................111
TABLA 31. TIPOS DE FUNCIONES DE DISTRIBUCIN GEV..............................................................................112
TABLA 32. ESTADSTICOS DE LA DISTRIBUCIN DE GUMBEL ........................................................................114
TABLA 33. AJUSTE MEDIANTE UNA CONDICIN POR INTERVALOS ................................................................124
TABLA 34. FRMULAS DE GRFICO ................................................................................................................134
TABLA 35. ESTIMADOR MS EMPLEADO PARA CADA TIPO DE FUNCIN DE DISTRIBUCIN ..........................147
TABLA 36. OPCIONES POSIBLES EN UN CONTRASTE DE HIPTESIS (HENSEL-HIRSCH, 2002).......................150
TABLA 37. CONTRASTES SOBRE LA MEDIA DE UNA POBLACIN NORMAL. ...................................................152
TABLA 38. CONTRASTES SOBRE LA VARIANZA DE UNA POBLACIN NORMAL..............................................153
TABLA 39. DISTRIBUCIN DE KOLMOGOROV-SMIRNOV (SINGH) .................................................................158
TABLA 40. VALORES CRTICOS TEST DE ALEXANDERSSON ...........................................................................165
viii
ndice de ecuaciones
EC. 1. PROBABILIDAD DE UN SUCESO ELEMENTAL CON SIMETRA ..................................................................16

EC. 2. DEDUCCIN DE LA PROBABILIDAD DE LAPLACE PARA UN SUCESO NO ELEMENTAL ............................16
EC. 3. PROBABILIDAD DE LAPLACE PARA UN SUCESO NO ELEMENTAL ...........................................................16
EC. 4. DEFINICIN DE FRECUENCIA RELATIVA .................................................................................................17
EC. 5. UNIN DE SUCESOS .................................................................................................................................19
EC. 6. INTERSECCIN DE SUCESOS ....................................................................................................................19
EC. 7. DIFERENCIA DE SUCESOS ........................................................................................................................19
EC. 8. PROPIEDAD CONMUTATIVA .....................................................................................................................20
EC. 9. PROPIEDAD ASOCIATIVA .........................................................................................................................20
EC. 10. PROPIEDAD DISTRIBUTIVA ....................................................................................................................20
EC. 11. PROPIEDAD DEL MDULO .....................................................................................................................20
EC. 12. PROPIEDAD IDEMPOTENCIA ..................................................................................................................20
EC. 13. OTRAS PROPIEDADES ............................................................................................................................20
EC. 14. AXIOMA 1 DE KOLMOGOROV ...............................................................................................................21
EC. 17. TEOREMA 1 DERIVADO DE LOS AXIOMAS DE KOLMOGOROV ..............................................................21
EC. 24. FRECUENCIA RELATIVA DEL SUCESO B CONDICIONADA A A...............................................................23
EC. 25. EXPRESIN DE LA PROBABILIDAD CONDICIONADA..............................................................................23
EC. 26. EXPRESIN DE LA PROBABILIDAD CONDICIONADA..............................................................................23
EC. 27. RELACIONES ENTRE LA PROBABILIDAD CONDICIONADA Y LA INTERSECCIN DE SUCESOS ...............23
EC. 28. PROBABILIDAD CONDICIONADA ENTRE TRES SUCESOS .......................................................................24
EC. 29. PROBABILIDAD CONDICIONADA ENTRE N SUCESOS .............................................................................24
EC. 30. INDEPENDENCIA DE SUCESOS ...............................................................................................................24
EC. 31. PROPIEDAD DE LOS SUCESOS INDEPENDIENTES ...................................................................................24
EC. 32. DEPENDENCIA DE SUCESOS INCOMPATIBLES .......................................................................................24
EC. 33. PROBABILIDAD TOTAL O COMPUESTA ..................................................................................................25
EC. 34. VARIACIONES DE N ELEMENTOS TOMADOS DE R EN R..........................................................................28
EC. 35. PERMUTACIONES DE N ELEMENTOS ......................................................................................................29
EC. 36. VARIACIONES CON REPETICIN DE N ELEMENTOS TOMADOS DE R EN R .............................................29
EC. 37. PERMUTACIONES CON REPETICIN DE N ELEMENTOS ..........................................................................29
EC. 38. COMBINACIONES ...................................................................................................................................29
EC. 39. COMBINACIONES CON REPETICIN .......................................................................................................29
EC. 40. PROBABILIDAD DE LAS OBSERVACIONES CON REEMPLAZAMIENTO....................................................30
EC. 41. PROBABILIDAD DE LAS OBSERVACIONES CON REEMPLAZAMIENTO Y MS DE DOS CLASES ..............30
EC. 42. PROBABILIDAD DE LAS OBSERVACIONES SIN REEMPLAZAMIENTO .....................................................30
EC. 43. PROBABILIDAD DE LAS OBSERVACIONES SIN REEMPLAZAMIENTO Y MS DE DOS CLASES ...............30
EC. 44. PROBABILIDAD DE QUE SE PRESENTE A SIEMPRE EN N REPETICIONES ................................................31
EC. 45. PROBABILIDAD DE QUE NO SE PRESENTE A EN N REPETICIONES..........................................................31
EC. 46. PROBABILIDAD DE SE PRESENTE A AL MENOS UNA VEZ EN N REPETICIONES ......................................31
EC. 47. PROBABILIDAD DE QUE A SE PRESENTE R VECES DE N .........................................................................31
EC. 48. PROBABILIDAD DE QUE A SE PRESENTE ENTRE R1Y R2 VECES DE N......................................................31
EC. 49. MEDIA ARITMTICA ..............................................................................................................................50
EC. 50. MEDIA PARA DATOS DISCRETOS ...........................................................................................................50
EC. 51. MEDIA CON DATOS AGRUPADOS EN N CLASES .....................................................................................50
EC. 52. VARIANZA Y DESVIACIN TPICA .........................................................................................................52
EC. 53. DESVIACIN TPICA CON DATOS AGRUPADOS EN N CLASES ................................................................52
EC. 54. COEFICIENTE DE VARIACIN.................................................................................................................53
EC. 55. DESIGUALDAD DE TCHEBYCHEV ..........................................................................................................53
EC. 56. RANGO INTERCUARTLICO ....................................................................................................................54
ix
EC. 57. MEDA ...................................................................................................................................................54

EC. 58. COEFICIENTE DE SESGO .........................................................................................................................54
EC. 59. COEFICIENTE DE SESGO CUARTLICO ....................................................................................................55
EC. 60. EXPRESIN DE LAS VALLAS ..................................................................................................................56
EC. 61. DISTRIBUCIONES MARGINALES .............................................................................................................60
EC. 62. DISTRIBUCIN CONDICIONAL ...............................................................................................................60
EC. 63. COEFICIENTE DE CORRELACIN DE PEARSON ......................................................................................63
EC. 64. COEFICIENTE DE SPEARMAN .................................................................................................................63
EC. 65. CORRECCIN DE LAS HETEROGENEIDADES ..........................................................................................67
EC. 66. EXPRESIONES ASOCIADAS A LA DETECCIN DE TENDENCIAS .............................................................69
EC. 67. DESVIACIONES ACUMULADAS Y UNITARIAS ACUMULADAS ................................................................69
EC. 68. MEDIAS MVILES ..................................................................................................................................70
EC. 69. FUNCIONES APLICABLES A FLUCTUACIONES PERIDICAS ...................................................................72
EC. 70. MODELO ADITIVO DE DESCOMPOSICIN ..............................................................................................72
EC. 71. MODELO MULTIPLICATIVO DE DESCOMPOSICIN ................................................................................72
EC. 72. TRANSFORMACIN NORMALIZANTE.....................................................................................................73
EC. 73. FUNCIN DE DISTRIBUCIN ..................................................................................................................76
EC. 74. PROBABILIDAD EN UN INTERVALO (A,B] ..............................................................................................77
EC. 75. FUNCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA .............................................77
EC. 76. FUNCIN DE DENSIDAD DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA UNIDIMENSIONAL .....77
EC. 77. FUNCIN DE DISTRIBUCIN EXTENDIDA A TODO EL DOMINIO DE LA VARIABLE ALEATORIA ............78
EC. 78. RELACIN ENTRE LAS FUNCIONES DE PROBABILIDAD Y DISTRIBUCIN .............................................78
EC. 79. RELACIN ENTRE LAS FUNCIONES DE DENSIDAD DE PROBABILIDAD Y DISTRIBUCIN ......................78
EC. 80 EXPRESIN DEL CUANTIL EN FUNCIN DEL FACTOR DE FRECUENCIA..................................................79
EC. 81 SUMA DE VARIABLES ALEATORIAS ........................................................................................................79
EC. 82 PRODUCTO DE VARIABLES ALEATORIAS ...............................................................................................80
EC. 83 RELACIN ENTRE LAS FUNCIONES DE DISTRIBUCIN DE UNA VARIABLE Y SU TRANSFORMADA .......80
EC. 84 RELACIN ENTRE FUNCIONES DE DISTRIBUCIN: TRANSFORMACIN MONTONA CRECIENTE .........80
EC. 85 RELACIN ENTRE FUNCIONES DE DISTRIBUCIN. TRANSFORMACIN MONTONA DECRECIENTE .....81
EC. 86 RELACIN ENTRE LAS FUNCIONES DE PROBABILIDAD DE UNA VARIABLE Y SU TRANSFORMADA ......81
EC. 87 RELACIN ENTRE LAS FUNCIONES DE DENSIDAD. TRANSFORMACIN MONTONA CRECIENTE .........81
EC. 88 RELACIN ENTRE LAS FUNCIONES DE DENSIDAD. TRANSFORMACIN MONTONA DECRECIENTE ....81
EC. 89 FUNCIN DE PROBABILIDAD BIVARIADA ...............................................................................................82
EC. 90 PROPIEDADES DE LA FUNCIN DE PROBABILIDAD BIVARIADA .............................................................82
EC. 91 PROPIEDADES DE LA FUNCIN DE DENSIDAD DE PROBABILIDAD BIVARIADA......................................82
EC. 92 FUNCIN DE DISTRIBUCIN BIVARIADA ................................................................................................82
EC. 93. FUNCIONES DE PROBABILIDAD MARGINAL PARA VARIABLE DISCRETA BIDIMENSIONAL...................83
EC. 94. FUNCIONES DE DENSIDAD DE PROBABILIDAD MARGINAL PARA VARIABLE DISCRETA BIDIMENSIONAL
..................................................................................................................................................................83
EC. 95. FUNCIONES DE DISTRIBUCIN MARGINAL PARA VARIABLE CONTINUA BIDIMENSIONAL ...................83
EC. 96 INDEPENDENCIA DE VARIABLES ALEATORIAS .......................................................................................84
EC. 97 FUNCIN DE PROBABILIDAD CONDICIONADA PARA VARIABLE ALEATORIA DISCRETA .......................84
EC. 98 FUNCIN DE DENSIDAD CONDICIONADA PARA VARIABLE ALEATORIA CONTINUA ..............................85
EC. 99 FUNCIN DE DISTRIBUCIN CONDICIONADA.........................................................................................85
EC. 100 FUNCIN DE DISTRIBUCIN CONDICIONADA PARA EL CASO DE VARIABLES INDEPENDIENTES.........85
EC. 101. ESPERANZA DE UNA VARIABLE CONTINUA ........................................................................................86
EC. 102. ESPERANZA DE UNA VARIABLE DISCRETA .........................................................................................86
EC. 103. ESPERANZA DE UNA FUNCIN.............................................................................................................86
EC. 104. ESPERANZA DE UNA CONSTANTE........................................................................................................86
EC. 105. ESPERANZA DE COMBINACIN LINEAL DE VARIABLES ALEATORIAS ................................................87
EC. 106. ESPERANZA DE UNA SUMA DE VARIABLES ALEATORIAS ...................................................................87
EC. 107. ESPERANZA DE UN PRODUCTO DE VARIABLES ALEATORIAS INDEPENDIENTES ................................87
EC. 108. VARIANZA DE LA POBLACIN .............................................................................................................87
EC. 109. VARIANZA DE UNA CONSTANTE .........................................................................................................87
EC. 110. VARIANZA DE UNA COMBINACIN LINEAL ........................................................................................88
EC. 111. VARIANZA DE UNA SUMA DE VARIABLES ALEATORIAS .....................................................................88
EC. 112. MOMENTO CENTRAL DE ORDEN N.......................................................................................................88
EC. 113. MOMENTO RESPECTO AL ORIGEN DE ORDEN (I, J) .............................................................................88
EC. 114. MOMENTO CENTRAL DE ORDEN (I, J) .................................................................................................88
EC. 115. VARIANZAS Y COVARIANZAS .............................................................................................................89
EC. 116. FUNCIN DE DENSIDAD NORMAL........................................................................................................91

EC. 117. FUNCIN DE DISTRIBUCIN NORMAL .................................................................................................91
EC. 118. VARIABLE TIPIFICADA Y DENSIDAD NORMAL DE LA VARIABLE TIPIFICADA.....................................92
EC. 119. RESOLUCIN NUMRICA DE LA NORMAL ...........................................................................................92
EC. 120. VARIABLE TIPIFICADA.........................................................................................................................94
EC. 121. DENSIDAD LOGARTMICO NORMAL ....................................................................................................95
EC. 122. PLANTEAMIENTO DE LA FUNCIN LOGARTMICA NORMAL DE TRES PARMETROS..........................96
EC. 123. DENSIDAD LOGARTMICO NORMAL DE TRES PARMETROS ...............................................................96
EC. 124. VARIABLE ALEATORIA 2 (CHI-CUADRADO) DE PEARSON .................................................................97
EC. 125. DENSIDAD 2 (CHI-CUADRADO) DE PEARSON .....................................................................................97
EC. 126. ESTADSTICO DE CONTRASTE PARA AJUSTE DE UNA FUNCIN DE DISTRIBUCIN ............................98
EC. 127. VARIABLE ALEATORIA T DE STUDENT................................................................................................99
EC. 128. DENSIDAD T DE STUDENT ...................................................................................................................99
EC. 129. VARIABLE ALEATORIA F DE FISHER.................................................................................................100
EC. 130. FUNCIN DE DENSIDAD DE LA F DE FISHER .....................................................................................100
EC. 131. DISTRIBUCIN DE BERNOULLI ..........................................................................................................101
EC. 132. PROBABILIDAD DE OBTENER R RECHAZABLES EN UN ORDEN DETERMINADO ................................101
EC. 133. DISTRIBUCIN BINOMIAL..................................................................................................................102
EC. 134. DISTRIBUCIN GEOMTRICA ............................................................................................................103
EC. 135. DISTRIBUCIN DE POISSON ...............................................................................................................105
EC. 136. DISTRIBUCIN EXPONENCIAL ...........................................................................................................107
EC. 137. DISTRIBUCIN EXPONENCIAL DE DOS PARMETROS .......................................................................108
EC. 138. DENSIDAD GAMMA ...........................................................................................................................108
EC. 139. DENSIDAD GAMMA EN FUNCIN DEL FACTOR DE ESCALA ..............................................................108
EC. 140. DENSIDAD PEARSON III ....................................................................................................................109
EC. 141. DENSIDAD LOG-PEARSON III ............................................................................................................110
EC. 142. FUNCIONES DE DISTRIBUCIN GEV (NERC, 1975) ........................................................................112
EC. 143. FUNCIONES DE DISTRIBUCIN Y DENSIDAD DE GUMBEL.................................................................114
EC. 144. FUNCIONES DE DISTRIBUCIN Y DENSIDAD DE FRECHET ................................................................115
EC. 145. FUNCIONES DE DISTRIBUCIN Y DENSIDAD DE EV3........................................................................116
EC. 146. EXPRESIN DE LA FUNCIN DE DISTRIBUCIN WEIBULL PARA MNIMOS .......................................116
EC. 147. FUNCIN DE DISTRIBUCIN WEIBULL DE DOS PARMETROS ..........................................................116
EC. 148. FUNCIONES DE DISTRIBUCIN TCEV...............................................................................................117
EC. 149. FUNCIN DE DISTRIBUCIN SQRT ET-MX ....................................................................................118
EC. 150. DESCOMPOSICIN DEL MODELO DE SERIES TEMPORALES ...............................................................121
EC. 151. CONDICIONES PARA EL AJUSTE POR MNIMOS CUADRADOS ............................................................124
EC. 152. AJUSTE POR MNIMOS CUADRADOS ..................................................................................................125
EC. 153. AJUSTE POR MNIMOS CUADRADOS. DISTANCIAS VERTICALES .......................................................125
EC. 154. AJUSTE POR MNIMOS CUADRADOS. DISTANCIAS HORIZONTALES ..................................................126
EC. 155. AJUSTE POR MNIMOS CUADRADOS. MEDIA GEOMTRICA DISTANCIAS VERTICALES-HORIZONTALES
................................................................................................................................................................126
EC. 156. EXPRESIN DE LA RECTA DE REGRESIN CONSIDERANDO EL TRMINO ALEATORIO .....................126
EC. 157. CONDICIN ESPERANZA NULA DEL ERROR.......................................................................................126
EC. 158. TRMINO DE VARIANZA DEL ERROR .................................................................................................126
EC. 159. AJUSTE POR MNIMOS CUADRADOS EN FUNCIN DE LOS RESIDUOS NORMALIZADOS ....................127
EC. 160. AJUSTE POR MC EN FUNCIN DE LOS RESIDUOS NORMALIZADOS Y DISTRIBUCIN GAMMA ........127
EC. 161. SESGO DEL RUIDO..............................................................................................................................127
EC. 162. VARIABLE GAMMA ............................................................................................................................127
EC. 163. TRANSFORMACIN NORMALIZANTE.................................................................................................128
EC. 164. ECUACIN DE REGRESIN MLTIPLE EN LOS RESIDUOS ..................................................................128
EC. 165. COEFICIENTES DE LA ECUACIN DE REGRESIN BIVARIADA POR MNIMOS CUADRADOS ..............128
EC. 166. COEFICIENTE DE CORRELACIN DE PEARSON ..................................................................................129
EC. 167. VARIANZA DEL RUIDO.......................................................................................................................129
EC. 168. COEFICIENTE DE CORRELACIN MLTIPLE ......................................................................................129
EC. 169. MATRIZ DE PRIORIZACIN ................................................................................................................129
EC. 170. DESESTACIONARIZACIN..................................................................................................................130
EC. 171. CLCULOS DE MEDIAS, DESVIACIONES TPICAS Y SESGOS DE LAS SERIES DE APORTACIONES
TRANSFORMADAS MEDIANTE LOGARITMOS ..........................................................................................130
EC. 172. TRANSFORMACIN DE LOS DATOS CONSIDERANDO EL SESGO Y LA COMPONENTE CCLICA
ESTACIONAL ...........................................................................................................................................131
xi
EC. 173. FRMULAS DE GRFICO ....................................................................................................................134

EC. 174 ESTIMADORES INSESGADOS ...............................................................................................................136
EC. 175 SESGO DE UN ESTIMADOR ..................................................................................................................136
EC. 176 ESTIMADORES CONSISTENTES ...........................................................................................................137
EC. 177 INVARIANZA DE LOS ESTIMADORES...................................................................................................137
EC. 178 EFICIENCIA DE UN ESTIMADOR ..........................................................................................................138
EC. 179 EFICIENCIA RELATIVA ........................................................................................................................138
EC. 180 MTODO DE LOS MOMENTOS .............................................................................................................139
EC. 181 MOMENTOS PONDERADOS PROBABILISTICAMENTE ..........................................................................142
EC. 182 RELACIN ENTRE LOS MOMENTOS PONDERADOS M1J0 Y M10K .........................................................142
EC. 183 MOMENTOS MUESTRALES PONDERADOS PROBABILISTICAMENTE ...................................................142
EC. 184 PROBABILIDAD DEL CONJUNTO DE UNA MUESTRA ...........................................................................145
EC. 185 FUNCIN DE VEROSIMILITUD .............................................................................................................145
EC. 186 MTODO DE MXIMA VEROSIMILITUD ..............................................................................................145
EC. 187 FORMA ALTERNATIVA DEL MTODO DE MXIMA VEROSIMILITUD ..................................................146
EC. 188 TEOREMA DE BAYES PARA VARIABLE ALEATORIA ...........................................................................148
EC. 189. 1ER TEOREMA FISHER .......................................................................................................................151
EC. 190. 2 TEOREMA FISHER ..........................................................................................................................152
EC. 191. CRITERIO PARA CONTRASTES CUANDO ES CONOCIDA ..................................................................152
EC. 192 CRITERIO PARA CONTRASTES CUANDO ES DESCONOCIDA .............................................................152
EC. 193. ESTADSTICO DE PEARSON................................................................................................................155
EC. 194. REGIN CRTICA PARA APLICACIN DEL TEST DE BONDAD DE AJUSTE...........................................156
EC. 195. ESTADSTICO DE PEARSON CORREGIDO PARA FRECUENCIAS PEQUEAS ........................................156
EC. 196. ESTADSTICO DE KOLMOGOROV.......................................................................................................158
EC. 197. TRATAMIENTO DE LA VARIABLE PARA DETECTAR HETEROGENEIDADES EN LA SERIE CON K-S ...158
EC. 198. ESTADSTICO DE KOLMOGOROV-SMIRNOV EN LA IDENTIFICACIN DE HETEROGENEIDADES .......158
EC. 199. ESTADSTICO DEL TEST DE WILCOXON O MANN-WHITNEY ...........................................................159
EC. 200. SUMA DE LOS RANGOS EN EL TEST DE WILCOXON O MANN-WHITNEY..........................................159
EC. 201. VALOR ESPERADO DEL RANGO EN EL TEST DE WILCOXON O MANN-WHITNEY ............................159
EC. 202. MEDIA Y DESVIACIN TPICA DE LA SUMA DE RANGOS ...................................................................159
EC. 203. VALORES ESTANDARIZADOS DE LA SUMA DE RANGOS ....................................................................160
EC. 204. ESTADSTICO DE KENDALL. ...........................................................................................................160
EC. 205. NORMALIZACIN DE LA DE KENDALL...........................................................................................161
EC. 206. ESTANDARIZACIN DEL ESTADSTICO DE SPEARMAN. ....................................................................161
EC. 207. MEDIA Y VARIANZA DEL TEST DE RACHAS. .....................................................................................161
EC. 208. ESTADSTICO DE MANN-KENDALL...................................................................................................163
EC. 209. NORMALIZACIN DE LA VARIABLE ..................................................................................................163
EC. 210. ESTADSTICO DE VON NEUMANN .....................................................................................................164
EC. 211. PARMETROS DE LA DISTRIBUCIN NORMAL DEL RATIO DE VON NEUMANN................................164
EC. 212. ESTADSTICO ESTANDARIZADO DEL TEST DE VON NEUMANN ........................................................164
EC. 213. ESTADSTICO DE VON NEUMANN APLICADO A RESIDUOS (SINGH, 1985) ......................................164
EC. 214. DEFINICIN DE LA REGIN DE ACEPTACIN DEL TEST ....................................................................165
EC. 215. TRATAMIENTO DE LA VARIABLE PARA LA APLICACIN DEL TEST DE ALEXANDERSSON ...............165
xii
Mdulo de Estadstica Aplicada a la Hidrologa
INTRODUCIN Y OBJETIVOS
La estadstica es la ciencia que se ocupa del tratamiento de los datos y la realizacin de

predicciones para la toma de decisiones. Los datos hidrolgicos tienen variabilidad en el
tiempo y en el espacio y estn afectados por incertidumbre o aleatoriedad, lo que hace
que esta disciplina les sea aplicable. En concreto se pueden citar los siguientes
cometidos de la estadstica:
1. Recopilacin y clasificacin de datos
2. Descripcin de datos y encontrar regularidades
3. Anlisis de muestras y realizacin de inferencias
4. Contraste de hiptesis
5. Medicin de las relaciones entre variables
6. Prediccin
Se consideran varios objetivos para la preparacin de unos apuntes de estadstica dentro
del curso de hidrologa. Entre ellos se mencionan los siguientes:
1. Sintetizar las herramientas generales de aplicacin en hidrologa
2. Transcribir conceptos bsicos recogidos de la bibliografa estadstica
3. Seleccin de bibliografa, principalmente en espaol
13
14
2
2.1
TEORA DE LA PROBABILIDAD
FENMENOS ALEATORIOS Y DEFINICIONES
La Estadstica trata del estudio de la realidad entendida a partir de los fenmenos

mostrados. Estos fenmenos son estadsticos cuando se define un procedimiento de
medida segn las componentes que se distingan. El objetivo de la Estadstica es pues el
estudio de fenmenos aleatorios, de su organizacin en modelos definidos por sus
componentes y relaciones existentes y de su coherencia con la realidad.
Los fenmenos aleatorios se caracterizan por (Martn Jadraque):
1. Pudiendo repetirse indefinidamente en condiciones anlogas, presentan
resultados distintos, de manera que no existe regularidad determinista sino
estadstica.
2. En los fenmenos aleatorios no se puede predecir el resultado de cada
experiencia particular, ya que una pequea variacin en las condiciones
iniciales da lugar a resultados completamente distintos
3. Ley del azar: si una cierta experiencia se repite n veces y anotamos el
nmero de veces que aparece cierto resultado, n, se observa que el cociente
n/n, frecuencia relativa, tiende a estabilizarse cuando n crece
indefinidamente
Definiciones bsicas:
Universo, poblacin o espacio muestral es un conjunto de valores posibles al que se dota de
estructura algebraica para definir sucesos y probabilidades asociadas. Se define al cumplir una
serie de propiedades comunes. Este conjunto puede ser finito o infinito.
Suceso: subconjunto del espacio muestral. Es un fenmeno con probabilidad de ocurrir. El
conjunto de todos los sucesos posibles forma el universo de sucesos. Los sucesos pueden ser
elementales (siempre ocurre alguno de ellos y son mutuamente excluyentes) o compuestos
(formados a partir de la unin de los sencillos)
Suceso seguro: coincidente con el espacio muestral
Suceso imposible: no ocurre nunca
La poblacin se estudia a partir de las muestras representativas cualitativamente y
cuantitativamente de la misma. Un conjunto de observaciones de una variable aleatoria se
denomina muestra. Las muestras se obtienen de una poblacin con propiedades estadsticas
constantes, mientras que en las muestras s cambian. Y a partir de las muestras se realizan
inferencias sobre la poblacin.
Ejemplo: Como fenmeno aleatorio se puede considerar el constituido por los caudales
mximos anuales. Todos los caudales que forman la poblacin se seleccionan por cumplir esa
caracterstica comn, ser un caudal mximo anual. Un suceso aleatorio sera, por ejemplo, el
registro de un ao.
15
2.2
2.2.1
DEFINICIN DE PROBABILIDAD
Definicin de Laplace
Algunos experimentos aleatorios sencillos tienen la propiedad de que todos los sucesos
elementales que lo componen tienen la misma probabilidad de ocurrencia. En ese caso
la distribucin de la probabilidad es uniforme y se dice que el experimento posee
simetra. Un ejemplo tpico sera el caso del lanzamiento de un dado. Cada uno de los
sucesos elementales, es decir, cada una de las seis caras del dado posee la misma
probabilidad de ser el resultado de uno de los lanzamientos.
En un experimento dotado de simetra y compuesto por n sucesos elementales (e1, e2, ...,
en) la probabilidad de ocurrencia de cada uno de los sucesos elementales ser igual a la
probabilidad total (uno) dividida por el nmero de sucesos elementales (n):
Ec. 1. Probabilidad de un suceso elemental con simetra
P(ei ) =
1
n
En el caso del ejemplo del dado existen seis sucesos elementales (las seis caras del
dado) y, por lo tanto, la probabilidad de obtener una cara determinada en un
lanzamiento ser:
Punacara =
1
6
Como consecuencia de lo expuesto, la probabilidad de un suceso cualquiera no

elemental, A, se podr determinar como la suma de las probabilidades de cada uno de
los sucesos elementales favorables al suceso A. Si el nmero de casos favorables es m,
se tendr:
Ec. 2. Deduccin de la probabilidad de Laplace para un suceso no elemental
PA = P (U efavorables ei ) =
P (e ) = n =
i
efavorables
i =1
m
n
donde se ha tenido en cuenta que la interseccin de sucesos elementales es el suceso

imposible. Por tanto, la probabilidad de un suceso cualquiera A se podr determinar
como el nmero de sucesos elementales favorables al suceso A dividido por el nmero
total de sucesos elementales:
Ec. 3. Probabilidad de Laplace para un suceso no elemental
P( A) =
n casos favorables
n casos posibles
Esta es la denominada regla de Laplace que, como se ha dicho, es solo aplicable a

fenmenos aleatorios dotados de simetra.
16
En el caso del dado, la probabilidad de un suceso cualquiera, por ejemplo obtener en un

lanzamiento un valor superior a dos, se calcular como el nmero de casos favorables
(obtener como resultado el 3, 4, 5 6) dividido por el nmero de casos posibles (el 1, 2
3, 4, 5 y 6):
P(obtener un valor mayor que dos ) =
4 2
= = 0,67
6 3
Se puede demostrar que la definicin propuesta por Laplace cumple los axiomas de
Kolmogorov (que se expondrn en el prximo apartado) y, por lo tanto, es una funcin
de probabilidad.
2.2.2
Definicin emprica de Von Mises
La definicin de Laplace de probabilidad descrita en el apartado anterior es solo

aplicable a aquellos experimentos dotados de simetra, es decir, cuando cada uno de los
sucesos elementales que componen el experimento tiene la misma probabilidad de
ocurrencia. Esto limita muchsimo su aplicabilidad puesto que la mayora de los
fenmenos fsicos complejos de carcter estocstico no son simtricos. Por ejemplo, si
consideramos como fenmeno aleatorio el caudal que circula por un ro en un instante
determinado, es evidente que los sucesos elementales que lo componen, cualquier
resultado posible al medir el caudal (en principio, cualquier nmero real no negativo),
no son isoprobables. En general se verificar, que la mayor parte de la probabilidad se
concentrar en determinados valores normales del caudal y ser mucho menor la
probabilidad de medir valores muy grandes o muy pequeos del mismo.
Von Mises propuso que en estos casos la probabilidad de un determinado suceso viene
dada por el lmite de su frecuencia relativa, nmero de ensayos favorables al suceso A
(nA) dividido por el nmero total de ensayos (n), cuando el nmero de ensayos del
experimento tiende a infinito.
P( A) = lim f A = lim
n
nA
n
Entonces se habla de la probabilidad como frecuencia relativa de un suceso respecto al

global. Dada una muestra finita con n elementos y nA elementos seleccionados por
cumplir una caracterstica o ser casos favorables, su probabilidad se podr estimar como
la frecuencia relativa del suceso. El nmero total de elementos de la muestra favorables
al suceso considerado (nA) se denomina frecuencia absoluta.
Ec. 4. Definicin de frecuencia relativa
P=
nA
n
Para Von Mises, la probabilidad de un suceso solo se puede conocer a travs de la

experiencia, es decir, la probabilidad del suceso queda determinada al realizar un gran
nmero de pruebas del experimento y examinar la frecuencia relativa del suceso que nos
interesa. El lmite al que tiende la frecuencia relativa es la probabilidad real del suceso.
Es decir, si la poblacin tuviese un tamao infinito se comprobara que el valor de
17
probabilidad tiende a un valor lmite en la que se estabilizan las relativas con un nmero
n de casos suficientemente grande. Esta convergencia de la frecuencia relativa hacia el
valor real de la probabilidad no es en absoluto evidente, aunque su existencia es
imprescindible para que se pueda estimar el valor de la probabilidad a partir del estudio
de una muestra. Como se ver en el apartados posteriores, la Ley Fuerte de los Grandes
Nmeros garantiza desde un punto de vista matemtico dicha convergencia.
No obstante, la definicin de Von Mises sigue teniendo dos inconvenientes bsicos
(Pea, 2000). La experimentacin nunca es indefinida, especialmente en aquellos casos
en que est limitada, por lo que se tiene una incertidumbre asociada a la estimacin de
la frecuencia relativa. Adems, a lo largo del tiempo el sistema puede variar y las
frecuencias relativas tambin, con lo que resulta difcil obtener una muestra
suficientemente larga con las propiedades homogneas de la poblacin.
Al igual que para el caso de la definicin de Laplace, se puede demostrar que el criterio
de Von Mises cumple los axiomas de Kolmogorov y, por tanto, constituye una funcin
de probabilidad.
2.2.3
La probabilidad subjetiva
Otros autores como Keynes, Jeffreys, Savage y De Fenetti han propuesto una definicin
de la probabilidad basada en un criterio subjetivo. Esta concepcin de probabilidad no
requiere de repeticin de pruebas, ni de estabilidad de las frecuencias, sino que est
basada en el grado de creencia que un determinado individuo pueda tener en un hecho
determinado o en el resultado de un determinado experimento. La probabilidad de cada
suceso ser diferente para cada persona porque cada uno dispondr de distinta
informacin y la valorar de forma diferente.
Si la valoracin subjetiva se realiza siguiendo determinados axiomas, definidos por De
Fenetti, se puede llegar a una medida cuantitativa de la probabilidad que cumple los
axiomas de Kolmogorov.
2.2.4
Ley fuerte de los grandes nmeros
Como se coment anteriormente, el criterio de Von Mises ser el habitualmente

empleado en hidrologa, puesto que los fenmenos fsicos que estudia dicha ciencia
carecen de la propiedad de simetra. Ser, por tanto, necesaria la obtencin de una
muestra a partir de la cual obtener las frecuencias relativas. No obstante, ya se apunt,
que la definicin de probabilidad de Von Mises presenta ciertas dificultades desde un
punto de vista matemtico. Es necesario garantizar la convergencia de la frecuencia
relativa hacia el valor real de la probabilidad, es decir, que la probabilidad puede ser
estimada partir de la muestra y con tanta precisin como se desee simplemente con
aumentar su tamao. Esta circunstancia puede garantizarse desde un punto de vista
matemtico a partir de la llamada Ley Fuerte de los Grandes Nmeros, la cual afirma
que:
El cociente del nmero de veces que se presenta el suceso A entre el de repeticiones

del fenmeno tiende a la probabilidad del suceso A.
18
Esta ley garantiza, por tanto, la viabilidad de emplear la definicin de Von Mises como
mtodo para estimar la probabilidad de un suceso. La demostracin matemtica de la
ley no se incluye en este curso debido a su complejidad. La misma demostracin
matemtica permite conocer que la frecuencia relativa, no solo converge hacia el valor
real de la probabilidad, sino que lo hace con bastante rapidez. Debido a esa rapidez en la
convergencia, se la llama ley fuerte, a diferencia de la ley dbil en la que la
convergencia es mucho ms lenta. Esta circunstancia permite realizar estimaciones
bastante precisas de la probabilidad con un nmero no muy elevado de datos.
2.3
PROBABILIDAD Y AXIOMAS DE KOLMOGOROV
2.3.1
Teora de conjuntos
La teora de conjuntos aporta la estructura desde la que se organizan los modelos

probabilsticos. Se ha definido el suceso aleatorio como un subconjunto del universo o
suceso seguro. En la teora de conjuntos se consideran las siguientes definiciones
(Martn Jadraque):
Unin de sucesos. Se llama suceso unin o suma de dos sucesos, A y B, a aquel

cuyas descripciones pertenecen a A o B. Cualquier elemento perteneciente al
conjunto unin pertenece a A o a B.
Ec. 5. Unin de sucesos
S = AU B
Interseccin de sucesos. Se llama suceso interseccin o producto de dos sucesos,

A y B, a aquel cuyas descripciones pertenecen a A y a B. Cualquier elemento
perteneciente al conjunto interseccin pertenece a A y a B
Ec. 6. Interseccin de sucesos
P = AI B
Espacio muestral o universo (suceso seguro). Es aquel suceso que contiene todos
los posibles resultados del fenmeno aleatorio. Se representa como E.
Suceso complementario. Dado el espacio muestral E y un suceso A, el

complementario est formado por todos los elementos que no pertenecen a A
dentro de E. Se representa por A .
Suceso diferencia. Dados dos conjuntos A y B, el suceso diferencia es el que

resulta de la interseccin de A con el complementario de B.
Ec. 7. Diferencia de sucesos
D = AI B
19
Conjunto vaco (suceso imposible). Es el suceso contrario al cierto. Se

representa con .
Sucesos incompatibles. Dos sucesos son incompatibles cuando la interseccin es

el conjunto vaco.
La unin e interseccin tienen las siguientes propiedades:

1. Conmutativa
Ec. 8. Propiedad conmutativa
AI B = BI A
AU B = BU A
2. Asociativa
Ec. 9. Propiedad asociativa
A I B I C = A I (B I C ) = ( A I B ) I C
A U B U C = A U (B U C ) = ( A U B ) U C
3. Distributiva
Ec. 10. Propiedad distributiva
A I (B U C ) = ( A I B ) U ( A I C )
A U (B I C ) = ( A U B ) I ( A U C )
4. Del mdulo
Ec. 11. Propiedad del mdulo
AI =
A U = A
5. Idempotencia
Ec. 12. Propiedad idempotencia
AI A = A
AU A = A
6. Otras
Ec. 13. Otras propiedades
AI B = AU B
20
AU B = AI B
2.3.2
Axiomas de Kolmogorov
Apoyndose en el lgebra de conjuntos, la probabilidad es una funcin que asocia a un

suceso A una probabilidad P(A). Para ser una probabilidad, esta funcin debe cumplir
con los siguientes axiomas (axiomas de Kolmogorov):
1. La probabilidad de cualquier suceso es positiva
Ec. 14. Axioma 1 de Kolmogorov
P( A) 0
2. La probabilidad del suceso seguro es 1.
P( E ) = 1
3. Si A y B son sucesos incompatibles y los unimos, la probabilidad del suceso
unin es la suma de las probabilidades de los sucesos aislados:
A I B = P( A U B ) = P ( A) + P ( B )
De los que se derivan 7 teoremas demostrables en virtud de los anteriores axiomas:
1. Teorema 1. La probabilidad de un suceso es siempre menor o igual que 1.
Ec. 17. Teorema 1 derivado de los axiomas de Kolmogorov
P ( A) 1
2. Teorema 2. La probabilidad de un suceso y la de su complementario suma la
unidad.
P( A) = 1 P ( A)
3. Teorema 3. La probabilidad del suceso imposible es nula.
P( ) = 0
4. Teorema 4. Si el suceso A es un subconjunto de B, la probabilidad de A es menor
o igual que la de B.
A B P ( A) P( B)
21
5. Teorema 5. La probabilidad de la unin de dos sucesos compatibles es igual a la

de cada uno de los sucesos menos la de la interseccin.
P( A U B) = P( A) + P( B ) P ( A I B)
6. Teorema 6. La probabilidad de la unin de ms de dos sucesos incompatibles es
la suma de las probabilidades de cada uno de ellos.
Ai I A j = (i j ) P ( A1 U ... An ) = P ( A1 ) + ...P( An )
7. Teorema 7.
((
) (
))
P A I B U A I B = P( A) + P( B) 2P( A I B)
2.3.3
Postulado de indiferencia
Mediante el lgebra de probabilidad definido se plantea el postulado de indiferencia

desde el cual se puede llegar a definir la Regla de Laplace expuesta anteriormente. El
postulado de indiferencia dice que si los n sucesos elementales de un fenmeno
aleatorio son incompatibles entre s y no existe ninguna razn que favorezca la
presentacin de uno respecto a los otros, debe admitirse que todos tienen la misma
probabilidad.
U ( Bi ) = E
Bi I B j = (i j )
P( Bi ) = P( B j ) = p
P( B1 ) U ...P( Bn ) = P ( E ) = 1 = n p P( Bi ) =
1
n
Y si se verifica un suceso A cuando se presenta alguno de entre m de los anteriores

sucesos:
P( A) = P( B1 U ...Bm ) = P ( B1 ) + ...P ( Bm ) = m p P ( A) =
m
n
Y queda la regla de Laplace como se haba enunciado anteriormente: si un suceso A se

presenta cuando tiene lugar alguno de los m casos favorables A1, A2, ... Am
incompatibles y equiprobables entre los n casos posibles incompatibles y equiprobables,
la probabilidad del suceso A es el nmero m de casos favorables dividido por el nmero
n de casos posibles.
22
2.4
2.4.1
CONCEPTO DE DEPENDENCIA E INDEPENDENCIA ESTOCSTICA

Probabilidad condicionada
El anlisis de muchas situaciones lleva a identificar sucesos que condicionan,

probabilsticamente, la aparicin de otros. En la prctica, la identificacin de estos
sucesos se decide en funcin de la experiencia que se tenga sobre la materia en cuestin.
Desde el punto de vista probabilstico se considera la realizacin de un experimento en
el que se identifica n1 veces un suceso A. De la misma manera, se identifica que otro
suceso, B, se presenta n2 veces de esas n1 originales de A. La frecuencia relativa de B,
habindose presentado A es:
Ec. 24. Frecuencia relativa del suceso B condicionada a A
n2
n2
P ( A I B)
P=
= n =
n1 n1
P( A)
n
Tal como aparece en la ecuacin anterior, se puede a su vez considerar la frecuencia de
cada uno de estos sucesos respecto al nmero n total de experimentos y expresar la
probabilidad de B condicionada a A en funcin del cociente entre la probabilidad de la
interseccin de sucesos y la del suceso A (teorema del producto).
Dados dos sucesos A y B, se llama probabilidad del suceso B condicionada por el suceso
A, representado por P(B/A), a la probabilidad del suceso B supuesto que ha ocurrido A.
Ec. 25. Expresin de la probabilidad condicionada
P (B A) =
P( A I B )
P( A)
De la misma manera:
Ec. 26. Expresin de la probabilidad condicionada
P( A B ) =
P( B I A)
P( B )
Quedando:
Ec. 27. Relaciones entre la probabilidad condicionada y la interseccin de sucesos
P( A I B) = P( A)P( B A) = P ( B )P( A B )
En el caso de manejar tres sucesos, se tendra:
23
Ec. 28. Probabilidad condicionada entre tres sucesos
P(C A I B) =
P(C I A I C ) P(C I A I C )
=
P( A I B)
P( A)P( B A)
P(C I A I C ) = P( A)P( B A)P (C A I B)

Y en el caso general:
Ec. 29. Probabilidad condicionada entre n sucesos
P( A1 I ... An ) = P ( A1 )P( A2 A1 )P( A3 A1 I A2 )...P ( An A1 I ... An 1 )

2.4.2
Dependencia e independencia de sucesos
Si se cumple que para dos sucesos de un experimento aleatorio, A y B,

Ec. 30. Independencia de sucesos
P( A) = P( A B) o P( B) = P( B A)
se dice que los sucesos son independientes. Es decir, la probabilidad de un suceso A es
la misma que condicionada a B, por lo que B no condiciona el suceso A.
Una segunda propiedad de los sucesos independientes es que la probabilidad del suceso
interseccin es el producto de probabilidades de los sucesos individuales:
Ec. 31. Propiedad de los sucesos independientes
P( A I B ) = P( A)P( B A) = P( B)P( A B)
P( B A) = P( B)
P ( A I B) = P ( A)P( B)
P( A B) = P( A)
La ltima propiedad a comentar es la que relaciona los sucesos incompatibles o

excluyentes con la dependencia. Se dice que si dos sucesos son incompatibles, son
dependientes.
Ec. 32. Dependencia de sucesos incompatibles
A I B = P( A I B) = 0 P ( A B) =
P( A I B)
= 0 P( A) P( A B)
P ( B)
Ejemplo: sean A1 y A2 dos sucesos independientes, distintos de E y . Demostrar que sus

complementarios son tambin independientes.
24
Ind P( A1 I A2 ) = P ( A1 )P( A2 )
P( A1 ) = 1 P( A1 )
P( A1 )P ( A2 ) = 1 P( A1 ) P( A2 ) + P( A1 )P ( A2 )
P( A2 ) = 1 P( A2 )
P ( A1 )P( A2 ) = 1 P ( A1 U A2 ) = P( A1 U A2 ) = P( A1 I A2 )cqd
2.4.3
Teorema de la probabilidad total o compuesta
A partir de los conceptos de dependencia estocstica y de probabilidad condicionada se

han desarrollado una serie de teoremas que permiten realizar el clculo de la
probabilidad de un suceso A a partir del conocimiento de las probabilidades de otros
sucesos Bi y de las probabilidades condicionadas. Uno de estos teoremas es el de la
probabilidad total o compuesta que se expone a continuacin y otro el teorema de
Bayes o de la probabilidad inversa, que se tratar en el prximo apartado.
El teorema de la probabilidad total o compuesta se puede enunciar de la siguiente
forma: sea B un suceso que se puede descomponer en un conjunto de sucesos Bi
incompatibles de tal forma que:
U ( Bi ) = B
i
Bi I B j = (i j )
Sea A un suceso que solo se puede dar dentro de B, para el cual se conocen las
probabilidades condicionadas P(A/Bi) y supongamos que se conocen tambin las
probabilidades P(Bi). Se verifica:
Ec. 33. Probabilidad total o compuesta
P( A) = P( A / Bi ) P ( Bi )
i
Demostracin :Puesto que AB=A, se cumple:
P( A) = P( A I B) = P A I U Bi = P U[A I Bi ]
i
Y por ser los sucesos Bi disjuntos, se tiene aplicando el teorema 5:
P( A) = P( A I Bi )
i
Y, finalmente, a partir de la ecuacin de la probabilidad condicional o teorema del producto:
P( A) = P( A / Bi ) P ( Bi )
i
25
Ejemplo: Se seleccionan caudales mnimos anuales de una estacin de aforos. Se trata de

obtener una expresin de la probabilidad de la serie de caudales mnimos aplicando el
teorema de la probabilidad total, distinguiendo entre caudales nulos y el resto. Se define
P(Q>q) como la probabilidad asociada a un caudal q de ser menor que uno dado Q.
Entonces,
P(Q q ) = P(Q q Q = 0)P (Q = 0) + P(Q q Q 0)P (Q 0)
P(Q q Q = 0) = 0
P (Q q) = P(Q q Q 0)P(Q 0)
P(Q q ) = k P (Q q Q 0)
m
P(Q 0) = = k
n
donde n es el nmero total de caudales mnimos seleccionados, m es el nmero de
caudales distintos de cero y se cumple que la probabilidad de obtener un caudal q menor
que uno dado Q igual a cero es nula.
2.4.4
Teorema de Bayes o de la probabilidad inversa:
Sea E el universo o espacio muestral que suponemos se puede descomponer en un

conjunto de sucesos Bi de tal forma que:
U( Bi ) = E
i
Bi I B j = (i j )
Sea A un suceso para el cual se conocen las probabilidades condicionadas P(A/Bi). Se
verifica:
Teorema de Bayes
P( Bi / A) =
P ( Bi ) P( A / Bi )
P( Bi ) P( A / Bi )
i
Demostracin : Por la ecuacin de la probabilidad condicional o teorema del producto, se tiene:
P( Bi / A) =
P( Bi A)
P( A)
Y por el mismo teorema:
P( Bi A) = P ( Bi ) P( A / Bi )
Por el teorema de la probabilidad total:
P( A) = P( A / Bi ) P ( Bi )
i
26
Y sustituyendo las dos ltimas expresiones en la obtenida para P(Bi/A), se obtiene el resultado
buscado:
P( Bi / A) =
P ( Bi ) P( A / Bi )
P( Bi ) P( A / Bi )
i
Ejemplo: En una determinada zona se pueden registrar tormentas generadas por dos
tipos de fenmenos meteorolgicos: lluvias de carcter convectivo y lluvias producidas
por frentes de bajas presiones (ciclones o borrascas). La probabilidad de que la
precipitacin registrada por un pluvimetro durante un aguacero sea una u otra depende
del tipo de fenmeno meteorolgico que ocurra. A partir del estudio de las
precipitaciones producidas por distintos tipos de aguaceros, se ha llegado a determinar
las siguientes probabilidades para las precipitaciones:
P < 100 mm
P > 100 mm
Lluvia convectiva
0,96
0,04
Lluvia ciclnica
0,99
0,01
Tambin se sabe que solo un tercio de los aguaceros de la zona son de tipo ciclnico. Si
la precipitacin registrada en el pluvimetro durante un aguacero es inferior a 100 mm:
a) Calcular la probabilidad de que el aguacero haya sido de tipo convectivo.
b) Lo mismo para un aguacero de tipo ciclnico, si la precipitacin
registrada ha sido mayor de 100 mm.
a) Si llamamos suceso B1 a que el aguacero sea de tipo convectivo y suceso B2 a que sea
de tipo ciclnico, se verifica:
U( Bi ) = E
i
Bi I B j = (i j )
La probabilidad de estos sucesos Bi es:
P( B1 ) = 2 / 3
P ( B2 ) = 1 / 3
Por tanto, si definimos el suceso A1 como el registro de una precipitacin inferior a 100
mm durante un aguacero, se tendr:
27
P( A1 / B1 ) = 0,96
P( A1 / B2 ) = 0,99
Y, por tanto, aplicando el teorema de Bayes:
P( B1 / A1 ) =
P( B1 ) P( A1 / B1 )
( 2 / 3)0,96
=
= 0,66
P( B1 ) P( A1 / B1 ) + P( B2 ) P( A1 / B2 ) (2 / 3)0,96 + (1 / 3)0,99
b) Si ahora llamamos A2 al registro de una precipitacin superior a 100 mm durante un

aguacero, se tendr:
P( A2 / B1 ) = 0,04
P( A2 / B2 ) = 0,01
Y aplicando el teorema de Bayes:
P( B2 / A2 ) =
2.5
P ( B2 ) P( A2 / B2 )
(1 / 3)0,01
=
= 0,11
P ( B1 ) P( A2 / B1 ) + P( B2 ) P( A2 / B2 ) ( 2 / 3)0,04 + (1 / 3)0,01
ELEMENTOS DE COMBINATORIA Y PROBABILIDAD
La combinatoria sirve de ayuda al clculo de probabilidades al permitir calcular el

nmero de casos que cumplen determinadas condiciones.
2.5.1
Variaciones o permutaciones de n elementos tomados de r en r
Se tienen n elementos y se escogen r de ellos uno a uno. Se desea saber cuntos

resultados posibles se pueden obtener, es decir, cuntas maneras distintas hay de
escoger r considerando el orden de eleccin. Es un problema de variaciones de n
elementos tomados de r en r y se resuelve considerando que en la primera eleccin se
tienen n posibilidades, en la segunda n-1, y as sucesivamente hasta la r-sima, en la que
se tienen n-r+1 posibilidades. La expresin matemtica de las variaciones es la
siguiente:
Ec. 34. Variaciones de n elementos tomados de r en r
Vrn = n( n 1)...( n r + 1) =
2.5.2
n!
(n r )!
Permutaciones
Las permutaciones son el nmero de maneras posibles en que se pueden ordenar n

elementos, es decir, el nmero de variaciones de n elementos tomados de n en n.
28
Ec. 35. Permutaciones de n elementos
Pn = n!
2.5.3
Variaciones con repeticin
Idntica a las variaciones pero admitiendo la repeticin de los elementos. El total de

sucesos posibles es de:
Ec. 36. Variaciones con repeticin de n elementos tomados de r en r
VRrn = n r
2.5.4
Permutaciones con repeticin

Ec. 37. Permutaciones con repeticin de n elementos
PRn = n n
2.5.5
Combinaciones
Si se tiene el mismo caso anterior, pero sin importar el orden en que se escogen los r
elementos, se pasa a un problema de combinaciones. Si se considera que el nmero total
de permutaciones de r elementos es r!, el nmero de combinaciones ser el de
variaciones de n elementos tomados de r en r, dividido entre r!.
Ec. 38. Combinaciones
C rn =
2.5.6
Prn n
n!
= =
r! r r!( n r )!
Combinaciones con repeticin

Ec. 39. Combinaciones con repeticin
n
n 1
n 1
+ ... + n
CRrn = + n
r
r 1
n r + 1
2.6
2.6.1
OBSERVACIONES REPETIDAS
Observaciones con reemplazamiento
Se quiere estimar la probabilidad de extraer de una urna con n1 bolas blancas y n2 negras
(N=n1+n2), r bolas blancas. Siendo n el total de bolas extradas. Considerando las
posibles combinaciones con xito, queda:
29
Ec. 40. Probabilidad de las observaciones con reemplazamiento
n r
nr
P = p (1 p )
n2
r

1 p = P (negra ) =
N
p = P (blanca) =
n1
N
En el caso de ms de dos opciones, si hay ni bolas de cada clase y se quieren extraer mi

de cada una, la probabilidad queda:
Ec. 41. Probabilidad de las observaciones con reemplazamiento y ms de dos clases
mk
m1
n = ni
n!
n1
nk
...
P =
m1!...mk ! N
mi / clase
N
2.6.2
Observaciones sin reemplazamiento
En este caso el problema vara porque con cada extraccin, cambian las condiciones de
experimentacin. El nmero total de casos posibles de extracciones de r elementos de
N
una urna con un total de N es . Si de estos casos se pretende calcular la
n
n1 n 2
.
probabilidad de que m1 sean blancas, el nmero de casos favorables ser
m1 r m1
La probabilidad buscada es:
Ec. 42. Probabilidad de las observaciones sin reemplazamiento
n1 n 2

m1 n m1
P=
N

n
Este ejemplo se puede extender al caso de ms de dos clases (Gmez Espadas).
Ec. 43. Probabilidad de las observaciones sin reemplazamiento y ms de dos clases
n1 n 2 nk
...
mk
m m
P = 1 2
N

n
2.6.3
Otros casos de observaciones repetidas
Para un fenmeno aleatorio cualquiera se tendrn las siguientes probabilidades

asociadas a la presentacin de un suceso aleatorio A durante n experimentos. La
30
presentacin de cada suceso A es independiente entre los distintos ensayos y tiene

probabilidad p.
1. La probabilidad de que A se presente en las n repeticiones del experimento es:
Ec. 44. Probabilidad de que se presente A siempre en n repeticiones
P( A I ... A) = p p.. p = p n
2. La probabilidad de que A no se presente en ninguno de los n ensayos es:
Ec. 45. Probabilidad de que no se presente A en n repeticiones
P( A I ... A) = (1 p)(1 p )..(1 p ) = (1 p ) n

3. La probabilidad de que A se presente al menos una vez es:
Ec. 46. Probabilidad de se presente A al menos una vez en n repeticiones
1 P( A I ... A) = 1 (1 p ) n
4. La probabilidad de que A se presente r veces del total n es, como se ha indicado
en el apartado 2.6.1:
Ec. 47. Probabilidad de que A se presente r veces de n
n r
p (1 p ) n r
r
5. La probabilidad de que A se presente entre r1 y r2 veces es:
Ec. 48. Probabilidad de que A se presente entre r1y r2 veces de n
r2
r = r1
r p
(1 p) n r
Ejemplo: Calcular el riesgo de que un caudal mximo anual con periodo de retorno
asociado T sea superado alguna vez durante los t aos siguientes.
1. Probabilidad de que en un ao esa avenida sea superada si corresponde a un
periodo de retorno de T aos
P(Q QT ) =
1
T
2. Probabilidad de no ser superada en un ao

P(Q QT ) = 1
1
T
31
3. Probabilidad de no ser superada durante t aos consecutivos

1
P = 1
T
4. Riesgo o probabilidad de ser superada alguna vez durante t aos consecutivos

1
R = 1 1
T
32
PRCTICA I
Se tienen los siguientes datos de caudal mximo anual medidos en una estacin de
aforos:
AO
CAUDAL (m3/s)
376
464
454
254
120
105
186
398
1600
10
410
11
142
12
80
13
100
14
380
15
214
16
137
17
207
18
464
19
138
20
964
1.Cul es el espacio muestral del fenmeno aleatorio?

2.Utilizando el criterio de Von Mises, calcular:
a)La probabilidad de que durante un ao se superen los 200 m3/s.
b)La probabilidad de que no se superen los 500 m3/s.
c)A partir de los dos resultados anteriores, la probabilidad de que el
mximo caudal medido durante un ao se site entre 200 m3/s. y 500
m3/s.
3.Calcular la probabilidad de los siguientes sucesos:
a)Que se superen los 200 m3/s. durante cinco aos consecutivos.
b)Que durante cinco aos consecutivos no se supere ningn ao los 200
m3/s.
c)Que durante cinco aos consecutivos se superen los 200 m3/s. al menos
una vez.
d)Que durante cinco aos consecutivos se superen los 200 m3/s. en tres
de los aos.
33
Solucin:
1. El espacio muestral ser cualquier resultado posible al realizar una medida de caudal
en un ro, es decir, todos los nmeros reales positivos y el cero:
E = + + {0}
2. a) A partir de los datos de la tabla, se divide el nmero de aos en los que se ha
medido un caudal superior a 200 m3/s. por el nmero total de datos:
P(Q > 200) =
12
= 0,6
20
b) Igual que el apartado anterior pero considerando el nmero de aos en los que se ha
medido un caudal inferior a 500 m3/s.:
P(Q < 500) =
18
= 0,9
20
c) El suceso Q<500 se puede expresar como la unin de:

(Q < 500) = (Q < 200) ( 200 < Q < 500)
Como los sucesos (Q<200) y (200<Q<500) son incompatibles, se tiene:
P(Q < 500) = P (Q < 200) + P (200 < Q < 500)
P( 200 < Q < 500) = P (Q < 500) P (Q < 200)
Como (Q<200) es el complementario de (Q>200):
P(Q < 200) = 1 P(Q > 200) = 1 0,6 = 0,4
Por tanto:
P( 200 < Q < 500) = P (Q < 500) P(Q < 200) = 0,9 0,4 = 0,5
3. a) La probabilidad de superar los 200 m3/s. a lo largo de un ao se ha calculado
anteriormente y es igual a 0,6. Que se supere durante cinco aos consecutivos ser igual
a la interseccin de los sucesos correspondientes a que se supere el caudal en cada uno
de los cinco aos, y como los sucesos son independientes:
P( 200 < Q5 aos ) = P(i =1 200 < Qaoi ) = i =1 P( 200 < Qaoi ) = 0,6 5 = 0,078
5
b) Se resuelve igual que el apartado anterior pero con las probabilidades del suceso
complementario:
P( 200 > Q5aos ) = P (i =1 200 > Qaoi ) = i =1 P( 200 > Qaoi ) = (1 0,6) 5 = 0,01
5
34
c) El suceso que durante cinco aos se supere el caudal de 200 m3/s. al menos una vez
es el complementario del suceso que no se supere nunca en los cinco aos. Por tanto, su
probabilidad se puede obtener como:
P( 200 < Qalmenosunao ) = 1 P (200 > Q5 aos ) = 1 0,01 = 0,99
d) Se resuelve aplicando la frmula expuesta en el apartado 2.6.1. o en el 2.6.3., para el
caso de que el nmero de experimentos sea 5 y el nmero de casos favorables 3.
n
5
P( 200 < Q3aos ) = p r (1 p ) nr = 0,6 3 (1 0,6) 2 = 0,346
r
3
35
PRCTICA II
Junto con los datos de caudal del ejercicio anterior, se tienen los siguientes datos de
precipitacin mxima diaria medidos en un pluvimetro:
AO
PRECIPITACIN (mm)
120
205
180
100
50
40
105
125
400
10
210
11
55
12
20
13
35
14
150
15
95
16
70
17
155
18
220
19
75
20
310
1.Calcular la probabilidad de que la precipitacin medida en el pluvimetro sea superior

a 200 mm. si se sabe que el caudal medido en la estacin de aforos ha superado los 300
m3/s. Lo mismo para el caso en que no se hayan superado los 300 m3/s.
2.Calcular la probabilidad de que durante el mismo ao el caudal supere los 300 m3/s. y
la precipitacin los 200 mm.
3.Utilizando la informacin obtenida en los dos apartados anteriores calcular la
probabilidad de que el caudal sea mayor de 300 m3/s. si la medida del pluvimetro es
superior a los 200 mm.
Solucin:
1. Se obtiene a partir de los datos de las tablas, dividiendo el nmero de aos en los que
simultneamente el caudal ha superado los 300 m3/s. y la precipitacin los 200 mm, por
el nmero de aos en los que el caudal ha superado los 300 m3/s. El segundo caso se
resuelve igual pero considerando el nmero de aos en los que el caudal no ha superado
los 300 m3/s. y la precipitacin s ha superado los 200 mm.
36
P( 200 Q) =
0
=0
11
2. La probabilidad pedida es la de la interseccin de los sucesos (300<Q) y (200<P). A

partir de la definicin de probabilidad condicionada:
P( 200 < P / 300 < Q) =
P (300 < Q 200 < P)

P (300 < Q)
P(300 < Q 200 < P ) = P (200 < P / 300 < Q )P(300 < Q )
La probabilidad condicionada se ha calculado en el primer apartado y la probabilidad
P(300<Q) se puede obtener a partir de los datos de caudal de la prctica I.
P(300 < Q) =
9
= 0,45
20
P(300 < Q 200 Q).
E = (300 < Q) (300 > Q)
(300 < Q) (300 > Q) =
Por tanto, se tendr:
P (300 < Q / 200 Q)P( 200 Q) 0,450,556 + (1 0,45)0
37
38
3
3.1
ESTADSTICA DESCRIPTIVA
INTRODUCCIN
En los apartados siguientes se revisan procedimientos para la descripcin estadstica de

variables. Los datos se manejan para obtener informacin. Esta descripcin se realiza
mediante estadsticos calculados con los valores numricos de la muestra, grficos y
resmenes para presentar la informacin. Estos procedimientos se han escogido de la
generalidad de tcnicas que aparecen en los manuales de estadstica consultados,
aplicndolos sobre ejemplos de variables hidrolgicas.
Los datos hidrolgicos suelen tener una serie de propiedades destacadas por Hensel y
Hirsch (2002):
1. Las variables hidrolgicas suelen ser positivas y tienen como lmite inferior
cero. Es el caso de caudales medios anuales, caudales mximos, precipitacin
mensual, evapotranspiracin anual, etc.
2. Dentro del conjunto de datos registrados hay valores extremos, alejados de la
concentracin de datos normales.
3. Las distribuciones de frecuencia suelen estar sesgadas con signo positivo como
consecuencia de la aparicin de datos extremos con valor superior a los del
dominio central.
4. La consecuencia de tener distribuciones de frecuencia sesgadas es no seguir
funciones de distribucin normal.
5. Los datos que constituyen las muestras pueden haber sido recogidos con la
condicin de superar un umbral, por ejemplo el de sensibilidad del equipo de
medida
6. Hay presencia de patrones estacionales y de otras fluctuaciones que hacen que
los datos tengan diferentes propiedades en funcin del momento en el que se
registran.
7. Hay autocorrelacin, es decir, a un valor alto tiende a sucederle otro alto, y a uno
bajo, otro bajo.
8. Hay una dependencia de variables no controladas
Adems, se registran en un determinado momento y en un determinado lugar. Por
constituir series temporales, el orden del registro aporta informacin sobre el proceso.
Otra de las caractersticas bsicas de las variables hidrolgicas es su contexto espacial.
Los datos hidrolgicos estn influidos por caractersticas fisiogrficas y locales por lo
que el estudio del contexto espacial tambin ofrece claves para comprensin. En este
sentido hay que destacar la importancia que tiene la referencia geogrfica de los datos y
la ayuda que supone la utilizacin de sistemas de informacin geogrfica.
39
El objetivo de la descripcin de las variables es, en primer lugar, conocer, extraer y

presentar informacin de los datos registrados. A medida que se avanza en el
conocimiento del fenmeno, se va pasando a problemas de inferencia o prediccin, por
ejemplo, a la aplicacin de tests estadsticos para el reconocimiento de determinadas
caractersticas, para la deteccin de inconsistencias en las series, para la interpretacin
de los resultados o para su utilizacin posterior, por ejemplo, en modelos hidrolgicos,
en el relleno de lagunas, etc.
El anlisis organiza los datos segn diferentes patrones que permitan extraer de ellos
informacin. No se debe olvidar que la aplicacin de ciertos patrones de estudio y la
abstraccin de los datos en grficos, estadsticos, etc. puede filtrar parte de la
informacin que se encuentra en los datos. La aplicacin de modelos y pautas de estudio
supone imponer una estructura a los datos que puede llegar a sustituir a la propia
realidad, seleccionando aspectos particulares y simplificando su complejidad.
Previamente a todo el anlisis se debe disponer y preparar un conjunto de datos (base de
datos) en el que hay varios aspectos a considerar (Kundzewicz et al., 2000). En estos
apuntes se destacan:
1. La calidad de los datos registrados y el conocimiento del proceso de medida de
las variables utilizadas. El control de la calidad con la que se registran los datos,
cmo se han registrado, con qu medios y la historia de la medicin ha de ser
anterior a su utilizacin y han de considerarse los efectos que tengan incidencia
en los aspectos que se estudien. En concreto, es de inters conocer cuando sea
posible:
a. Medios utilizados
b. Calidad de las medidas
c. Historia de los registros: hay cambio de tcnicas y tecnologa de la
medicin a lo largo del tiempo?
Estos aspectos relacionados con la calidad de la medida son muy importantes
porque permiten dar explicacin a problemas que surgen en la utilizacin de las
series. Normalmente, es difcil conocer estos detalles de las mediciones, sobretodo
cuando se manejan importantes volmenes de informacin, como en el caso de la
simulacin hidrolgica, en la que se han de manejar datos meteorolgicos e
hidromtricos de varias estaciones distintas. No obstante, tambin hay tcnicas que
permiten identificar heterogeneidades e inconsistencias en las series.
2. Existen tambin otros aspectos relacionados con la disponibilidad de datos
temporales y con el intervalo temporal de referencia escogido para el estudio.
As se puede destacar la importancia que tienen los siguientes aspectos de cara a
la utilizacin de las variables:
a. Longitud de las series de registros.
b. Existencia de lagunas y periodos intermedios sin datos. Lgicamente, la
abundancia de lagunas dificulta la derivacin de las caractersticas de las
series
40
c. Frecuencia de los datos e intervalo temporal de trabajo, horario, diario,

mensual, anual,... con la consiguiente aparicin de distintas fluctuaciones
similares a la estacionalidad dependientes de ese intervalo temporal de
trabajo
3. Los procesos seguidos para la estimacin de la variable en estudio. Es decir, en
el caso de una variable como la humedad relativa media mensual, conocer cmo
se ha derivado un valor mensual a partir de los datos diarios u horarios y la
posibilidad de introducir sesgos en las estimaciones.
4. Por ltimo, en los textos consultados tambin se considera previo al inicio de la
descripcin de los datos, el conocimiento de las posibilidades que ofrece el uso
de transformaciones que simplifiquen su utilizacin posterior.
En los siguientes apartados se repasan elementos bsicos del anlisis univariado y del
bivariado, as como tcnicas sencillas para el anlisis de los efectos de la temporalidad
en las series. El caso del anlisis del contexto espacial se deja para el mdulo de
estadstica.
3.2
ANLISIS UNIVARIADO
Este apartado se centra en la descripcin de los datos de una variable. Con generalidad,
las variables pueden ser cualitativas o cuantitativas, discretas o continuas. Cada tipo de
variable permite un tipo de ordenacin para trabajar numricamente con ellas. Las
ordenaciones y escalas se establecen en funcin de criterios como mayor/menor que,
igualdad/desigualdad, valoracin numrica de las diferencias entre dos modalidades y
distancias al origen absoluto de la variable (Bosque Sendra, 1997). Estos criterios
constituyen las herramientas sobre las que se basan las descripciones de elementos.
3.2.1
Herramientas grficas
Con variables cualitativas o cuantitativas, el primer paso para su descripcin puede ser
la ordenacin de los registros en tablas. Estas tablas se construyen al conocer una
cualidad y ordenar el nmero de casos registrados para cada caso de la cualidad
identificada. Por ejemplo, si se piensa en conocer qu estacin es la ms proclive a la
presentacin de mximos anuales, se pueden ordenar los datos en una tabla donde
aparezcan el nmero de mximos asociados a cada mes y utilizar un diagrama circular
para su descripcin. En la figura se aprecia que la mayora de los casos se dan entre los
meses de septiembre a diciembre, con nula aparicin de mximos, en la serie disponible,
durante los meses de junio a agosto.
Mes
Nmero de mximos
Oct Nov Dic Ene Feb Mar Abr May Jun Jul Ago Sep TOTAL
12
36
41
Oct Nov Dic Ene Feb Mar Abr May Jun Jul Ago Sep TOTAL
Mes
Junio
0%
Julio
0%
Mayo
3%
Agosto
0%
Septiembre
8%
Abril
8%
Octubre
34%
Marzo
8%
Febrero
0%
Enero
6%
Diciembre
14%
Noviembre
19%
Figura 1. Grfica de sectores

Tabla 1. Estacionalidad de los mximos anuales de una estacin pluviomtrica.
En el caso anterior se ilustra un concepto importante sobre el estudio de lluvias

mximas. Los grficos son tambin herramientas inductivas que permiten analizar los
datos en busca de caractersticas, Con una serie temporal, lo ms sencillo es representar
los valores en funcin del orden en que se van tomando. La representacin grfica de
los datos en su evolucin temporal (Tabla 2), permite extraer unas primeras
consecuencias sobre la informacin subyacente. En el siguiente ejemplo, realizado con
valores anuales de precipitacin registrados en la estacin pluviomtrica A, se pueden
extraer unas primeras conclusiones acerca de los diferentes periodos, de la diferente
variabilidad, etc.
Ao 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958
Pluvio
31
20
21
23
22
21
29
34
22
17
22
38
18
15
12
33
22
27
(mm)
Ao 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976
Pluvio
(mm)
42
34
29
32
26
35
34
25
27
27
28
36
23
34
26
35
36
25
24
Periodo de medidas 1941-1976.

Nmero total de datos: 36
Precipitacin registrada (mm)
40
35
30
25
20
15
10
1976
1975
1974
1973
1972
1971
1970
1969
1968
1967
1966
1965
1964
1963
1962
1961
1960
1959
1958
1957
1956
1955
1954
1953
1952
1951
1950
1949
1948
1947
1946
1945
1944
1943
1942
1941
Tiempo (aos)
Figura 2. Grfica de evolucin temporal

Tabla 2. Valores anuales de precipitacin en un pluvimetro A.
En el caso anterior se ha dibujado una serie anual de 36 datos por lo que hay espacio
suficiente para poder contemplar las propiedades generales de la serie. Si se dispone de
una serie mensual con un mayor nmero de datos, se puede, bien utilizar los datos
anuales para obtener conclusiones desde la escala superior o bien, utilizar una o varias
grficas, dividiendo el dominio en varios tramos a costa de impedir la visin general.
800
700
600
500
400
300
200
100
ene-00
ene-97
ene-94
ene-91
ene-88
ene-85
ene-82
ene-79
ene-76
ene-73
ene-70
ene-67
ene-64
ene-61
ene-58
ene-55
ene-52
ene-49
ene-46
ene-43
ene-40
ene-37
ene-34
ene-31
ene-28
Figura 3. Serie mensual de precipitaciones
Cuando se dibuja una serie puede plantearse la posibilidad de utilizar alguna

transformacin de los datos, por ejemplo logartmica, til cuando hay valores extremos
43
que imponen una variabilidad dominante. La transformacin logartmica reduce la

variabilidad de los datos y destaca los valores ms bajos, pero no se pueden utilizar con
valores nulos en la serie.
1000
100
10
ene-00
ene-96
ene-92
ene-88
ene-84
ene-80
ene-76
ene-72
ene-68
ene-64
ene-60
ene-56
ene-52
ene-48
ene-44
ene-40
ene-36
ene-32
ene-28
Figura 4. Serie logartmica de precipitaciones mensuales
Las transformaciones se usan con tres objetivos (Hensel y Hirsch, 2002): reducir la
asimetra de las variables, linealizarlas o buscar la homocedasticidad, es decir, hacer de
la variabilidad en la variacin algo constante. Utilizando la informacin de estos dos
autores, las caractersticas de las principales transformaciones son:
Tipo de
transformacin
Utilizada para
x3
x2
x 3
log(x )
1
x
1
x2
Efecto sobre las variables
Reducir el sesgo
negativo
Reducir el sesgo
negativo
Reducir el sesgo
positivo
Reducir el sesgo
positivo
Reducir el sesgo
positivo
Reducir el sesgo
positivo
Comprime los valores bajos;

expande los valores altos
Comprime los valores bajos;
expande los valores altos
Expande los valores bajos;
comprime los valores altos
Reducir el sesgo
positivo

Reducir el sesgo
positivo

Tabla 3, Tipos de transformaciones
44
Comentarios
No se puede utilizar con datos

nulos.
nulos.
El signo preserva el orden de
las observaciones
nulos.
las observaciones
nulos.
las observaciones
Si la serie tiene muchos puntos, puede ser conveniente agregar los datos en valores o
elegir estadsticos que simplifiquen la serie. En el caso del ejemplo de la Figura 4, se
pueden agregar los datos en totales anuales. Para tener una primera idea de cules son
los movimientos que hay en la serie, se puede aadir una curva suavizada que destaque
adecuadamente los cambios en la serie. La Figura 5 incorpora una curva suavizada
obtenida a partir de una media mvil de 11 aos. Esta lnea suavizada permite
contemplar una oscilacin y definir las caractersticas de un periodo. La determinacin
de este tipo de curvas se tantea buscando describir adecuadamente la serie analizada.
1800
1600
1400
1200
1000
800
600
400
200
19
40
19 41
43
19 44
46
19 47
49
19 -50
52
19 53
55
19 56
58
19 59
61
-6
19 2
64
19 65
67
19 68
70
19 71
73
-7
19 4
76
19 77
79
19 80
82
19 -83
85
19 86
88
-8
19 9
91
19 92
94
19 95
97
-9
20 8
00
-0
1
Figura 5. Datos anuales de precipitacin y curva suavizada superpuesta
En resumen, se recomienda la utilizacin de transformaciones, divisiones del dominio

de los datos y el uso de estadsticos y agregaciones para ir destacando las caractersticas
ms importantes de la serie.
En el caso de que los datos se registren con cierta erraticidad, es recomendable
dibujarlos con grficos de puntos. A los puntos se les puede aadir una curva de
tendencia suavizada que destaque la evolucin de la serie. Es el caso aplicable a series
piezomtricas que no se registran de forma regular. El ajuste para ver la tendencia y
evolucin de la serie puede realizarse con medias mviles.
224,50
224,50
224,00
224,00
223,50
223,50
223,00
223,00
222,50
222,50
222,00
222,00
221,50
221,50
221,00
28/08/76
221,00
17/09/78
06/10/80
26/10/82
14/11/84
04/12/86
23/12/88
12/01/91
31/01/93
20/02/95
11/03/97
28/08/76
17/09/78
06/10/80
26/10/82
14/11/84
04/12/86
23/12/88
12/01/91
31/01/93
20/02/95
11/03/97
Figura 6. Niveles piezomtricos.
45
3.2.2
Asignacin de frecuencias
Ya aparece en los ejemplos anteriores y es una de las formas ms sencillas de describir

un conjunto de datos. Las frecuencias relativas se definen como el cociente entre el
nmero de veces que se observa un suceso y el nmero total de datos (Ec. 4). En
variables cualitativas se pueden posteriormente representar en un diagrama de Pareto,
clases frente a frecuencias, para identificar las frecuencias mximas, las mnimas o la
forma de la distribucin de frecuencias.
35
Frecuencia relativa (%)
30
25
20
15
10
Se
pt
ie
m
br
e
go
sto
io
Ju
l
io
Ju
n
M
ay
o
br
il
A
o
M
ar
z
o
Fe
br
er
En
er
o
br
e
iem
br
e
ov
ctu
N
ici
em
br
e
Figura 7. Diagrama de Pareto con una variable cualitativa
El grfico anterior se aplica tambin sobre variables cuantitativas. En el caso de

variables cuantitativas, hay que realizar una operacin previa de agrupamiento en
clases. Se ha de dividir el rango de la serie en intervalos discretos, contando el nmero
de medidas que se encuentran en cada uno de ellos y transformando stas en
porcentajes. Para determinar la amplitud y localizacin de los intervalos, se suelen
utilizar estadsticos como la media y desviacin tpica, etc., o fijar amplitudes
constantes en funcin del recorrido de la variable y del nmero de clases total, que el
usuario debe ir adaptando a cada situacin. Algunas reglas hacen depender el nmero de
clases del tamao de la muestra, n, como por ejemplo ent ( n ) ent ( 2 n ) y
ent (1 + 3,3 log n ) siendo ent la funcin parte entera. Convienen probar con diferente
nmero de clases (entre 5 y 20 est recomendado) hasta alcanzar la descripcin ms
clara. Tal como se puede comprobar, en el ejemplo de las precipitaciones anuales, con
un tamao de muestra de 36, se han tomado 8 clases de igual amplitud, 3, distribuidas
entre los valores mximo y mnimo. El resultado final se dibuja como un grfico de
barras denominado histograma de frecuencias (Tabla 4). Las hojas de clculo tienen
implementada la posibilidad del tanteo y ajuste de un histograma a un nmero de clases
con unos lmites definidos por el usuario.
46
Intervalo
Nmero de ocurrencias
Frecuencia observada
x < 17
5,6
Intervalo
Frecuencia observada
17 x < 20
20 x < 23
23 x < 26
26 x < 29
29 x < 32
32 x < 35
35 x
2
7
5
6
3
6
5
5,6
19,4
13,9
16,7
8,2
16,7
13,9
Frecuencia observada (%)
25
20
15
10
0
<17
17-20 20-23 23-26 26-29 29-32 32-35
> 35
Figura 8. Diagrama histograma de frecuencias

Tabla 4. Histograma de frecuencias
El proceso completo para la estimacin de un histograma de frecuencias puede

resumirse en la siguiente figura.
Redondeo
Tanteo del nmero

de clases
Definicin de los
lmites de clase
Estimacin de
frecuencias relativas
Figura 9. Agrupamiento y elaboracin de un histograma
Una vez elaborado el histograma de frecuencias se puede intentar contestar a las

siguientes preguntas:
1. La distribucin es simtrica o asimtrica respecto a los valores de mxima
frecuencia?
2. Qu variabilidad hay en la muestra?
3. Hay mezcla de distribuciones o mximos de frecuencia separados por clases
intermedias?
4. Existen truncamientos en la muestra o, por el contrario, la frecuencia de los
extremos se va reduciendo suavemente?
De la misma manera se pueden obtener las frecuencias acumuladas como aquellas que
representan el nmero de casos ocurridos con valor menor que cada uno de los umbrales
escogidos. La traduccin de estas frecuencias al concepto de probabilidades de
47
ocurrencia es inmediata: la probabilidad de que se recoja un valor menor a otro dado

coincide con la frecuencia acumulada correspondiente.
Intervalo
x < 17
x < 20
x < 23
x < 26
x < 29
x < 32
x < 35
x < 38
Frecuencia acumulada
2
4
11
16
22
25
31
36
5,6
11,2
30,6
44,5
61,2
69,4
86,1
100,0
100
Frecuencia acumulada (%)
90
80
70
60
50
40
30
20
10
> 35
32-35
29-32
26-29
23-26
20-23
17-20
< 17
Intervalos de precipitacin (mm)
Figura 10. Grfico de frecuencias acumuladas

Tabla 5. Histograma de frecuencias acumuladas
Es tambin usual utilizar frmulas que asignan una probabilidad de igualar o superar un
valor de la serie xm en funcin del orden m que ocupa en la misma. Es decir, asignan la
probabilidad a cada uno de los valores de la serie y no por intervalos. Para ello, se ha de
proceder a ordenar la serie de mayor a menor y aplicar una de las frmulas existentes
que, con carcter general, pueden expresarse en funcin de un parmetro b (Chow,
1994). Como se puede comprobar, estas frmulas corrigen la asignacin de
probabilidades a los extremos por otras ligeramente distintas, tal y como se puede
comprobar en el ejemplo donde se ha aplicado la formulacin de Gringorten:
P( X < x m ) = 1
mb
n +1 2b
Mtodo
Hazen
Chegodayev
Valor de b
0,5
0,3
Weibull
Blom
3/8
Tukey
1/3
Gringorten
0,44
Tabla 6. Frmulas no paramtricas de probabilidad
A partir de la asignacin de frecuencias y probabilidades realizada, puede ser de inters

comprobar en qu grado la muestra puede o no ajustarse a distribuciones de
48
probabilidad conocidas. Para este propsito se utilizan papeles probabilsticos como el

normal, logartmico normal, de Gumbel, etc. En ellos, las abscisas y ordenadas se han
escalado adecuadamente para linealizar la funcin de distribucin asociada. De esta
manera, si una muestra se ajusta a determinada funcin de distribucin, sus datos
aparecern alineados en la correspondiente grfica, facilitando la realizacin de
interpolaciones y extrapolaciones.
Serie de valores
P(X<xm)
Serie de valores
P(X<xm)
Gringorten, %
Gringorten, %
38
36
36
35
35
34
34
34
34
33
32
31
29
29
28
27
27
27
98
96
93
90
87
85
82
79
76
74
71
68
65
62
60
57
54
51
26
26
25
25
24
23
23
22
22
22
22
21
21
20
18
17
15
12
49
46
43
40
38
35
32
29
26
24
21
18
15
13
10
7
4
2
40
35
Precipitacin (mm)
30
25
20
15
10
5
0
0
20
40
60
80
100
120
Frecuencia acumulada (%)
Tabla 7. Asignacin de probabilidad de ocurrencia
49
40
100
35
Precipitacin (mm)
Precipitacin (mm)
30
25
20
15
10
10
5
1
0
-3
-2
-1
-3
-2
-1
Figura 11. Frecuencias en papel normal y logartmico normal.
Otra posibilidad de estudio de una muestra consiste en obtener resmenes numricos de

la misma. Son las medidas de localizacin, dispersin y forma:
3.2.3
Medidas de localizacin.
Son valores estadsticos que pretenden dar una idea de cul es el rango de valores
ocupado por la muestra y, en los casos de la media aritmtica, mediana y moda, de la
tendencia central de la distribucin:
3.2.3.1 Media aritmtica.
Es el equivalente al centro de gravedad de la muestra. Para calcularla se utiliza el
sumatorio sobre todos los valores de la muestra, n:
Ec. 49. Media aritmtica
n
mx =
i =1
xi
n
En la frmula anterior, el trmino 1/n es el peso asociado a cada valor xi y coincide con
su frecuencia. Cuando se disponga de datos discretos, la media puede calcularse
utilizando la frecuencia relativa de cada uno de ellos:
Ec. 50. Media para datos discretos
n
i =1
i =1
mx = xi f ( xi ) = xi
ni
n
Y cuando los datos estn agrupados en clases, se calcula tomando un valor central de
cada clase, mi:
Ec. 51. Media con datos agrupados en n clases
n
i =1
i =1
mx = mi f ( xi ) = mi
50
ni
n
Por tanto, la media aritmtica es muy sencilla de obtener, pero es sensible a valores
extremos con lo que puede dar una idea errnea del centro de la muestra cuando existen
valores extremos dispersos y distantes respecto al cuerpo central de la misma.
3.2.3.2 Mediana.
Es el valor tal que ordenada la muestra, deja a cada lado la mitad de observaciones. Es
decir, es el valor que presenta una probabilidad del 50%. Si el nmero total de datos en
la muestra es impar, coincidir con el que ocupa la posicin (n+1)/2, mientras que en
las muestras con un nmero de datos par, se puede obtener como la media de los valores
anterior y posterior al centro, (xn/2+x1+n/2)/2.
Al trabajar con rangos, esta medida filtra la sensibilidad a los valores de extremos. Se
tiene entonces una medida robusta de la tendencia central. Adems, las diferencias entre
media y mediana describen la asimetra de la muestra. Con muestras simtricas,
tendern a dar valores similares, mientras que cuanto ms asimtrica sea una
distribucin de valores, ms diferirn sus valores.
3.2.3.3 Moda.
Es el valor que se presenta con mayor frecuencia. Como la mediana es ms robusta ante
la presencia de valores extremos, pero su estimacin se dificulta con variables continuas
para las que hay que definir los intervalos en los que agrupar los datos. Su utilidad es
mayor cuando se trabaja con variables discretas.
3.2.3.4 Valores mximos y mnimos registrados.
3.2.3.5 Primer y tercer cuartiles.
Los cuartiles son valores representativos de la divisin en cuartos del rango de
frecuencias. Es decir, son los valores que tienen una probabilidad de ocurrencia del 25%
(primer cuartil) y 75% (cuartil superior).
51
Funcin de densidad
50%
50%
25%
25%
modax ax
mx
Valores de x
Figura 12. Media aritmtica, mediana, moda y cuartiles
3.2.3.6 Deciles, percentiles y cuantiles.

De la misma forma que en el caso anterior representan la divisin en 10, 100 y cualquier
fraccin del rango de frecuencias respectivamente.
3.2.4
Medidas de dispersin.
Son variables para describir la variabilidad de la muestra respecto a la tendencia central:

3.2.4.1 Varianza, sx2, y desviacin tpica, sx.
Definidas por medio del sumatorio del cuadrado de las distancias de cada valor de la
serie respecto a la media. En el caso de la desviacin tpica se calcula la raz cuadrada
de la varianza para obtener unidades comparables a los estadsticos de tendencia central
Ec. 52. Varianza y desviacin tpica
n
s x2 =
i =1
( xi m x ) 2
n
sx =
( xi m x ) 2
n
i =1
n
Como en el caso de las medias, cuando los datos estn agrupados se pueden aplicar las
siguientes frmulas:
Ec. 53. Desviacin tpica con datos agrupados en n clases
sx =
(mi mx )2 f ( xi ) =
i =1
52
ni
(m m ) n
2
i =1
Ambas, como en el caso de la media aritmtica y, si cabe, an ms al manejar

diferencias elevadas al cuadrado, son sensibles a la presencia de valores errticos, por lo
que pueden resultar medidas inadecuadas en esos casos.
A partir de ellas tambin se define el coeficiente de variacin como el valor relativo de
la desviacin tpica respecto a la media
Ec. 54. Coeficiente de variacin
CV =
sx
mx
Coeficientes de variacin superiores a uno nos indicarn la posible existencia de valores

extremos altos, mientras que coeficientes de variacin ms reducidos indicarn cierta
concentracin alrededor de la media.
La desigualdad de Tchebychev expresa que entre la media y un nmero k veces la
desviacin tpica existe, como mnimo, el
1
1001 2 %
k
de las observaciones (Pea, 2000).
Ec. 55. Desigualdad de Tchebychev
f ( xi m x k s x ) 1
1
k2
Demostracin: se basa en seleccionar las observaciones que estn a una distancia respecto a
la media mayor que ksx de las que estn a menos distancia y aplicar la definicin de
varianza:
( xi m x ) 2
( xi m x ) 2
( xi m x ) 2
( xi m x ) 2
=
+
n
n
n
n
i : x i m x > k s x
i : xi m x k s x
i : x i m x > k s x
I =1
2
2
2 2
xi m x > k s x ( xi m x ) > k 2 s x2
(
x
m
)
>
n
s
i x
i
x
i : xi m x > k s x
s x2 =
s x2
( xi m x ) 2
1
> k 2 s x2 f ( xi m x > k s x ) f ( xi m x > k s ) < 2
n
k
i : x i m x > k s x
f ( x i m x k s ) 1
1
k2
De lo que se sigue que entre la media y dos desviaciones tpicas estn al menos el 75% de las
observaciones; y entre la media y 3 desviaciones tpicas, el 89%.
53
3.2.4.2 Rango intercuartlico

Definido como la diferencia entre el tercer y primer cuartil, trabajando nicamente con
el cuerpo de valores que abarca el 50% de las frecuencias. Al evitar la dependencia
respecto a la media, puede lograr medidas consistentes de la dispersin cuando la
muestra presente extremos.
Ec. 56. Rango intercuartlico
IQR = Q3 Q1
3.2.4.3 Mediana de las desviaciones absolutas
Tampoco se ve afectada por los valores extremos de las desviaciones respecto a la
media. Se calcula como la mediana de las desviaciones absolutas respecto a la mediana.
Ec. 57. MEDA
MEDA = mediana xi a x
3.2.5
Medidas de forma de la distribucin de valores.
3.2.5.1 Coeficiente de sesgo.

Es til para describir la simetra/asimetra de la distribucin alrededor de la media. Su
expresin matemtica responde a la siguiente expresin:
Ec. 58. Coeficiente de sesgo
CS =
1 n ( xi m x ) 3
n i =1
3
Un valor positivo del coeficiente de sesgo indicar la existencia de una cola con valores
superiores a la media y, al contrario, un valor negativo, la existencia de una cola con
valores inferiores a la media. En caso de existir una simetra alrededor de la media, el
coeficiente de sesgo tendr valor nulo. Como desventaja hay que citar la elevada
sensibilidad de este estadstico a la presencia de valores extremos y al escaso nmero de
datos.
54
Funcin de densidad
Valores de x
mx
Figura 13. Signos coeficiente de sesgo y forma de la funcin de densidad
3.2.5.2 Coeficiente de sesgo cuartlico.

Y finalmente, para eliminar la sensibilidad a la presencia de valores extremos, se puede
optar por una medida ms resistente que la anterior, funcin de los cuartiles, mediana y
rango intercuartlico. El coeficiente de sesgo cuartlico conserva el criterio de signos
anterior, con signo positivo para las distribuciones con cola hacia la derecha y el
negativo, al contrario.
Ec. 59. Coeficiente de sesgo cuartlico
CSQ =
3.2.6
(Q3 a ) (Q1 a )
IRQ
Tabla de estadsticos
En el ejemplo escogido se tendran los siguientes parmetros:

Media aritmtica
Mediana
27
26
Tercer cuartil
Varianza
33
42,4
Moda
22
Desviacin tpica
6,5
Mximo
38
Coeficiente de variacin
0,24
Mnimo
12
Rango intercuartlico
11
Primer cuartil
22
Coeficiente de sesgo
-0,19
Tabla 8. Estadsticos de la estacin pluviomtrica
3.2.7
Grfico caja
Con estas variables se pueden construir los denominados grficos en caja donde
aparecen de forma ms intuitiva las caractersticas mencionadas anteriormente a
propsito de la localizacin, tendencia central, existencia de valores errticos,
dispersin y forma. Para ello se indica sobre un eje convenientemente escalado entre los
valores mximo y mnimo, la posicin de la media aritmtica m y mediana a, los dos
cuartiles y para los casos de distribuciones normales, las denominadas vallas inferior y
superior, utilizadas como referencia de valores anmalos (outliers) que hay que estudiar
con especial detenimiento. Sus expresiones son:
55
Ec. 60. Expresin de las vallas
3
Vi = Q1 IQR
4
3
Vs = Q3 + IQR
4
El grfico en caja parece indicar la existencia de una cola hacia los valores mnimos. En
este mismo sentido se manifiesta el coeficiente de sesgo o asimetra, negativo, aunque
posiblemente manifieste cierta la sensibilidad a los valores extremos bajos.
Figura 14. Grfico en caja
3.3
ANLISIS BIVARIADO
El estudio de las relaciones entre dos series de valores facilita y ampla el conocimiento
de fenmenos que en el apartado anterior solo se contemplaban unilateralmente. Este
nuevo terreno es el del anlisis bivariado y la extensin a ms de dos variables el
multivariado.
Como en el caso anterior, el primer paso consiste en la organizacin de los datos en
tablas. Estas tablas se pueden acompaar de los estadsticos obtenidos mediante un
anlisis univariado de cada una de las variables. La comparacin permite empezar a
extraer consecuencias.
Parmetros estadsticos
Media aritmtica
Mediana
Pluvimetro A Pluvimetro B
27
29
26
28
Moda
22
23
Mximo
38
39
Mnimo
12
23
Primer cuartil
22
25
Tercer cuartil
33
32
42,4
24,9
Varianza
Desviacin tpica
6,5
5,0
0,24
0,17
Rango intercuartlico
11
7,50
Coeficiente de sesgo
-0,19
0,53
Coeficiente de variacin
Tabla 9. Estadsticos descriptivos de las series de lluvia registrada
Tambin las frecuencias pueden compararse mediante tablas o con ayuda de grficos
buscando comprobar si hay o no concordancia entre las series. La Tabla 10 compara las
frecuencias asignadas a series de mximos de precipitacin y caudales en funcin de su
estacionalidad.
Mes
N mximos
anuales de
precipitacin
N caudales
mximos
anuales
56
Oct
12
Nov
7
Dic
5
Ene
2
Feb
0
Mar
3
Abr
3
May
1
Jun
0
11
Jul
0
Ago
0
Sep TOTAL
3
36
44
Mes
Oct
Nov
Dic
Ene
Feb
Mar
Abr
May
Jun
Jul
Ago
Sep
TOTAL
35
Frecuencia relativa (%)
30
25
20
15
10
5
io
Ju
l
go
sto
Se
pt
ie
m
br
e
Ju
ni
o
A
br
il
M
ay
o
ctu
br
N
e
ov
ie
m
br
e
D
ici
em
br
e
En
er
o
Fe
br
er
o
M
ar
zo
Figura 15. Grfico de barras comparando las frecuencias de dos variables

Tabla 10. Comparacin de frecuencias relativas de caudales y precipitaciones mximas
En el caso de manejar dos series temporales, una posibilidad sencilla consiste en

organizar los datos en tablas donde se ordenen los datos contemporneos segn su
sucesin. En el ejemplo mostrado se comprueba que la mayor dispersin se da en el
primer pluvimetro, que alcanza valores menores durante el primer periodo.
Ao 1941
Pluvimetro A
31
(mm)
Pluvimetro B
34
(mm)
Ao 1959
Pluvimetro A
34
(mm)
Pluvimetro B
31
(mm)
1942
20
1943
21
1944
23
1945
22
1946
21
1947
29
1948
34
1949
22
1950
17
1951
22
1952
38
1953
18
1954
15
1955
12
1956
33
1957
22
1958
27
28
32
28
31
23
35
30
27
27
28
36
28
25
24
39
23
36
1960
29
1961
32
1962
26
1963
35
1964
34
1965
25
1966
27
1967
27
1968
28
1969
36
1970
23
1971
34
1972
26
1973
35
1974
36
1975
25
1976
24
23
23
23
33
26
25
28
29
23
37
23
35
28
30
39
23
26
40
Precipitacin (mm)
35
30
25
20
Pluvimetro A
15
Pluvimetro B
10
1940
1945
1950
1955
1960
1965
1970
1975
Figura 16. Grfica e evolucin temporal con dos series

Tabla 11. Evolucin de las series pluviomtricas registradas en los pluvimetros A y B.
Siempre que sea posible se deben comparar series registradas en distintos puntos con
cierta proximidad geogrfica. Esto facilita y da consistencia a la identificacin de
patrones comunes. Y al contrario, tambin permite la deteccin de errores. La
comparacin de varias series se puede realizar con varias grficas temporales, con las
mismas escala en abscisas y ordenadas. Cuando los valores de las series sean
57
sustancialmente distintos, se puede recurrir a la estandarizacin de los valores, por

ejemplo, utilizando la normalizacin clsica. Siguen siendo vlidas las mismas
recomendaciones citadas con el anlisis univariado, es decir, utilizacin de curvas
suavizadas que den una idea de las fluctuaciones de las series, la agregacin o el uso de
estadsticos cuando se tengan numerosos datos, la divisin del dominio temporal para
mejorar la visualizacin y el uso de transformaciones.
En la siguiente figura se muestra un ejemplo de niveles piezomtricos en cuatro puntos
cercanos. Aparecen tendencias similares en los cuatro piezmetros, con rectas de
regresin cuasi-horizontales excepto en el ltimo caso. Haber utilizado la misma escala
permite obtener una idea de la distinta localizacin y variabilidad de cada fenmeno en
cada piezmetro. Evidentemente, esta informacin ofrecida por las cuatro grficas tiene
que ser completada con el conocimiento de la zona, del acufero, de las acciones sobre
el mismo y de su localizacin relativa.
226,00
226,00
224,00
224,00
222,00
222,00
220,00
220,00
218,00
218,00
216,00
216,00
214,00
214,00
212,00
212,00
210,00
210,00
28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997
28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997
226,00
226,00
224,00
224,00
222,00
222,00
220,00
220,00
218,00
218,00
216,00
216,00
214,00
214,00
212,00
212,00
210,00
210,00
28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997
28/08/1976 17/09/1978 06/10/1980 26/10/1982 14/11/1984 04/12/1986 23/12/1988 12/01/1991 31/01/1993 20/02/1995 11/03/1997
Figura 17. Ejemplo de niveles piezomtricos
3.3.1
Distribuciones conjuntas de frecuencia
En el caso univariado se calculan las frecuencias relativas de los sucesos mediante el

cociente entre casos favorables y totales. Cuando se contempla la distribucin de dos
variables, los casos favorables hacen referencia al cumplimiento de las dos condiciones
referidas a cada una de las variables. En una tabla de contingencia (variables
cualitativas) o en una tabla de distribucin conjunta de frecuencia (variables
cuantitativas) se ordenan todas estas frecuencias. En el caso de considerar como
variables la estacionalidad de las precipitaciones mximas anuales y de los caudales
58
mximos instantneos anuales (Tabla 12), en las filas y columnas se tendrn cada uno
de los meses considerados (clases de cada variable) y en cada cuadrcula de la matriz, la
frecuencia relativa calculada como cociente del nmero de casos en los que se dan a la
vez precipitaciones mximas y caudales mximos de cada combinacin de meses entre
el total de meses. La interpretacin de estos resultados tiene que hacer referencia a la
similitud existente en la estacionalidad del fenmeno.
caudales
oct
oct
nov
dic
ene
feb
mar
abr
may
jun
jul
ago
sep
nov
dic
ene
feb
precipitaciones
mar
abr
may
jun
jul
ago
sep
21%
0%
0%
3%
3%
0%
0%
0%
0%
0%
3%
0%
0%
14%
3%
3%
0%
0%
0%
0%
0%
0%
0%
0%
3%
0%
3%
0%
0%
3%
0%
0%
0%
0%
0%
0%
0%
0%
3%
3%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
3%
0%
0%
0%
7%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
3%
3%
3%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
3%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
7%
31%
21%
10%
7%
0%
10%
10%
3%
0%
0%
0%
7%
24%
17%
10%
10%
3%
14%
3%
3%
0%
0%
3%
10%
Tabla 12. Tabla de contingencia de las variables precipitacin mxima, caudal mximo.
25%
20%
15%
10%
5%
sep
ago
jul
jun
may
abr
mar
feb
ene
dic
nov
oct
0%
oct nov
dic ene
feb mar
abr may
jun
jul ago
sep
Figura 18. Distribucin conjunta de las variables estacionalidad
La distribucin conjunta de las dos variables expresada en la tabla anterior sirve para
definir la distribucin marginal de cada una de las variables. Esta distribucin marginal
expresa las frecuencias de una de las variables independientemente de la ocurrencia o
no de la segunda variable. Como se expresa en la tabla anterior, estas distribuciones
marginales se pueden calcular por suma de las frecuencias correspondientes a la
variabilidad de la segunda variable en cada clase de la primera. Es decir,:
59
Ec. 61. Distribuciones marginales

m
j =1
i =1
f ( xi ) = f ( xi , y j ) f ( y j ) = f ( xi , y j )
As, en la ltima fila de la Tabla 12 se tiene la distribucin marginal de la estacionalidad
de las precipitaciones mximas; y en la ltima columna, la distribucin marginal de la
estacionalidad de los caudales mximos.
La distribucin condicional ser expresin de las frecuencias correspondientes a una
variable supuesto el cumplimiento de una clase de la segunda:
Ec. 62. Distribucin condicional
f ( y j xi ) =
f ( xi , y j )
f ( xi )
Por tanto, supuesta una precipitacin mxima en octubre, las correspondientes

frecuencias condicionadas sern las que aparecen en la siguiente tabla.
Mes Probabilidad condicional
P/PMAX(OCT)
67%
oct
0%
nov
0%
dic
11%
ene
11%
feb
0%
mar
0%
abr
0%
may
0%
jun
0%
jul
11%
ago
0%
sep
Clculo
=0,21/0,31
=0,03/0,31
=0,03/0,31
=0,03/0,31
Tabla 13. Probabilidad condicional
3.3.2
Comparacin de cuantiles
Un grfico interesante es el que compara cuantiles de las distribuciones de frecuencias

de ambas series. Representando las parejas de puntos correspondientes a cada uno de
ellos se obtienen grficas del siguiente tipo:
60
Cuantil
(%)
c0
c5
Pluvimetro A (mm)
12
17
Pluvimetro B (mm)
23
23
c10
19
23
c15
21
23
40
c20
22
23
35
c25
22
25
c30
23
26
c35
23
26
c40
25
27
c45
26
28
c50
26
28
c55
27
28
c60
28
29
c65
29
30
c70
32
31
c75
33
32
c80
34
34
c85
34
35
c90
35
36
c95
36
38
c100
38
39
Comparacin de cuantiles
Pluvimetro B
45
30
25
20
15
10
10
15
20
25
30
35
40
45
Pluvimetro A
Figura 19. Comparacin de cuantiles
Tabla 14. Comparacin de cuantiles
Si los puntos se alinean sobre la recta x=y, se puede deducir que las dos series siguen
idntica funcin de distribucin. Si el alineamiento sigue otra recta cualquiera, se
deduce la existencia de una funcin de distribucin similar, pero con distintos
parmetros estadsticos. En otros casos expresar la relacin no lineal entre las
distribuciones de ambas series.
3.3.3
Diagrama de dispersin
La forma de representacin ms usual es el denominado diagrama de dispersin.

Dibujando las parejas de puntos muestrales, se puede contemplar cualitativamente qu
tipo de correspondencias o correlaciones se pueden establecer entre las variables,
adems de destacar puntos errticos que puedan deberse a errores durante el proceso de
medicin.
61
Diagrama de dispersin
45
Pluvimetro B (mm)
40
35
30
25
20
15
10
10
15
20
25
30
35
40
45
Pluvimetro A (mm)
Figura 20. Dispersin entre los datos de los pluvimetros A y B.
Con carcter general, las correlaciones entre variables pueden ser positivas, negativas o
inexistentes. Dos variables estn positivamente correlacionadas cuando a los valores
altos de una corresponden valores altos en la segunda, y a los valores bajos de una, los
valores bajos de la segunda. Cuando la correlacin es negativa, a los valores altos de
una, corresponden los valores bajos en la otra. Por ltimo, las variables no estarn
correlacionadas cuando no se pueden estimar tendencias como las anteriores.
Los diagramas de dispersin se pueden utilizar de mltiples maneras para ver diferentes
correlaciones con diferentes variables. En el siguiente ejemplo se muestran las
dispersiones entre distintas series de tres en tres, lo que permite comparar las distintas
correlaciones.
Figura 21. Diagramas de dispersin mltiples entre diferentes variables.
3.3.4
Coeficientes de correlacin simple: Pearson y Spearman
Un indicador del grado de ajuste de las variables es el coeficiente de correlacin simple

de Pearson, definido como el cociente entre la covarianza y las desviaciones tpicas de
las variables:
62
Ec. 63. Coeficiente de correlacin de Pearson

n
rxy =
( x i m x ) ( yi m y )
n
i =1
x y
El numerador o covarianza entre x e y refleja el sentido de las correlaciones, positiva o

negativa, anteriormente especificadas, creciendo en valor absoluto cuando la
correspondencia entre las variables es mayor. Al dividirla por las desviaciones tpicas,
los valores que puede adoptar el coeficiente de correlacin pasan a pertenecer al
intervalo [-1,1]. Cuando el valor de rxy es +1, el diagrama de dispersin estar alineado
segn una recta de pendiente positiva y si el valor de rxy es 1, las series seguirn una
recta de pendiente negativa, con el resto de casos comprendidos entre estos dos
extremos. Un valor nulo indicar independencia entre las variables.
Hay que advertir que el coeficiente de correlacin de Pearson es sensible a los valores
extremos de las series. Pueden conseguirse altos coeficientes de correlacin cuando los
extremos marcan una tendencia alineada y, al contrario, tambin pueden ocultar una
buena alineacin del cuerpo central del diagrama de dispersin cuando estos extremos
con valores altos se localizan errticamente. Para poder llegar a mejores conclusiones se
recomienda combinar este coeficiente con otras medidas de asociacin como el
coeficiente de correlacin de Spearman. La expresin matemtica de este es similar a la
anterior, pero en vez de manejar los valores de las series, se introduce el orden o rango
que ocupan estos en las mismas ordenadas de menor a mayor, siendo el rango del menor
valor, 1, y el del mximo valor, n:
Ec. 64. Coeficiente de Spearman
n
rRxy =
( R xi mRx ) ( Ryi mRy )

n
i =1
Rx Ry
As definido este nuevo coeficiente de Spearman no es sensible a los valores extremos.

Adems, informa sobre el carcter montono de la relacin, dando valores positivos de
rRxy cuando la correspondencia sea creciente y negativos cuando sea decreciente, pero
sin estar influido por la posible linealidad que sigan las variables. En el ejemplo, se han
calculado unos coeficientes de Pearson y Spearman de 0,57 y 0,50 respectivamente
teniendo en cuenta que a los grupos de rangos idnticos se les asocia el rango
intermedio correspondiente:
Ao
1941
1942
Rangos en el
pluvimetro A (mm)
25,0
5,0
1943
7,0
1944
12,0
1945
8,5
Rangos en el
pluvimetro B (mm)
Ao
Rangos en el
pluvimetro A (mm)
Rangos en el
pluvimetro B (mm)
29,0 1959
18,5 1960
27,0 1961
28,5
24,0
25,5
4,5
26,0
4,5
18,5 1962
25,5 1963
17,0
4,5
32,5
28,0
28,5
12,5
16,0
10,5
20,5
18,5
19,0
22,0
1946
6,0
1947
23,0
1948
30,5
4,5 1964
30,5 1965
23,5 1966
1949
10,0
14,5 1967
63
Ao
Rangos en el
pluvimetro A (mm)
Rangos en el
pluvimetro B (mm)
1950
1951
3,0
8,5
1952
36,0
1953
4,0
1954
2,0
1955
1,0
1956
27,0
1957
11,0
1958
20,5
Ao
Rangos en el
pluvimetro A (mm)
Rangos en el
pluvimetro B (mm)
14,5 1968
18,5 1969
32,5 1970
22,0
34,0
4,5
34,0
13,0
4,5
18,5 1971
10,5 1972
30,5
30,5
18,0
18,5
9,0 1973
35,5 1974
32,5
23,5
35,0
35,5
4,5 1975
32,5 1976
15,0
4,5
14,0
12,5
Tabla 15. Deduccin de los rangos de las series pluviomtricas
Al tratar con series temporales se pueden calcular coeficientes de correlacin de una

serie consigo misma adoptando un desfase temporal entre los trminos. Se definen
entonces los coeficientes de autocorrelacin, dependientes del paso temporal escogido
en cada paso. Un correlograma ser la expresin grfica de los valores del coeficiente
de autocorrelacin cuando se van considerando sucesivos desfases temporales (k=1, 2,
3, etc.). En la figura siguiente se muestra un correlograma de una serie hidrolgica en el
que se ve cmo se va perdiendo informacin a medida que aumenta el paso, desfase
mensual, de clculo.
1,00
coeficiente de autocorrelacin
0,80
0,60
0,40
0,20
0,00
-0,20
-0,40
0
10
11
12
13
14
m eses
Figura 22. Correlograma
3.3.5
El mtodo de las dobles acumulaciones
El mtodo de las dobles acumulaciones es una tcnica sencilla cuyo objetivo es valorar
la consistencia de una serie temporal en funcin de otra serie de referencia. Para su
aplicacin se toman las dos series de datos durante el periodo comn de registro,
comparndose en un diagrama x, y sus series acumuladas. Si la relacin entre las dos
series se ha mantenido estable, es decir, a los incrementos de una corresponden los
proporcionales en la de referencia, la representacin mostrar una tendencia lineal. En
caso contrario, la presencia de quiebros y saltos indica cambios en la relacin entre las
series de datos.
64
Ao
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
Estacin
pluviomtrica
A
(mm)
Serie
acumulada
estacin A
(mm)
36
25
26
28
27
26
34
39
27
22
27
43
23
20
22
33
27
27
36
62
87
115
142
168
202
240
268
290
317
360
384
403
425
458
485
513
Serie
Serie
pluviomacumulada
trica
de (mm)
referencia
(mm)
34
28
32
28
31
23
35
30
27
27
28
36
28
25
24
39
23
36
34
62
94
122
153
176
211
241
268
295
323
359
387
412
436
475
498
534
Ao
Estacin
pluviomtrica
A
(mm)
Serie
acumulada
estacin A
(mm)
34
29
32
26
35
34
25
27
27
28
36
23
34
26
35
36
25
24
546
575
607
633
667
701
726
754
780
808
844
867
901
926
961
997
1021
1045
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
Serie
Serie
pluviomacumulada
trica
de (mm)
referencia
(mm)
31
23
23
23
33
26
25
28
29
23
37
23
35
28
30
39
23
26
565
588
611
634
667
693
718
746
775
798
835
858
893
921
951
990
1013
1039
Tabla 16. Series pluviomtricas acumuladas en las estaciones A y B

1200
1000
800
600
400
200
0
0
200
400
600
800
1000
1200
Figura 23. Aplicacin del mtodo de las dobles acumulaciones
Los quiebros en la pendiente reflejan inconsistencias sistemticas y cambios en las

condiciones de medicin, instrumentacin, etc. Los saltos y escalones entre rectas de la
misma pendiente se deben a errores accidentales como los debidos a lecturas errneas,
fallos en los medidores, etc. Un caso que suele aparecer con frecuencia es la presencia
de quiebros, entre pendientes inicial y final paralelas que puede corresponder a cambios
65
temporales en la localizacin del medidor, que registra durante el periodo intermedio un

fenmeno proporcionalmente diferente respecto a la estacin de referencia.
1200
1200
1000
1000
800
800
600
600
400
400
200
200
0
0
200
400
600
800
1000
1200
200
400
600
800
1000
1200
Figura 24. Deteccin de inconsistencias en dobles acumulaciones
Para evitar falsas interpretaciones respecto a los cambios de pendiente y la aleatoriedad

propia de los datos, se deben considerar cambios que afecten a un grupo significativo de
puntos, unos cinco como mnimo. Se recomienda trabajar con una escala temporal
mnima consistente que en el caso de las precipitaciones es del mes, ya que la
erraticidad de los datos a escalas menores puede ocultar las tendencias entre las
estaciones. Adems, con series temporales de datos que presenten cambios estacionales
muy pronunciados, es conveniente desglosar la aplicacin del mtodo a las series
obtenidas en cada estacin climtica, trabajando con series obtenidas por ejemplo de los
eneros, etc.
Existen mtodos para mejorar la seleccin de los puntos de quiebro de las dobles
acumulaciones. Un mtodo que aparece en la bibliografa consultada (Allen et al., 1998)
es el siguiente:
-
Hallar la recta de regresin de los datos acumulados de la estacin Yi en

funcin de los de la de referencia Xi
xi =
yi =
j: j i
j: j i
y est _ i = b xi
Calcular los residuos en funcin de la recta de regresin hallada
i = y i b xi
-
66
Representar la serie de residuos en un grfico donde se pueda contemplar su

evolucin. Si sta aparece errtica, se tendr homogeneidad entre las series.
En caso contrario, cuando aparezca una evolucin definida, se tendr una
relacin inconsistente. Los cambios en la tendencia de los residuos indican
los momentos de quiebro buscados
90
80
70
60
50
40
30
20
10
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978
Figura 25. Chequeo del cambio de tendencia
Una vez se ha identificado la fuente de error, se puede homogeneizar la serie estudiada

respecto a la de referencia. Para ello, se utilizan los resultados de las dobles
acumulaciones. Siendo c la nueva pendiente a la que se va a ajustar la serie estudiada
en el periodo a corregir, r la pendiente a la que se ajustan las dobles acumulaciones en
el mismo periodo y Pr los valores originales a corregir, los nuevos Pc se obtienen
aplicando la frmula siguiente:
Ec. 65. Correccin de las heterogeneidades
Pc =
c
P
r r
Normalmente, la serie de referencia se obtiene de la media de un grupo representativo

del periodo, admitiendo la hiptesis de que la serie de las medias de un grupo de
registros, es poco sensible a los cambios en los registros individuales debido a la
compensacin de errores entre estos. Por tanto, para analizar la heterogeneidad en los
registros, por ejemplo de un pluvimetro en particular, se tomaran otros de la misma
regin climtica y se obtendra una serie de referencia media a partir de datos
contemporneos.
Este grupo debe estar constituido por un nmero suficiente de estaciones con series de
registros de comportamiento en media similar y cierta continuidad temporal. La serie
media queda desvirtuada si alguna de estas series tuviera un peso pronunciado sobre las
dems o si solo se dispusiera de un nmero reducido de estaciones pluviomtricas, ya
que surgirn dudas acerca de su consistencia.
Por ejemplo, en el caso del anlisis de series pluviomtricas, se forma una serie de
referencia a partir de un grupo lo ms numeroso posible de estaciones, atendiendo a
caractersticas climticas uniformes y factores que puedan ser de utilidad como la
distancia y diferencia de altitud entre estaciones, exposicin a los frentes hmedos, etc.
67
Tambin pueden ser de utilidad criterios basados en parmetros estadsticos como la

media y desviacin tpica, recomendndose que entre las estaciones del grupo no se
superen diferencias en media entre el 10% y 15%.
La aplicacin de las dobles acumulaciones a series de caudales conlleva la aparicin de
problemas particulares relativos al funcionamiento hidrolgico de las cuencas. Con
carcter general, hay que considerar la disposicin de la red hidrogrfica, que determina
la eleccin de la serie ms consistente, tericamente la de aguas abajo, con una mayor
agregacin de caudales y compensacin de errores. As, se pueden detectar, aparte de
los cambios en los sistemas de medicin y errores accidentales ya mencionados,
derivaciones de caudales, alteraciones y fugas.
3.4
3.4.1
COMPONENTES EN LAS SERIES TEMPORALES

Tendencias, ciclos y estaciones
Se define una serie temporal como la coleccin ordenada de datos registrados a

intervalos regulares de una variable, destacando la importancia dada al intervalo de
medida seleccionado y al orden en que se registran. En funcin del intervalo temporal
escogido, en la serie temporal aparecen distintos tipos de movimientos o fluctuaciones,
crecientes o decrecientes, de carcter sistemtico o estocstico. Por ejemplo, si se est
tratando con una serie de temperaturas a escala horaria, aparecen como mnimo los
ciclos diarios con una evolucin de temperaturas desde las mnimas alcanzadas durante
la noche y las mximas dadas al medioda. Si esta serie se trata desde una escala
mensual, aparecer como mnimo el ciclo estacional. Desde el punto de vista
hidrolgico interesa conocer cmo identificar y manejar las fluctuaciones e ir filtrando
estas fuentes de variacin de las series originales para facilitar el conocimiento del
estado hidrolgico.
Desde la escala temporal superior se distingue en primer lugar la tendencia suave,
montona e indiferente de otros movimientos crecientes o decrecientes, similar a la que
pueden dar polinomios de grado bajo. Para poder apreciar esta componente son
necesarias series lo suficientemente largas, i.e. un nmero grande de aos con datos, que
comprendan al menos 2 3 ciclos o fluctuaciones de orden inmediatamente inferior.
Cuando la disponibilidad de datos de las series es menor, estas tendencias se asocian a
cambios bruscos en las condiciones.
68
Figura 26. Serie anual de datos de lluvia y tendencia lineal
Para ajustar la tendencia persistente se pueden utilizar varios modelos. Lo ms simple es

recurrir a la representacin de una tendencia lineal utilizando, por ejemplo, mnimos
cuadrados. En la literatura econmica se encuentran otras opciones como es la
utilizacin de una curva logstica. Este tipo de curvas da una tendencia curva en S. Se
representan utilizando una tasa de crecimiento o decrecimiento constante de la
pendiente en papel logartmico. Siendo t la variable tiempo y a, b y c parmetros
Ec. 66. Expresiones asociadas a la deteccin de tendencias
lineal : y = at + b
polinmica : y = a + bt + ct 2
exp onencial : y = ae bt
potencial : y = at b
log stica : y =
a
1 + e b t
La identificacin de estas tendencias montonas en hidrologa est dificultada por la

longitud y presencia de lagunas en las series adems de la presencia de episodios
extremos como las crecidas y su influencia en la estimacin de los parmetros de las
expresiones anteriores.
Las fluctuaciones y ciclos plurianuales tienen el inconveniente de la falta de una
frecuencia constante, lo que dificulta su manejo. Por esto, las tcnicas grficas son
bsicas al permitir explorar el carcter de las series. Para destacar los ciclos se pueden
emplear medias mviles o curvas de desviaciones respecto a la media acumuladas.
En las desviaciones acumuladas se representan como serie temporal los valores
acumulados de las desviaciones respecto a la media o los valores acumulados de estas
desviaciones estandarizadas por la media. Se maneja as informacin sobre el carcter,
hmedo o seco del ciclo en funcin del signo de la desviacin.
Ec. 67. Desviaciones acumuladas y unitarias acumuladas
yi =
(x
j: j i
yi =
j : j i
(x
69
Figura 27. Desviaciones unitarias acumuladas (%) y precipitaciones anuales
Las medias mviles se calculan utilizando los datos adyacentes a uno dado con una
ponderacin adecuada. Siendo m el orden de la media mvil y utilizando como ndice i,
con recorrido total de m valores, distribuidos, mitad y mitad, entre anteriores y
posteriores, la estimacin centrada de la media mvil es:
Ec. 68. Medias mviles
yi =
i
j(i ,i + k 1)
yi = i xi
i =1
Los pesos asociados a los valores intervinientes en una media mvil suelen ser
decrecientes conforme aumenta la distancia al punto central o iguales a la inversa del
total de valores utilizados, que es el caso de la media aritmtica. Por otro lado, a medida
que el orden de la media mvil es mayor, ms suavizada ser la curva finalmente
obtenida y mayor ser la componente de fluctuacin cclica filtrada. Esto puede ser
interesante si lo que se intenta es filtrar conjuntamente el ciclo y la componente de
tendencia.
Al no tener los ciclos una frecuencia fija se ha de trabajar con datos anuales, medias
anuales o medias mviles sobre un ao completo, 12 meses que filtren el efecto
estacional, o mltiplos enteros de ese ciclo bajo la hiptesis de que los residuos no
tendrn componentes con autocorrelacin y que la media de varios datos eliminar las
fluctuaciones aleatorias. Por ejemplo, se pueden utilizar medias calculadas desde el
inicio del ciclo hidrolgico durante cada doce meses.
70
350
300
250
200
150
100
50
oc
t -8
0
oc
t -8
1
oc
t -8
2
oc
t -8
3
oc
t -8
4
oc
t -8
5
oc
t -8
6
oc
t -8
7
oc
t -8
8
oc
t -8
9
oc
t -9
0
oc
t -9
1
oc
t -9
2
oc
t -9
3
oc
t -9
4
oc
t -9
5
oc
t -9
6
oc
t -9
7
oc
t -9
8
oc
t -9
9
oc
t -0
0
oc
t -0
1
Figura 28. Serie de precipitaciones con valores medios anuales y media mvil de 12 meses.
En el siguiente paso aparecen las variaciones estacionales de cada ao. Esta fluctuacin
es regular y se da como consecuencia del giro de la Tierra alrededor del Sol, as como el
ciclo diario aparece como efecto de la rotacin terrestre. Estas componentes se
identifican de distintas maneras y aparecern en los residuos que queden del filtrado de
la informacin anterior. La forma en que aparece esta estacionalidad es variable,
dependiendo de las condiciones hidrolgicas. Por ejemplo, los caudales o series
hidrolgicas agregadas (Figura 30) de grandes cuencas dan un ciclo anual bien definido
por la agregacin de factores implicados. Si se trabaja con muestras individualizadas
(Figura 29), la sensibilidad a condiciones particulares con eventos extremos y la
aleatoriedad es mayor, por lo que podra deducirse un ciclo estacional menos definido.
200,0
150,0
100,0
50,0
0,0
0
100
200
300
400
500
600
700
-50,0
-100,0
-150,0
OCT
NOV
DIC
ENE
FEB
M AR
ABR
M AY
JUN
JULIO
AGO
SEP
Figura 29. Series estacionales con media estacional superpuesta
71
Figura 30. Ciclos mensuales en media y desviacin tpica
Las funciones peridicas de senos, cosenos y parmetros como la frecuencia, f, nmero

de ciclos por unidad de tiempo (1/12 para el caso de series mensuales; 1/365 para series
diarias,...), amplitud, A, o fase, son tambin usadas para la representacin de estos
ciclos.
Ec. 69. Funciones aplicables a fluctuaciones peridicas
y = Aseno(2 f t + )
Tratadas las componentes de tendencia, ciclo y estacin, queda un trmino residual de
que como aleatorio, con una variabilidad que obedece a causas desconocidas o
incontrolables. Existen varias posibilidades para descomponer una serie temporal en
cada uno de los trminos anteriores y obtener el residuo. Son clsicos los modelos
aditivos, multiplicativos o mixtos. Siendo xi el dato original, ti el correspondiente a la
tendencia, ci el del ciclo plurianual, ei el estacional y ri el residuo final, la expresin de
estos modelos es la siguiente:
Ec. 70. Modelo aditivo de descomposicin
xi = ti + ci + ei + ri
Ec. 71. Modelo multiplicativo de descomposicin
xi = ti ci ei ri
Para valorar la eleccin entre uno y otro modelo hay que tener en cuenta la interaccin
impuesta entre los trminos de las expresiones anteriores. En el modelo aditivo no hay
interaccin, mientras que en el modelo multiplicativo hay una relacin proporcional
entre los trminos.
Un procedimiento de descomposicin basado en la utilizacin del modelo multiplicativo
es el conocido como de Macauley. Se resume en los siguientes puntos para valores
mensuales:
1. Estimacin de una tendencia por ajuste lineal a la serie completa.
72
2. Clculo de la media mvil centrada de 12 meses

3. Divisin de la media mvil entre el dato correspondiente a la tendencia. Con
este cociente se obtiene una visin de la componente cclica
Ciclo
Tendencia
50.00
50.00
5.00
q8005
Componente cclica
q8005
Lineal (q8005)
45.00
45.00
4.50
40.00
40.00
4.00
35.00
35.00
3.50
30.00
30.00
3.00
25.00
2.50
20.00
20.00
2.00
15.00
15.00
1.50
10.00
10.00
1.00
5.00
5.00
0.50
0.00
0.00
0.00
25.00
y = -0.0085x + 10.252
2
R = 0.1359
Figura 31. Tendencia y ciclos en la descomposicin Macauley
4. Clculo del ratio entre el valor real de cada mes y el valor de la media mvil. La
componente estacional se obtiene como el promedio de estos ratios
correspondientes a cada mes; es decir, seleccionando los ratios de cada mes y
calculando su media.
Estacionalidad
Ratio ValorActual/MediaMvil
1.20
3.50
Ratio ValorActual/MediaMvil
3.00
1.00
2.50
0.80
2.00
0.60
1.50
0.40
1.00
0.20
0.50
0.00
Oct
0.00
Nov
Dic
Ene
Feb
Mar
Abr
May
Jun
Jul
Ago
Sep
Figura 32. Estacionalidad en la descomposicin Macauley
La transformacin normalizante se utiliza para el caso de filtrado de la componente

estacional. sta se refleja en medias y desviaciones tpicas, por lo que es usual utilizar
una transformacin normalizante que permita el estudio de otros efectos en las series.
Ec. 72. Transformacin normalizante
zi , j =
yi , j i
donde i y i son la media y desviacin tpica del mes i.
73
3.4.2
Consideraciones sobre la autocorrelacin temporal
El coeficiente de autocorrelacin temporal sirve para evaluar la propensin de la

variable a que a un valor alto siga un valor alto o a un valor bajo, uno bajo (o al
contrario), separados un intervalo de duracin k. La secuencia de coeficientes de
autocorrelacin conforme aumenta el desfase entre datos se denomina correlograma.
Los coeficientes de autocorrelacin de una serie completa antes de la descomposicin y
los de la serie de los residuos son distintos. En la descomposicin se va filtrando
informacin con autocorrelacin y los residuos que finalmente se obtienen dan valores
reducidos. Un efecto que se refleja en el correlograma es de las fluctuaciones
estacionales. En la siguiente figura se muestra cmo ha cambiado la autocorrelacin
entre las series mensuales (en rojo) antes y despus de la transformacin. Las series de
coeficientes de autocorrelacin en verde y azul corresponden a datos trimestrales y
anuales. Antes de la transformacin normalizante, las precipitaciones mensuales
muestran un ciclo regular correspondiente a las estaciones meteorolgicas. Despus de
la transformacin, ese efecto ha sido filtrado.
Figura 33. Efecto de la transformacin normalizante en series de precipitacin mensual
3.5
CONTEXTO ESPACIAL
Objetivo: definir tcnicas que permitan identificar componentes espaciales e identificar

la correlacin espacial en los datos.
74
VARIABLE ALEATORIA Y FUNCIONES DE DISTRIBUCIN
4.1
CONCEPTO DE VARIABLE ALEATORIA
Cada uno de los sucesos probabilsticos que hemos definido en el captulo anterior se
representa matemticamente mediante una variable, que se denomina aleatoria porque
sus valores vienen determinados por el azar. Es decir, una variable aleatoria es la
representacin matemtica de los posibles resultados de un determinado experimento
probabilstico.
Cada vez que se realice el experimento, la variable adquirir un determinado valor que
ser el resultado del mismo y al que corresponder una determinada probabilidad.
4.2
4.2.1
TIPOS DE VARIABLES ALEATORIAS

Variables aleatorias discretas y continuas
Una variable aleatoria se denomina discreta cuando el nmero de valores que se pueden
obtener como resultado del experimento aleatorio asociado a la misma es finito1. Un
ejemplo tpico de variable aleatoria discreta es la asociada al resultado obtenido en el
lanzamiento de un dado. Dicha variable solo puede tomar seis valores diferentes, los
correspondientes a las seis caras del dado.
Una variable aleatoria ser continua cuando tenga un nmero infinito de valores
posibles, es decir, el nmero de resultados posibles de su experimento aleatorio
asociado es infinito. Las variables aleatorias habitualmente empleadas en hidrologa son
de tipo continuo. Por ejemplo, la variable aleatoria asociada a la medida del caudal en
un punto determinado de un ro es continua puesto que existe un nmero infinito de
resultados posibles (cualquier nmero real positivo).
4.2.2
Dimensin de una variable aleatoria
La descripcin cuantitativa de un experimento aleatorio no siempre es descrita por una

nica caracterstica numrica, sino que en determinadas circunstancias es necesario
tener en cuenta ms de una. El nmero de caractersticas numricas que es necesario
considerar para describir el resultado de un experimento es igual a la dimensin de la
variable aleatoria asociada al mismo.
Por ejemplo, en el caso del experimento comentado en el apartado anterior (medida del
caudal en un ro) la dimensin de su variable aleatoria es igual a uno puesto que solo es
necesario un nico valor numrico para definir el resultado del experimento. En este
caso se dice que la variable aleatoria es unidimensional o univariada.
Estrictamente tambin sera una variable aleatoria discreta aquella que tiene un nmero infinito de
resultados posibles si ese infinito es numerable.
75
En el caso de que el suceso probabilstico considerado fuese la ocurrencia de una

avenida en un ro y describisemos el hidrograma de avenida mediante su caudal punta
y su volumen, se necesitaran dos caractersticas numricas para describir el resultado
de cada experimento y, por tanto, la dimensin de la variable aleatoria sera igual a dos.
En este caso se dira que la variable aleatoria es bidimensional o bivariada. En general,
una variable aleatoria con dimensin mayor que uno se dice que es multidimensional o
multivariada. Las variables aleatorias con dimensin mayor que uno se denominan
habitualmente en la literatura vectores aleatorios.
Una variable aleatoria n-dimensional ser discreta si cada una de las n caractersticas
numricas que la definen es discreta. Ser continua si cada una de ellas es continua. Si
alguna de las caractersticas es discreta y otras continuas, la variable aleatoria es mixta.
4.3
VARIABLE ALEATORIA UNIVARIADA
Una vez definida la variable aleatoria correspondiente a un determinado suceso

probabilstico, el inters de la estadstica se centra en determinar la probabilidad
correspondiente a cada posible valor de la variable. Veremos en este apartado como se
define la probabilidad para el caso de una variable aleatoria univariada.
4.3.1
Funcin de distribucin
La forma ms habitual de relacionar los valores de la variable aleatoria con sus

probabilidades es mediante la denominada funcin de distribucin (F(x)), cuyo valor en
cada valor xo de la variable se define como la probabilidad de que la variable aleatoria x
tome un valor menor o igual que xo.
Ec. 73. Funcin de distribucin
F ( xo ) = P( x xo )
Cualquier funcin de distribucin debe verificar:

1. F ( ) = P(x ) = 0
2. F ( ) = P(x ) = 1
3. La funcin de distribucin es montona no decreciente.
4. En el caso de variable aleatoria continua la funcin de distribucin es
continua.
La propiedad 1. debe verificarse puesto que el obtener un valor menor que - es el
suceso imposible cuya probabilidad es cero, y la 2. puesto que el obtener un valor
inferior a + es el suceso seguro cuya probabilidad es uno.
Si se escoge un intervalo comprendido entre los lmites a y b, la probabilidad
correspondiente a un valor de la variable comprendido entre dichos lmites, a<xb es
entonces:
76
Ec. 74. Probabilidad en un intervalo (a,b]
P( a < x b) = F (b) F (a )
Demostracin:
Teniendo en cuenta que los sucesos ax y a<xb son mutuamente excluyentes,
P( x a) = F (a)
P( x b) = P( a x a < x b) = P ( x a ) + P( a < x b) = F (b)

P (a < x b) = F (b) F ( a)
Adems, como la probabilidad es no negativa y la funcin de distribucin se define
como montona no decreciente, se tiene que
F (b) F (a ) 0
4.3.2
Funcin de probabilidad
La funcin de probabilidad (p(xo)) nos dice la probabilidad de obtener un valor concreto

de la variable xo:
Ec. 75. Funcin de probabilidad de una variable aleatoria discreta
p ( xo ) = P( x = xo )
Esta definicin es vlida para una variable aleatoria discreta, para la cual solo son
posibles determinados valores aislados. En el caso de una variable aleatoria continua se
define la funcin de probabilidad en el punto xo como la que, multiplicada por dx, nos
da la probabilidad de que la variable tome un valor en un entorno diferencial del valor xo
(entre xo y xo+d x). Por este motivo, a la funcin de probabilidad en el caso de variable
aleatoria continua se la denomina funcin de densidad de probabilidad (f(xo)).
Ec. 76. Funcin de densidad de probabilidad para una variable aleatoria unidimensional
f ( xo ) = P( xo x < x o + dx )
Las funciones de probabilidad y densidad de probabilidad cumplen:

1. Se tiene que verificar que:
0 p ( xo ) 1
0 f ( xo ) 1
puesto que los valores de la probabilidad estn comprendidos entre cero y uno.
2. La funcin de distribucin asociada al extender la integral o el sumatorio a todo el
dominio de la variable aleatoria es uno.
77
Ec. 77. Funcin de distribucin extendida a todo el dominio de la variable aleatoria

+
F ( +) F ( ) =
f ( x)dx = 1
F ( +) F ( ) = f ( x ) = 1
3. La funcin de densidad o cuanta es no negativa en cualquier punto del dominio de

la variable aleatoria.
4. Con una variable aleatoria continua, el valor de la probabilidad de obtener un valor
en el entorno diferencial de un punto determinado es una cantidad infinitesimal.
En el caso de una variable aleatoria discreta el valor de la funcin de distribucin en un
punto xo ser igual a la suma de los valores de la funcin de probabilidad en todos los
puntos xi menores que xo.
Ec. 78. Relacin entre las funciones de probabilidad y distribucin
F ( xo ) = P( x xo ) =
p( x )
i
xi xo
Para el caso de una variable aleatoria continua la expresin anterior se transforma en la

siguiente:
Ec. 79. Relacin entre las funciones de densidad de probabilidad y distribucin
F ( xo ) = P( x xo ) = f ( x )dx
xo
o lo que es lo mismo:
f (x ) =
dF (x )
dx
Es decir, la funcin de densidad de probabilidad es la derivada de la funcin de

distribucin.
4.3.3
Expresin de la funcin de distribucin mediante factor de frecuencia
El clculo de los valores de la variable aleatoria que corresponden a determinadas

probabilidades acumuladas (o ms habitualmente en hidrologa, a determinados
periodos de retorno), los denominados cuantiles, requiere que la funcin de distribucin
sea invertible, es decir, que se pueda expresar la variable x en funcin de F. Algunas de
las funciones de distribucin ms habitualmente empleadas (normal, Pearson III,
logPearson III, ...) o bien no disponen de expresin analtica para la funcin de
distribucin o bien, an existiendo, es muy difcil despejar la variable, por lo que el
clculo de los cuantiles a partir de las mismas resulta bastante complicado.
78
Para resolver este problema se ha definido un mtodo alternativo de expresar la relacin

entre la variable y la probabilidad, que facilita la obtencin de los cuantiles. Este
mtodo, denominado del factor de frecuencia, consiste en expresar la variable
correspondiente a un determinado periodo de retorno como la media mas una desviacin
respecto a la misma:
xT = + xT
La desviacin respecto a la media es expresable como la desviacin tpica multiplicada
por un determinado factor (factor de frecuencia), que ser funcin del periodo de
retorno y del tipo de distribucin que siga la poblacin.
xT = K T
Por tanto:
Ec. 80 Expresin del cuantil en funcin del factor de frecuencia
xT = + K T
La ecuacin del factor de frecuencia fue propuesta por Chow en 1951 y se aplica a
muchas funciones de distribucin empleadas en hidrologa. Para cada funcin de
distribucin se puede calcular el factor de frecuencia en funcin del periodo de retorno,
bien expresndolo como una expresin matemtica, bien mediante una tabla. Una vez
que se conoce el factor de frecuencia, se estima el valor de la media y la desviacin
tpica a partir de la muestra y se aplica la expresin anterior.
4.3.4
Operaciones con variables aleatorias
4.3.4.1 Suma de variables aleatorias
Se define la variable aleatoria suma de las variables x e y, como la variable s que es

igual a:
Ec. 81 Suma de variables aleatorias
s = x+ y
El experimento aleatorio asociado a la variable s es el conjunto de los experimentos

asociados a las variables x e y, siendo el valor del experimento asociado a s la suma de
los resultados obtenidos para los dos experimentos parciales.
4.3.4.2 Producto de variables aleatorias
Se define la variable aleatoria producto de las variables x e y, como la variable s que es

igual a:
79
Ec. 82 Producto de variables aleatorias
s = x y
El experimento aleatorio asociado a la variable s es el conjunto de los experimentos
asociados a las variables x e y, siendo el valor del experimento asociado a s el producto
de los resultados obtenidos para los dos experimentos parciales.
4.3.5
Transformacin de variables aleatorias
Se denomina transformacin de la variable aleatoria x a una nueva variable aleatoria

y cuyos valores vienen dados por una funcin de la variable x. Es decir, dada la variable
x se obtiene la variable y mediante:
y = h(x)
donde h es una funcin conocida de x.
El experimento aleatorio asociado a la variable aleatoria y es el mismo que para la
variable aleatoria x, obtenindose el valor de y para cada realizacin del experimento
aplicando la funcin h al valor obtenido de x.
La funcin de distribucin de y se puede obtener a partir de la de x. Si llamamos G(y)
a la funcin de distribucin de la variable y, se verificar:
Ec. 83 Relacin entre las funciones de distribucin de una variable y su transformada
G ( y o ) = P ( y y o ) = P[h( x) y o ] = P ( x A)
siendo A el conjunto de valores de x para los cuales h(x)=yo.
En el caso de que la funcin h(x) sea montona creciente la relacin anterior se puede
concretar algo ms. El conjunto A de valores x para los cuales h(x)yo, sern:
x xo
siendo:
x o = h 1 ( y o )
Por lo tanto:
Ec. 84 Relacin entre funciones de distribucin: Transformacin montona creciente
G ( y o ) = P [x x o ] = F ( x o )
por lo que las funciones de distribucin de x e y son idnticas.
En el caso de que la funcin h(x) sea montona decreciente se tendr:
80
Ec. 85 Relacin entre funciones de distribucin. Transformacin montona decreciente
G ( y o ) = P ( x x o ) = 1 P ( x xo ) = 1 F ( x o )
En cuanto a la funcin de probabilidad, la probabilidad de obtener un valor de yo
para la variable y ser igual a la probabilidad de obtener uno de los valores de x para los
cuales h(xo)=yo.
Ec. 86 Relacin entre las funciones de probabilidad de una variable y su transformada
P( y o ) = P( y = y o ) =
P( x )
i
y o = h ( xi )
En el caso de variables continuas, la funcin de densidad de probabilidad se puede

obtener como derivada de la funcin de distribucin:
Ec. 87 Relacin entre las funciones de densidad. Transformacin montona creciente
dG ( y )
dF ( x ) dx
dx
= g ( y) =
= f ( x)
dy
dx dy
dy
f ( x) = g ( y )h '
si la funcin h(x) es montona creciente. Y:
Ec. 88 Relacin entre las funciones de densidad. Transformacin montona decreciente
dG ( y )
dF ( x ) dx
dx
= g ( y) =
= f ( x)
dy
dx dy
dy
f ( x) = g ( y )h '
si la funcin h(x) es montona decreciente.
4.4
4.4.1
VARIABLE ALEATORIA BIVARIADA

Funcin de distribucin conjunta
Al igual que se definan las funciones de distribucin, probabilidad y densidad de

probabilidad para el caso de variables univariadas, se pueden generalizar las
definiciones dadas anteriormente para el caso de variables bivariadas o, en general,
multivariadas. Estas funciones representarn, como en el caso univariado, la relacin
entre los valores de la variable y sus probabilidades.
Si la variable es discreta, llamaremos funcin de probabilidad conjunta a la
probabilidad de obtener un valor concreto para la variable bidimensional:
x = ( x, y )
81
Ec. 89 Funcin de probabilidad bivariada
P ( x o ) = P [x = x o = ( x o , y o ) ]
Al igual que en el caso univariado se debe verificar:
Ec. 90 Propiedades de la funcin de probabilidad bivariada
P( xo ) 0
P( x ) = 1
i
La probabilidad de cualquier valor de la variable debe ser mayor o igual que cero y la
suma de las probabilidades de todos los posibles valores de la variable debe ser igual a
uno, como consecuencia de la definicin de probabilidad.
Si la variable es continua, se emplear la funcin de densidad de probabilidad
conjunta, que se define como la que multiplicada por dxdy da la probabilidad de que la
variable adopte un valor en un entorno diferencial de xo e yo.
Es decir:
x o = ( x o , y o ) x x o + dx = ( x o + dx, y o + dy )
Como antes, se verifica:
Ec. 91 Propiedades de la funcin de densidad de probabilidad bivariada
f ( x ) = f ( x, y ) 0
f ( x, y )dxdy = 1
La funcin de distribucin conjunta se obtiene por integracin de la funcin de

densidad de probabilidad y viene definida como la probabilidad de que la variable
x=(x,y) tome un valor tal que:
x xo
y yo
Se tendr.
Ec. 92 Funcin de distribucin bivariada
F ( x o ) = F [x ( x o , y o ) ] =
xo
yo
82
f ( x, y ) dxdy
4.4.2
Variable aleatoria marginal. Funcin de distribucin marginal
Si x es una variable aleatoria bidimensional x=(x,y), se llama variable aleatoria marginal

referida a la componente xi a la variable unidimensional que se obtiene cuando se
considera la variable aleatoria aisladamente.
Para una variable bidimensional existen dos variables marginales. Si partisemos de una
variable n-dimensional, se tendrn n variables marginales.
Se pueden obtener las funciones de probabilidad y distribucin para cada una de las
variables marginales a partir de las de la variable bivariada, sumando los valores de
probabilidad de la variable x, manteniendo xi fijo y variando la otra componente xj a
todos sus valores posibles. Estas funciones se denominan marginales.
La funcin de probabilidad marginal se obtendr como:
Ec. 93. Funciones de probabilidad marginal para variable discreta bidimensional
P ( x ) = P ( x, y )
y
P ( y ) = P ( x, y )
x
Para variable continua, la funcin de densidad de probabilidad marginal vendr dada

por:
Ec. 94. Funciones de densidad de probabilidad marginal para variable discreta bidimensional
f ( x, y )dy
f ( x) =
f ( x, y)dx
f ( y) =
Por ltimo, la funcin de distribucin marginal se obtiene por integracin de la

funcin de densidad:
Ec. 95. Funciones de distribucin marginal para variable continua bidimensional
xo
xo
F ( x o ) = P ( x xo ) =
f ( x )dx =
yo
yo
F ( y o ) = P( y y o ) =
f ( x, y)dxdy
f ( y ) dy =
f ( x, y )dxdy
La palabra marginal proviene de que en el caso de manejar una variable

bidimensional discreta y tener escritas las probabilidades de cada valor de x=(x,y) en
una tabla de doble entrada, las probabilidades de la variable aislada x o y se obtienen en
los mrgenes de la tabla al sumar por filas o columnas.
83
4.4.3
Dependencia e independencia de variables aleatorias. Funcin de distribucin

condicionada
Las definiciones de dependencia e independencia estadstica y de probabilidad

condicionada definidas en el captulo 2 para sucesos aleatorios, puede generalizarse para
el caso de variables aleatorias.
Se dice que dos variables aleatorias son independientes si se cumple:
Ec. 96 Independencia de variables aleatorias
F ( x, y ) = F ( x )F ( y )
al igual que para sucesos se verificaba:

P( A B) = P( A)P ( B)
Es decir, la funcin de distribucin conjunta es el producto de las funciones de

distribucin marginales.
Ejemplo:
El resultado anterior, derivado de la independencia de las variables aleatorias, se puede aplicar a
la estimacin de funciones de distribucin. Supongamos que la funcin H(y) representa la
funcin de distribucin de las intensidades de precipitacin mximas anuales. Por otro lado G(z)
representa la funcin de distribucin de las duraciones de los chubascos mximos. La funcin
de distribucin de las precipitaciones mximas, supuesta la independencia de las variables
aleatorias anteriores, intensidad de precipitacin y duracin del chubasco, sera el producto de
las funciones de distribucin anteriores, H(y) G(z).
A partir de las dos variables x e y se puede definir la variable aleatoria condicionada

como la variable x/y que representa los posibles valores de la variable x sabiendo que la
variable y ha adquirido un determinado valor de y=yo.
Para esta nueva variable se pueden definir las funciones de probabilidad, densidad y
distribucin que reciben el nombre de condicionadas.
La variable aleatoria condicionada x es la univariada que se obtiene al darle un valor
concreto yo a la variable y.
La funcin de probabilidad condicionada viene dada por:
Ec. 97 Funcin de probabilidad condicionada para variable aleatoria discreta
P ( x, y ) =
donde:
84
P ( x, y o )
P( yo )
P ( y o ) = P ( x, y o )
x
Se divide por P(y) para que la suma de todas las probabilidades de los valores de x sea
igual a uno, condicin que debe cumplir cualquier funcin de probabilidad.
P ( x, y
P ( x, y
o
)=
P( yo )
)
=
P( y o )
=1
P( y o )
La funcin de densidad de probabilidad condicionada, para el caso de variable

aleatoria continua, es:
Ec. 98 Funcin de densidad condicionada para variable aleatoria continua
f ( x, y o ) =
f ( x, y o )
f ( yo )
con:
f ( x, y )dx
f ( yo ) =
Al igual que antes, al dividir por f(yo) se consigue que:
f ( x / y o ) dx =
f ( yo )
1
=1
f ( x, y o )dx =
f ( y o )
f ( yo )
Por ltimo, la funcin de distribucin condicionada se obtiene, como anteriormente,

a partir de la funcin de densidad:
Ec. 99 Funcin de distribucin condicionada
x
F ( x / yo ) =
f ( x, y o )
dx
f ( yo )
Si las variables x e y son independientes, se verifica:

Ec. 100 Funcin de distribucin condicionada para el caso de variables independientes
F ( x / y) =
F ( x )F ( y )
= F ( x)
F ( y)
y la funcin de distribucin condicionada de la variable x respecto a y coincide con la

funcin de distribucin de x.
85
4.5
ESPERANZA Y MOMENTOS DE LAS FUNCIONES DE DISTRIBUCIN
Al considerar la funcin de distribucin, densidad y cuanta como expresiones de la

probabilidad en el dominio de la variable aleatoria, vuelve a tener sentido encontrar las
expresiones de las medidas de centralidad, dispersin, asimetra o curtosis que
anteriormente se haban mencionado al describir las muestras. En aquel caso se conoca
una muestra tomada de la variable aleatoria. Aqu, a travs de la funcin de probabilidad
y el dominio de la variable se tiene completamente conocido el fenmeno aleatorio.
4.5.1
Esperanza matemtica
4.5.1.1 Definicin
Se denomina esperanza matemtica de una variable aleatoria al valor medio ponderado
por su probabilidad:
Ec. 101. Esperanza de una variable continua
+
E ( x) =
x f ( x)dx
Ec. 102. Esperanza de una variable discreta

+
E ( x) = x f ( x )
Esta definicin se puede extender a la consideracin de una funcin g(x):

Ec. 103. Esperanza de una funcin
E [g ( x ) ] =
g ( x) f ( x)dx
E [g ( x)] = g ( x) f ( x)
4.5.1.2 Propiedades
1. La esperanza de una constante es la constante
Ec. 104. Esperanza de una constante
+
E (b) = b f ( x ) = b f ( x) = b1 = b
2. La esperanza de una variable aleatoria funcin lineal de otra es la combinacin

lineal de la esperanza.
86
Ec. 105. Esperanza de combinacin lineal de variables aleatorias
y = a x + b
+
E ( y ) = E ( a x + b) = (a x + b) f ( y ) = a x f ( x) + b f ( x) = aE ( x ) + b
3. La esperanza de una variable aleatoria suma de otras, independientes o no, es la

suma de las esperanzas de cada una de ellas
Ec. 106. Esperanza de una suma de variables aleatorias
y = x1 + .. + xn
+
E ( y ) = E ( x1 + .. + xn ) = ( x1 + .. + xn ) p ( x1 ,..., xn ) = x1 p( x1 ) + .. xn p ( xn )
= E ( x1 ) + .. + E ( xn )
4. La esperanza de una variable aleatoria producto de otras es el producto de las

esperanzas siempre que sean independientes
Ec. 107. Esperanza de un producto de variables aleatorias independientes
y = x1 .. x n
E ( y ) = E ( x1 .. x n ) = E ( x1 )..E ( x n )
4.5.2
Varianza
4.5.2.1 Definicin
La medida de la dispersin de la poblacin conocidas la funcin de probabilidad y el
dominio de la variable viene dada por la esperanza de las desviaciones cuadrticas sobre
la media:
Ec. 108. Varianza de la poblacin
V ( x) = E ( x E ( x)) 2 = E ( x 2 ) (E ( x) )
4.5.2.2 Propiedades
1. La varianza de una constante es nula
Ec. 109. Varianza de una constante
V (b) = E (b E (b)) 2 = E (b b) 2
2. La varianza de una variable aleatoria funcin lineal de otra es:
87
Ec. 110. Varianza de una combinacin lineal
y = a x + b
V ( y ) = V (a x + b) = E ((a x + b) ( aE ( x) + b)) 2 = E a 2 ( x E ( x)) 2 = a 2 V ( x)
3. La varianza de una suma de variables aleatorias es la suma de las varianzas si

hay independencia.
Ec. 111. Varianza de una suma de variables aleatorias
y = x1 + .. + x n
V ( y ) = V ( x1 + .. + x n ) = V ( x1 ) + .. + V ( x n )
4.5.3
Momentos centrales de orden n
En general se expresa como momentos centrales de orden n a la siguiente expresin:

Ec. 112. Momento central de orden n
M n ( x ) = E ( x E ( x)) n = ( x E ( x)) n p ( x )
M n ( x ) = E ( x E ( x)) n = ( x E ( x)) n f ( x )dx
4.5.4
Momentos respecto al origen y centrales de una variable bidimensional
Las expresiones anteriores se amplan al caso de variables aleatorias bidimensionales o

multidimensionales. En el caso bidimensional, el orden del momento tiene dos
coordenadas, (i, j), quedando las siguientes expresiones:
Ec. 113. Momento respecto al origen de orden (i, j)
+
i , j = x i y j p ( x, y )
++
i, j =
x y
i
f ( x, y )dxdy
Ec. 114. Momento central de orden (i, j)
M i , j = E ( x 10 ) i ( y 01 ) j = ( x 10 ) i ( y 01 ) j p ( x, y )
+ +
M i , j = E ( x 10 ) ( y 01 )
i
) = (x

88
10
) i ( y 01 ) j f ( x, y )dxdy
De los ltimos tienen especial inters las varianzas y covarianzas:

Ec. 115. Varianzas y covarianzas
M 2, 0 = 20 102
2
M 0, 2 = 02 01
M 1,1 = 11 10 01
89
90
MODELOS DE DISTRIBUCIN UNIVARIADA DE PROBABILIDAD
En los siguientes apartados se exponen diferentes funciones de distribucin y sus

caractersticas ms importantes. La expresin matemtica de tales funciones de
distribucin depende de parmetros, que podran coincidir con estadsticos sencillos
como la media, desviacin tpica, coeficiente de sesgo, etc. Sin embargo, en muchos
casos la expresin matemtica de las funciones de distribucin no se hace depender de
estos estadsticos, sino de otros parmetros que simplifican su expresin. As, se recurre
a parmetros como los denominados factores de localizacin, de escala o de forma, que
vuelven a hacer referencia conceptos similares que los que describen la media,
desviacin tpica y sesgo respectivamente, aunque no coinciden exactamente.
El parmetro de localizacin se identifica con una abscisa de referencia de la
distribucin. Puede coincidir con la media y una medida central de localizacin, pero no
siempre es as. El parmetro de escala est definido como la posicin de un punto
respecto a otro de referencia, normalmente el parmetro de localizacin. Como
ejemplos se pueden citar la desviacin tpica. Por ltimo, el parmetro de forma sirve
para clasificar la geometra de las distribuciones.
5.1
DISTRIBUCIN NORMAL Y ASOCIADAS
La funcin de distribucin normal o de Gauss se asocia a un gran nmero de fenmenos

naturales. Depende de dos parmetros: , que es adems media, mediana y moda, y ,
que coincide con la desviacin tpica. No tiene sesgo y es simtrica. Se denota por N
(,), siendo sus funciones de densidad y distribucin de probabilidad las que se
exponen a continuacin. La funcin de densidad no es integrable y las probabilidades se
calculan resolviendo la integral por mtodos numricos.
Ec. 116. Funcin de densidad normal
f ( x) =
1 x 2

2
Ec. 117. Funcin de distribucin normal

1 x 2

2
1
P(Y y ) = F ( y ) =
e
2
dx
Media
Desviacin tpica
Sesgo
Curtosis
Tabla 17. Estadsticos de la distribucin normal
El efecto de la variacin de la media en una funcin de densidad o distribucin es

equivalente al desplazamiento sobre el eje de abscisas de la variable aleatoria de la
misma funcin de densidad. En las siguientes grficas se comprueba el efecto que
produce, tanto en la funcin de distribucin como en la de densidad, el aumento de la
desviacin tpica. Aumentar la desviacin tpica supone aumentar la variabilidad de la
muestra por lo que la concentracin de valores de la campana de Gauss se reduce.
91
-4
-3
-2
-1
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-7
-6
-5
-4
-3
-2
-1
Variable
Desviacin tpica= 1
Desviacin tpica= 2
0
Variable
Figura 34. Distribucin normal tipificada y comparacin con desviacin tpica 2.
-4
-3
-2
-1
Funcin de densidad
Funcin de densidad
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0
-7
-6
-5
-4
-3
-2
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-1
0
Desviacin tpica= 1
Desviacin tpica= 2
Variable
Variable
Figura 35. Densidad normal tipificada y comparacin con desviacin tpica 2.
Se conoce como variable tipificada a la transformada de la variable original en funcin

de su media y desviacin tpica. La variable aleatoria tipificada tiene una distribucin de
probabilidad distinta, N(0,1), que se usa como referencia para el clculo de
probabilidades de otras variables aleatorias normales, pero con parmetros y , en
general distintos de 0 y 1. Transformando los valores de las variables normales del caso
que se considere, se transfiere el problema al clculo de probabilidades de la N(0,1), de
la que se dispone de tablas.
Ec. 118. Variable tipificada y densidad normal de la variable tipificada
z=
f ( z) =
1
2
1 2
z
2
F ( z) =
x
1
e 2 dx
2
En Chow (1994) se tienen las expresiones para la resolucin de esta integral en la

variable tipificada.
Ec. 119. Resolucin numrica de la normal
1
2
3
4
B = 1 + 0,196854 z + 0,115194 z + 0,000344 z + 0,019527 z
2
z < 0 P (Z z ) = F ( z ) = B
z 0 P (Z z ) = F ( z ) = 1 B
92
En la siguiente tabla se muestran los valores de probabilidad tipificados obtenidos por

medio de la hoja Excel y la utilizacin del comando DISTR.NORM.ESTAND()
Valor x Funcin de Valor x Funcin de Valor x Funcin de
Distribucin
Distribucin
Distribucin
-3,0
-2,8
-2,6
-2,4
-2,2
-2,0
-1,8
-1,6
-1,4
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2
0,0013
0,0026
0,0047
0,0082
0,0139
0,0228
0,0359
0,0548
0,0808
0,1151
0,1587
0,2119
0,2743
0,3446
0,4207
0,0
0,5000
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0
0,5793
0,6554
0,7257
0,7881
0,8413
0,8849
0,9192
0,9452
0,9641
0,9772
0,9861
0,9918
0,9953
0,9974
0,9987
Tabla 18. Funcin de distribucin normal
La distribucin normal se utiliza en hidrologa con variables de las que cabe esperar
simetra alrededor de la media. Es una funcin de distribucin muy utilizada para
multitud de procesos. En la siguiente figura se muestra un ejemplo con el ajuste de
precipitaciones totales anuales de una estacin pluviomtrica.
Figura 36. Ajuste de una distribucin normal a precipitaciones totales anuales
Sin embargo, en muchas situaciones el sesgo de las poblaciones que se estudian en

hidrologa es pronunciado por lo que el ajuste de la distribucin normal no es adecuado,
tal como se puede observar de su aplicacin a casos de lluvias mximas como el que se
representa en la siguiente figura. Otro inconveniente para su utilizacin es que el
dominio de la normal abarca tambin valores negativos y muchas variables hidrolgicas
son estrictamente positivas como la precipitacin o el caudal.
93
Figura 37. Ajuste de una distribucin normal en precipitaciones mximas anuales.
Papel normal:
Para poder dibujar una funcin de distribucin normal como una recta, se transforman
adecuadamente los valores del eje de abscisas, probabilidad. Se tendran que despejar los
valores de z en funcin de la probabilidad, pero debido a la imposibilidad de manejar una
expresin explcita de la integral de la distribucin, se manejan expresiones aproximadas.
A continuacin se muestran las expresiones utilizadas para transformar las abscisas en
funcin de la probabilidad de excedencia, p, y de una variable auxiliar w (Chow, 1994).
p = 1 F ( z) =
1
T
1
0 0,5 w = ln
2
(1 p )
5.1.1
z = w
1
2,515517 + 0,802853w + 0,010328w2

1 + 1,432788w + 0,189269w2 + 0,001308w3
2,515517 + 0,802853w + 0,010328w 2

z = w
1 + 1,432788w + 0,189269w 2 + 0,001308w3
Teorema central del lmite
Este teorema establece (Pea, 2000) que si x1, ..., xn son variables aleatorias
independientes con media i, desviacin tpica i y distribucin cualquiera, sin ser
necesariamente la misma, entonces, si n crece, la variable Y= x1+ ...+ xn tiende a una
funcin de distribucin N(,2). La variable Y se tipifica y quedara ZN(0,1):
Ec. 120. Variable tipificada
Z=
94
La aplicacin de este teorema en hidrologa es inmediata. Cuando se disponga de

variables aleatorias fruto de la composicin de otras como ocurre con las precipitaciones
totales anuales, se puede presuponer su ajuste segn una normal. Otro ejemplo directo
es la generacin de nmeros aleatorios. Se pueden generar nmeros segn una funcin
de distribucin uniforme y despus sumarlos para obtener una normal.
Otras distribuciones asociadas a la normal son la logartmica normal, la 2 de Fisher, la t
de Student y la F de Snedecor.
5.1.2
Distribucin logartmica normal
Se dice que una variable aleatoria x sigue una funcin de distribucin logartmica
normal si sus logaritmos siguen una distribucin normal. La variable x tiene que ser
estrictamente positiva. La normal, al contrario, admite un dominio de valores positivo y
negativo. Utilizando los logaritmos neperianos y los parmetros y , media y
desviacin tpica de los logaritmos de la variable transformada y, la expresin de la
funcin de densidad es la que sigue.
Ec. 121. Densidad logartmico normal
x LN y = ln x N ( , )
1 ln x 2

2
1
f ( x) =
e
x 2
x>0
Media
Desviacin tpica
e(
+ 2
) (e
) e 1
2
Sesgo
2
+2 e
Curtosis
2
Tabla 19. Estadsticos de la distribucin logartmico normal ( y , medias y desviaciones

tpicas de los logaritmos de la variable x)
Las siguientes grficas muestran la asimetra de la distribucin logartmico normal,

aunque los logaritmos s se mantienen simtricos alrededor de su media. La
transformacin logartmica se aplica para reducir la asimetra positiva de variables
hidrolgicas (Chow, 1994), ampliando la resolucin en los valores bajos de la variable.
95
2,40
2,20
Funcin de dis tribucin
2,00
Funcin de densidad
1,80
1,60
1,40
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0,0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
6,0
2,40
Desviacin tpica de la muestra= 0,2
2,20
2,00
Funcin de densidad
1,80
1,60
1,40
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0,0
0,5
1,0
1,5
2,0
2,5
3,0
Variable
Variable
3,5
4,0
4,5
5,0
5,5
6,0
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00

0
Variable
Variable
Figura 38. Funciones de densidad y distribucin logartmico normales
Esta distribucin ampla el campo de aplicacin del teorema central del lmite al caso de
variables generadas como el producto de n variables aleatorias independientes, x1, ..., xn,
Y= x1 ... xn. Entonces, el logaritmo de Y seguir una poblacin normal.
En hidrologa se utiliza tambin una funcin de distribucin logartmica normal de tres
parmetros (NERC, 1975). Al tomar logaritmos se puede aadir un lmite inferior que
pasa a denominarse factor de localizacin.
Ec. 122. Planteamiento de la funcin logartmica normal de tres parmetros
z = ln( x xo )
Quedando una funcin de densidad:
Ec. 123. Densidad logartmico normal de tres parmetros
1 ln ( x x )
o
z

z
2
1
f ( x) =
e
( x xo ) z 2
5.1.3
Distribucin 2 (chi-cuadrado) de Pearson
Si x1, ..., xn son variables aleatorias independientes, con distribucin N(0,1), la variable
aleatoria suma de los cuadrados de las n variables sigue la distribucin chi-cuadrado de
96
Pearson. El nmero de sumandos n se denomina grados de libertad y es el nico

parmetro del que depende la funcin de distribucin.
Ec. 124. Variable aleatoria 2 (chi-cuadrado) de Pearson
y = x12 + ... + xn2
xi N (0,1)
Ec. 125. Densidad 2 (chi-cuadrado) de Pearson
n 1
2
y
2
e
f ( y) = n
2 2 n
( 2)
y>0
Media
Desviacin tpica
Sesgo
2n
Curtosis
3 + 12
Tabla 20. Estadsticos de la distribucin 2 (chi-cuadrado) de Pearson
La siguiente grfica muestra distintas funciones de densidad de la chi-cuadrado,

observndose cmo la funcin va hacindose simtrica a medida que aumenta el
nmero de grados de libertad.
0,25
Grados de libertad 2
Funcinde densidad
0,20
0,15
0,10
0,05
0,00
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
40,0
Figura 39. Densidades de la chi-cuadrado dependientes del nmero de grados de libertad
La funcin de distribucin ha de calcularse por integracin numrica. Los resultados

pueden consultarse en diferentes tablas existentes en la bibliografa, con entradas en
funcin del nmero de grados de libertad y la probabilidad acumulada. Las hojas de
clculo tienen esas funciones implementadas.
97
1,0000
0,9000
0,8000
Probabilidad
0,7000
2
3
4
5
6
7
8
9
10
15
20
30
40
50
60
70
80
90
100
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
Variable aleatoria
Figura 40. Funcin de distribucin Chi-cuadrado en funcin de los grados de libertad
Otros teoremas relativos a la chi-cuadrado que aparecen en la bibliografa consultada

son los siguientes:
1. (Spiegel, 1990) Sean U1,...Uk variables aleatorias con distribucin chi-cuadrado
y v1,...vk los grados de libertad respectivos. Su suma W= U1+,...+Uk tiene
distribucin chi-cuadrado con v1+...+vk grados de libertad.
2. (Spiegel, 1990) Sean U1 y U2 variables aleatorias independientes. Si U1 tiene
distribucin chi-cuadrado con v1 grados de libertad, mientras que U=U1+U2
tiene distribucin chi-cuadrado con v grados de libertad, siendo v>v1, entonces U2
tiene distribucin chi-cuadrado con v-v1 grados de libertad.
Esta funcin de distribucin tiene una aplicacin importante, que es la comprobacin

del ajuste de una serie de datos a una determinada distribucin (Gmez Espadas). Para
ello se comparan las frecuencias observadas con las frecuencias tericas de la
distribucin que se supone que se ajusta a los datos. Las frecuencias observadas se
calculan dividiendo el dominio de la variable, inicialmente cualitativa, en n clases. El
estadstico de comparacin siguiente sigue una distribucin chi-cuadrado con n-1
grados de libertad. Si el valor obtenido con el estadstico es superior al valor de
referencia tomado de las tablas de la chi-cuadrado para un nivel de significacin dado,
se rechaza la hiptesis de ajuste. Si ocurre lo contrario, el valor del estadstico es menor
que el terico dado por las tablas, el ajuste se acepta.
Eliminado: estadstico
Ec. 126. Estadstico de contraste para ajuste de una funcin de distribucin

n
( f ri f ti )2
i =1
f ti
5.1.4
n21
Distribucin t de Student
Dadas n+1 variables aleatorias independientes, x, x1, ..., xn con distribucin idntica
N(0,), Gosset plante la siguiente variable aleatoria:
98
Ec. 127. Variable aleatoria t de Student
tn =
1 n 2
xi
n i =1
Esta variable aleatoria depende del nmero de grados de libertad, n del denominador.
Tiene la ventaja de que la distribucin no depende de la varianza comn 2, adems de
ser simtrica, a diferencia de la chi-cuadrado.
Ec. 128. Densidad t de Student
n +1
1
2
f ( y) =
n n
2
< y <
Media
( )
Desviacin tpica
)1 + y
Sesgo
Curtosis
( n +1)
3+ 6
n4
n>4
n2
n>2
Tabla 21. Estadsticos de la distribucin t de Student
En la siguiente figura se observa la simetra de la funcin de densidad, que tiende a la

normal conforme aumenta el nmero de grados de libertad.
0,45
0,40
Funcinde densidad
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-9 -8 -7 -6 -5 -4 -3 -2 -1 0
Figura 41. Densidad de la t de Student para diferentes grados de libertad
5.1.5
Distribucin F de Fisher
Dadas n1+n2 variables aleatorias independientes, x1, ..., xn1 y y1, ..., yn2 con distribucin
idntica N(0,), se plantea la siguiente variable aleatoria:
99
Ec. 129. Variable aleatoria F de Fisher
Fn1 ,n2
1 n1 2
xi
n1 i =1
=
1 n2 2
y j
n 2 j =1
Ec. 130. Funcin de densidad de la F de Fisher
n + n2
1
n1 n2 n1
n1 + n2
1
2
f ( x) =
n12 n22 x 2 (n2 + n1 x ) 2
n n
1 2
2 2
x>0
Esta variable aleatoria depende del nmero de grados de libertad del numerador y
denominador. Su funcin de distribucin no depende de , aunque s de los grados de
libertad mencionados.
Media
n2
n2 2
n2 > 2
Desviacin tpica
2n (n1 + n 2 2)
2
2
Sesgo
Curtosis
n1 (n 2 2 ) (n 2 4)
2
n2 > 4
Tabla 22. Estadsticos de la distribucin F de Fisher
5.2
PROCESO DE BERNOULLI
El proceso de Bernoulli es aquel que cumple las siguientes caractersticas (Pea, 2000):
1. Para cualquier suceso solo existen dos posibles resultados, verdadero o falso,
aceptable o defectuoso, llueve o no llueve.
2. La proporcin de elementos de cada categora (V o F) en la poblacin se mantiene
constante.
3. Las observaciones son independientes unas de otras y cada realizacin no contiene
informacin sobre la siguiente.
Se asume que son procesos de Bernoulli aquellos en los que se dan observaciones con
reemplazamiento en una poblacin finita o infinita que cumpla las condiciones
anteriores, estabilidad e independencia en las observaciones. En este proceso se pueden
definir diferentes variables aleatorias de inters, con sus funciones de distribucin
asociadas.
100
5.2.1
Distribucin de Bernoulli
La variable aleatoria es en este caso la definida por los posibles resultados, verdadero o
falso, 0 1, llueve o no llueve. Cada una de las dos posibilidades tiene una probabilidad
de ocurrencia constante. Si el resultado es aceptable, la probabilidad de ocurrencia es el
porcentaje fijo de sucesos aceptables o verdaderos, q. El caso contrario se define por el
porcentaje asociado, p, igual al complementario del anterior, 1-q. Considerando la
variable aleatoria definida con 0 para el caso del suceso aceptable y con 1 para el falso o
rechazable, la funcin de probabilidad puede expresarse:
Ec. 131. Distribucin de Bernoulli
P( x) = p x q 1 x
x = 0,1
Esta funcin de distribucin tienen los estadsticos asociados a la poblacin:
Media Desviacin tpica
pq
Sesgo
Curtosis
q p
pq
Tabla 23. Estadsticos de la distribucin de Bernoulli
Clculo del coeficiente de sesgo o asimetra de la distribucin de Bernoulli
CA( X ) =
=
=
E (x E (x ))
] = ((x p ) P( x )) =
3
(0 p )3 q + (1 p )3 p = p3 + p 4 + p 3 p 2 + 3 p3 p 4
pq
p 1 3 p + 2 p 2
5.2.2
pq
pq
p 3 p 2 + 2 p 3
) = p(1 p )( 1 2 p ) = pq(q p ) = (q p )
pq
pq
pq
pq
Distribucin Binomial
En el mismo proceso (Pea, 2000) puede definirse otra variable aleatoria, distinta de la
anterior, que represente el nmero de elementos rechazables (valor 1 y con probabilidad
de ocurrencia p) al observar n. Entonces, la nueva variable aleatoria puede tomar
valores desde 0, es decir, todas las observaciones de n son aceptables, hasta n, todas
rechazables. La probabilidad de que dadas las n observaciones, r sean rechazables,
supuesta la independencia entre las observaciones, ser:
Ec. 132. Probabilidad de obtener r rechazables en un orden determinado
P( x = r ) = p r q n r
Pero como el nmero de posibilidades para obtener r elementos rechazables de n

coincide con el nmero de combinaciones posibles de r elementos en n, la funcin de
probabilidad queda:
101
Ec. 133. Distribucin binomial
n
P( x = r ) = p r q n r
r
Con los estadsticos asociados que se muestran en la siguiente tabla:
Media
Desviacin tpica
n p
Sesgo
Curtosis
q p
n pq
3+
n pq
1 6 pq
n pq
Tabla 24. Estadsticos de la distribucin binomial
Ejemplo: estimar el valor de la media y varianza de la distribucin binomial.

Aprovechando el clculo para la de Bernoulli,
E ( X ) = E ( X 1 + X 2 + ... + X n )
E ( X ) = n p
E ( X i ) = 0q + 1 p = p
V ( X ) = E ( X 1 + X 2 + ... + X n )
V ( X i ) = E ( X i E ( X i ))
V ( X ) = n pq
= (0 p ) q + (1 p ) p = p q + q p = q p
2
En las siguientes figuras se muestra la distribucin de probabilidad para diferentes

proporciones de elementos rechazables, siguiendo los ejemplos de Pea (2000). Con p
igual al 50% la distribucin es simtrica; en otros casos, asimtrica.
p= 0,2
p= 0,1
0,12
0,14
0,12
0,1
Probabilidad
Probabilidad
0,1
0,08
0,06
0,04
0,08
0,06
0,04
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
0,02
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
0,02
Nmero de elementos rechazables
p= 0,5
0,09
0,09
0,08
0,08
0,07
0,07
0,06
0,06
Probabilidad
Probabilidad
p= 0,4
0,05
0,04
0,03
0,05
0,04
0,03
0,02
0,02
0,01
0,01
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Figura 42. Distribuciones binomiales de probabilidad para distintos porcentajes de p
102
Ejemplo: se estima como criterio de diseo un probabilidad de que se produzca una

crecida de 0,2 (5 aos de periodo de retorno). La construccin de la obra va a durar 5
aos. Cul es la probabilidad de que aparezca una crecida anual al menos una vez
durante la construccin de la presa.
La probabilidad de que se produzca al menos una vez es la suma de las probabilidades
de ocurrencia de una vez, dos veces, tres veces, cuatro veces y cinco veces.
5
5
P = 0,2 i 0,8 5i = 0,67
i =1 i
5.2.3
Distribucin Geomtrica
En el caso en que se quiera calcular la probabilidad de obtener un nmero de elementos

dado hasta el primero rechazable (Pea, 2000), se tiene la distribucin geomtrica.
Tomando n como nmero total de observaciones, n-1 ser el nmero de observaciones
aceptables, con probabilidad q, y 1 el nmero de las rechazables con probabilidad p que
pone fin al suceso. La funcin de distribucin se muestra a continuacin:
Ec. 134. Distribucin geomtrica
P( x = n) = pq n 1
Media
Desviacin tpica
q
p
Sesgo
1+ q
Curtosis
3+
p 2 + 6q
q
Tabla 25. Estadsticos de la distribucin geomtrica
Clculo de la media de la distribucin geomtrica,
= (iP( x = i )) = p + 2 pq + 3 pq 2 + ... + n pq n 1 + ...

i =1
(1 q ) = pq + pq 2 + pq 3 + ... + pq n + ... = 1 + q + q 2 + q 3 + ... + q n + ...

(1 q ) = 1 =
1
p
Tambin en este caso se muestran grficas representativas de la distribucin de

probabilidad para diferentes valores del porcentaje p de elementos rechazables. Al
aumentar p, se comprueba la concentracin de la densidad de probabilidad alrededor de
los primeros valores y la disminucin de probabilidad para casos con n grandes.
103
p= 0,1
p= 0,4
0,12
0,45
0,40
0,10
Probabilidad
Probabilidad
0,35
0,08
0,06
0,04
0,30
0,25
0,20
0,15
0,10
0,02
0,05
36
40
44
48
40
44
48
32
28
24
36
Nmero de elementos
20
16
12
48
44
40
36
32
28
24
20
16
12
0,00
0
0,00
Nmero de elementos
p= 0,5
p= 0,7
0,60
0,80
0,70
0,50
Probabilidad
Probabilidad
0,60
0,40
0,30
0,20
0,50
0,40
0,30
0,20
0,10
0,10
Nmero de elementos
32
28
24
20
16
12
48
44
40
36
32
28
24
20
16
12
0,00
0
0,00
Nmero de elementos
Figura 43. Distribuciones geomtricas para distintos valores de p.
Ejemplo: calcular la probabilidad de que la crecida de 5 aos de periodo de retorno se

produzca por primera vez el quinto ao.
Aplicando la funcin de distribucin geomtrica
P( x = 5) = pq 51 = 0,20,8 4 = 0,08
5.3
PROCESO DE POISSON
Todas las variables del proceso anterior son discretas. El proceso de Poisson
corresponde a la observacin de sucesos puntuales sobre un soporte continuo, tiempo,
longitud, rea, etc. (Pea, 2000). Por ejemplo, se podran considerar as la ocurrencia de
tormentas en el tiempo. Este proceso se caracteriza por:
1. El nmero medio de sucesos es constante por unidad de observacin. Es decir, el
nmero de tormentas por unidad de tiempo es constante. La proporcin se
representa por en la formulacin que sigue.
2. Los sucesos aparecen aleatoriamente de forma independiente y un nmero de
tormentas no condiciona la aparicin de otras.
104
5.3.1
Distribucin de Poisson
En este caso, la variable aleatoria considerada es el nmero de sucesos en un intervalo

de longitud fija (Pea, 2000). Para hallar su funcin de distribucin se parte de una
funcin de distribucin binomial, suponiendo que el nmero n de elementos es infinito,
ya que las observaciones puntuales se producen sobre un continuo. Adems se ha de
suponer que la probabilidad de observar una caracterstica determinada, p, es reducida
(por ejemplo la presentacin de una tormenta). La constante definida anteriormente
como el nmero medio de sucesos por unidad de observacin, ser igual al producto del
nmero total de elementos que constituyen esa unidad de observacin, por el porcentaje
de elementos seleccionados np. Mientras n tiende a (ya que trabajamos sobre un
intervalo infinitesimal) este porcentaje p es tendente a cero. Aplicando la condicin de
lmite a la funcin de distribucin binomial se llega a la definicin final de la
distribucin de probabilidad para esta nueva variable aleatoria.
Ec. 135. Distribucin de Poisson
P( x = r ) =
r
r!
Demostracin:
r
n
P( x = r ) = 1
n
r n
nr
n
lim 1
n r
n n
nr

1
n
r
n( n 1)...(n r + 1)
r
n(n 1)...(n r + 1) n
= lim
= lim
r
1 n =
r! n
r! n
(n ) r
nr

1
n
r
r!
Los estadsticos bsicos de esta funcin de distribucin son:

Media
Desviacin tpica
Sesgo
Curtosis
3+
Tabla 26. Estadsticos de la distribucin de Poisson
En las siguientes grficas se puede apreciar cmo la distribucin de probabilidad tiende

hacia la simetra, a medida que aumenta el valor de ,. La variable aleatoria sigue
siendo discreta y los valores de mayor frecuencia se concentran alrededor de .
105
landa= 2
0,70
0,30
0,60
0,25
45
50
50
0,20
45
landa= 10
40
landa= 5
35
Nmero de elementos
40
Nmero de elementos
35
30
50
45
40
35
30
25
20
15
0,00
10
0,05
0,00
0
0,10
25
0,10
20
0,20
0,15
15
0,30
0,20
10
0,40
0,50
Probabilidad
Probabilidad
landa= 0,5
0,14
0,18
0,12
0,14
Probabilidad
Probabilidad
0,16
0,12
0,10
0,08
0,06
0,10
0,08
0,06
0,04
0,04
0,02
0,02
Nmero de elementos
30
25
20
15
10
50
45
40
35
30
25
20
15
10
0,00
0
0,00
Nmero de elementos
Figura 44. Distribuciones de probabilidad de Poisson para distintos valores de .
Ejemplo: suponiendo un nmero medio de tormentas durante la primavera de 20,

calcular la probabilidad de que se produzcan 10 tormentas en esa estacin
P( x = r ) =
= 20
r = 10
e
r!
2010 20
e = 0,006
P ( x = 10) =
10!
Calcular la probabilidad de que se produzcan 5 tormentas en 46 das (1 mes y medio

suponiendo que la duracin de la primavera es de tres meses, 92 das).
e
r!
20
10 5 10
=
= 10
e = 0,038
P( x = 5) =
2
5!
r =5
P( x = r ) =
106
5.3.2
Distribucin exponencial
En este caso la variable aleatoria se define como el intervalo de tiempo entre dos
ocurrencias consecutivas. En este caso ya se trata de una variable continua. Para hallar
la funcin de probabilidad de la variable continua tiempo se utiliza la anterior
distribucin de Poisson. Para ello, se considera que la probabilidad de tener un intervalo
de tiempo entre dos ocurrencias consecutivas de duracin mayor que t, es igual que la
probabilidad de que no tengamos ningn suceso en el intervalo t. La constante de
Poisson ser ahora t y r es 0, quedando:
Ec. 136. Distribucin exponencial
F (t ) = P(T t ) = 1 e t
Demostracin: utilizando la funcin de distribucin de Poisson,
e P( x = 0) = P(T > t ) = e t F (t ) = P(T t ) = 1 e t

r!
F
f (t ) =
= e t
t
P( x = r ) =
Los estadsticos de la funcin se muestran en la siguiente tabla:

Media
1/
Desviacin tpica
1/
Sesgo
Curtosis
Tabla 27. Estadsticos de la distribucin exponencial
La siguiente grfica muestra la funcin de densidad de la exponencial para distintos

valores de la constante . El inverso de esta constante es el factor de escala.
0,80
0,70
0,5
0,60
2
f(x)
0,50
0,2
0,40
0,30
0,20
0,10
30
25
20
15
10
0,00
Tiempo
Figura 45. Distribuciones exponenciales en funcin del valor de .
Las expresiones anteriores se pueden transformar para considerar la presencia de un

factor de localizacin x0 y de escala =1/
107
Ec. 137. Distribucin exponencial de dos parmetros
F ( x) = 1 e
x x0
Con lo que la media ahora pasa a ser x0+

5.3.3
Distribucin Gamma
Ahora se considera la distribucin de la variable aleatoria x, tiempo que transcurre hasta

el r-simo xito (Pea, 2000). Aplicando que la probabilidad de que la variable aleatoria
supere un tiempo t es igual a la probabilidad de obtener r-1 sucesos Poisson en t, se
tiene,
Ec. 138. Densidad Gamma
f (t ) =
1
r t r 1 e t
(r 1)!
r>0
Demostracin:
r 1
F (t ) = 1 P( x > t ) = 1
x=0
f (t ) =
( t )x e t F (t ) = 1 r 1 ( t )x e t
x!
x =0
x!
1
F
=
r t r 1e t
t (r 1)!
Los estadsticos de la funcin se muestran en la siguiente tabla:

Media
Desviacin tpica
Sesgo
Curtosis
Tabla 28. Estadsticos de la distribucin Gamma
Si se definen los factores de escala, =1/ y forma, k, igual a r, sin factor de

localizacin, la funcin de densidad quedara:
Ec. 139. Densidad Gamma en funcin del factor de escala
f (t ) =
1
t k 1e
( )
k
k >0
En la siguiente figura se aprecian los cambios en la forma de la funcin de densidad

Gamma al variar los valores de los parmetros de escala y forma.
108
0,12
k=5;alfa=2
k=10;alfa=2
0,10
k=5;alfa=4
f(x)
0,08
0,06
0,04
0,02
0,00
0
10
15
20
25
30
35
40
45
50
Figura 46. Funciones de densidad de gamma.

Esta funcin de distribucin con dos parmetros tiene lmite inferior cero, lo que puede dar
problemas para utilizarla con variables hidrolgicas que tengan como lmite inferior un valor
superior (Chow, 1994).
5.3.4
Distribucin Pearson III
Una funcin de distribucin utilizada en hidrologa es la Pearson III. Procede de la

consideracin de una distribucin Gamma a la que se aade un factor de localizacin u.
Ec. 140. Densidad Pearson III
f ( x) =
1
k 1
( x u ) e
k
(k )
( x u )
k >0
Los estadsticos en funcin de los parmetros de localizacin, escala y forma, se
muestran en la siguiente tabla:
Media
Desviacin tpica
u + k
Sesgo
Curtosis
-
2
k
Tabla 29. Estadsticos de la distribucin Pearson III
5.3.5
Distribucin Log-Pearson III
Si los logaritmos de la variable aleatoria siguen la distribucin de Pearson III, la

variable aleatoria se dice que sigue la denominada funcin de log-Pearson III, que ha
sido utilizada para el anlisis de mximos anuales de avenidas desde su recomendacin
por Water Resources Council (WRC) de EE.UU. La funcin de distribucin logPearson III tiene 3 parmetros. En la siguiente ecuacin, u, y k representan los
factores de localizacin, escala y forma de los logaritmos.
109
Ec. 141. Densidad log-Pearson III
f ( x) =
1
ln x u
x (k )
k 1
ln x u
Al tener 3 parmetros, su ajuste se hace muy sensible a los valores observados y a la

longitud de las series. Para evitar las incertidumbres asociadas al ajuste se pueden
regionalizar factores como el coeficiente de sesgo, que se tomara entonces como dato
en estaciones pertenecientes a cada regin hidrolgica. En la siguiente figura se
comprueban las diferentes familias segn el ajuste alcanzado.
Media
Desviacin tpica
Sesgo
68,71
35,04
3,53
1,80
0,15
1,70
Figura 47. Ajustes de una funcin log-Pearson III a lluvias mximas anuales
Media
Desviacin tpica
Sesgo
1525,33 3,17
354,11 0,11
0,02 -0,43
Figura 48. Ajustes de una funcin log-Pearson III a lluvias mximas anuales.
110
Media
Desviacin tpica
Sesgo
2569,58 3,40
428,20 0,08
-1,37 -1,94
Figura 49. Ajustes de una funcin log-Pearson III a lluvias mximas anuales
La forma de la funcin ajustada puede ser en J, J invertida, U, U invertida. Cualquier

resultado no es vlido para aplicarlo en hidrologa. Kite (1981) recomienda controlar su
aplicacin a aquellos casos en los que el coeficiente de forma es mayor que 1 y el de
escala es positivo, con lo que resulta una funcin unimodal sin lmite superior. Es decir,
se seleccionan las situaciones que tienen sesgo positivo y mayor que uno para que la
transformacin logartmica no imponga un lmite superior. En el caso de las figuras
anteriores solo la primera lo cumplira.
Los estadsticos, en el espacio logartmico, se muestran en la tabla siguiente:
Media
u + k
Desviacin tpica
Sesgo
Curtosis
2signo( )
k
Tabla 30. Estadsticos de los logaritmos en la distribucin log-Pearson III
5.4
DISTRIBUCIONES DE VALORES EXTREMOS
Hay una serie de funciones de distribucin utilizadas para sucesos extremos en

hidrologa, mximos o mnimos, seleccionados de un conjunto de datos. Es el caso de
los mximos anuales, caudales y precipitacin, sobre los que se aplican funciones de
distribucin que daran un soporte terico del fenmeno. Funciones de distribucin de
este tipo son las derivadas de la familia de valores extremos generalizados, GEV, o la
SQRT et max.
5.4.1
Funciones de distribucin de valores extremos generalizados GEV
La familia de funciones de valores extremos generalizados GEV son la solucin del

problema de mximos o mnimos de series de datos independientes e idnticamente
distribuidos, planteado de la siguiente manera (Kite, 1981; Llamas, 1993).
Sea una variable aleatoria cuya funcin de distribucin es
111
G ( x) = P( X x)
La serie anterior puede estar representada por precipitaciones mensuales. Se divide la
serie total en subseries de longitud fija, k, para elegir el mximo o mnimo de cada una
de ellas. La longitud total de la serie es n y las longitudes parciales son k por lo que se
tiene un nmero n/k de mximos y mnimos.
Las funciones de distribucin de los mximos y mnimos se denotan por M(x) y m(x).
M ( x ) = P( X Mx x)
m( x) = P( X mn x)
Tanto el mximo y mnimo de cada subserie, son mximos o mnimos de todos los
valores de cada subserie, por lo que:
M ( x ) = P ( X Mx x) = P( X 1 x;... X k x) = P(( X i x)) = P( X i x) = G ( x) k

m( x) = P ( X mn x ) = 1 P ( X mn > x) = 1 P ( X 1 > x;... X k > x) = 1 P(( X i > x )) =
= 1 P (X i x) = 1 (1 G ( x ) )
quedando planteada la condicin sobre mximos y mnimos
El conjunto de las familias se expresa segn la funcin de distribucin siguiente:

Ec. 142. Funciones de distribucin GEV (NERC, 1975)
F ( x) = e
k
1 k x u

0,6 < k < 0,6

Cada funcin de distribucin est caracterizada por el valor de los parmetros, u de
localizacin, de escala y k de forma. Los tres grupos de funciones dependen del valor
de k, positivo, negativo y nulo cuyas denominaciones se presentan en la siguiente tabla.
Denominacin
GEV1 Fisher-Tippet o Gumbel
GEV2
Frechet
GEV3
Weibull
Valor de k Forma en papel

extremo Gumbel
nulo
negativo
positivo
recta
cncava
convexa
Tabla 31. Tipos de funciones de distribucin GEV.
112
Periodo de retorno (aos)

2
10000
10
25
50 100
200 500 1000
5000 10000
9000
GEV2
8000
7000
mm
6000
GEV1
5000
4000
3000
GEV3
2000
1000
0
Figura 50. Forma de las distribuciones GEV en funcin del signo de k.
En la siguiente figura se muestra la forma de las distintas funciones de densidad. Las

tres aparecen con sesgo positivo, pero la GEV2 es la que da ms peso a la cola de la
derecha.
0,0012
GEV3
GEV2
0,0010
GEV1
densidad
0,0008
0,0006
0,0004
0,0002
0,0000
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Figura 51. Funciones de densidad GEV.
5.4.1.1 GEV1, distribucin de Gumbel

El valor de k es nulo y la funcin de distribucin tiene un sesgo de 1,14. Tomando
lmites, la expresin anterior para la familia GEV queda:
113
Ec. 143. Funciones de distribucin y densidad de Gumbel
F ( x) = e
f ( x) =
x u
e
x u
x u e

Figura 52. Ajuste de una distribucin de Gumbel

Media
u + 0,5772
Desviacin tpica Sesgo Curtosis
1,14
6
Tabla 32. Estadsticos de la distribucin de Gumbel
La funcin de distribucin Gumbel se puede derivar de la condicin de funciones de

distribucin de mximos expuesta anteriormente.
G( y) = 1 e
= 1 e P( X Mx x) = P( X Mx y + ln( k )) = 1 e y ln( k
x = y + ln( k )
M ( x ) = G ( x) k
ey
= 1
k
x u
lim P( X Mx x) = e e = e e
k
Una caracterstica interesante de la distribucin Gumbel es que el parmetro de

localizacin u coincide con la moda, valor de mxima frecuencia.
Se puede plantear la estandarizacin de la funcin de distribucin utilizando como
variable reducida la que considera el factor de escala y localizacin de la misma manera
que en la normalizacin. Adems, el cuantil se puede expresar fcilmente en funcin del
114
periodo de retorno T
1
y

F ( x) = e e y = ln ln
F ( x) y = ln ln T
T 1
F ( x) = P( x < X T ) F ( x) = 1
y=
xu
5.4.1.2 GEV2, distribucin de Frechet

La funcin de Frechet toma ahora valores negativos para el parmetro de forma k y la
variable x tiene un lmite inferior. El parmetro de escala es positivo (NERC, 1975).
Ec. 144. Funciones de distribucin y densidad de Frechet
F ( x) = e
k
1 k x u

1
xu
f ( x) = 1 k

k < 0, > 0, u +
1 1
k
k
1 k x u

A continuacin se muestra un ajuste sobre datos de precipitacin mxima. La forma de

la distribucin se ajusta a la curvatura cncava de los mximos de forma tal que no
encuentra asntota.
Figura 53. Ajuste de una distribucin GEV2
5.4.1.3 GEV3, distribucin de Weibull

Por ltimo, esta funcin GEV3 tiene forma convexa, con valores del factor de forma y
escala, k y , positivos y un lmite superior en la variable.
115
Ec. 145. Funciones de distribucin y densidad de EV3
F ( x) = e
f ( x) =
k
1 k x u

1
xu
1 k
1 1
k
k > 0, > 0, x u +
k
1 k x u

Figura 54. Ajuste de una distribucin EV3.
En el ajuste de caudales mnimos, se utiliza la siguiente expresin de la distribucin de

Weibull.
Ec. 146. Expresin de la funcin de distribucin Weibull para mnimos
F ( x) = 1 e
x u 1k

k > 0, > 0, u x
en funcin de los parmetros de forma k, escala y lmite inferior u. Se supone que este
lmite mnimo tiene un valor positivo. Si se toma un valor nulo, queda la distribucin
Weibull de dos parmetros:
Ec. 147. Funcin de distribucin Weibull de dos parmetros
F ( x) = 1 e
x 1k

> 0, u x
116
Caudal mnimo (m/s)
10
25
50 100
200
400
380
360
340
320
300
280
260
240
220
200
180
160
140
120
100
80
60
40
20
0
500 1000
5000 10000
Periodo de retorno (aos)
Figura 55. Ajuste de una distribucin Weibull de dos parmetros
5.5
OTRAS FUNCIONES DE DISTRIBUCIN
5.5.1
TCEV
La ley TCEV, Two Component Extreme Value, se plantea con la posibilidad de resolver
el problema de la condicin de separacin de sesgo (Ferrer, 1996). Este problema
consiste en que las desviaciones tpicas de los coeficientes de sesgo de los valores
observados son mayores que los correspondientes a las derivadas de la utilizacin de
modelos tradicionales. La ley TCEV depende de cuatro parmetros y su expresin
deriva de la consideracin de dos mecanismos generadores de las tormentas,
denominados bsico y extraordinario (Ferrer, 1996). Ambos se modelan con una
distribucin de Gumbel y suponiendo la independencia de procesos, la distribucin
TCEV queda como producto de dos funciones Gumbel y 4 parmetros.
Ec. 148. Funciones de distribucin TCEV
F ( x) = e
5.5.2
x u1
e 1
x u 2
e 2
Funcin de distribucin SQRT ET-mx
La funcin de distribucin SQRT ET-mx da un esquema terico para el anlisis de

mximos de lluvia anual segn las siguientes hiptesis (Ferrer, 2000):
1. la duracin y la intensidad de un fenmeno tormentoso son fenmenos
independientes
117
2. la duracin de lluvia se distribuye segn una exponencial y la intensidad segn

una ley Gamma
3. la cantidad total de lluvia de un fenmeno tormentoso es proporcional al
producto de duracin por intensidad
4. la ocurrencia de grandes chubascos sigue la distribucin de Poisson
Queda una funcin de distribucin segn la siguiente ley de 2 parmetros, k de forma y
de escala. Los momentos no se pueden obtener de forma analtica por lo que hay que
aplicar integraciones numricas para el ajuste (Ferrer, 1996).
Ec. 149. Funcin de distribucin SQRT ET-mx
F ( x) = e k [(1+
x e
x0
Figura 56. Aplicacin de la SQRT ET-mx a series de lluvias mximas anuales
Esta funcin de distribucin es de fcil manejo por tener nicamente dos parmetros y
eleva los valores de los cuantiles de precipitacin mxima respecto a los dados por la
Gumbel gracias a la raz cuadrada del segundo trmino exponencial (Etoh, 1987).
118
119
COMPLETADO DE SERIES HIDROMETEOROLGICAS
Uno de los problemas que frecuentemente se encuentran en hidrologa es la existencia de

lagunas en las series de datos registrados de una estacin pluviomtrica o hidromtrica y la
necesidad de pronosticar sus valores. Estas lagunas pueden extenderse durante un periodo largo
de tiempo porque la estacin haya dejado de funcionar, o bien pueden tener un carcter puntual,
debido a que el aparato se haya estropeado, que la persona encargada de la medicin no las haya
realizado, o haya existido un problema de trascripcin de datos.
Para completar las lagunas de estas series existen dos alternativas. En primer lugar, se podran
estimar reproduciendo el fenmeno fsico relativo al dato en cuestin, procedimiento que puede
complicarse por la dificultad intrnseca para la simulacin de algunos fenmenos. Es el caso de
las precipitaciones, cuya simulacin fsica depende del conocimiento que se posea sobre la
circulacin atmosfrica, humedad, temperatura, etc. Otros procesos, como la generacin de
escorrenta, muy ligada a la ocurrencia de precipitaciones, admiten la simulacin del ciclo
hidrolgico conforme a leyes conceptuales o fsicamente basadas.
Tambin se pueden rellenar las lagunas utilizando la informacin subyacente en la

propia serie de datos de cada estacin y en la relacin que estos datos mantengan con
los de otras estaciones con las que comparten factores como la pertenencia a la misma
regin climtica, mismos regmenes de caudales etc. (modelos de interpolacin
temporal, autorregresivos y de regresin en general).
El diseo de la estructura del modelo estocstico hace que se manejen conceptos
similares a la hora de hablar de la generacin de series sintticas. stas son de utilidad
cuando se trata de calcular algn estadstico, ligado a una frecuencia segn patrones de
diseo. En ellas, los datos se asumen como pertenecientes a un fenmeno aleatorio que se
puede manejar por medio del conocimiento de una serie suficientemente larga o de su funcin
de distribucin. Las propiedades estadsticas bsicas describen su tendencia central, su
variabilidad, el sesgo, la correlacin con otras series o la autocorrelacin, que intenta describir
el hecho de que caudales altos o bajos en series hidrometeorolgicas tienden a ser seguidos por
caudales altos o bajos, respectivamente. Tal como se expondr, la aplicacin de estas tcnicas
exige admitir hiptesis dependientes del tipo de dato, por las cuales usualmente se distingue
entre datos meteorolgicos e hidromtricos.
La eleccin de un intervalo temporal de trabajo tiene influencia en el tipo de modelo a utilizar.
En los apartados siguientes se realiza una exposicin de las tcnicas estocsticas de completado
de series meteorolgicas y de caudales con escala mnima mensual, que es generalmente la
escala temporal de trabajo utilizada en estudios de recursos.
6.1
PROPIEDADES DE LAS SERIES TEMPORALES
Tal como se avanz en el captulo dedicado a la estadstica descriptiva, las series

temporales son secuencias de datos histricos o sintticos producidos por un proceso
aleatorio durante sucesivos intervalos de tiempo. En los apartados siguientes se
considera que el trmino i-simo, xi, de una serie temporal est constituido por una parte
determinista, di, y una parte aleatoria, ei,
120
Ec. 150. Descomposicin del modelo de series temporales
xi = di + ei
La parte determinista es funcin de las caractersticas que extraigamos de la serie como
la media, la variabilidad de la muestra y los tipos de correlacin que mantenga la propia
serie consigo misma o con otras registradas en el entorno. La parte aleatoria tiene
asociada una funcin de distribucin, por ejemplo, una funcin uniforme, la normal,
logartmico normal, etc. Es decir, este diseo, vlido para completado y generacin de
series sintticas, ha de considerar las siguientes cuestiones (Fiering-Jackson, 1971):
a. Un valor anterior guarda o no informacin del siguiente o siguientes
valores?. Si es as cmo?. Es el inmediatamente anterior o es una serie de
valores anteriores?. Los modelos han de considerar la informacin
contenida en cuntos pasos anteriores?
b. Qu variables se pueden seleccionar con informacin sobre una dada?.
Podemos disear un modelo estocstico que permita prever, por ejemplo,
una serie de caudales con los registrados en otros puntos del territorio o con
series de precipitacin?. Se pueden aprovechar las caractersticas regionales
del fenmeno?.
Una serie temporal quedara caracterizada con el conocimiento de las funciones de
distribucin correspondientes a cada paso t en que se realiza y las relaciones entre ellas.
En cada paso, son posibles multitud de resultados con una distribucin de probabilidad
asociada. Con suficientes realizaciones a lo largo del tiempo, podramos manejar la
distribucin conjunta, la de dos variables consecutivas o la de cualquier subconjunto de
variables. En la prctica esta caracterizacin se simplifica a conocer el vector de las
medias correspondientes a cada instante, las varianzas y las covarianzas.
La estacionariedad hace referencia al mantenimiento de estas propiedades en el tiempo
y, en concreto, se denomina estacionariedad dbil cuando media y varianza se
mantienen constantes y las covarianzas solamente dependen del paso o intervalo de
tiempo considerado:
1. Media: (t)=
2. Desviacin tpica: (t)=
3. Covarianzas, (xt+k,xt)= k o si se prefiere en trminos del coeficiente de
autocorrelacin, k= k/ o.
Otro estadstico de la serie temporal es el coeficiente de sesgo, representativo de la falta
de simetra de las distribuciones hidrolgicas. Desde la perspectiva en que se estudian
aqu las series temporales, su influencia es importante para elegir el tipo de funcin de
distribucin o la transformacin necesaria en los datos. Se suele tener como referencia
por aplicacin del teorema central del lmite la funcin de distribucin normal o la
logartmico normal y cuando los sesgos son pronunciados, se recurre a funciones tipo
gamma como las expuestas en captulos anteriores.
En Fiering-Jackson (1971) se destaca el papel que tiene la persistencia de los datos
hidrolgicos en la seleccin del nmero de datos para estimar las propiedades
121
anteriores. Aparte de la influencia negativa que tiene en la estimacin de los estadsticos

anteriores la posible actividad humana, se menciona el que el hecho de que los datos
hidrolgicos tiendan a parecerse a los anteriores. Series con una alta persistencia,
requerirn mayor cantidad de valores a la hora de estimar la media. Otras con
persistencias bajas, tienen menor necesidad de valores., Los autores mencionados
refieren necesidades entre los 30 y 50 datos.
En el captulo dedicado a la estadstica descriptiva se trat la existencia de ciclos y
movimientos en las series temporales. Estos cambios hacen que no se cumpla la
propiedad de estacionariedad. Sin embargo, la consideracin de ciclos constantes
permite sortear este problema utilizando los asociados a los ciclos en cuestin y
transformaciones como la normalizante u otras similares. Una vez estimado el paso
temporal y el tratamiento de los ciclos estacionales, el procedimiento a seguir constara
de las siguientes fases
1. Elegir el periodo de completado en funcin de las necesidades del estudio y
de las caractersticas de los datos existentes como problemas por
alteraciones, disponibilidad suficiente de datos, etc.
2. Calcular estadsticos como la media, desviaciones tpicas, coeficientes de
sesgo y coeficientes de autocorrelacin.
3. Tanteo de funciones de distribucin adecuadas a los datos. Primero se tantea
el posible ajuste segn una normal o una logartmico normal. Si se estima
que el sesgo es importante, habr que ir a una distribucin gamma.
4. Transformacin de las series hidrometeorolgicas para filtrar
componentes estacionales o eliminar los sesgos.
las
5. Establecimiento de la ecuacin de regresin y decisin sobre el grado de

correlacin: simple, doble, triple, etc.
6. Proceder al completado estableciendo criterios de orden y priorizacin en las
variables transformadas.
7. Deshacer las transformaciones realizadas sobre las series completadas.
6.2
COMPLETADO DE SERIES MENSUALES SIN PERSISTENCIA.
Con carcter general, el completado de datos meteorolgicos se puede realizar

utilizando una serie de tcnicas que abarcaran desde la consideracin de la media
aritmtica, que permite rellenar datos entre series bajo determinadas condiciones de
similitud; el ratio normal, para el relleno de series homogneas, mediante el uso de
expresiones como:
Pi , 4 =
P
P
1 P4
Pi ,1 + 4 Pi , 2 + 4 Pi , 3
3 P1
P2
P3
en la que el subndice i es indicativo del dato a rellenar en una estacin 4 a partir de los
datos contemporneos registrados en las estaciones 1, 2 y 3 y de las relaciones entre las
122
medias de las series registradas en cada uno de las cuatro estaciones; el inverso
distancia al cuadrado y aquellos mtodos que aprovechan superficies de interpolacin
representativas del dato en una regin, como las isoyetas para las precipitaciones; hasta
los mtodos de regresin simple y mltiple, que permiten la obtencin de los valores
incgnita en funcin del grado de asociacin entre series de datos.
6.2.1
Regresin simple
6.2.1.1 Posibilidades de ajuste

Estudiada la correlacin entre dos variables el paso que ahora se trata es el de encontrar
una curva de ajuste a la nube de dispersin que permita expresar la variable dependiente
en funcin de la independiente y estimar los valores de una en funcin de los de la otra.
Para este propsito se emplean las tcnicas de regresin y la curva de ajuste mencionada
se denomina curva o ecuacin de regresin.
El ajuste de una curva a un diagrama de dispersin entre dos variables puede realizarse
de diversas maneras. En primer lugar cabe mencionar la validez de un ajuste a
sentimiento que permitira introducir la experiencia del autor en la estimacin. Sin
embargo, la falta de una expresin analtica reduce la utilidad de esta tcnica.
Otra opcin es utilizar una expresin matemtica predefinida. Elegido el tipo de
relacin, lineal o polinmica y de qu grado, exponencial, logartmica, etc. queda
encontrar el mejor ajuste en funcin de los datos disponibles. En el caso de la regresin
lineal una recta expresa la relacin entre las dos variables. Y esta recta depende de dos
parmetros, a, pendiente, y b, trmino independiente.
45
Trmino independiente
40
Pluvimetro B (mm)
Pendiente
yest = a x + b
35
30
25
20
15
Variable independiente
Variable dependiente
10
10
15
20
25
30
35
40
45
Pluvimetro A (mm)
Figura 57. Ajuste recta de regresin
Son tambin posibles otros mtodos de ajuste, como asignar valores medios de la
variable dependiente y a cada intervalo de la independiente x. Viene a ser una condicin
que determina una curva de ajuste discontinua, por escalones, pero con mejor
adaptacin a la nube de puntos. En todo caso, una vez realizado el proceso previo, se
pueden buscar polinomios de aproximacin que suavicen las discontinuidades.
123
Intervalo de
precipitaciones en el
pluvimetro A (mm)
Valor medio de la
precipitacin en el
pluvimetro B (mm)
x < 17
17 x < 20
20 x < 23
23 x < 26
26 x < 29
29 x < 32
32 x < 35
35 x
24,5
27,5
27,4
25,0
27,8
30,7
30,7
35,0
Ajuste por condicin de intervalos

45
40
35
30
25
20
15
10
10
15
20
25
30
35
40
45
Pluvimetro A (mm)
Tabla 33. Ajuste mediante una condicin por intervalos
6.2.1.2 Recta de ajuste por mnimos cuadrados entre dos series

El mtodo de los mnimos cuadrados que se basa en la minimizacin del error
cuadrtico medio de la curva de ajuste respecto a la nube de dispersin. Este error
cuadrtico medio se define como el sumatorio de las diferencias al cuadrado entre el
valor de y muestral y el estimado yest mediante la ecuacin de ajuste para el
correspondiente valor de x. Por tanto, la condicin de minimizacin para una funcin de
ajuste entre x e y, yest=f(x) dependiente de unos parmetros ak, se expresa como:
Ajuste lineal por mnimos cuadrados
45
(yi-yesti)
n
ECM = ( yi yesti )2
i =1
ECM
=0
a
ECM
=0
b
Pluvimetro B (mm)
40
yest = a x + b
35
30
25
20
15
10
10
15
20
25
30
35
40
Pluvimetro A (mm)
Figura 58. Ajuste de una recta de regresin por mnimos cuadrados.
En general, las expresiones se deducirn de:

Ec. 151. Condiciones para el ajuste por mnimos cuadrados
n
ECM = ( yi y esti ) 2
i =1
124
k (1, n )
ECM
=0
ak
45
Permitiendo obtener los parmetros ak de la funcin f(x). Las siguientes expresiones dan
la estimacin de los coeficientes a y b aplicando la condicin de mnimos cuadrados si
se adopta una relacin lineal entre x e y.
Ec. 152. Ajuste por mnimos cuadrados
n
i =1
i =1
ECM = ( yi yesti ) 2 = ( yi (axi + b )) =
yest = a x + b
= yi2 + (a xi + b ) 2 yi (a xi + b )
2
i =1
n
n
ECM
= (2(a xi + b )xi 2 yi xi ) = 2 a xi2 + b xi yi xi = 0
a
i =1
i =1
i =1
i =1
i =1
i =1
a xi2 + bn x xi yi = 0 a xi2 + bnx = xi yi

n
ECM
= 2(axi + b ) 2 yi = 0 ax + b = y b = y a x
b
i =1
i =1
i =1
a xi2 + bn x = xi yi a xi2 + n yx na x = xi yi
i =1
x y
i
i =1
a=
i =1
n
xi2
i =1
n
y x
2
x
x y
i
i =1
b= y
xi2
i =1
n
y x
2
x
Finalmente,
a = rxy
y COV ( x, y ) y COV ( x, y )
=
=
x
x y x
x2
b = m y a mx
En el caso anterior se ha ajustado la curva utilizando como medida de error las

distancias verticales. Queda una expresin del tipo:
Ec. 153. Ajuste por mnimos cuadrados. Distancias verticales
yest y =
COV ( x, y )
x2
xx
Aplicando estas frmulas al ejemplo propuesto resultara una ecuacin de regresin

entre los pluvimetros A y B, yPB=0,43xPA+17,3. Si se toman distancias horizontales, la
expresin del ajuste es distinta e igual a:
125
Ec. 154. Ajuste por mnimos cuadrados. Distancias horizontales
(x x) = COV( x, y) (y
2
y
est
Y la media geomtrica de ambas expresiones es:

Ec. 155. Ajuste por mnimos cuadrados. Media geomtrica distancias verticales-horizontales
= rxy =
COV ( x, y )
=
2x 2y
( x i mx ) ( yi m y )
i =1
x y
El uso de estas relaciones debe considerar varios factores. El primero hace referencia a
que no se deben extrapolar los resultados fuera de los lmites de estudio. Por ejemplo, si
las relaciones se han planteado con 200 nios entre 8 y 14 aos y una correlacin
positiva edad altura; se puede extrapolar esta relacin para calcular la altura de una
persona 80 aos?. En segundo lugar tambin hay que destacar que las dependencias han
de plantearse razonablemente: una buena relacin puede surgir entre dos variables
independientes pero relacionadas con una tercera, pero puede no ser razonable plantear
la regresin entre la primera y la tercera. Por ejemplo, hay buena correlacin entre
nmero de enfermedades y nivel econmico; lo mismo cabe decir entre el parque
automovilstico y nivel econmico; habr una buena relacin entre el nmero de
enfermedades y el parque automovilstico?, es razonable plantearla en estos trminos?.
Las expresiones anteriores sobre un ajuste por mnimos cuadrados se pueden ampliar al
caso de considerar un elemento aleatorio en la relacin entre dos variables. Entonces, la
ecuacin de regresin se expresa como sigue,
Ec. 156. Expresin de la recta de regresin considerando el trmino aleatorio
yest ,i = a xi + b + i
La distribucin del error est condicionada a las de las variables utilizadas. Para una
distribucin simtrica, se estimaran la tendencia central y desviacin tpica, del error,
dependiente de las condiciones de ajuste. En el caso del ajuste por mnimos cuadrados,
la esperanza del error es nula y la varianza depende de la desviacin tpica de la variable
dependiente y del coeficiente de correlacin.
Ec. 157. Condicin esperanza nula del error
E [yi yest ,i ] = E [ yi b a xi ] = y b a x = 0
Ec. 158. Trmino de varianza del error
E ( yi yest ,i ) = y2 (1 rxy2 )
Es decir, partiendo de unas variables x e y pertenecientes a una distribucin normal, el
2
trmino de error queda caracterizado por pertenecer a una N(0, y 1 rxy2 ).
126
Las ecuaciones anteriores se han obtenido utilizando los datos sin transformacin
alguna. Sin prdida de generalidad, se pueden expresar los resultados anteriores en
funcin de los residuos normalizados:
Ec. 159. Ajuste por mnimos cuadrados en funcin de los residuos normalizados
yest y =
COV ( x, y )
2
x
x x +
yest y
= rxy
xx
(1 r ) ) al haber dividido entre la desviacin tpica de

2
xy
Con perteneciente a una N(0,
y. Con distribuciones de tres parmetros, normalizadas las variables, y con la notacin

Ec. 160. Ajuste por MC en funcin de los residuos normalizados y distribucin Gamma
yest y
= rxy
xx
+ 1 rxy2
se tendra perteneciente a una Gamma(0, 1, ) tal que el coeficiente de sesgo del

ruido, , es funcin del de la variable independiente y del coeficiente de correlacin de
Pearson, (Fiering-Jackson, 1971)
Ec. 161. Sesgo del ruido
1 rxy3
(1 r )
2 1, 5
xy
Y la variable que se puede generar de una t perteneciente a N(0,1)

Ec. 162. Variable gamma
3
2
2 t
2
1 +

6
36
cuya utilizacin est desaconsejada (Fiering-Jackson, 1971) por la sensibilidad de los
coeficientes de sesgo a la informacin disponible.
6.2.2
Regresin mltiple en series mensuales sin persistencia
En la siguiente deduccin se aade la consideracin de los ciclos estacionales en una

serie sin persistencia y la deduccin de una formulacin bivariada. Los factores y la
forma de filtrar estas componentes cclicas caractersticas de cada estacin
individualizada se establecen en funcin de la hiptesis que se establezca sobre la
estructura que tienen los datos. Suele ser habitual considerar que los datos
meteorolgicos se mantienen estacionarios durante el ciclo de completado y que su
estructura se puede asimilar a la de datos distribuidos normalmente. De acuerdo a esto,
una normalizacin en funcin de la media y desviacin tpica de cada uno de los meses
bastara para eliminar la componente cclica, homogeneizando la totalidad de los datos
de cada estacin segn una funcin de distribucin normal de media 0 y desviacin
tpica 1. Es decir, se pueden obtener las series de residuos aleatorios de acuerdo a las
medias y desviaciones tpicas correspondientes a las doce series mensuales:
127
Ec. 163. Transformacin normalizante
tij =
xij x j
Sj
2
1
1
xij x j ;
xij ; S j =
N 1 i =1
N i =1
donde j es el ndice mensual de 1 a 12, xij es el dato meteorolgico correspondiente al
ao i y mes j, x j media de los datos del mes j, N nmero de aos de la serie, Sj
xj =
desviacin tpica de la serie correspondiente al mes j. La serie de residuos

correspondiente se obtiene en tij, estacionaria en media y varianza.
En la prctica, tratndose de datos xij meteorolgicos mensuales, y la correspondiente
serie de residuos tij, no suele presentar autodependencia temporal y as se supone al
plantear los modelos de completado. A continuacin se expone la metodologa de
clculo para el caso particular en que se realice una regresin bivariada. El proceso que
se describe sera prcticamente idntico si se considerasen ms estaciones en la
ecuacin de regresin. Para el establecimiento de la ecuacin de regresin, los valores tij
correspondientes a una estacin se expresan como una funcin lineal de los de otra
pareja de estaciones mediante la ecuacin estocstica de regresin bivariada siguiente:
Ec. 164. Ecuacin de regresin mltiple en los residuos
tij3 = t 3 + a1 (tij1 t 1 ) + a 2 (tij2 t 2 ) + ij

donde los superndices 1, 2 representan a las estaciones de referencia para completar la
estacin nmero 3; a1 y a2 son los coeficientes de regresin parcial que se pueden
expresar en funcin de los coeficientes de correlacin simple r13, r23 y r12 al aadir la
condicin de error cuadrtico mnimo y ij es un ruido independiente y normalmente
distribuido de media 0 y desviacin tpica S . Los valores medios de los residuos tij en
cada estacin (t 1 , t 2 , t 3 ) son de valor 0 ya que corresponden a series normales
previamente estacionarizadas.
De acuerdo a la mencionada condicin de error cuadrtico mnimo, las expresiones de
los coeficientes de regresin a1 y a2 son:
Ec. 165. Coeficientes de la ecuacin de regresin bivariada por mnimos cuadrados
s3 r13 r23 r12

s r r r

a 2 = 3 23 13 2 12
2
s1 1 r12
s2 1 r12
donde s1, s2 y s3 son las desviaciones tpicas de las series tij correspondientes a cada
estacin y, dado que estas series han sido previamente estacionarizadas, su valor ser 1,
r12 es el coeficiente de correlacin simple entre los residuos de las estaciones 1 y 2; r13
es el coeficiente de correlacin simple entre los residuos de las estaciones 1 y 3; r23 es el
coeficiente de correlacin simple entre los residuos de las estaciones 2 y 3, segn la
expresin siguiente donde m y n representaran las diferentes combinaciones entre las
estaciones mencionadas:
a1 =
128
Ec. 166. Coeficiente de correlacin de Pearson
(t
rmn =
m
ij
t m ) (tijn t n )
ij
(t
ij
m
ij
tm)
2
(t
n
ij
tn)
ij
Se puede comprobar que la media del ruido ij es cero, mientras que su desviacin tpica
sera funcin del error cuadrtico cometido en la ecuacin de regresin. Se puede
estimar a partir de la expresin:
Ec. 167. Varianza del ruido
S2 = S 32 (1 ( R123 ) 2 )
siendo R123 el coeficiente de correlacin mltiple entre las estaciones 1 y 2 con la
nmero 3, que para valores de desviacin tpica s1, s2 y s3 unitarios toma la expresin:
Ec. 168. Coeficiente de correlacin mltiple
r 2 + r 2 2 r12 r13 r23
R123 = 13 23
1 r122
con valores comprendidos entre 0 y 1.

La ecuacin de regresin se plantea para cada pareja de estaciones que pueden
correlacionarse con la estacin que se desea completar. En el momento de rellenar un
dato se debe elegir aquella pareja de estaciones que proporcione el completado ms
satisfactorio. El criterio seguido para realizar esta eleccin se basa en la formacin de
una matriz de priorizacin para cada estacin a completar, funcin de los coeficientes de
correlacin mltiple entre las series de residuos y del nmero de datos comunes entre
las tres estaciones.
Los trminos de la matriz de priorizacin para la estacin a completar k es la siguiente,
para cada pareja de estaciones de referencia m y n,:
Ec. 169. Matriz de priorizacin
a
k
Pmn = Rmn
mnk
12
donde Pmn es el elemento (m,n) de la matriz de priorizacin correspondiente a la

k
estacin a completar k, Rmn
el coeficiente de correlacin mltiple entre la estacin k y
las estaciones m y n de referencia y Nmnk el nmero de datos mensuales registrados a la
vez en las tres estaciones m, n y k. El exponente a suele ser un dato que se introduce en
base a ponderar la importancia que tiene en el completado el nmero de datos comunes
entre las tres estaciones, aunque se puede determinar experimentalmente bajo el criterio
de generar series con mnimo error cuadrtico.
Halladas las matrices de priorizacin de cada estacin, se puede elegir cul es la mejor
pareja para rellenar un mes en cuestin. En principio se escoger para cada estacin k la
pareja de referencia con un mayor valor de priorizacin, pero la existencia de los
129
valores en el mes de completado en esas estaciones m y n, origina que se tengan que

elegir sucesivas parejas de estaciones de acuerdo a valores decrecientes de priorizacin.
Dado que las series completadas han sido las tij, se precisa deshacer la transformacin
para obtener la serie desestacionarizada y completada xij. Ello se consigue aplicando la
siguiente expresin a los residuos completados de la estacin k:
Ec. 170. Desestacionarizacin
xij = x j + S j tij
Para aplicar esta metodologa es preciso agrupar previamente las estaciones
meteorolgicas en grupos homogneos o afines, estableciendo un control previo de las
estaciones que sirven de referencia para el completado de una dada. Se evita as la
transmisin de heterogeneidades y errores de unas estaciones a otras.
6.3
COMPLETADO DE SERIES MENSUALES CON PERSISTENCIA
El planteamiento del caso de regresin simple con persistencia es idntico al del

apartado anterior considerando que la serie x corresponde a la desplazada, por ejemplo,
un intervalo de tiempo. Los modelos estocsticos multivariados de regresin utilizados
para rellenar lagunas en series de aportaciones mensuales consideran, a diferencia del
caso anterior, la existencia de una estructura de autocorrelacin temporal en la serie de
datos de cada estacin, permitiendo adems extraer informacin a travs de la
correlacin espacial con otras estaciones.
A continuacin se pasa a exponer la metodologa propuesta por el Cuerpo de Ingenieros
de los EE.UU., que se ha estandarizado bajo la denominacin del modelo HEC-4. Este
modelo permite rellenar lagunas en secuencias de aportaciones basndose en la
autocorrelacin de una estacin y de sus relaciones estadsticas con otras (correlacin
espacial).
Como en el caso anterior, el primer paso consiste en extraer la serie de residuos de
acuerdo a la estructura segn la cual se distribuyen los datos de las series de
aportaciones. El programa plantea como hiptesis que las series se comportan de
acuerdo a una distribucin LogPearson III con lo que, habiendo transformado las series
originales en series de los logaritmos de los aportaciones mensuales, el programa
considera la media, desviacin tpica y coeficiente de sesgo del logaritmo de la serie
segn las expresiones siguientes:
Ec. 171. Clculos de medias, desviaciones tpicas y sesgos de las series de aportaciones
transformadas mediante logaritmos
y ij = log xij
N
y
yj =
i =1
ij
j =
(y
i =1
yj)
ij
N
gj =
(N 1) (N 2)
(y
yj)
ij
i 1
j
N 1
N ;
;
donde yij es el logaritmo de las aportaciones en el mes j del ao i, y j es la media de la
serie logartmica de las aportaciones en el mes j y N es el nmero de aos de la serie.
130
Posteriormente, se estacionarizan las series de acuerdo a las expresiones:

Ec. 172. Transformacin de los datos considerando el sesgo y la componente cclica estacional
gj
6 g j tij
3
+ 1 1 +
gj 2
j
6
;
donde tij es una serie estacionaria a la que se han suprimido las tendencias estacionales.
A sus valores podra ajustarse, en primera aproximacin una distribucin normal, ya
que los xij han sufrido una transformacin logartmica normalizante previa. Este
tratamiento se debe al hecho suficientemente conocido de que las aportaciones no
siguen una distribucin normal. A los valores tij, el modelo HEC-4 no les ajusta una
normal, sino una distribucin Pearson-III en la que se hace intervenir el coeficiente de
sesgo peridico g j , resultando una nueva variable ki,j.
tij =
y ij y j
k ij =
El modelo de regresin planteado sobre la serie de residuos es del tipo

M
k ijo = bo k ijo1 + b1 k ij1 + ij

1=1
donde kijo es el valor en el mes j del ao i de la variable transformada (Pearson-III) en la

estacin a completar o, k ijo1 es el valor en el mes j-1 del ao i de la variable
transformada (Pearson-III) en la estacin a completar o, bo es el coeficiente
autorregresivo (temporal), b1 es el coeficiente de regresin entre las estaciones o y 1, k i1, j
es el valor en el mes j del ao i de la variable transformada (Pearson-III) en la estacin
de referencia 1, M es el nmero de estaciones consideradas en la regresin, ij es el ruido
de media 0 y desviacin tpica
El proceso de completado de datos es similar al expuesto en el mtodo de completado
de precipitaciones. Como se observa en el planteamiento de ecuaciones, las diferencias
bsicas estriban en la propiedad de autocorrelacin de las series de caudales y en la
necesidad de transformaciones normalizantes de las mismas.
6.4
GENERACIN DE NMEROS ALEATORIOS
Los ordenadores personales tienen la posibilidad de generar nmeros pseudoaleatorios.

Son mquinas deterministas y utilizando los mismos datos, dan idnticos resultados.
Los nmeros aleatorios se construyen entonces respetando propiedades de series
aleatorias. Pertenecen a una funcin de distribucin uniforme, desde la que se pueden
derivar nmeros pertenecientes a otras poblaciones.
Una funcin de distribucin uniforme es aqulla para la que los casos posibles, dentro
del dominio [0,1], son independientes unos de otros y son equiprobables.
6.4.1
Generacin de nmeros aleatorios de una funcin de distribucin uniforme.

Modelo lineal.
Parmetros:
131
a. Valor inicial x0, nulo o positivo

b. Multiplicador a, nulo o positivo
c. Incremento c, nulo o positivo
d. Divisor m, mayor que todos los trminos anteriores
Generar los valores de la serie xi utilizando el resto de la divisin del modelo lineal axi1+c entre m.
(a xi 1 + c )
xi = resto
6.4.2
Generacin de nmeros aleatorios de una funcin de distribucin normal
La generacin de nmeros aleatorios normales se puede basar en la aplicacin del

teorema central del lmite, es decir, en que la suma de nmeros aleatorios pertenecientes
a una funcin de distribucin idntica (tambin se puede extender al caso contrario), con
media y varianza finitas, 2, es aproximadamente normal, con media n y varianza
n2. Si se generan nmeros normales utilizando 12 valores de la funcin de
distribucin uniforme a los que se restan 6 unidades, se tendr una normal de media
cero y desviacin tpica unidad.
6.4.3
Generacin de nmeros aleatorios de una funcin de distribucin normal.

Transformacin de Box-Muller
Esta transformacin utiliza dos nmeros uniformemente distribuidos con media 0 y

varianza, 12, para generar nmeros normales de media 0 y varianza, 12.
ti = ln
132
1
cos(2 u2 )
u1
ESTIMACIN DEL MODELO. INFERENCIA ESTADSTICA
7.1
INTRODUCCIN
La expresin inferencia estadstica hace referencia a la estimacin o construccin de

los modelos estadsticos. Se denomina modelo estadstico a la representacin
matemtica del comportamiento probabilstico de la muestra. La inferencia estadstica
trata de estimar a partir de un conjunto de resultados obtenidos mediante la realizacin
repetida de un experimento aleatorio (muestra) la representacin matemtica del
fenmeno aleatorio subyacente, es decir, trata de conocer las propiedades de la
poblacin a partir de la muestra.
Existen diversos tipos de mtodos de estimacin (denominados habitualmente
estimadores) que emplean distintas magnitudes obtenidas a partir de la muestra como
representativas de la poblacin y que aprovechan en mayor o menor medida la
informacin que esta proporciona. Hay una primera divisin bsica entre los mtodos de
estimacin, los denominados mtodos paramtricos y no paramtricos, como se ver a
continuacin. Los primeros suponen que la poblacin se comporta segn una funcin de
distribucin predefinida, con una expresin matemtica conocida (alguna de las
expuestas en el captulo anterior), y tratan de determinar el valor de sus parmetros. Los
distintos procedimientos de estimacin que se presentarn a lo largo del captulo
corresponden a este tipo de mtodos.
Tambin se expondr a lo largo del captulo las principales propiedades de los
estimadores, las que deben poseer para estimar con la mayor precisin posible la
poblacin, y que permitirn decidir que mtodos de estimacin se deben seleccionar en
cada ocasin.
7.2
7.2.1
MTODOS DE ESTIMACIN DEL MODELO

Mtodos paramtricos
Son aquellos mtodos que asumen que la funcin de distribucin de la poblacin se

corresponde con una expresin matemtica predefinida que contiene una serie de
parmetros cuyo valor es diferente para cada poblacin.
La construccin del modelo consta, por tanto, de dos fases: seleccin de la funcin de
distribucin predefinida y estimacin del valor de los parmetros de la misma a partir de
la muestra para la poblacin que se est estudiando. La estimacin de los parmetros se
realizar mediante la aplicacin de diversas tcnicas matemticas (estimadores) que se
describirn a lo largo del captulo.
7.2.2
Mtodos no paramtricos
Los mtodos no parmetricos, al contrario que los anteriores, no suponen que la

distribucin de probabilidad en la poblacin se corresponda con expresiones algebraicas
133
basadas en unos parmetros que es preciso ajustar a partir de la muestra, sino que
suponen que esa expresin matemtica es desconocida.
El mtodo no parmetrico ms simple consiste en el ajuste grfico de una curva a los
datos de la muestra representados en papel de probabilidad, aunque tiene el
inconveniente de su subjetividad.
La aplicacin de este mtodo exige asignar a cada uno de los datos una determinada
probabilidad muestral que permita representarlos en un determinado papel de
probabilidad (habitualmente papel Gumbel). Esta asignacin se realiza, como se
coment en el captulo 3, mediante las denominadas frmulas de grfico que
corresponden a la expresin general:
Ec. 173. Frmulas de grfico
F ( xi ) = Pr ob( x xi ) =
i
N + 1 2
siendo:
xi = dato de la muestra que ocupa el lugar i de la serie ordenada de menor a

mayor.
N = nmero total de datos de la muestra.
= parmetro de la frmula.
Distintos valores del parmetro conducen a distintas expresiones, siendo algunas de
las ms empleadas las mostradas en la tabla siguiente (tambin en captulo 3).
Nombre
Expresin
Weibull
Gringorten
0,44
Hazen
0,5
i
N +1
i 0.44
F ( xi ) =
N + 0.12
i 0 .5
F ( xi ) =
N
F ( xi ) =
Tabla 34. Frmulas de grfico
Con independencia del empleo o no del mtodo grfico, es siempre recomendable

comparar grficamente los resultados obtenidos por otros procedimientos, con los datos
representados grficamente.
Ejemplo: Se dispone de los siguientes datos referentes a caudales mximos anuales registrados
en una estacin de aforos.
134
Comprobar si la poblacin a la que pertenece la muestra se ajusta a una funcin de distribucin

tipo Gumbel.
Solucin: Una forma de comprobar si un determinado tipo de funcin de distribucin se ajusta a
las propiedades estadsticas de una poblacin de la cual conocemos una muestra es representar
grficamente los datos asignndoles probabilidad mediante una frmula de grfico y
dibujndolos sobre el papel de probabilidad de dicha distribucin. Si la representacin de los
datos se ajusta sensiblemente a una recta significa que la poblacin corresponde a esa
distribucin.
En primer lugar es necesario asignar probabilidades muestrales, para lo cual se emplear la
formula de Gringorten:
F ( xi ) =
i 0.44
N + 0.12
En la tabla adjunta se indica la probabilidad muestral de cada dato de la serie una vez ordenada
de menor a mayor.
Estas parejas de caudalprobabilidad muestral se representan en papel Gumbel dando como

resultado el grfico adjunto en el que se observa que la poblacin se ajusta muy bien a dicha
135
distribucin.
7.3
7.3.1
PROPIEDADES DE LOS ESTIMADORES

Estimadores insesgados
Se dice que un estimador T es insesgado (o centrado) respecto a un determinado

parmetro de la poblacin cuando la media de diversas estimaciones del parmetro a
partir de distintas muestras tiende al valor real del parmetro en la poblacin:
Ec. 174 Estimadores insesgados
E [ est ] =
Esta es una propiedad deseable en cualquier estimador puesto que significa que la
distribucin del valor del parmetro obtenida a partir de las muestras esta centrada en el
valor real. No obstante, no es la nica propiedad a tener en cuenta, puesto que tan
importante como el valor alrededor del cual est centrada la distribucin de las
estimaciones es la dispersin o varianza de las mismas.
Se denomina sesgo del estimador respecto al parmetro a la magnitud:
Ec. 175 Sesgo de un estimador
sesgo( est ) = E[ est ]

En el caso de que el estimador sea centrado respecto a ese parmetro, su sesgo ser cero.
136
7.3.2
Estimadores consistentes
Se dice que un estimador T es consistente respecto a un parmetro cuando la media de

las estimaciones realizadas sobre muestras de tamao n tiende al valor real de la
variable en la poblacin al crecer el tamao de la muestra:
Ec. 176 Estimadores consistentes
[ ]
n
E est
Esta propiedad representa un nivel de exigencia inferior al de la propiedad anterior. No

se exige que el estimador sea centrado para un tamao de muestra cualquiera pero s que
tienda a serlo cuando el tamao de la muestra crece. Es decir, lo sera para una muestra
de tamao infinito. Cuando no se pueda exigir que un estimador sea insesgado, al
menos debera exigirse que fuese consistente.
7.3.3
Estimadores invariantes
Se dice que un estimador T es invariante cuando la estimacin del parmetro se

transforma de forma coherente al cambiar el sistema de referencia en que se expresan
los elementos de la muestra.
El cambio en el sistema de referencia puede ser de dos tipos:
Cambio de origen: Desplazamiento del origen de tal forma que los valores de la
muestra se ven modificados al sumarles o restarles un valor constante. Si el
nuevo cero corresponde al valor que anteriormente era c, los nuevos valores de
la muestra sern x1-c, x2-c, x3-c, ...
Cambio de escala: Los valores de la muestra se ven multiplicados o divididos
por una constante. La muestra se transformar en cx1, c x2,c x3, ...
Segn el estimador sea invariante ante el primer tipo de cambio o el segundo, se dice
que es invariante por traslacin o invariante por cambio de escala.
La expresin matemtica de la invariancia en ambos supuestos es:
Ec. 177 Invarianza de los estimadores
T ( x1 + c, x 2 + c, x3 + c,..., x n + c ) = T ( x1 , x 2 , x3 ,..., x n ) + c
T (cx1 , cx 2 , cx3 ,..., cx n ) = cT ( x1 , x 2 , x3 ,..., x n )
Esta propiedad no es imprescindible para un estimador, ni tiene relacin con la bondad
de sus estimaciones, simplemente puede ser interesante en algunas situaciones en las
que se prevea la necesidad de revisar las estimaciones ante cambios en el sistema de
referencia.
137
7.3.4
Estimadores eficientes
Se define la eficiencia (o precisin) de un estimador T respecto al parmetro como la

inversa de la varianza de sus estimaciones a partir de diversas muestras:
Ec. 178 Eficiencia de un estimador
eficiencia( est ) =
Var ( est )
Es decir, un estimador es ms eficiente o preciso cuanto menos dispersas estn sus

estimaciones respecto al valor medio. Un valor grande de la varianza representa un
valor pequeo de la eficiencia y a la inversa.
Si un estimador es centrado, un valor grande de la eficiencia significa que todas las
estimaciones del parmetro sern muy prximas al valor real del parmetro en la
poblacin. Obviamente, entre dos estimadores centrados ser preferible aquel que es
ms preciso.
Lo ptimo, y lo exigible siempre que sea posible, es que los estimadores sean
insesgados y altamente eficientes, lo que significar que sus estimaciones sern siempre
muy prximas al valor real del parmetro.
Se denomina eficiencia relativa de dos estimadores T1 y T2 al cociente entre sus
eficiencias:
Ec. 179 Eficiencia relativa
ER =
7.3.5
( )
( )
( )
( )
2
1
eficiencia est
Var est
=
1
2
eficiencia est
Var est
Estimadores robustos
Se dice que un estimador T es robusto respecto al parmetro cuando disminuye poco

su eficiencia cuando el modelo experimenta una pequea modificacin. Es decir, si al
estimar el modelo hemos supuesto que la estructura probabilstica de la poblacin
corresponde a una determinada funcin de distribucin, pero la funcin de distribucin
real fuese ligeramente diferente, el estimador no perdera prcticamente eficiencia. Es
decir, disminuira poco la bondad de sus estimaciones.
La robustez es una propiedad muy deseable en un estimador puesto que de poco sirve
un estimador muy eficiente pero muy poco robusto puesto, que ante cualquier error en
la estimacin del modelo perdera por completo su eficiencia. En ese tipo de situaciones
es preferible un estimador algo menos eficiente pero robusto, que mantendr su
eficiencia aunque la estimacin del modelo no sea demasiado buena.
138
7.4
ESTIMACIN PUNTUAL
Supongamos que se dispone de una muestra de una variable aleatoria x, que sigue una
distribucin de probabilidad correspondiente a una expresin matemtica conocida,
aunque dependiente de unos parmetros desconocidos, y que no disponemos de ninguna
informacin inicial sobre el valor de dichos parmetros. Veremos a continuacin
diferentes tcnicas matemticas que permitirn estimar el valor de los parmetros ms
apropiado para reflejar las caractersticas estadsticas de la muestra
7.4.1
Mtodo de los Momentos
Este estimador para los parmetros de la distribucin fue propuesto por K. Pearson a
finales del siglo XIX. Consiste en suponer que el valor de los momentos de la poblacin
(media, varianza, sesgo, ...) es igual al de los momentos muestrales. El valor de los
parmetros se obtiene planteando el sistema de ecuaciones que resulta de igualar la
expresin terica de los momentos de la poblacin en funcin de los parmetros y los
valores obtenidos a partir de la muestra. Es necesario disponer de tantas ecuaciones
como parmetros se quiere estimar, por lo que ser necesario igualar los momentos
hasta un orden igual al nmero de parmetros desconocidos. Una funcin de
distribucin dependiente de un solo parmetro requerir igualar nicamente el valor de
la media, mientras que una dependiente de cuatro parmetros necesitar igualar el valor
de la media, varianza, sesgo y curtosis.
Si hay que estimar k parmetros (1, ... , k) y se conocen los k primeros momentos
muestrales de la poblacin (m1, ... , mk), se plantear el siguiente sistema de ecuaciones:
Ec. 180 Mtodo de los momentos
M 1 (1 ,..., k ) = m1
M
M k (1 ,..., k ) = mk
Siendo Mi(1, ... , k) la expresin terica de los momentos de la poblacin que son
funcin de los parmetros.
Una ventaja importante de este mtodo es su sencillez aunque no aprovecha toda la
informacin disponible en la muestra. Otra ventaja es que el resultado es menos sensible
que en otros mtodos a una eleccin incorrecta de la funcin de distribucin.
Ejemplo: Ajustar a la serie de caudales mximos del ejemplo del apartado 6.2.2. una funcin de
distribucin tipo Gumbel mediante el mtodo de los momentos y calcular el valor del caudal
correspondiente a un periodo de retorno de 200 aos.
139
Solucin: La expresin matemtica de la funcin de distribucin Gumbel depende de dos

parmetros u y .
F ( x) = e e
xu
El valor de los parmetros en el mtodo de los momentos se determina igualando las

expresiones tericas de los momentos de la poblacin, funcin de los parmetros, a los
momentos muestrales. Como en este caso se necesita conocer dos parmetros, basta con
plantear la igualdad de los dos primeros momentos, la media y la varianza (o la desviacin
tpica).
En primer lugar es necesario calcular los momentos muestrales a partir de los datos de la
muestra. La media muestral ser:
x
M =
16887
= 844.4
20
donde xi son los datos de la muestra y N el nmero total de datos.

En cuanto a la desviacin tpica muestral, su valor viene dado por la siguiente expresin:
(x
=
(x
M ) 2
N 1
844.4) 2
19
5280872.6
= 527,2
19
La expresin correspondiente a la media de la poblacin es:
M = u + 0.5772
Y la desviacin tpica:
Igualando las expresiones anteriores al valor de los momentos muestrales, se tiene:
140
M = u + 0.5772 = 844.4
= 527.2
De donde se obtiene:
u = 844.4 0.5772411.1 = 607.1
527.2 6
= 411.1
Por lo que la funcin de distribucin buscada ser:
F ( x) = e
x 607.1
411,1
El valor de F(x) para el cuantil de 200 aos de periodo de retorno es:
F ( x) = 1
1
1
= 1
= 0.995
T
200
Por tanto, el cuantil ser:
F ( x) = e
x 607.1
411,1
= 0.995
x = 607.1 411.1ln( ln 0.995) = 2784m 3 / s
7.4.2
Mtodo de los Momentos Ponderados Probabilsticamente
El Mtodo de los Momentos Ponderados Probabilsticamente fue desarrollado por

Greenwood en 1979 para poblaciones en las cuales la funcin de distribucin F(x) sea
expresable de forma explcita en forma inversa, es decir:
x = x(F )
Este mtodo calcula unas funciones lineales (los momentos ponderados
probabilsticamente) de los datos e iguala dichas cantidades con las expresiones tericas
en funcin de los parmetros para la ley considerada, de forma anloga al mtodo de los
momentos. Este mtodo confiere un mayor peso a los mayores valores de la serie,
resultando valores ms conservadores.
Los momentos ponderados probabilsticamente corresponden a la siguiente expresin:
141
Ec. 181 Momentos ponderados probabilisticamente
M ijk = E x i F j (1 F )
siendo i, j, k nmeros enteros y F la probabilidad de que x no sea superada.

En el caso particular de i=1 y bien j=0 k=0, M10k y M1j0 son lineales y pueden ser
utilizados en la estimacin de los parmetros de funciones de distribucin invertibles.
M10k y M1j0 estn relacionados entre s, mediante las expresiones:
Ec. 182 Relacin entre los momentos ponderados M1j0 y M10k
k
k
M 10 k = ( 1) j M 1 j 0
j =0 j
j
j
M 1 j 0 = (1) k M 10 k
k =0 k
La expresin del momento M1j0=E[x, Fj] realiza la ponderacin de la variable por la

probabilidad que tienen de no ser superada, con lo que tienen mayor influencia los
valores ms altos.
La estimacin de los valores de M10k y M1j0 a partir de la muestra se realiza con las
expresiones:
Ec. 183 Momentos muestrales ponderados probabilisticamente
1
M 10 k =
N
i 0.35
x i 1
i =1
1
M 1 j 0 =
N
i 0.35
x
i
i =1
donde los xi son los N valores de la muestra ya ordenados siendo i=1 el menor valor.
A partir de las expresiones anteriores, la estimacin de los parmetros se realiza de
forma similar a la empleada en el mtodo de los momentos convencionales siguiendo
los siguientes pasos:
142
Deduccin terica de la expresin de M1j0 en funcin de los parmetros para el

tipo de funcin de distribucin seleccionada.
Estimacin de los momentos ponderados a partir de la muestra.
Obtencin de un sistema de tantas ecuaciones como parmetros tenga la funcin

de distribucin seleccionada, que resulta de igualar los valores muestrales y las
expresiones tericas, variando j desde cero hasta el nmero de parmetros menos
uno.
Resolucin del sistema de ecuaciones planteado.
Ejemplo: Ajustar a la siguiente serie de precipitaciones mximas una funcin de distribucin

tipo GEV mediante el mtodo de los momentos ponderados probabilsticamente.
Solucin: La expresin matemtica de la funcin de distribucin GEV depende de tres

parmetros u, y k.
F ( x) = e

x u k
1 k

El valor de los parmetros en el mtodo de los momentos ponderados probabilsticamente se

determina igualando las expresiones tericas de los momentos ponderados de la poblacin,
funcin de los parmetros, a los momentos muestrales. Como en este caso se necesita conocer
tres parmetros es necesario plantear la igualdad de los tres primeros momentos: M100, M110 y
M120.
En primer lugar es necesario calcular los momentos muestrales a partir de los datos de la
muestra. Vienen dados por la expresin:
1
M 1 j 0 =
N
i 0.35
xi
N
i =1
N
donde xi son los datos de la muestra, i el puesto que ocupa el dato en la serie ordenada de menor
a mayor y N el nmero total de datos.
El valor de los tres primeros momentos para la muestra es:
143
M 100 = 59,989
M 110 = 38,243
M 120 = 29,167
La expresin terica de los momentos para una poblacin tipo GEV es:
M 1 j0 =
1
1+
1 ( j + 1) k (1 + k )
u +
j
k
Igualando las expresiones anteriores al valor de los momentos muestrales se tiene un sistema de
tres ecuaciones que nos permitir conocer el valor de los parmetros. La resolucin de dicho
sistema de ecuaciones es compleja por lo que se han establecido unas expresiones que permiten
encontrar su solucin:
C=
2M 110 M 100 log10 2
3M 120 M 100 log10 3
k = 7,8590C + 2,9554C 2
(2M 110 M 100 )k

(1 + k )(1 2 k )
u = M 100 +
((1 + k ) 1)
k
De donde se obtiene:
u = 44,0020
= 17,9668
k = 0,2430
Por lo que la funcin de distribucin buscada ser:
F ( x) = e
7.4.3
x 44 , 0020 0 , 2430

1+ 0 , 2430
17
,
9668
Mtodo de Mxima Verosimilitud
El mtodo de mxima verosimilitud fue propuesto por Fisher, y consiste en determinar

el valor de los parmetros imponiendo que la probabilidad de obtener todo el conjunto
de la muestra sea la mxima posible.
El mtodo parte de la denominada funcin de verosimilitud. Supongamos que se
dispone de una muestra de tamao N, X=(x1, ..., xN), que se supone pertenece a una
poblacin que se asume sigue una determinada funcin de distribucin, F(x,). La
funcin de densidad de probabilidad asociada a la funcin de distribucin es f(x,), que
al igual que la funcin de distribucin depende de los parmetros .
144
Como hemos dicho, el objeto del mtodo de mxima verosimilitud es obtener el valor
de los parmetros que hace mxima la probabilidad de obtener el conjunto de los N
valores de la muestra. La probabilidad conjunta de los N valores de la muestra, al ser
cada uno de los N valores independiente del resto, ser:
Ec. 184 Probabilidad del conjunto de una muestra
N
P( X , ) = f ( x1 , ) f ( x 2 , )... f ( x N , )dx1 dx 2 ...dx N = f ( xi , ) dxi

i =1
Al entrar en la expresin anterior con distintos conjuntos de valores X y un conjunto de

parmetros fijos, se obtendr la probabilidad de obtener distintas muestras. Como en
nuestro caso lo que conocemos es la muestra y desconocemos los parmetros , si
variamos y mantenemos fijo X, obtendremos la probabilidad de obtener la muestra de
la que disponemos ante distintos valores de los parmetros.
Es decir, podemos definir la funcin:
Ec. 185 Funcin de verosimilitud
L( , X ) = L( ) = P( X , )
con X fijo y variable. A esta funcin L se la denomina funcin de verosimilitud.
Una vez definida la funcin de verosimilitud, el valor de los parmetros se obtiene
derivando dicha funcin respecto a cada uno de los parmetros e igualando las
derivadas a cero (condicin matemtica para maximizar el valor de la funcin y, por
tanto, de la probabilidad conjunta de la muestra). Se obtendr de esta manera un sistema
de ecuaciones, tantas como parmetros tenga la funcin de distribucin, cuya resolucin
proporcionar el valor buscado de los parmetros:
Ec. 186 Mtodo de mxima verosimilitud
L( , X )
=0
1
L( , X )
=0
2
M
Puesto que el mximo de una funcin y el de su logaritmo se alcanza en el mismo
punto, es frecuente maximizar el logaritmo de la funcin de verosimilitud en lugar de la
propia funcin, lo que frecuentemente conduce a expresiones ms sencillas. Por tanto,
un sistema de ecuaciones equivalente ser:
145
Ec. 187 Forma alternativa del mtodo de mxima verosimilitud
ln L( , X )
=0
1
ln L( , X )
=0
2
M
El mtodo de mxima verosimilitud es considerado habitualmente como el ms
eficiente, es decir, aquel que produce una varianza menor en los parmetros estimados,
pero tiene el inconveniente de ser bastante sensible a una incorrecta eleccin de la
funcin de distribucin. Otro inconveniente de este mtodo es la mayor dificultad
numrica frente a otro tipo de mtodos.
En general puede decirse que este mtodo proporciona estimadores con las siguientes
propiedades:
Asintticamente centrados
Con distribucin asintticamente normal
Eficientes o de varianza mnima
Suficientes
Invariantes
Ejemplo: Supongamos que se dispone de una muestra X=(x1, ..., xN) que se supone sigue
una distribucin exponencial. Calcular el valor del parmetro de la distribucin mediante
el mtodo de mxima verosimilitud.
Solucin: La funcin de distribucin exponencial corresponde a la siguiente expresin:
F ( x ) = 1 e x
Y la de densidad de probabilidad a:
f ( x ) = e x
La funcin de verosimilitud ser, por tanto:
N
i =1
i =1
L( , X ) = f ( xi , ) = e xi
Tomando el logaritmo de la funcin de verosimilitud:
N
i =1
i =1
ln L( , X ) = ln f ( xi , ) = ln e xi = N ln xi
Derivando el logaritmo del funcional respecto a e igualndolo a cero:
146
i =1
ln L( , X ) N N
= xi = 0
i =1
Resolviendo la ecuacin se obtiene el valor buscado para el parmetro :
1
N
=x
i =1
Por tanto:
7.4.4
1
x
Estimadores ms empleados para distintas funciones de distribucin
Aunque cada modelo de ley puede ajustarse por varios mtodos, existen ciertas
combinaciones que son las ms habitualmente empleadas. Estas combinaciones se
detallan en la tabla adjunta.
DISTRIBUCIN
Normal
Gumbel
Valores Extremos Generalizados
(GEV)
Log Pearson III (LP3)
SQRT-ET max
Valores extremos de dos componentes
(TCEV)
MTODO
Momentos
Momentos y Mxima Verosimilitud
Momentos ponderados
probabilsticamente
Momentos en el espacio de los
logaritmos
Mxima verosimilitud
Mxima verosimilitud
Tabla 35. Estimador ms empleado para cada tipo de funcin de distribucin
7.5
ESTIMACIN POR INTERVALO
Al contrario que en la estimacin puntual, el mtodo de estimacin por intervalo no

asocia un nico valor a la estimacin de cada cuantil sino que le asocia uno o varios
intervalos que permiten precisar la incertidumbre existente en la estimacin. El
resultado de la estimacin del parmetro no es un nico valor sino que para cada cuantil
se definen los intervalos de confianza.
Se llama intervalo de confianza del parmetro con nivel de confianza 1- al intervalo
[1,2] tal que si se estima el parmetro a partir de distintas muestras del mismo tamao,
el (1-a)100% de las veces la estimacin se encuentra en dicho intervalo. Al valor se
le denomina nivel de significancia.
7.6
ESTIMACIN BAYESIANA
En el caso de la estimacin bayesiana no se estima un nico valor para los parmetros

de los cuales depende la funcin de distribucin de la poblacin, sino que los
147
parmetros se consideran variables aleatorias y su estimacin proporciona su

distribucin de probabilidad.
En la estimacin bayesiana se parte de una distribucin inicial o a priori f(q) y se
calcula la distribucin final o a posteriori mediante el teorema de Bayes.
Ec. 188 Teorema de Bayes para variable aleatoria
f ( , X ) =
f ( X , ) f ( )
f ( X , ) f ( )d
La estimacin puntual y por intervalo se pueden considerar casos particulares de la

estimacin bayesiana, puesi se desea realizar una estimacin puntual se tomar la media
o la moda de la distribucin como valor nico de los parmetros, y si se desea un
intervalo de confianza se tomar el intervalo de los parmetros que encierre una
probabilidad fijada en su distribucin y a partir de l el intervalo de la variable
correspondiente a un determinado cuantil.
148
8
8.1
TEST DE CONTRASTE DE HIPTESIS.

INTRODUCCIN.
Los tests de contraste de hiptesis constituyen una herramienta numrica para comparar
las hiptesis realizada con la realidad y evaluar el acierto de las primeras. Esta tcnica
es apropiada cuando las hiptesis planteadas son simples y cuando haya variabilidad en
los datos que induzca a manejar criterios estadsticos. Las hiptesis que normalmente se
plantean se refieren a la distribucin de la muestra, a la independencia de los datos o a la
homogeneidad-heterogeneidad de los grupos de datos.
Ejemplo: se pueden plantear contrastes sobre la consistencia y homogeneidad de las
series meteorolgicas que se utilizan en un estudio de recursos. Las razones a las que
obedece la aparicin de heterogeneidades en las series son mltiples, dependientes de
factores tales como alteraciones naturales o inducidas por el hombre (cambio en la
instrumentacin, cambios de las instrucciones y momento de observacin o en las
condiciones de medicin por crecimiento de la vegetacin, colocacin de
construcciones, vallas, etc..., deterioro del equipo, errores en la calibracin del equipo,
cambios en la localizacin de los sensores, etc.) que habrn de ser corregidas. El efecto
en los datos de casos como stos debe ser detectado y considerado si se pretende
obtener conclusiones vlidas acerca del comportamiento de una variable. Las dobles
acumulaciones sirven para identificar estos efectos, pero si nicamente se utiliza la
herramienta grfica, queda como decisin basada en la propia experiencia del tcnico
el decidir qu grado de cambio es el que ha de corregirse. Mediante los tests de
contraste de hiptesis se puede establecer un procedimiento objetivo y una medida que
sirva para rechazar o aceptar la homogeneidad de una serie.
8.2
TESTS ESTADSTICOS DE CONSISTENCIA Y CONTRASTE DE

HIPTESIS
El contraste de hiptesis es el procedimiento que permite valorar el acierto de una

hiptesis simple, hiptesis nula, Ho. Aceptar o rechazar esa hiptesis supone rechazar o
aceptar la alternativa, hiptesis alternativa, H1. Esta decisin se basa en estadsticos de
los que se conoce su distribucin de probabilidad. El estadstico toma para la muestra
dada un valor determinado y mediante la probabilidad asociada a la presentacin de este
valor, se obtiene un criterio para aceptar o no una hiptesis. Es decir, es necesaria la
utilizacin de un estadstico como medida y de una distribucin de probabilidad que
permita valorar cmo de raro, funcin de los datos de la muestra, es el resultado
obtenido. Esto se realiza dividiendo el dominio de valores posibles del estadstico en
regiones que permitan aceptar (regin de aceptacin) o rechazar la hiptesis (regin
crtica).
En la eleccin de hiptesis se pueden cometer dos tipos de errores:
-
rechazar la hiptesis nula Ho cuando es cierta (error tipo I)
aceptar la hiptesis nula Ho cuando es falsa (error tipo II).
149
El nivel de significacin, , es la probabilidad de rechazar la hiptesis nula cuando es

cierta lo que nos permite definir un umbral de aceptacin / rechazo de una hiptesis y
dividir el dominio de valores del estadstico. Conocida la distribucin del estadstico
seleccionado, se escoge una probabilidad pequea (0,01 a 0,05) para definir el rango
de valores con los que rechazaremos la hiptesis nula (regin crtica) o la aceptaremos
(regin de aceptacin). Por otro lado, los tests tambin estn caracterizados por su
potencia, probabilidad complementaria a la de aceptar la hiptesis nula cuando es falsa.
El test que tenga la menor probabilidad de cometer un error tipo II se dice que es ms
potente.
Ho es verdadera
Aceptacin P(decisin correcta)=1-
Rechazo
Error tipo I
P(error tipo I)=
Nivel de significacin
Ho es falsa
Error tipo II
P(error tipo II)=
P(decisin correcta)=1-
Potencia del test
Tabla 36. Opciones posibles en un contraste de hiptesis (Hensel-Hirsch, 2002)
Ejemplo:
1. Planteamiento de hiptesis:
a. Hiptesis nula: en la serie temporal no hay tendencias
b. Hiptesis alternativa: hay tendencia en la serie temporal
2. Seleccin de un estadstico: pendiente de la recta de regresin ajustada a la serie
temporal
3. Nivel de significacin: probabilidad de que el test detecte una tendencia cuando
no la hay
a. Al estadstico se le debe asociar una probabilidad sobre los valores de la
pendiente (baja para valores bajos de la pendiente; alta para valores altos
de la pendiente). Esta probabilidad representa el % de sucesos que tienen
tendencia dado un valor de la pendiente.
b. Nivel de significacin: probabilidad anterior
4. Errores y potencia del test:
a. Error tipo I: se toma como referencia un valor de pendiente asociado al
nivel de significacin o riesgo que aceptamos. Con pendientes mayores,
rechazar la hiptesis nula, aunque puede que tenga un valor raro
asociado al error tipo I y nivel de significacin.
b. Potencia del test: probabilidad de detectar una tendencia cuando est
presente. Para pendientes pequeas, la probabilidad de cometer un error
tipo II aumenta. Un contraste alternativo puede discriminar mejor estas
situaciones y tener mayor potencia.
150
Con carcter general, los denominados test paramtricos se aplican planteando

previamente en la elaboracin del test qu distribuciones siguen los datos de la muestra.
Es el caso tpico de test basados en poblaciones normales. La poblacin normal depende
de dos parmetros que se calculan en funcin de los datos de la muestra y el estadstico
se calcula en funcin de estos parmetros. En otras situaciones para las que no se
pueden realizar consideraciones previas sobre las distribuciones tericas de los datos, se
plantean los denominados test no paramtricos. Mediante estos ltimos se valoran
hiptesis basadas en la ordenacin de frecuencias y rangos de los datos como la
independencia entre series, la bondad del ajuste a una distribucin terica o la
homogeneidad y la comparacin de tendencias centrales y posicin de dos series. En los
textos de la OMM (Kundzewicz, 2000) se distingue entre tests dependientes o no de
funciones de distribucin y tests paramtricos y no paramtricos. Una de las formas de
elaborar tests sin asumir funcin de distribucin alguna es trabajar con los rangos o
generando muestras sintticas por permutacin o muestreo con reemplazamiento. El test
paramtrico sera aquel en que el contraste se efecta por medio de parmetros, mientras
que el no paramtrico efecta el contraste, pero sin cuantificar, por ejemplo, el cambio.
Ejemplo: clculo del nivel de significacin asociado a una muestra y un estadstico sin
depender de una funcin de distribucin previa (Kundzewicz, 2000)
1. Aplicacin de un nmero s (entre 100 y 2000, en un nmero suficientemente
grande) de permutaciones o muestreo con reemplazamiento.
2. De la muestra original se calcula el valor del estadstico T.
3. De cada una de las series generadas se calculan los estadsticos Ti, i=1,s.
4. Se ordenan de menor a mayor los valores calculados de Ti y se obtiene el valor
de k tal que Tk<To<Tk+1.
5. Por tanto, a la muestra original le corresponde un nivel de significacin asociado
a la probabilidad p:
p=
8.2.1
k
k + 0,5
k +1
p=
p=
s
s +1
s+2
Teoremas de Fisher
Los teoremas de Fisher se aplican para la obtencin de criterios en los problemas de

inferencia estadstica sobre poblaciones normales. Si x1, ...xn es una muestra aleatoria
simple de una poblacin N(,) y x y s2 son respectivamente la media y cuasivarianza
muestral, se cumple:
1. Teorema de Fisher
Ec. 189. 1er teorema Fisher
x N ( ,
2. Teorema de Fisher
151
Ec. 190. 2 teorema Fisher
(x
n
( n 1)s
n21 con s 2 =
i =1
(n 1)
3. x y n21 son independientes

Con lo que se pueden obtener criterios para la aplicacin de tests paramtricos:
Ec. 191. Criterio para contrastes cuando es conocida
x
N (0,1)
n
Ec. 192 Criterio para contrastes cuando es desconocida
x
n
( n 1)s /
n 1
2
tn 1
x
tn 1
s
n
Esto se puede aplicar a los siguientes contrastes de hiptesis:

Ttulo
Muestra
Poblacin
Contraste sobre la media de una

poblacin
x1,...xn
N(,)
Contraste
Condiciones
Bilateral. Ho: =o; H1 <>o
Regin crtica
conocida
desconocida
Unilateral. Ho: =<o; H1 >o
conocida
desconocida
Unilateral. Ho: =>o; H1 <o
conocida
desconocida
C = x o > z
2
n
C = x o > tn 1,
2
n
C = x o > z
n
C = x o > tn 1,
n
C = x o < z1
n
C = x o < tn 1,1
n
Para muestras grandes (n>30) la t de Student se aproxima a una normal
Tabla 37. Contrastes sobre la media de una poblacin normal.
En el siguiente ejemplo se valora la homogeneidad de una serie de caudales anuales. Se

supone que se comportan como una funcin de distribucin normal y se sospecha que
puede existir un cambio en las propiedades de la serie.
152
Ejemplo: Problema:
Se tiene caracterizada una serie de caudales anuales de una cuenca A mediante una
distribucin normal de media 3,56 m3/s y desviacin tpica 2,14 m3/s.
Durante un periodo reciente (27 aos) se han extrado por bombeo caudales en una
cuenca prxima B y no se conoce si este hecho ha afectado o no a la hidrologa de A. La
media de caudales anuales en A durante los ltimos 27 aos es de 1,51 m3/s. Se pide
contrastar si hay o no un cambio significativo en la media.
Ho: no hay cambio en la media; H1 hay cambio en la media. Se toma como nivel de
significacin 5%, repartido en dos tramos de 2,5% ambos lados de la media, por lo que
la regin de aceptacin se encuentra comprendida entre (-1,96, 1,96). Al realizar las
operaciones, el valor del estadstico queda fuera de esta regin, es decir, cae en la regin
crtica:
1,51 3,56
= 4,96 > 1,96 = z 2,5%
2,14
27
por lo que no se puede aceptar la hiptesis de la homogeneidad de la serie.
Evidentemente, se ha comprobado la falta de homogeneidad, pero no la causa.
Ttulo
Muestra
Poblacin
Contraste sobre la varianza de una

poblacin
x1,...xn
N(,)
Contraste
Condiciones
Regin crtica
Bilateral. Ho: = o; H1 <> o
desconocida
2 o2 ;
desconocida
Unilateral. Ho:
H1
> o2
2 o2 ;
2
2
H1 < o
Unilateral. Ho:
Con conocida, cambiar
desconocida
(n 1)s 2
(n 1)s 2 2
n 1,1 , n21,
C=
2
2
2
2
(n 1)s
C=
< n21,
2
o
(n 1)s 2
C=
< n21,1
2
o
2
( xi )
por
o2
Tabla 38. Contrastes sobre la varianza de una poblacin normal.
En el siguiente ejemplo se vuelve a plantear un test de homogeneidad, pero esta vez en

trminos de la diferencia de medias de dos poblaciones normales independientes, entre
dos periodos, caracterizados por sus medias y desviaciones tpicas.
153
Ejemplo: bajo la hiptesis de apoyarse en series que siguen distribuciones normales sin
una varianza conocida, una forma de valorar si hay cambios en la media significativos
entre dos periodos distintos es plantear el siguiente contraste de hiptesis:
Ho: 1=2; H1: 12
La aplicacin del primer teorema de Fisher nos dara:
x
N (0,1)
n
Del segundo teorema
( n 1)s 2
n21
Y el cociente de los trminos anteriores ser por definicin una t de Student con n-1
grados de libertad, que queda:
x
t n 1
S
n
Al plantear el test sobre la diferencia de las medias se tiene:
(x
x 2 ( 1 2 )
S12 S 22
+
n1 n2
tf
La regin crtica para un nivel de significacin , se define como

2
S12 S 22
+
n1 nn
S12 S 22
+
} siendo f =
{ x1 x2 > tf, /2
2
2
2
n1 n2
1 S12
1 S 22
+

n1 + 1 n1 n2 + 1 n2
tf /2 es el cuantil correspondiente al valor de probabilidad /2 de la distribucin t de
Student para f grados de libertad dados por la aproximacin de Welch, el entero ms
prximo a la expresin anterior. Esta correccin tiene en cuenta el efecto de la
simplificacin realizada en las varianzas que han desaparecido del cociente que define la
variable aleatoria t de Student en una diferencia de variables aleatorias. Con muestras
grandes se puede simplificar y tomar la distribucin normal estndar z/2 por la
distribucin de Student tf, /2.
Este test se puede aplicar al ejemplo siguiente para el contraste de medias entre dos
periodos de mediciones en una misma estacin pluviomtrica:
154
Estacin
pluviomtrica C
(mm)
40
35
30
25
20
15
10
1974
1971
1968
1965
1962
1959
1956
1953
1950
34
29
32
26
35
34
25
27
27
28
36
23
34
26
35
36
25
24
1947
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
Estacin pluviomtrica C.
Periodo de medidas 1941-1976.
Nmero total de datos: 36
1944
31
20
21
23
22
21
29
34
22
17
22
38
18
15
12
33
22
27
Estacin
pluviomtrica C
(mm)
1941
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
Ao
Precipitacin registrada (mm)
Ao
Tiempo (aos)
Tomando una t de Student de 25 grados de libertad dados por el valor de f como

distribucin del estadstico, se obtendra un valor lmite de 2,06, mientras que el cociente
1 2
da un valor de 2,6, lo que supone aceptar la hiptesis alternativa. Es decir,
S12 S 22
+
n1 n2
existe una diferencia significativa entre las medias al 5% del nivel de significacin
siempre que las poblaciones sean normales.
Test 2 de bondad de ajuste
8.2.2
El test de 2 se utiliza para valorar la bondad del ajuste con una funcin de distribucin
comparando las frecuencias de la muestra clasificada en clases con las de la distribucin
terica. Es un contraste aplicable a variables discretas o continuas.
Como hiptesis nula, Ho, se toma el que la variable x sigue una determinada funcin de
distribucin terica F(x) o que tiene al menos su forma. El estadstico que se utiliza es el
de Pearson:
Ec. 193. Estadstico de Pearson
k
=
i =1
k
n ni
(n n pi )2 = k ni2 n = k (Observadasi Tericasi )2
pi = i
pi n
n pi
Tericasi
i =1
i =1 n pi
i =1
siendo k el nmero total de clases, ni el nmero de elementos por clase de la muestra, n

el total de la muestra y pi la probabilidad terica correspondiente a ese intervalo de clase
y funcin de distribucin F. Lgicamente, cuanto mayor sea , menos se parecern las
distribuciones muestral y terica. Este estadstico sigue una distribucin 2 con k-1
grados de libertad y la regin crtica est dada por:
155
Ec. 194. Regin crtica para aplicacin del test de bondad de ajuste
C = > k21,
Si los datos de la muestra se utilizan para calcular m parmetros, el nmero de grados de

libertad ser k-m-1. Es decir, el contraste tambin se aplica sobre la hiptesis de que la
muestra tiene una forma correspondiente a la funcin de distribucin, por ejemplo,
normal, de la que, a partir de la muestra, se calculan sus parmetros.
Este estadstico aparece al considerar que en cada intervalo del histograma una binomial
con una media npi y una desviacin tpica n pi qi (i es el subndice de clase).
Suponiendo que n es suficientemente grande y que p es pequeo, se tiene una Poisson
de la que queda como media npi y como desviacin tpica n pi . Al normalizar se
considera que la variable es una N(0,1) y la suma del cuadrado de k-1 variables
aleatorias independientes N(0,1), una 2 con k-1 grados de libertad. Para su aplicacin
se recomienda:
El nmero de clases del histograma de la muestra afecta a la aplicacin del test.

Se requiere un mnimo de 5 6 clases, con un nmero similar de datos en las
clases y como mnimo entre 3 y 10 datos por clase.
El tamao muestral debe ser, por tanto, grande, n > 25, 30 elementos.
El estadstico es sensible a la presencia de valores extremos, por lo que es bueno

revisar los sumandos parciales (frecuencias observadas menos tericas al
cuadrado).
No olvidar que en realidad se est contrastando el ajuste de la funcin de

distribucin terica a la muestra con el histograma construido.
Si las frecuencias son pequeas y no se pueden reagrupar las clases, se aplica la

correccin de Yates (Garca et al., 1998):
Ec. 195. Estadstico de Pearson corregido para frecuencias pequeas
k
=
i =1
( n n p
i
0,5)
n pi
Ejemplo:
Contrastar el posible ajuste de una funcin de distribucin normal a una serie de
mximos anuales registrados en una estacin pluviomtrica. El ejercicio se puede
realizar utilizando las herramientas del anlisis de datos de la hoja excel. Para activarlas
se debe ir al men Complementos dentro del correspondiente de Herramientas. Una vez
activado el anlisis de datos, se utiliza la aplicacin Histograma, que a su vez pide
seleccionar la matriz de los datos cuyas frecuencias hay que ordenar y la matriz con los
lmites de los intervalos. En la solucin que se muestra a continuacin, se han tomado
finalmente 6 intervalos.
156
Con formato
Media
63,83 (calculadas de la muestra)
Desviacin tpica
25,06 Nmero total de datos: 53
Nmero de clases
6
Nmero de grados de libertad
3
Clases Observadas Probabilidad Probabilidad
Puntos Aplicacin Probabilidad
npi
acumulada
parcial
medio
de la
parcial Tericas
por
normal
intervalo
40
7
13,21%
13,21%
32,5
10,56%
10,56%
5,60
55
18
47,17%
33,96%
47,5
25,73%
15,17%
8,04
70
11
67,92%
20,75%
62,5
47,88%
22,15%
11,74
85
7
81,13%
13,21%
77,5
70,73%
22,85%
12,11
100
5
90,57%
9,43%
92,5
87,37%
16,64%
8,82
y
5
100,00%
9,43%
107,5
95,93%
8,56%
4,54
mayor...
SUMA
Referencia chi cuadrado al 5% alfa
Estadstico de
Pearson
0,352
12,337
0,047
2,156
1,654
0,047
16,593
7.815
Histograma inicial
Frecuencia
40%
35%
% Observado
30%
% Terico-Normal
25%
20%
15%
10%
5%
0%
menor 40
40-55
55-70
70-85
85-100
100-y
mayor...
Clase
8.2.3
Tests basados en la distribucin de Kolmogorov-Smirnov
Este test se puede aplicar como la 2 para conocer si unos datos siguen una funcin de
distribucin determinada. Tambin es til cuando se quiere contrastar la falta de
homogeneidad de las distribuciones de datos entre dos periodos. Para aplicar este test la
funcin de distribucin debe ser continua.
Considerando como hiptesis nula el que la muestra siga una distribucin terica, FT, se
procede de la siguiente manera:
1. Ordenar la muestra de menor a mayor y asociar una frecuencia observada
correspondiente al orden de observacin (para el orden r, probabilidad r/n)
2. Obtener las diferencias de estas probabilidades de los valores observados con las
correspondientes a la funcin de distribucin terica. El estadstico del test de
Kolmogorov-Smirnov es el mximo valor absoluto de estas diferencias. Sigue
una distribucin de Kolmogorov-Smirnov que se puede consultar en tablas para
la que hay que considerar el trmino n .
157
Ec. 196. Estadstico de Kolmogorov
n max ( FO ( x) FT ( x) ) Kolmogorov
siendo n el tamao de la muestra, FO las frecuencias acumuladas de los valores
observados y FT las tericas. Si el estadstico calculado es mayor que el correspondiente
a las tablas, se rechaza la hiptesis de comportamiento de la muestra segn la
distribucin seleccionada.
dividir los siguientes valores por n

para contrastar con el mximo valor
absoluto de las diferencias de frecuencias
90%
95%
99%
10
20
30
40
50
100
1,05
1,10
1,12
1,13
1,14
1,17
1,22
1,14
1,22
1,24
1,26
1,27
1,29
1,36
1,29
1,42
1,46
1,50
1,52
1,55
1,63
Tabla 39. Distribucin de Kolmogorov-Smirnov (Singh)

Cuando se contrasta la normalidad de una muestra y con ella se calculan los parmetros,
los valores de la tabla de referencia se corrigen por los de Lilliefors, bastante ms
restrictivos. La correspondiente distribucin se denomina Kolmogorov-SmirnovLilliefors.
En el texto de Singh (1985) se expone una tcnica para utilizar el test de KolmogorovSmirnov en la deteccin de heterogeneidades en las series temporales. Para ello se
calculan las diferencias, yi, entre los valores de la estacin a comprobar y los de la
estacin de referencia. A continuacin, se calcula la serie de desviaciones acumuladas
estandarizadas por la desviacin tpica de la serie de diferencias tal como se indica a
continuacin:
Ec. 197. Tratamiento de la variable para detectar heterogeneidades en la serie con K-S
k
S k = ( yi y )
i =1
S2 =
1 n
( yi y ) 2
n i =1
S ka =
Sk
S
que permite detectar la falta de homogeneidad si se alcanzan valores demasiado altos. El

estadstico de referencia sigue siendo el mximo de los valores absolutos alcanzados,
que, en trminos de las expresiones anteriores, queda:
Ec. 198. Estadstico de Kolmogorov-Smirnov en la identificacin de heterogeneidades
P = mx S ka
0 k n
que puede valorarse segn las tablas de Kolmogorov-Smirnov ( P
158
).
8.2.4
Test de Wilcoxon, Mann-Whitney
El test de Wilcoxon o Mann-Whitney contrasta si dos muestras independientes (xi, yj)

(i=1..n, j=1..m, nm) son heterogneas y entre ellas hay un cambio de localizacin,
mediana, provengan o no de una misma poblacin no necesariamente normal. Es un test
que trabaja sobre los rangos de las series ordenadas y se aplica con independencia de la
funcin de distribucin a la que pertenezcan. La hiptesis nula es que las dos series
tienen la misma mediana.
Para aplicar el test, se mezclan las dos muestras y se asigna un rango a cada uno de los
valores de la nueva serie nica. Siendo el estadstico Rx la suma de los rangos ocupados
por la serie xi:
Ec. 199. Estadstico del test de Wilcoxon o Mann-Whitney
n
Rx =
xi
i =1
Este ndice sigue aproximadamente una distribucin normal si el tamao de las

muestras no es pequeo (n y m > 5). Como la suma de los rangos de n+m datos es:
Ec. 200. Suma de los rangos en el test de Wilcoxon o Mann-Whitney
n+m
i =
i =1
1+ n + m
N +1
(n + m ) = N
el valor esperado del rango de una observacin xi que puede tomar los valores de 1..N
con idntica probabilidad
1
es:
N
Ec. 201. Valor esperado del rango en el test de Wilcoxon o Mann-Whitney

E [r ( xi )] =
i N
1
i =1
por lo que la media y desviacin tpica de Rx quedan:

Ec. 202. Media y desviacin tpica de la suma de rangos
= n
N +1
n m
y 2 =
(N + 1)
2
12
Estos resultados permiten estandarizar el valor de Rx obtenido de la muestra y

determinar los lmites de las regiones de aceptacin y crtica segn los valores normales.
Segn Kundzewicz (2000) se pueden tomar como valores estandarizados los de las
siguientes expresiones
159
Ec. 203. Valores estandarizados de la suma de rangos
Rx < Rx =
Rx + 0,5
Rx = Rx = 0
Rx > Rx =
Rx 0,5
En el caso planteado como ejemplo, con dos muestras de 18 valores tal y como aparecen
en el ejemplo del apartado 8.2.1, Rx toma un valor de 237, de 333 y 2 de 999 con lo
que el valor estandarizado es 3,07, entre los lmites de confianza al 95% de la normal,
(-1,96, +1,96) y la homogeneidad no se puede aceptar.
8.2.5
Test de Wilcoxon con signos
Una variacin del anterior es el denominado test de Wilcoxon con signos, que tambin
se plantea sobre la homogeneidad de la serie. Esta vez el estadstico de referencia se
obtiene como suma de los rangos de los valores negativos de las diferencias entre datos
de dos series. Estas diferencias han de ser ordenadas de forma ascendente segn el valor
absoluto de las mismas.
8.2.6
Test de la de Kendall
Este test mide la correlacin entre dos series de variables utilizando los rangos de los
valores de las mismas. El estadstico se obtiene contabilizando el nmero de veces en
que a un incremento de una variable, y, le corresponde un aumento en la otra, x, P; y el
nmero de veces en que a un decremento de y le corresponde un incremento de x, M. Es
decir, estas dos cantidades se calculan ordenando las series de parejas de manera
creciente en x y contabilizando, para cada valor de y, el nmero de veces en que los
valores subsiguientes de la serie y son mayores y menores. La diferencia entre ambas
cantidades, S=P-M, permite obtener el estadstico , valor estandarizado de S por el
nmero total de comparaciones posibles de n pares de datos,
Ec. 204. Estadstico de Kendall.
PM
n(n 1) )
2
Este se puede asumir normal N(0,1) al transformarlo con,
160
Ec. 205. Normalizacin de la de Kendall.
S 1
S > 0 :
z = S = 0 : 0
S +1
S < 0 :
8.2.7
n
(n 1)(
2n + 5)
18
Test del coeficiente de Spearman
Este es un test basado tambin en los rangos para determinar si la correlacin entre dos
variables es significativa. La hiptesis nula es que las series son independientes y no
hay correlacin entre los pares de rangos.
El estadstico es el coeficiente de Spearman (Ec. 64) de las series. Para determinar la
regin de aceptacin y regin crtica se considera que, con muestras de ms de 20
valores, el estadstico siguiente sigue una normal de media nula y desviacin tpica
unidad (Kundzewicz, 2000).
Ec. 206. Estandarizacin del estadstico de Spearman.
rRxy n 1
8.2.8
Test de rachas
Este test se aplica para conocer si la muestra est constituida por datos aleatorios e
independientemente distribuidos contrastando el nmero de rachas. Una racha est
constituida por una sucesin de valores por encima o por debajo de un determinado
nivel, por ejemplo la mediana. Longitud de una serie es el nmero de valores de cada
racha.
Se supone que los datos hidrolgicos de partida son independientes y se contrasta como
hiptesis nula la independencia de los registros utilizando el estadstico constituido por
el nmero de rachas de la serie, que para un nmero suficientemente alto de valores, 40,
se aproxima a una normal. La hiptesis alternativa es que los datos no son
independientes. Si n es el nmero total de datos en la serie, los valores de la media y
varianza del numero de rachas para un nmero total de datos par e impar son los
siguientes,
Ec. 207. Media y varianza del test de rachas.
=1+
n
2
2 =
n(n 2 )
4(n 1)
=1+
(n 1)( n 3)
n 1
2 =
2
4(n 2)
161
Estos valores permiten estandarizar el nmero total de rachas de la serie y calcular las
regiones de aceptacin y crticas por medio de una normal de media 0 y desviacin
tpica 1.
Se dispone de una serie de caudales mximos anuales y se desea aplicar un test de
rachas para comprobar si las presas construidas en cabecera a mediados de los aos 60
tienen influencia en la reduccin de avenidas. Se supone que la existencia de lagunas no
afecta a la aplicacin del test.
Ao
1946-47
1947-48
1948-49
1949-50
1950-51
1951-52
1952-53
1953-54
1954-55
1955-56
1956-57
1957-58
1958-59
1959-60
1960-61
1961-62
m3/s
464,2
447,0
880,0
181,0
860,0
315,0
92,9
375,0
134,2
177,3
954,0
440,4
800,0
302,0
114,0
143,5
Racha
+
+
+
+
+
+
+
+
+
+
-
Ao
1962-63
1963-64
1964-65
1965-66
1966-67
1967-68
1968-69
1969-70
1970-71
1971-72
1972-73
1973-74
1974-75
1975-76
1976-77
1977-78
m3/s
207,4
128,3
Racha
-
362,0
161,0
154,7
161,4
460,5
133,6
556,5
377,5
163,2
70,9
347,8
319,5
524,2
+
+
+
+
+
+
+
Ao
1978-79
1979-80
1980-81
1981-82
1982-83
1983-84
1984-85
1985-86
1986-87
1987-88
1988-89
1989-90
1990-91
m3/s
87,0
226,2
87,0
45,5
Racha
-
270,1
311,4
413,0
800,1
208,2
372,7
221,1
+
+
+
+
-
1200,0
1000,0
m /s
800,0
600,0
400,0
200,0
1946-47
1947-48
1948-49
1949-50
1950-51
1951-52
1952-53
1953-54
1954-55
1955-56
1956-57
1957-58
1958-59
1959-60
1960-61
1961-62
1962-63
1963-64
1964-65
1965-66
1966-67
1967-68
1968-69
1969-70
1970-71
1971-72
1972-73
1973-74
1974-75
1975-76
1976-77
1977-78
1978-79
1979-80
1980-81
1981-82
1982-83
1983-84
1984-85
1985-86
1986-87
1987-88
1988-89
1989-90
1990-91
0,0
Si las presas causan una disminucin en las avenidas, durante el segundo periodo habr
un predominio de rachas negativas, es decir, valores por debajo de esa media. El
contraste es unilateral. El total de datos es 42, las rachas son 20 y el valor crtico para un
nivel de significacin del 2,5% es 16, asumiendo que el nmero de rachas sigue una
normal y despreciando las lagunas existentes en la serie. De lo anterior se sigue que los
datos son aleatorios y la influencia de presas de cabecera no es significativa.
McCuen (2003) destaca dos factores a considerar en la aplicacin del test de rachas:
1. La aplicabilidad del test depende de si el cambio introducido es suficientemente
importante respecto a la variabilidad introducida por otros componentes
aleatorios. En el caso del ejemplo aplicado a la generacin de avenidas, es
posible que el test no pueda detectar efectos sobre los cambios de usos de suelo
162
si la variabilidad introducida por la variable precipitacin es relativamente

grande.
2. La aplicabilidad tambin est influida por la manera en que se introducen los
cambios. Si stos ocurren de forma gradual y durante un periodo largo respecto
al total disponible, ser ms difcil identificar su efecto. Por el contrario, cuando
los cambios se producen de manera repentina y centrados en el periodo
temporal de estudio, es esperable que sus efectos sean ms claros en la serie.
8.2.9
Test de Mann-Kendall
Un test aplicado para la deteccin de tendencias en los datos y la consecuente falta de

homogeneidad temporal es el de Mann-Kendall. Es un test no paramtrico
originalmente desarrollado por Mann en 1945, para posteriormente Kendall aportar la
distribucin del estadstico en 1975. La hiptesis nula es que no hay tendencia en los
datos, independientes y pertenecientes a la misma poblacin. La idea que subyace en l
es tambin ver cmo estn entremezclados los valores de una serie a partir del siguiente
estadstico:
Ec. 208. Estadstico de Mann-Kendall
n
u = ni
i =1
donde ni es el nmero de veces que los elementos precedentes en la serie a xi le son

inferiores. Es decir, xj < xi para todo j < i. Valores anormalmente bajos o altos de este
estadstico permiten inferir que hay cierta concentracin de valores altos o bajos en la
serie y, consecuentemente cierta falta de homogeneidad o una tendencia marcada.
El valor del cuantil correspondiente al nivel de significacin escogido se determina
mediante permutaciones de la serie original. Por cada permutacin se calcula el
estadstico u, lo que finalmente permite manejar su distribucin.
McCuen (2003) incluye las expresiones para transformar la variable anterior en normal
con muestras de 30 ms elementos. V es la desviacin tpica, funcin del nmero total
de datos, n, y del nmero de grupos con medida idntica, g, siendo ti el nmero de
medidas con igual valor de cada uno de los grupos. El estadstico S conserva el signo de
las diferencias entre cada elemento y el resto considerado.
Ec. 209. Normalizacin de la variable
u 1
S > 0 : V
z = 0
u +1
S < 0 :
V
n(n 1)(
2n + 5) ti (ti 1)(
2ti + 5)
V=
i =1
18
163
8.2.10 Test del ratio de Von Neumann

Este es un no paramtrico para contrastar la independencia de los datos de una serie
temporal. La hiptesis nula supone la independencia en la serie. Para su aplicacin esta
serie ha de consistir en al menos 30 datos (Kundzewicz, 2000). Si N es el nmero total
de datos, el estadstico de Von Neumann tiene la siguiente expresin:
Ec. 210. Estadstico de Von Neumann
n 1
N ( xi xi +1 ) 2
V=
i =1
n
(N 1) ( xi x )2
i =1
Este estadstico tiene distribucin normal con los siguientes parmetros:

Ec. 211. Parmetros de la distribucin normal del ratio de Von Neumann
V =
2N
N 1
2 =
4(N 2)
(N 1)2
Entonces, el estadstico estandarizado sigue una normal de media nula y desviacin

tpica uno, lo que facilita el manejo de las regiones de aceptacin y crtica segn los
correspondientes a los niveles (1-/2).
Ec. 212. Estadstico estandarizado del test de Von Neumann
2 N
N 1 = V (N 1) 2 N
4(N 2)
2 N 2
2
(N 1)
V
v=
En la publicacin de Singh (1985) este test se presenta para la deteccin de

heterogeneidades en la serie respecto a otra de referencia. La hiptesis nula es que se
mantiene la homogeneidad. Su aplicacin se plantea sobre una serie de residuos (yi=xixref_i siendo i=1..n) respecto a valores de una estacin de referencia, por ejemplo, las
medias de un grupo de estaciones pertenecientes a la misma regin climtica. El test del
ratio de Von Neumann permite introducir informacin de carcter regional como se
haca en las dobles acumulaciones. De la serie de residuos, se calcula el estadstico V,
que en la referencia aparece ligeramente modificado respecto al anteriormente
presentado:
Ec. 213. Estadstico de Von Neumann aplicado a residuos (Singh, 1985)
n 1
( y
V=
( y
i =1
164
yi +1 ) 2
i =1
n
y )2
tal que para que sea aceptada la hiptesis de homogeneidad en los datos, V debe estar
comprendido entre un valor correspondiente al nivel escogido y 2, es decir la
pertenencia a un intervalo {V, 2},
Ec. 214. Definicin de la regin de aceptacin del test
V = 2 2
N 2
( N 1) ( N + 1)
siendo N el tamao de la muestra y el percentil de la distribucin normal

estandarizada.
Aplicando este criterio a la serie dada en el apartado 8.2.1 y calculando la serie de
residuos a partir de la informacin contenida en la serie de medias anuales de 25
estaciones pertenecientes a la misma regin (coincidentes con la estacin de referencia
del ejemplo de las dobles acumulaciones) y un nivel de significacin del 5%, resultara
un valor de VP igual a 1,46 para un estadstico V igual a 1,13. Se concluye la falta de
homogeneidad de la serie pluviomtrica
8.2.11 Test de Alexandersson
De forma similar al anterior se plantea el test de Alexandersson, basado en construir la
x
serie de cocientes qi = i , que una vez estandarizados permiten definir el estadstico
xref _ i
T de la forma siguiente (Almarza et al., 1996):
Ec. 215. Tratamiento de la variable para la aplicacin del test de Alexandersson
n
q=
i =1
S2 =
1 n
(qi q ) 2
n i =1
zi =
1 n
1 k
t k = zi +
zi
k i =1 n k i =k +1
qi q
S
Valores crticos. Alexandersson.

Nivel de confianza 95%
T = mx t k
25
50
75
100
150
200
Valor
crtico
7,75
8,85
8,95
9,15
9,35
9,55
0 k n
Tabla 40. Valores crticos test de Alexandersson
165
166
BIBLIOGRAFA
Allen, R.G., Pereira, L.S., Raes, D. y Smith, M. 1998. Anejo IV, Statistical Analisis of
Weather data sets en Crop Evapotranspiration. Guidelines for computing crop water
requirements. FAO Irrigation and Drainage Paper 56. Roma.
Almarza Mata, C, Lpez Daz, J. A., Flores Herrez C. 1996. Homogeneidad y
variabilidad de los registros histricos de precipitacin de Espaa. Direccin General
del Instituto Nacional de Meteorologa.
Bosque Sendra, J., 1997. Sistemas de Informacin Geogrfica. Segunda edicin. Ed.
Rialp, S.A. Madrid.
Bras R. L, Rodriguez-Iturbe I. 1985. Random Functions and Hydrology. Reading,
Massachusetts: Addison-Wesley.
CEDEX. Estudio de recursos hidrulicos del Per, Zona Titicaca.
Chow Ven Te, Maidment, D. R.; Mays, L. W., 1994. Hidrologa Aplicada. McGrawHill Interamericana. Santaf de Bogot, Colombia.
Etoh Takeraku, Murota, Akira, Nakanishi, Masanori, 1987. SQRT Exponential Type
Distribution of Maximum. En Hydrologic Frequency Modelling. Proceedings of the
International Symposium on Flood Frequency an d Risk Analyses, 14-17 Amy, 1986.
Louisiana State University, Baton Rouge, USA. Pginas 253-264. Editado por Vijay P
Singh. Reidel Publishing Company.
Ferrer Polo, Javier, 1992. Anlisis Estadstico de Caudales de Avenida. Centro de
Estudios Hidrogrficos del CEDEX. Serie Monografas del MOPT, Ministerio de Obras
Pblicas y Transportes, n 26. Madrid
Ferrer Polo, Javier, 1996. El modelo de funcin de distribucin SQRT-ET MAX en el
anlisis regional de mximos hidrolgicos: aplicaciones a las lluvias diarias. Tesis
Doctoral. Universidad Politcnica de Madrid. Escuela Tcnica Superior de Ingenieros
de Caminos, Canales y Puertos.
Fiering, Myron B; Jackson, Brbara B, 1971. Synthetic Streamflows. Water Resources
Monograph, 1. American Geophysical Union. Washington, D.C.
Garca Prez, A., Navarro Veguillas, H., Vlez Ibarrola, R. 1995. Estadstica II.
Universidad Nacional de Educacin a Distancia. Madrid.
Gmez Espadas, J. L. Estadstica. Curso Internacional de Hidrologa General y
Aplicada. CEDEX. Madrid.
HEC-4. U.S. Army Corps of Engineers. The Hydrologic Engineering Center. California.
EE.UU.
167
Helsel, D.R. y Hirsch, R.M. 2002. Statistical Methods in Water Resources. Book 4.
Hydrologic Analysis and Interpretation. Techniques of Water Resources Investigations
of the United States Geological Survey. USGS
Kite, G.W., 1977. Frequency and Risk Analyses in Hydrology. Water Resources
Publications, Fort Collins, Colorado.
Kundzewicz, Z.W.; Robson, A. 2000. Detecting trend and other changes in hydrological
data. World Climate Programme Water. WMO/TD-N 1013. United Nations
Educational Scientific and Cultural Organization. World Meteorological Organization.
Ginebra, mayo 2000.
Llamas, Jos, 1993. Hidrologa General, Principios y Aplicaciones. Servicio Editorial
Universidad del Pas Vasco.
Martn Jadraque, V. Estadstica Matemtica. Recordatorio de conceptos bsicos. CSIC.
Instituto de Hidrologa. Escuela de Hidrologa.
McCuen, Richard. 2003. Modeling Hydrologic Change: Statistical Methods. Lewis
Publishers. CRC Press Company.
NERC, 1975. Flood Studies Report. Volume I. Hydrological Studies. Natural
Environmental Research Council. London
Rodrguez Barrera, R., Llasat Botija, C. y Martn Vide J.. Anlisis de series temporales
en climatologa: modelizacin y homogeneidad. Universitat de Barcelona. Textos
Docentes 165.
Salas, J.D., Delleur, J. W., Yevjevich, V., Lane W. L. 1988. Applied Modeling of
Hydrologic Time Series. Water Resources Publications.
San Miguel, J. M., 1990. Estadstica Radical. Servicio de Publicaciones de la ETSI
Caminos, Canales y Puertos de la Universidad Politcnica de Madrid.
Singh V. P.,1985. Hydrologic Systems. Volume II. Watershed Modelling. Prentice Hall,
Englewood Cliffs, New Jersey.
Pea, D. 2000. Estadstica, Modelos y mtodos. 2 tomos. 1. Fundamentos. Alianza
universidad textos. Alianza Editorial, Madrid.
Spiegel, M. R. 1990. Probabilidad y Estadstica. Teora y 760 problemas resueltos. Serie
Schaum. McGraw-Hill.
168

Curso Estad

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Curso Estad

Uploaded by

Copyright:

Available Formats

Mdulo de estadstica aplicada a la Hidrologa

Estadstica Aplicada a la Hidrologa

Estadstica Aplicada a la Hidrologa

TEORA DE LA PROBABILIDAD ..................................................................................................15

FENMENOS ALEATORIOS Y DEFINICIONES .................................................................................15

ESTADSTICA DESCRIPTIVA ........................................................................................................39

Medidas de dispersin. ............................................................................................................52

Medidas de forma de la distribucin de valores. ...................................................................54

Estadstica Aplicada a la Hidrologa

VARIABLE ALEATORIA Y FUNCIONES DE DISTRIBUCIN .............................................75

Suma de variables aleatorias .................................................................................................. 79

Momentos centrales de orden n...............................................................................................88

MODELOS DE DISTRIBUCIN UNIVARIADA DE PROBABILIDAD .................................91

DISTRIBUCIN NORMAL Y ASOCIADAS .........................................................................................91

GEV1, distribucin de Gumbel ............................................................................................. 113

COMPLETADO DE SERIES HIDROMETEOROLGICAS...................................................120

PROPIEDADES DE LAS SERIES TEMPORALES ...............................................................................120

Estadstica Aplicada a la Hidrologa

Regresin simple ....................................................................................................................123

Posibilidades de ajuste .......................................................................................................... 123

ESTIMACIN DEL MODELO. INFERENCIA ESTADSTICA .............................................133

Mtodos paramtricos ...........................................................................................................133

TEST DE CONTRASTE DE HIPTESIS. ....................................................................................149

Estadstica Aplicada a la Hidrologa

FIGURA 1. GRFICA DE SECTORES ....................................................................................................................42

Estadstica Aplicada a la Hidrologa

FIGURA 56. APLICACIN DE LA SQRT ET-MX A SERIES DE LLUVIAS MXIMAS ANUALES........................118

Estadstica Aplicada a la Hidrologa

Estadstica Aplicada a la Hidrologa

EC. 1. PROBABILIDAD DE UN SUCESO ELEMENTAL CON SIMETRA ..................................................................16

Estadstica Aplicada a la Hidrologa

EC. 57. MEDA ...................................................................................................................................................54

Estadstica Aplicada a la Hidrologa

EC. 116. FUNCIN DE DENSIDAD NORMAL........................................................................................................91

Estadstica Aplicada a la Hidrologa

EC. 173. FRMULAS DE GRFICO ....................................................................................................................134

Mdulo de Estadstica Aplicada a la Hidrologa

La estadstica es la ciencia que se ocupa del tratamiento de los datos y la realizacin de

Estadstica Aplicada a la Hidrologa

Mdulo de Estadstica Aplicada a la Hidrologa

La Estadstica trata del estudio de la realidad entendida a partir de los fenmenos

Estadstica Aplicada a la Hidrologa

Como consecuencia de lo expuesto, la probabilidad de un suceso cualquiera no

donde se ha tenido en cuenta que la interseccin de sucesos elementales es el suceso

Esta es la denominada regla de Laplace que, como se ha dicho, es solo aplicable a

Mdulo de Estadstica Aplicada a la Hidrologa

En el caso del dado, la probabilidad de un suceso cualquiera, por ejemplo obtener en un

Definicin emprica de Von Mises

La definicin de Laplace de probabilidad descrita en el apartado anterior es solo

Entonces se habla de la probabilidad como frecuencia relativa de un suceso respecto al

Para Von Mises, la probabilidad de un suceso solo se puede conocer a travs de la

Estadstica Aplicada a la Hidrologa

Ley fuerte de los grandes nmeros

Como se coment anteriormente, el criterio de Von Mises ser el habitualmente

El cociente del nmero de veces que se presenta el suceso A entre el de repeticiones

Mdulo de Estadstica Aplicada a la Hidrologa

PROBABILIDAD Y AXIOMAS DE KOLMOGOROV

La teora de conjuntos aporta la estructura desde la que se organizan los modelos

Unin de sucesos. Se llama suceso unin o suma de dos sucesos, A y B, a aquel

Interseccin de sucesos. Se llama suceso interseccin o producto de dos sucesos,

Suceso complementario. Dado el espacio muestral E y un suceso A, el

Suceso diferencia. Dados dos conjuntos A y B, el suceso diferencia es el que

Estadstica Aplicada a la Hidrologa