Professional Documents
Culture Documents
de datos funcionales
Se revisan tres mtodos para la prediccin espacial de los datos funcionales. Inicialmente,
se propone un predictor que tiene la misma forma que el predictor kriging clsico, pero teniendo
en cuenta las curvas en lugar de datos de una sola dimensin. Los otros predictores surgen
de adaptaciones de modelos lineales funcionales con respuesta funcional en el caso de datos
funcionales espacialmente correlacionados. Por un lado, se define un predictor que es una com-
binacin de kriging y del modelo funcional lineal point-wise (concurrente). Por otra parte, se
utiliza el modelo funcional lineal total para extender dos mtodos clsicos geoestadsticos mul-
tivariantes para el contexto funcional. El primer predictor se define en trminos de parmetros
escalares. En el resto de los casos, los predictores implican parmetros funcionales. Se adapta
un criterio de optimizacin, criterio utilizado en prediccin espacial multivariante para estimar
los parmetros escalares y funcionales que intervienen en los predictores propuestos. En todos
los casos se da un enfoque no paramtrico basado en la expansin en trminos de bases de fun-
ciones que se usa para obtener las curvas a partir de datos discretos.
Palabras clave: base de funciones; Cokriging; validacin cruzada; modelo lineal funcional;
Kriging; prediccin espacial multivariante.
iii
Contenidos
Introduccin 1
1 Geostadstica Univariante 5
1.1 Tipos de datos espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Anlisis estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Variable regionalizada . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 Hiptesis de estacionariedad . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Estudio del semivariograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Anisotropa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4.1 Anisotropa geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.2 Anisotropa zonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Condicin de positividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Versiones muestrales de algunas medidas de variabilidad espacial . . . . . . . . 14
1.7 Factores a tener en cuenta para la modelizacin . . . . . . . . . . . . . . . . . 15
1.8 Mtodos de estimacin de los parmetros del variograma . . . . . . . . . . . . 16
1.8.1 Estimacin por mnimos cuadrados (MC) . . . . . . . . . . . . . . . . 16
1.8.2 Estimacin mximo verosmil (MV) . . . . . . . . . . . . . . . . . . . 17
1.9 Kriging: prediccin e interpolacin . . . . . . . . . . . . . . . . . . . . . . . . 18
1.9.1 Kriging Simple (SK) . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.9.2 Kriging Ordinario (OK) . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.9.3 Kriging universal(UK) . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.9.4 Cokriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2 Geostadstica Multivariante 29
2.1 Anlisis estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2 Cokriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2.1 Cokriging simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2.2 Cokriging ordinario . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3 Cokriging universal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4 Condicin de insesgadez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
v
vi CONTENIDOS
Bibliografa 105
Glosario 107
Index 108
Introduccin
La mayora de los fenmenos naturales que se estudian son variables medidas tanto en el espacio
como en el tiempo. Considerando una superficie de un suelo, por ejemplo, en ocasiones se puede
observar una alta variabilidad en distancias pequeas. Esta variabilidad es el resultado de los
procesos naturales. Si se tienen datos de una de esas variables en n sitios de una regin con
continuidad espacial, implcitamente en cada uno de ellos hay una observacin funcional y as
usando tcnicas de suavizado los valores encontrados pueden convertirse en un dato funcional.
Por ello, en este proyecto se mostrar cmo las tcnicas de permiten identificar tendencia en
media y varianza y explorar la estructura de autocorrelacin inherente a un conjunto de datos
medidos en una regin con continuidad espacial mediante el uso de varios ejemplos. Muchos de
los datos recogidos en problemas de las ciencias aplicadas son curvas. Para modelizar este tipo
de informacin est el Anlisis de Datos Funcionales (FDA), (se puede ver en [26]) se utiliza
desde finales de los aos noventa. En ciencias como la agronoma, meteorologa, ecologa y
otras el anlisis geostadstico, (vase [6]) se utiliza, a menudo, para describir la distribucin
espacial.
La palabra geoestadstica se compone de dos partes, geo y estadstica de manera similar a
trminos como geofsica o geoqumica. Se usa con dos acepciones diferentes:
1. como una coleccin de todos los mtodos estadsticos y probabilsticos aplicados a las
geo-ciencias,
La geoestadstica fue usada primero por la industria minera, debido a los altos costes altos
que suponan las perforaciones que se hacan, de ah que el anlisis de los datos fuera de suma
importancia. De hecho muchos libros y publicaciones sobre geoestadstica estn en su mayora
orientados a problemas de minera.
La motivacin de este trabajo es ofrecer una solucin al problema de predecir curvas en
aquellas zonas no muestreadas de una regin, basndonos en estas dos ramas estadsticas, el
anlisis de datos funcionales y la estadstica espacial. Los captulos 1-3 recogen el fundamento
terico ms importante, necesario para este proyecto, para ambas ramas.
1
2 CONTENIDOS
15
10
5
0
5
Da
Figura 1: Valores medios de las curvas diarias de la temperatura media observado en 66 esta-
ciones meteorolgicas de Galicia.
Los datos de cada estacin se obtuvieron la pgina web de Meteogalicia - Xunta de Galicia
(http://www.meteogalicia.es/web/index.action). Las coordenadas geogrficas de estaciones me-
teorolgicas (Figura 2) tambin se han obtenido de esa pgina. Estos datos son analizados en el
Captulo 4.
Figura 2: Estaciones metereolgicas. El punto marcado en rojo corresponde a la Facultad de
Matemticas, punto no muestreado.
Captulo 1
Geostadstica Univariante
La Geostadstica es la ciencia que estudia los fenmenos que fluctan en el espacio y/o tiempo,
oferciendo una coleccin de herramientas estadsticas para la descripcin y modelizacin de la
variabilidad espacial (y temporal).
El trmino Estadstica Espacial se usa para describir una amplia variedad de modelos y
mtodos adecuados para el anlisis de datos referenciados espacialmente. En el libro [6] se
puede encontrar una descripcin general de stos.
El anlisis espacial comprende el conjunto de conceptos y procedimientos utilizados para
abordar el estudio de la estructura y las relaciones territoriales a partir del conocimiento de la
posicin de las entidades geogrficas y las caractersticas de las variables seleccionadas para su
investigacin.
Cuando la distribucin espacial de los datos es importante para su estudio e interpretacin,
la aplicacin de tcnicas especficas para datos espaciales cobra importancia puesto que puede
proporcionar mayor informacin que las tcnicas tradicionales.
Las bases de datos espaciales deben contener observaciones de una (o varias) variables es-
tadsticas de inters y una referencia cartogrfica. Estas variables van a ser continuas, la nica
condicin que se le impone es que exista alguna dependencia entre dos variables con distinta ref-
erencia cartogrfica, es decir, dos observaciones son ms similares cuanto ms cercanas son sus
realizaciones muestrales y a su vez, a medida que la distancia de las localizaciones muestrales
aumenta, la correlacin entre las variables tiende a anularse. La caracterstica de dependencia es
una diferencia importante respecto al anlisis estadstico efectuado con datos independientes lo
que va a suponer ventajas, ya que las predicciones sern ms precisas, como inconvenientes, las
estimaciones menos precisas.
No existe ninguna restriccin en las referencias cartogrficas, que pueden ser una referencia
territorial explcita como latitud y longitud (datos geogrficos) o una referencia implcita como
domicilio o cdigo postal (datos socio-econmicos).
En estadstica espacial se distinguen tres tipos de datos (vase [6]): datos geoestadsticos o
georreferenciados (geostatistical data), datos en rejilla o datos en un rea (lattice data), y datos
de procesos puntuales (point processes data).
5
6 C APTULO 1. G EOSTADSTICA U NIVARIANTE
Independientemente del tipo de datos, los objetivos principales del estudio de la Estadstica
Espacial son, como en casi todos los campos de la Estadstica, dos:
1. Descripcin de los datos. Esto puede incluir no slo el estudio descriptivo del proceso
Z(u), tal como se entiende dentro de la estadstica clsica, sino tambin la modelizacin
del tipo de dependencia espacial.
F (u; z) = P {Z(u) z}
F (u1 , . . . , uk ; Z1 , . . . , Zk ) = F (u1 + C, . . . , uk + C; Z1 + C, . . . , Zk + C)
para cualquier vector de traslacin C. Es decir, esta hiptesis establece el grado de homogenei-
dad espacial del fenmeno.
8 C APTULO 1. G EOSTADSTICA U NIVARIANTE
Como slo se dispone de una realizacin discreta de la variable Z(u), es inevitable que haya
que asumir ciertas hiptesis para poder llevar a cabo algn tipo de estudio estadstico. El tipo de
estacionariedad asumido indica qu tipo de inferencia estadstica puede realizarse con el modelo
probabilstico.
Se considera un proceso estocstico {Z(u), u D}, donde D es un subconjunto de Rd
(espacio Eucldeo d-dimensional). El proceso Z se dice que es Gaussiano si, para cualquier
natural k 1 y las localizaciones u1 , . . . , uk , el vector (Z(u1 ), Z(u2 ), . . . , Z(uk )) tiene una
distribucin normal multivariante.
Estrictamente Estacionario
Si la correspondiente distribucin de (Z(u1 ), Z(u2 ), . . . , Z(uk )) es la misma que la del vector
(Z(u1 + h), Z(u2 + h), . . . , Z(uk + h)) para cualesquiera u1 , u2 , . . . , uk puntos espaciales y
cualquier h Rd , el proceso se dice que es estrictamente estacionario.
Z2 = C(0), x D.
Se puede ver que si todas las varianzas son finitas entonces un proceso estrictamente esta-
cionario es tambin estacionario de segundo orden. La afirmacin inversa es falsa, en general,
pero un proceso Gaussiano que es a la vez estacionario de segundo orden ser tambin estricta-
mente estacionario, ([6]).
Hiptesis intrnseca
Si se asume que (u) es una constante, la cual podemos suponer cero sin prdida de generalidad,
se puede definir:
2(u1 u2 ) = Var {Z(u1 ) Z(u2 )}
1.2 A NLISIS ESTRUCTURAL 9
La ecuacin anterior slo tiene sentido si la parte izquierda depende de u1 y u2 slo a travs
de su diferencia u1 u2 . Un proceso que satisface esta propiedad se llama intrnsicamente
estacionario. La funcin 2() se llama variograma y () semivariograma.
2. |(h)| (0) = 0.
Var {Z(u1 ) Z(u2 )} = Var {Z(u1 )} + Var {Z(u2 )} 2Cov {Z(u1 ), Z(u2 )}
= 2C(0) 2C(u1 u2 )
(h)
2. lim|h|+ |h|2
= 0.
Desde este punto de vista, las distintas formas (ms fuertes) de estacionariedad no son nece-
sarias. La estacionariedad tanto intrnseca como la de segundo orden son suposiciones ms
naturales. Por ello, hay que ser cauto cuando un anlisis preliminar de los datos indica que el
proceso es intrnsecamente estacionario y no estacionario.
Isotropa
Por otra parte, si la variable es estacionaria de segundo orden, siempre puede obtenerse la fun-
cin de covariograma a partir de la funcin de semivariograma: (h) = Z2 C(h).
De ahora en adelante, por facilidad de notacin, se denotar el variograma isotrpico por
(h), donde h representa la longitud del vector, en lugar del propio vector. El semivariograma
representa un ndice de cambio que muestra una variable con la distancia. Su forma describe el
patrn de variacin espacial en trminos de su magnitud y forma general.
La pediente del semivariograma indica la intensidad de cambio del atributo (variable) anal-
izado con la distancia al mismo tiempo que el porcentaje de disminucin en la dependencia
espacial. El mximo valor que alcanza un semivariograma se llama meseta (sill) o varianza a
priori, e indica la escala bajo la cual los datos definen un proceso estacionario de segundo orden.
La meseta puede ser o no finita. Los semivariogramas que tienen meseta finita cumplen con la
hiptesis de estacionariedad fuerte; mientras que cuando ocurre lo contrario, el semivariograma
define un fenmeno natural que cumple slo con la hiptesis intrnseca.
El lag o distancia para la que el sill es alcanzado se llama rango o alcance y define el
lmite de la dependencia espacial. El rango se interpreta como la zona de influencia. Existen
algunos modelos de semivariograma en los que no existe una distancia finita para la cual dos
observaciones sean independientes; por ello se llama rango efectivo a la distancia para la cual el
semivariograma alcanza el 95% de la meseta. Cuanto ms pequeo sea el rango, ms cerca se
est del modelo de independencia espacial. El rango no siempre aparece de manera explcita en
la frmula del semivariograma.
2. Modelo lineal.
Define un modelo no acotado en funcin de dos constantes positivas. La funcin tiende
a infinito para distancias grandes lo que hace que este modelo no se corresponda con un
proceso estacionario,
0 si |h| = 0
(|h|) =
c0 + c1 h si |h| > 0.
3. Modelo esfrico.
Definido por un rango actual a, una varianza a priori (sill) c1 y un efecto nugget c0 ,
3
|h|
c0 + c1 1.5 a 0.5 |h| a si |h| a
(|h|) =
c0 + c1 si |h| a.
4. Modelo Exponencial.
Definido por un rango efectivo a (rango integral a/3), una varianza a priori (sill) c1 y un
efecto nugget c0 ,
3 |h|
(|h|) = c0 + c1 1 exp .
a
5. Modelo Gaussiano.
Definido por un rango efectivo a, una varianza a priori c1 y un efecto nugget c0 ,
" !#
(3 |h|)2
(|h|) = c0 + c1 1 exp .
a2
8. Familia Matrn.
Esta clase se define mejor en trminos de la funcin de covarianza definida por
1 2 2 |h| 2 2 2 |h|
C0 (|h|) = 2 1 k2 .
2 (2 ) 1 1
Todos los modelos anteriores (excepto el lineal y el potencial) son acotados, lo que significa
que el sill (umbral) se alcanza realmente en el lmite a una cierta distancia marcada por el rango.
Adems se tienen las siguientes observaciones:
Para el modelo de efecto nugget, el sill es alcanzado tan pronto la distancia se hace posi-
tiva.
El comportamiento cerca del origen del modelo potencial depende de los valores del parmetro
, siendo lineal para = 1 y parablico para valores de cercanos a 2.
1.4 Anisotropa
Hay varias formas de trabajar con procesos anistropicos considerando stos como generaliza-
ciones ms o menos directas de procesos isotrpicos.
1.5 C ONDICIN DE POSITIVIDAD 13
p
X
(h) = 0 (Ai h) ,
i=1
() es el semivariograma
P de un proceso estacionario de segundo orden, entonces si a1 , . . . , an
son constantes con ai = 0, tenemos
XX
ai aj (ui uj ) 0
i j
El estimador ms simple viene dado por el mtodo de los momentos, el cual, suponiendo que
los puntos de muestreo u1 , . . . , uN estn definidos en un retculo regular, viene definido por
1 X
2(h) = {Z(ui ) Z(uj )}2 .
#N (h)
(ui ,uj )N (h)
N (h) denota todos aquellos pares (ui , uj ) para los que ui uj = h y #N (h) denota el cardinal
de N (h). En el caso, por otra parte ms comn, de que los puntos de muestreo no estn en un
retculo regular, se aplica la frmula anterior pero con la nueva definicin de N (h),
1 X
2ZY (h) = (Z(ui ) Z(uj )) (Y (ui ) Y (uj )).
#N (h)
(ui ,uj )N (h)
Una posible objecin al mtodo de los momentos es que no es robusto frente a valores extremos
de Z.
Otra objecin surge del hecho del sesgo de la distribucin: si suponemos que el proceso es
Gaussiano, para valores concretos de u y h, la distribucin de {Z (u + h) Z(u)}2 es de la
forma 2(h)21 , y la distribucin de 21 est sesgada. Sin embargo, si X 21 entonces X 1/4
tiene una distribucin casi simtrica y por tanto las medias muestrales de |Z(u1 ) Z(u2 )|1/2 se
comportarn mejor que las de {Z(u1 ) Z(u2 )}2 .
1.7 FACTORES A TENER EN CUENTA PARA LA MODELIZACIN 15
La funcin de covarianza muestral puede ser tambin obtenida mediante el mtodo de los
momentos se la siguiente forma:
1 X
C(h) = Z(ui )Z(uj ) m2
#N (h)
(ui ,uj )N (h)
P P
donde m = #N1(h) i Z(ui ). Si adems definimos 2 = 1
#N (h) i Z(ui )
2 m2 , podemos
estandarizar la covarianza para definir el correlograma
C(h)
(h) =
2
Por otra parte, el madograma es una medida similar al variograma del mtodo de los momen-
tos en el que el cuadrado de las diferencias entre Z(ui ) y Z(uj ) es sustituido por la diferencia
absoluta, dando lugar a la siguiente expresin
1 X
2M (h) = |Z(ui ) Z(uj )|
#N (h)
(ui ,uj )N (h)
Algunas de las anteriores medidas de variacin espacial pueden ser usadas cualitativamente
para conseguir estructuras de continuidad espacial. Ms de un tipo de medidas puede ser
obtenida al mismo tiempo. En general, las caractersticas observadas a travs del eje de las
abcisas (distancias) son comunes para todas las medidas de variabilidad / continuidad. Sin em-
bargo los valores del eje de ordenadas que definen el variograma son especficos del tipo de
variograma elegido.
Se tienen dos reglas prcticas que deberan ser tenidas en cuenta al estimar un variograma:
1. el variograma emprico slo debe ser considerado para distancias para las que el nmero
de pares es superior a 30, (ver [? ]);
2. la distancia de fiabilidad para un variograma experimental es h < D/2 siendo D la dis-
tancia mxima que presentan las localizaciones muestreadas.
Mnimos cuadrados ordinarios (MCO), en los que se toma como aquel valor que mini-
miza { ()} { ()} . (donde indica la transposicin de matrices).
1.8 M TODOS DE ESTIMACIN DE LOS PARMETROS DEL VARIOGRAMA 17
Mnimos cuadrados ponderados (MCP), en los que se toma como aquel valor que mini-
miza { ()} W ()1 { ()}. En este caso W () es una matriz diagonal cuyos
elementos de la diagonal son las varianzas de , aunque no covarianzas como si lo hace
el MCG. Por tanto MCP admite varianzas de , aunque no covarianzas aunque si lo hace
el MCG.
Mnimos cuadrados generalizadoss (MCG), en los que se toma como aquel valor que
minimiza { ()} V ()1 { ()} . Aqu V () denota la matriz de covarianzas
de , la cual depende de .
En general, los tres estimadores MCO, MCP y MCG, aparecen en orden creciente de efi-
ciencia pero decreciente en simplicidad. Notar que MCO es fcilmente implementable por al-
gn procedimiento de mnimos cuadrados no lineales, mientras que MCP y MCG requieren la
especificacin de las matrices W () y V ().
n n 1 1
l(, , ) = log(2) + log() + logdet(V ()) + (Z X) V ()1 (Z X) .
2 2 2 2
Aunque este mtodo es computacionalmente factible, su mayor dificultad frente a por ejem-
plo el mtodo de MCP lo hace menos usado.
Supngase {Y1 , . . . , Yn } son variables aleatorias independientes y normales N (, 2 ) con
parmetros desconocidos y 2 . Los estimadores mximo verosmiles de y 2 son = Y =
1 P 2 1 P
2
n i Yi y = n i Yi Y . Pero este estimador resulta sesgado y se suele usar el esti-
2 1 P
2
mador insesgado de , n1 i Yi Y . Supngase ahora que en lugar de trabajar con el
vector Y1 , . . . , Yn lo hacemos con la densidad conjunta de Y1 Y , . . . , Yn Y , cuya distribu-
1 P
2
cin no depende de . Ahora el estimador verosmil de 2 es directamente n1 i Yi Y .
Esta idea puede ser extendida al modelo general, Z N (X, ). Si se define W = A Z
donde define la ponderacin, peso asignado a los datos que intervienen en el sumatorio,
m(u0 ) y m(u ) son los correspondientes valores esperados de Z(u0 ) y Z(u ) respectivamente
1.9 K RIGING : PREDICCIN E INTERPOLACIN 19
y n(u0 ) + 1 elementos: n(u0 ) atributos. A partir de ahora y sin prdida de generalidad para que
la notacin resulte ms sencilla se usar n en lugar de n(u0 ).Obsrvese que slo actan aquellas
localizaciones u vecinas a la localizacin de prediccin de u0 .
Cualquier base de kriging tiene como objetivo la minimizacin de la varianza del error
E2 (u), la cual en su formato general viene dado por
E2 (u) = Var [Z (u) Z(u)]
donde el superndice * indica el valor estimado para esa localizacin.
Adems E2 (u) = Var [Z (u) Z(u)] se minimiza bajo la restriccin de insesgadez, es de-
cir, E [Z (u) Z(u)] = 0. Normalmente, la variable aleatoria que define el atributo en estudio
se descompone en una componente residual R(u) y otra determinista que define la tendencia
m(u),
Z(u) = R(u) + m(u)
La componente residual se modeliza como una variable aleatoria estacionaria de media cero y
covarianza Cr (h), siendo
E {R(u)} = 0
Cov {R(u), R(u + h)} = E {R(u) R(u + h)} = CR (h)
De esta forma, el valor esperado de la variable aleatoria Z en una cierta localizacin u viene
dado por el valor de la componente tendencia en esa localizacin E {Z(u)} = m(u).
De acuerdo con el modelo considerado para la tendencia, podemos considerar las siguientes
variantes kriging lineales: simple (SK), ordinario (OK), con modelo de tendencia o universal
(UT), en bloques y factorial. En cuanto a los no lineales se pueden mencionar: lognormal,
multi-Gaussiano, de rango, indicatriz y disyuntivo.
En la Tabla 1.1 se resumen los principales tipos de kriging lineal que detallaremos a contin-
uacin.
Kriging Media Anlisis estructural Propiedades
para Z(u) m(u) Y (u)
Simple Constante conocida Covariograma Son ptimos si hay normalidad
Ordinario Constante desconocida Semivariograma multivariada.
Universal No constante y desconocida Semivariograma Independiente de la distribucin
son los mejores predictores
linealmente insesgados.
Antes de comenzar el estudio de cada uno de ellos, se presentan dos particularidades impor-
tantes:
1. La condicin de estacionariedad, necesaria para el anlisis estructural, no es ahora impre-
scindible para la prediccin kriging. Por esta razn, en muchas de las expresiones que
se utilizarn se podemos encontrar (u u ) o C(u u ) en vez de (h) o C(h)
utilizadas anteriormente.
20 C APTULO 1. G EOSTADSTICA U NIVARIANTE
Por tanto en este caso no existen restricciones para las ponderaciones tendientes al cumplimiento
de la condicin de insesgadez. La estimacin de los pesos del mtodo kriging simple se obtiene
de tal forma que se minimice V ( (u0 ) (u0 )).
usando:
1.9 K RIGING : PREDICCIN E INTERPOLACIN 21
1. E [(u0 )] = 0
2. E ( (u ) (u )) = Cov ( (u ) , (u )) = C
3. E ( (u0 ))2 = 2
n X
X n n
X
V ( (u0 ) (u0 )) = E ((u )(u )) 2 C + 2
=1 =1 =1
X n
= C = C0
=1
El estimador Kriging Ordinario puede predecirse como una combinacin lineal de las n
variables aleatorias as:
Z (u0 ) = 1 Z(u1 ) + 2 Z(u2 ) + . . . + n Z(un )
Xn
= Z(u )
=1
en donde los representan los pesos o ponderaciones de los valores originales. Dichos pesos
se calculan en funcin de la distancia entre los puntos muestreados y el punto donde se va a hacer
la correspondiente prediccin. La suma de los pesos debe ser igual a uno para que la esperanza
del predictor sea igual a la esperanza de la variable. Esto ltimo se conoce como el requisito de
insesgadez.
Estadsticamente la propiedad de insesgadez se expresa a travs de E (Z (u0 )) = E (Z(u0 )).
Asumiendo que el proceso es estacionario de media m (desconocida) y utilizando las propiedades
del
Pnvalor esperado, se demuestra que la suma de las ponderaciones debe ser igual a uno, es decir,
= 1. Se dice que Z (u ) es el mejor predictor, lineal en este caso, porque los pesos
=1 0
se obtienen de tal manera que minimicen la varianza del error de prediccin, es decir que min-
imicen la expresion V (Z (u0 ) Z(u0 )).
Esta ltima es la caracterstica distintiva de los mtodos kriging, ya que existen otros mtodos de
interpolacin como el de distancias inversas o el poligonal, que no garantizan varianza mnima
deP prediccin. La estimacin de los pesos se obtiene minimizando V (Z (u0 ) Z(u0 )) sujeto
a n=1 = 1.
Se tiene que V (Z (u0 ) Z(u0 )) = V (Z (u0 )) 2Cov [Z (u0 ), Z(u0 )] + V [Z(u0 )].
Desagregando las componentes de la ecuacion anterior se obtiene lo siguiente:
" n #
X
V [Z (u0 )] = V Z(u0 )
=1
n X
X n
= Cov [Z(u ), Z(u )]
=1 =1
P
Luego se debe minimizar la funcin anterior sujeta a la restriccin n=1 = 1. Este problema
de minimizacin con restricciones se resuelve mediante el mtodo de los Multiplicadores de
Lagrange.
n X n n n
!
X X X
k2 = C 2 C0 + 2 1
=1
por lo cual los pesos que minimizan el error de prediccin se determinan mediante la funcin de
covariograma a travs de
= (C )1 C0 .
Encontrando los pesos se calcula la prediccion en el punto u0 . De forma anloga se procede para
cada punto donde se quiera hacer prediccin. La varianza de prediccin del Kriging Ordinario
ser por tanto:
n
X
2
OK = 2 C0
=1
Existen diferentes mtodos para evaluar la bondad de ajuste del modelo de semivariograma
elegido con respecto a los datos muestrales y por ende de las predicciones hechas con kriging.
La tcnica ms empleada es la de Validacin Cruzada (cross-validation, CV) sirve para com-
parar valores estimados por los modelos con los reales. La idea consiste en un proceso iterativo
en el que cada vez se excluye un dato de la muestra y se estima con el resto de los datos el
modelo de semivariograma escogido, predecir va kriging el valor de la variable en estudio en la
ubicacin del punto que se excluy. Cada uno de estos valores se compara, por ejemplo medi-
ante regresin lineal, con el valor real. Buenos coeficientes de correlacin / determinacin sern
indicativos de una correcta modelizacin. Si el modelo de semivarianza elegido describe bien la
estructura de autocorrelacin espacial, entonces la diferencia entre el valor observado y el valor
predicho debe ser pequeo. Este procedimiento se realiza de forma secuencial con cada uno
de los puntos muestrales y as se obtiene un conjunto de n errores de prediccin. Lo usual es
calcular medidas que involucren a estos errores de prediccin para diferentes modelos de semi-
varianza y seleccionar aqul que optimice algn criterio como por ejemplo el del mnimo error
cuadrtico medio (MECM). Una forma descriptiva de hacer la validacin cruzada es mediante
un grfico de dispersin de los valores observados contra los valores predichos. En la medida
en que la nube de puntos se ajuste ms a una lnea recta que pase por el origen, mejor sera el
modelo de semivariograma utilizado para realizar el kriging.
Sin embargo, la utilizacin de la validacin cruzada para seleccionar modelos de semivariogra-
mas, tiene algunas restricciones:
1. Un remuestreo del modelo de semivariograma no influye en los pesos y krigings. As, los
valores de sill total no pueden ser obtenidos por validacin cruzada de valores restimados.
2. El sill relativo y el comportamiento del semivariograma en el origen nugget, no pueden
ser usados simultneamente con la validacin cruzada.
1.9 K RIGING : PREDICCIN E INTERPOLACIN 25
Intervalos de Confianza
Asumiendo que los errores de prediccin siguen una distribucin normal estndar y que son
hindependientes, un intervalo de confianza
i del 100(1 )%, 0 < < 1, para Z(u) es:
z (u) z1 2 k , z (u) + z1 2 k , con z el valor calculado de la prediccin y z1 2 el per-
Este tipo de kriging (UK) considera que la media local no es conocida y vara suavemente en
cada vecindad local W (u). La componente de tendencia se modeliza como una combinacin lin-
eal de funciones fl (u) de las coordenadas. Para tratar este tipo de variables es frecuente descom-
poner la variable Z(u) como la suma de la tendencia, tratada como una funcin determinstica,
ms una componente estocstica estacionaria de media cero. Asmase que Z(u) = m(u)+(u),
con E ((u)) = 0, V ((u)) = P 2 y por consiguiente E(Z(u)) = m(u). La tendencia puede
p
expresarse mediante m(u) = l=1 al fl (u) donde las funciones fl (u) son conocidas y p es
el nmero de trminos empleados para ajustar m(u). El predictor Kriging Universal se define
como:
n
X
Z (u0 ) = Z(u )
=1
26 C APTULO 1. G EOSTADSTICA U NIVARIANTE
E (Z (u0 )) = m (u0 )
n
!
X
E Z(u ) = m (u0 )
=1
n
!
X
m(u ) = m (u0 )
=1
n p
! p
X X X
al fl (u ) = al fl (u0 )
=1 l=1 l=1
p n
! p
X X X
al fl (u ) = al fl (u0 )
l=1 =1 l=1
Xn Xp
fl (u ) = fl (u0 )
=1 l=1
La obtencin de los pesos en el Kriging Universal, anlogo a los otros mtodos kriging, se hace
de tal forma que la varianza del error de prediccin sea mnima.
usando:
1. C = Cov((u ), (u ))
2. 2 = E ((u0 ))2
se tiene
n X
X n n
X
V (Z (u0 ) Z(u0 )) = C 2 C0 + 2
=1 =1 =1
en trminos matriciales
11 12 ... 1n f11 ... f1n
21 1 10
22 ... 2n f21 ... f2n
.. 2 20
.. .. .. .. .. ..
. . . . . . . ... ...
n1 n2 . . . nn f1n . . . fpn n = n0
f11 f12 . . . f1n 0 ... 0 1 f10
.. .. .. .. .. .. .. ... ...
. . . . . . .
n fp0
fp1 fp2 . . . fpn 0 ... 0
donde fl = fl (u ) es la l-sima funcin en el punto j-simo. La varianza de prediccin del
Kriging Universal esta dada por:
n
X p
X
U2 K = 0 + l fl (u0 )
=1 l=1
1.9.4 Cokriging
El trmino cokriging se utiliza para los mtodos de regresin en los que intervienen varios atrib-
utos. Supongamos, pues, que disponemos de dos variables regionalizadas Z, Y definidas en las
mismas localizaciones. La ecuacin para la estimacin del valor de la variable principal Z en la
localizacin u0 viene dada por
n1
X n2
X
Z (u0 ) = 1 (u0 )Z(u1 ) + 2 (u0 )Y (u2 )
1 =1 2 =1
Este tipo de kriging requiere un modelo para la matriz de funciones de covarianza, incluida la
covarianza de Z, CZ (h), la covarianza de Y , CY (h), la covarianza cruzada de Z Y , CZY (h) =
Cov {Z(u), Y (u + h)}, y la covarianza cruzada de Y Z, CY Z (h).
Captulo 2
Geostadstica Multivariante
Hasta ahora se ha estudiado como estimar una propiedad utilizando los valores conocidos de
dicha propiedad obtenidos en puntos vecinos o cercanos o bien como hacer uso de una funcin
de tendencia para guiar la estimacin de la propiedad.
Se consideran entonces procesos espaciales multivariantes:
Z(U ) = (Z1 (u), Z2 (u), . . . , Zp (u)) /u D , D Rd De forma que:
Sin prdida de generalidad, suele suponerse que la variable de inters (variable a predecir) es Z1
mientras que las restantes se denominan variables secundarias.
Existe E [Zi(u)] = mi , i = 1, 2, . . . , p, u D.
29
30 C APTULO 2. G EOSTADSTICA M ULTIVARIANTE
Existe
1
2 Cov ((Zi (u) Zi (u + h)) , (Zj (u) Zj (u + h))) = i,j (h);
i, j = 1, 2, . . . , p, u D y h Rd .
3. En el caso de variables estacionarias de segundo orden, existe una relacin entre semivar-
iograma y covariograma cruzados:
1
i,j (h) = Ci,j (0) [Ci,j (h) + Ci,j (h)]
2
Es importante sealar que sta no es la nica definicin de semivarigrama cruzado que puede
encontrarse en la bibliografa ya que existen diversas formas de generalizar los semivariogra-
mas unidimensionales al caso multidimensional. As, por ejemplo, una segunda definicin muy
extendida es:
1
Var (Zi (u) Zj (u + h)) = i,j (h); i, j = 1, 2, . . . , p; u D y h Rd .
2
A esta segunda expresin se le suele denominar pseudosemivariograma cruzado.
3. En el caso de variables estacionarias de segundo orden, no existe una relacin entre pseu-
dosemivariograma y covariograma cruzados.
2.2 C OKRIGING 31
Al igual que en el caso de geoestadstica univariada, lo fundamental es contar con una her-
ramienta que mida la correlacin espacial de las variables involucradas y su interrelacin.
La correlacin espacial de cada una de las variables involucradas se obtiene como antes a
travs de la funcin de covarianza o del variograma.
La correlacin espacial conjunta o la interrelacin se obtiene a travs de la funcin de covar-
ianza cruzada que se estudiar a continuacin
2.2 Cokriging
Planteamiento bsico de la estimacin por Cokriging:
Considerar la estimacin de Z1 (u) como una combinacin lineal de las observaciones disponibles
de Z1 ms combinaciones lineales de las observaciones de las variables relacionadas.
Ejemplo:
N
X M
X
Zcok (u) = (u)Z(u ) + (u)Y (x )
=1 =1
N
X N1
X Nk
X
Zcok (u) = (u)Z(u ) + 1 (u)Y1 (x1 ) + . . . + k (u)Yk (xk )
=1 1 =1 k =1
El primer sumando es una combinacin lineal de la variable principal y los siguientes de las
variables secundarias.
N Nj
K X
X X
Zcok (u) = (u)Z(u ) + j (u)Yj (xj )
=1 j=1 j =1
E(Z(u)) = m conocida
E(Yj (u)) = mj conocida j.
E(Z(u ) m) = 0
E(Y1 (x )) m1 = 0
Con lo cual,
E(Zcok (u)) = m = E(Z(u))
Para calcular explcitamente la expresin de la varianza hay que proceder con cautela debido
a que aparecen nuevos trminos a considerar.
Var [Z(u) Zcok (u)] = Var [Z(u)] + Var [Zcok (u)] 2Cov (Z(u), Zcok (u))
T1 = Var [Z(u)] = 2
T2 = Var [Zcok (u)]
X X
= Var i (Z(ui m)) + Var j (Y (xj mj ))
X X
+ 2Cov i (Z(ui m)), j (Y (xj mj ))
XX XX
= i j CZ (ui uj ) + i j CY (xi xj )
XX
+ 2 i j CZY (ui xj )
T3 = 2Cov (Z(u), Zcok (u))
X X
= 2 i CZ (u ui ) + 2 j CZY (u xj )
(u)] N
X N
X
Var [Z(u) Zcok
= 2 j CZ (ui uj ) + 2 j CZY (ui xj )
i
j=1 j=1
2CZ (u ui ), i = 1, 2, . . ., N
(u)] N
X N
X
Var [Z(u) Zcok
= 2 j CY (xi xj ) + 2 j CZY (ui xj )
i
j=1 j=1
2CZY (u xi ), i = 1, 2, . . . , N1
CY Z (u1 x1 ) CY Z (u1 x2 ) . . . CY Z (u1 xN )
CY Z (u2 x1 ) CY Z (u2 x2 )
. . . CY Z (u2 xN )
.. .. .
. . . . . ..
CZY CY Z (uN x1 ) CY Z (uN x2 ) . . . CY Z (uN xN )
=
CY CY (0) CY (x1 x2 ) . . . CY (x1 xN )
CZ (x2 x1 ) CY (0) . . . CY (x2 xN )
.. .. ..
. . ... .
CY (xN x1 ) CY (xN x2 ) . . . CY (0)
1 CZ (u u1 )
2 CZ (u u2 )
.. ..
. .
N C Y U CZ (u uN )
=
1
CY U = CY (u x1 )
2 CY (u x2 )
.. ..
. .
N CY (u xN )
Con lo cual,
K Nj
X X X
E (Zcok (u)) = m + mj j
j=1 j =1
P PN
Y se obtienen las condiciones = 1, jj=1 j = 0, j = 1, 2, . . . , K.
Ahora se procede nuevamente como en el kriging ordinario pero con K + 1 parmetros
de Lagrange. Cuando se tiene tan solo una variable secundaria, el sistema de ecuaciones del
cokriging ordinario es,
CZ CZY 1 0 CZU
CY Z CY 0 1
= CY U
1 0 0 0 1 1
0 1 0 0 2 0
Obsevaciones:
2.3 C OKRIGING UNIVERSAL 35
2. Debe existir una correlacin lineal entre las variable principal y las variables secundarias.
3. Las variables secundarias deben poseer un nmero mucho mayor de observaciones que la
variable principal.
Cuando las variables estn intrnsicamente relacionadas, es decir, cuando ocurre que los
modelos de variograma o covarianza de todas las variables son proporcionales a un mismo
modelo de variograma o covarianza, entonces el kriging y el cokriging con datos totalmente
coincidentes son iguales.
El predictor cokriging se define como el mejor predictor lineal insesgado (BLUP) calculado con
todas las variables observadas:
p X
X ni
Z1 (u0 ) = i,j Zi (ui,j ).
i=1 j
36 C APTULO 2. G EOSTADSTICA M ULTIVARIANTE
En muchas reas se ha empezado a trabajar con grandes bases de datos, que cada vez con ms
frecuencia, corresponden a observaciones de una variable aleatoria tomadas a lo largo de un
intervalo continuo (o en discretizaciones cada vez ms extensas de este intervalo continuo).
En campos como la espectrometra, el resultado de la medicin es una curva que representa
a la muestra concreta que al menos se ha evaluado en una centena de puntos. Este tipo de datos,
que llamaremos datos funcionales, surgen de manera natural en muchas disciplinas, y como este
ejemplo podramos citar muchos otros en diversos campos como la economa, ingeniera, medio
ambiente, . . .. Ante estos nuevos retos surge como respuesta la estadstica de datos funcionales
que originalmente identificaba dato funcional con funcin en un intervalo continuo. Bsica-
mente, los problemas a los que se debe enfrentar la estadstica con datos funcionales responde
a las mismas necesidades que la estadstica clsica. Estos se podrian categorizar de la siguiente
manera:
2. Explicar y modelar la relacin entre una variable dependiente y una independiente (mod-
elos de regresin).
En ambos casos todas las tcnicas includas estn restringidas al espacio de funciones L2 ,
es un espacio con caractersticas especficas que lo hacen especialmente tratable. Una variable
aleatoria X se dice que es una variable funcional si toma valores en un espacio funcional E
(Espacio normado o seminormado completo), como se puede ver en [8].
Un conjunto de datos funcionales {Xn . . . , Xn } es la observacin de n variables funcionales
X1 . . . , Xn idnticamente distribuidas.
La primera dificultad que siempre tendremos al analizar datos funcionales, es encontrar una
representacin adecuada para los datos.
37
38 C APTULO 3. A NLISIS DE DATOS FUNCIONALES
Estas defniciones se pueden aplicar a muchos tipos de espacios. En particular, Rp con las
mtricas usuales es un espacio funcional y por tanto puede deducirse que toda tcnica que se
desarrolle para datos funcionales puede ser aplicada con ciertas garantas en el entorno mul-
tivariante. El espacio ms comunmente usado cuando se habla de datos funcionales es el es-
pacio L2 [S], esto es, las funciones de cuadrado integrable en el intervalo S = [a, b] R.
p
Desde
un punto de vista podemos tener datos funcionales en la familia: L [S, ] =
R msp general
f : S R tal que |f (t)| d , donde (S, ) es un espacio de medida y 1 < p < . Estos
espacios son semi-normados salvo el caso p = 2 que es el nico de esta familia que es un espacio
de Hilbert separable. Cuando se desarrolla una nueva tcnica para datos funcionales la primera
preocupacin es siempre determinar en que espacio funcional vamos a trabajar. Esto determi-
nar decisivamente el conjunto de herramientas que podremos usar. Una preocupacin similar
la tendremos al aplicar una tcnica de datos funcionales a un conjunto de datos. La mtrica del
espacio funcional que se elija para encuadrar estos datos debe ser coherente con la interpretacin
fsica del fenmeno que describan.
En general, la representacin de un dato funcional en una base ortonormal proporcionar
ventajas tanto desde el punto de vista terico como prctico sirviendo de puente entre la in-
evitable discretizacin del dato funcional y su verdadera forma funcional.
Una base es un conjunto de funciones conocidas e independientes {k }kN tales que cualquier
funcin puede ser aproximada, tan bien como se quiera, mediante una combinacin lineal de K
de ellas con K suficientemente
P grande. De esta forma, la observacin funcional puede aproxi-
marse como x(t) K c
k=1 k k (t).
Si los elementos de la base son fcilmente diferenciables hasta orden q tenemos x(q) (t)
PK (q)
k=1 ck k (t).
Bsicamente, la idea clave cuando se pueden usar bases ortonormales es representar cada
dato funcional en la base usando aquellas coordenadas que son ms significativas. Debido a la
alta dimensin de los datos funcionales, se elige en general un nmero K para representar los
datos en el subespacio, convirtiendo el problema de dimensin infinita en un problema multidi-
mensional. La eleccin del parmetro K y de la base ms adecuada para los datos observados
se antoja crucial y, en principio, no hay ninguna regla que permita hacer una seleccin ptima
de forma universal. El parmetro K es, en cierto modo, un parmetro de suavizacin de los
datos funcionales. Si K es bajo tendremos un modelo muy manejable pero posiblemente habre-
mos perdido informacin relevante. Si K es alto representaremos muy bien los datos pero el
problema de la dimensin cobra importancia. Si atendemos a la eleccin de la base, para datos
peridicos se suele emplear la base de Fourier y para datos no peridicos la base B-spline o la
Wavelet. Una base muy popular est basada en la expansin de Karhunen-Love que no es ms
que la extensin del anlisis de componentes principales multivariante a procesos estocsticos
y por aadidura a datos funcionales. Calculando a partir del operador momento de segundo
orden muestral las correspondientes autofunciones y autovalores es posible construir especfi-
camente una base ortonormal adaptada para cada conjunto de datos. Esta tcnica se denomina
Componentes Principales Funcionales (FPCA) y ha dado lugar a muchas tcnicas interesantes
para datos funcionales. Sin embargo, esta tcnica puede ser muy sensible a la aparicin de datos
atpicos y la representacin del dato funcional puede no ser relevante para el objetivo del estu-
dio como podra ser la relacin con otra variable funcional o no. La decisin sobre qu base
3.1 P RELIMINARES 39
elegir debe tomarse en funcin del objetivo del estudio y los datos y aprovechando las ventajas
e inconvenientes que presenta cada tipo de base. Si se trunca cualquiera de estas bases en un
nmero determinado de elementos obtendremos una semimtrica que tambin podremos usar
para manejar los datos funcionales. En este caso, cualquier mtrica o semi-mtrica en el espa-
cio no es ms que una forma de determinar qu elementos del espacio estn cercanos y cules
lejanos.
La estadstica con datos funcionales tiene frontera con otros campos relevantes de la estads-
tica como el anlisis multivariante, el anlisis de datos longitudinales o las series temporales.
Como se coment anteriormente, una tcnica de datos funcionales puede aplicarse con ciertas
garantas a datos multivariantes. Al revs, en general, no es cierto. Para la mayora de las tcni-
cas multivariantes que basan mucho de su trabajo en propiedades del lgebra matricial puede ser
un problema casi insalvable tratar datos funcionales de alta frecuencia con seguramente, muy
fuerte colinealidad. Segn aumenta el grado de resolucin con el que somos capaces de ver una
curva, ms difcil resulta para las tcnicas multivariantes obtener un resultado convirtiendo el
aumento de resolucin en una dificultad ms que en una oportunidad de obtener mejor informa-
cin. Algo similar podra decirse del anlisis de datos longitudinales. En este campo se obtienen
medidas repetidas a lo largo del tiempo para el mismo sujeto, pero en general, ste es un nmero
pequeo y las tcnicas multivariantes pueden adaptarse para trabajar con ellas. La principal di-
ficultad para tratar datos longitudinales como datos funcionales suele ser precisamente la baja
calidad de representacin de las curvas. La relacin con el campo de las series temporales es
totalmente diferente. As, ejemplos clsicos de datos funcionales se han construido a base de
cortar una serie temporal en ciclos homogneos. Por ejemplo, en [25] se usan los datos de un
ndice burstil estadounidense troceados por aos (como unidad funcional) para deducir a partir
de la forma de cada curva anual la tipologa de los distintos aos (de expansin, de crisis, ...).
Considerados los datos como una serie temporal, el objetivo es predecir alguno de los periodos
del prximo ao. Como conjunto de datos funcionales, el objetivo es resumir la informacin
y el resultado ser siempre un dato funcional, esto es, un ciclo anual completo. Por tanto, la
relacin entre estos dos campos es peculiar. Muchas veces trabajan sobre la misma informacin
pero desde pticas completamente diferentes.
3.1 Preliminares
Se presentan unas definiciones preliminares sobre medidas clsicas y distancias entre vectores
en Rp en contexto funcional. Se asume que X(t), Y (t), Z(t), t T son funciones definidas en
algn espacio de funciones.
Producto interior Z
hX(t), Y (t)i = X(t)Y (t)dt.
T
Propiedades:
3. Bilinealidad: haX(t) + bY (t), Z(t)i = a hX(t), Z(t)i + b hY (t), Z(t)i, para cua-
lesquiera nmeros reales a y b.
Norma
q
kX(t)k = kX(t)k2 , donde
Z
kX(t)k2 = hX(t), X(t)i = X(t)X(t)dt.
T
Propiedades:
1. kX(t)k 0.
2. kaX(t)k = |a| kX(t)k, para cualquier nmero real a.
3. kX(t) + Y (t)k kX(t)k + kY (t)k.
p
4. |hX(t), Y (t)i| kX(t)k kY (t)k = |hX(t), X(t)i| |hY (t), Y (t)i|.
|hX(t),Y (t)i|
5. 1 (kX(t)k(Y (t))) 1
1 Pn
Varianza: Var(X) = n1 Xi (t) X(t) Xi (t) X(t) .
i=1
1 Pn
Covarianza: Cov(X(t1 ), X(t1 )) = n1 i=1 (Xi (t1 ) x(t1 )) (Xi (t2 ) x(t2 )).
Cov(X(t1 ),X(t1 ))
Correlacin: Corr(X(t1 ), X(t1 )) = .
Var(X(t1 ))Var(X(t2 ))
1 Pn
Covarianza cruzada: Cov(X(t1 ), Y (t2 )) = n1 i=1 Xi (t1 ) X(t1 ) Yi (t2 ) Y (t2 ) .
Cov(X(t1 ),Y (t2 ))
Correlacin cruzada: Corr(X(t1 ), Y (t2 )) = .
Var(X(t1 ))Var(Y (t2 ))
Repetir el proceso anterior, exigiendo adems en el paso m que m (s)k (s), k < m.
K
X
Xi (t) = fik k (t)
k=1
R
donde fik es el valor de la componente principal Xi k .
Las caractersticas ms notables de las componentes principales son las siguientes:
42 C APTULO 3. A NLISIS DE DATOS FUNCIONALES
Pueden servir para detectar datos atpicos (aunque tambin pueden esconderlos).
1
0 (t) = ,
T
sin(rt)
2r1 (t) = q ,y
T
2
cos(rt)
2r (t) = q .
T
2
m+L1
X
S(t) = ck Bk (t, )
k=1
j
j,k (t) = 2 2 2j t k ,
j
j,k (t) = 2 2 2j t k ,
Z
j,k (t)j,k (t)dt = k,k ,
Z
j,k (t)j ,k (t)dt = 0,
Z
j,k (t)j ,k (t)dt = j,j k,k .
Elegida la base la aproximacin ortogonal wavelet de una funcin f (t) viene dada por:
44 C APTULO 3. A NLISIS DE DATOS FUNCIONALES
X X
f (t) SJ,k J,k (t) + dJ,k J,k (t)
k k
X X
+ dJ1,k J1,k (t) + + d1,k 1,k (t)
k k
Llamando:
X
SJ (t) = SJ,k J,k (t)
k
X
DJ (t) = dJ,k J,k (t)
k
X
DJ1 (t) = dJ1,k J1,k (t)
k
X
D1 (t) = d1,k 1,k (t)
k
A la funcin Sj (t) se la conoce como seal suave y a las funciones Dj (t) como las funciones
detalle. A esta descomposicin se la llama descomposicn multiresolucin.
N
X
x(tj ) = sj (ti )y(ti ) X = SY
i=1
ti tj
Suavizacin tipo Kernel (h): sj (ti ) = h1 K h .
h i
M SE [x(t)] = E {x(t) x(t)}2
= Sesgo2 (x(t)) + Var (x(t)) .
n (y x ) W (y x )
GCV() = .
n df () n df ()
La varianza de la prediccin viene dada por:
y = Sy Var(y) = Se S .
Kx
X
Xi (t) = cik k (t) X = C (t),
k
K
X
(t) = bk k (t) = b
k
donde resulta
1 1
b = Z Z Z y, y = CJ by = Zby = Z Z Z Z y = Sy
R
con J = (t) (t)dt.
Versin penalizada
1 1
b = Z Z + R0 Z y, y = CJ by = Zby = Z Z Z + R0 Z y = Sy
Z
Yi (t) = X(s)(s, t)ds + i (t),
T
46 C APTULO 3. A NLISIS DE DATOS FUNCIONALES
k X
X L
(s, t) = bkl k (s)l (t) = (s) B(t).
k=1 l=1
Observados los pares (X1 , Y1 ), , (Xn , Yn ) para estimar el modelo previo, se sugiere es-
timar minimizando:
n
Z X Z 2
LM SSE() = Yi (t) Xi (s)(s) B(t)ds dt,
i=1
Como antes debe restringirse el tamao de las bases para que la estimacin sea razonable.
Z
Y (t) = X(s) (s)B(t)ds + (t) = XB(t) + (t)
R
donde X es una matriz n K de la forma X = X(s) (s)ds.
Por tanto, de la ecuacin anterior, usando la representacin de (t)
Z Z
X XB (t) (t)dt = X Y (t) (t)dt,
Z
J (X X) vec(B) = vec X Y (t) (t)dt ,
R
donde J = (t) (t)dt. Si adems Y = C entonces:
1
vec(B) = J (X X) J X vec(C)
R
donde J = (t) (t)dt.
La penalizacin de estos estimadores puede hacerse tanto en s como en t. Sea
Z
R = [Ls s ] L (s) ds,
Z
S = [Lt t ] L (t) dt.
3.5 E LECCIN DE LA SUAVIZACIN 47
Z
X XBJ + s RBJ + t J BS = X Y (t) (t)dt
R
donde J = (t) (t)dt. Si como antes Y = C entonces:
1
vec(B) = J (X X) + s J R + t S J J X vec(C)
R
donde J = (t) (t)dt.
Captulo 4
En los tres captulos anteriores se ha presentado el marco terico necesario para poder llevar
a cabo la aplicacin a datos reales combinando ambas tcnicas. Se usar para cada tcnica el
conjunto de datos de la temperatura descrito en la intoduccin.
Antes de describir las tcnicas kriging usadas se presenta una estadstica descriptiva bsica
y funcional de los datos junto con unos conceptos bsicos de meteorologa que ayudarn a
interpretar los resultados.
En la parte superior de la Figura (4.1) se tiene la temperatura de Galicia a lo largo del ao
2009 y en la inferior lo mismo salvo que destacando la temperatura en la Facultad de Matemti-
cas (Santiago de Compostela) punto no muestreado.
La Figura (4.2) presenta la temperatura en Galicia a lo largo del ao 2009 distribuida a lo
largo de las cuatro estaciones del ao (primavera, verano, otoo e invierno) destacando siempre
la temperatura en el punto no muestreado.
En el Captulo 3 se ha tratado con detalle la metodologa del Anlisis de Datos Funcionales,
pero como en cualquier anlisis estadstico es bsico conocer la media, la varianza, el mnimo,
mximo, de los datos, que es lo que se presenta en la Figura (4.3). El clculo de estos
estadsticos queda desarrollado en dicho captulo.
49
50 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
10
C
10
0 100 200 300
das
T Santiago
10
das
circula por la superficie y se encuentra una cadena montaosa, asciende por ella y la enfra.
El vapor de agua que contiene el aire, se condensa y cae en forma de precipitaciones. En
las montaas hay temperaturas baijas y llueve ms.
Distancia al mar. El agua tiene una elevada capacidad calorfica (tarda mucho en calen-
tarse y luego tarda mucho tambin en enfriar). En el verano la Tierra se calienta con ms
intensidad (no transmite el calor, lo acumula en la superficie) con el mar. Por eso si el auga
del mar est ms fra, refresca el ambiente de las zonas costeras. En el invierno la Tierra
enfra ms que el mar, y el mar as modera el fro en las zonas costeras. (Por ejemplo: las
brisas costeras: terrestres y marinas, nocturnas y diurnas)
Otros conceptos que cabe citar son:
Isotrmicas. Son lneas que unen puntos de igual temperatura.
25
25
20
20
15
C
15
10
5
10
0
T Santiago T Santiago
5
80 100 120 140 160 180 200 220 240 260
das das
20
15
10
C
5
5
0
0
10 5
5
T Santiago T Santiago
das das
Todos estos factores determinan que en Galicia predomine el clima ocenico templado.
Este clima se caracteriza por unas temperaturas suaves en el verano y moderadamente fras en
el invierno, as como por unas precipitacions muy abundantes, sobre todo en el invierno. En
la Tabla (4.1) se recogen la temperaturas mnimas, medias y mximas en las 66 estaciones de
estudio.
Sin embargo, al estudiar con detalle las caractersticas climatolgicas de nuestra Comunidad,
podemos distinguir las siguintes variedades de clima: ocenico costero, ocenico continental,
ocenico mediterrneo y ocenico de montaa.
Media de la T Varianza de la T
12
20
10
15
8
C
C
10
6
4
5
2
0
0 100 200 300 0 100 200 300
da da
T mnima T mxima
15
25
10
20
C
C
5
15
0
10
5
10
da da
El ocenico continental se localiza en las zonas del interior. Se caracteriza por tener ve-
ranos clidos e inviernos fros con posibilidades de heladas. Las precipitacins alrededor
de los 1.000mm anuales, podiendo ser de nieve en el invierno.
El ocenico mediterrneo es propio de los valles del Mio y del Sil. Se caracteriza por
tener temperaturas elevadas en el verano e suaves en el invierno. Pluviosidad ms escasa,
sobre todo en el verano, oscilando entre los 600 y 1.000mm anuales.
El ocenico de montaa propio de las zonas montaosas como las sierras de los Ancares,
El Caurel, Queixa, . Se caracteriza por tener veranos frescos e inviernos menos fros
que en otras zonas montaosas ms alejadas del mar. Precipitaciones abundantes, de hasta
1.500mm anuales, que en el invierno pueden ser de nieve.
4.2 K RIGING ORDINARIO PARA FUNCIONES - VALORES DE DATOS ESPACIALES 53
Las bases ms usadas son las B-splines y las de Fourier. Las primeras se usan para clculos rpi-
dos y flexibles y las segundas para datos peridicos tales como los ciclos diarios de la temper-
atura como es el caso que nos ocupa. Una vez se tiene un dato expresado en la forma de la base de
Fourier se pueden expresar todos los datos como elementos de esa base. Si XM,I,1 , ..., Xm,I,66
son todas las observaciones de una de las variables, se puede obtener una representacin de la
base minimizando:
66
X
Q = [Xm,i,j xm,i (tj )]2
j=1
con respecto a los cm,i,k , (con K 66, ya que cada da se tienen 66 observaciones). El nmero
de bases K determina la suavidad resultante del ajuste, esto es, valores pequeos o grandes de
K proporccionan ms o menos suavidad en el ajuste. Hay que tener cuidado que no suceda se
que se est interpolando, ([23]).
54 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
Para cada estacin y tanto para la temperatura se ha representado el 1 de enero del 2009
como elemento de una base de Fourier de 21, 33 y 65 elementos. Se ha determinado que en
ambos casos la base de Fourier de 65 proporcciona un nivel de ajuste aceptable para los datos
diarios. Despus de esta conversin el objeto de estudio es recontruir no slo el 1 de enero del
2009 sino los 365 das del ao. En la Figura 4.4 puede observarse el proceso seguido.
N bases: 21
20
N bases: 33
N bases: 65
15
C
10
5
01/01/2009
Este enfoque est totalmente de acuerdo con las tendencias actuales del FDA, y, en partic-
ular, con la metodologa funcional de estimacin no paramtrica. La propuesta de Giraldo et
al. es hacer Kriging basado en prediccin espacial de curvas aleatorias formalmente coincide
con el Kriging funcional introducido por Goulard y Voltz, ([11]), pero la versin no paramtrica
desarrolla notables diferencias (por ejemplo, la representacin de los datos) y un problema adi-
cional cmo es el de la eleccin de los parmetros de suavizacin (la clave de los mtodos no
paramtricos). El predictor est basado en la filosofa bsica de los datos funcionales, esto es, las
curvas son entidades singulares, ms que una secuencia de observaciones individuales (Ramsay
y Silverman, 2005). El desarrollo de las frmulas en las tres tcnicas pueden consultarse con
detalle en los artculos de Giraldo et al.
E (s (t)) = m(t), t T, s D.
V (s (t)) = 2 (t), t T, s D.
Cov si (t), sj (t) = C(h, t) = Csi sj (t), si , sj D, t T, donde h = ksi sj k.
12 V si (t) sj (t) = (h; t) = si sj (t), si , sj D, t T, donde h = ksi sj k.
La funcin (h; t), es una funcin de h, llamada semivariograma de (t). Adems, se consid-
era la familia de predictores lineales para (t)s0 :
n
X
s0 (t) = i si (t), 1 , . . . , n R
i=1
El predictor, s0 (t), tiene la misma expresin que un kriging ordinario, pero considerando
curvas en vez de variables, es decir, la curva de prediccin es una combinacin lineal de las
curvas observadas. Se asume por tanto que cada curva medida es un dato completo. Este enfoque
trata la curva completa como una entidad singular. Los s en la ecuacin s0 (t) muestran la
influencia de las curvas que estn alrededor de la localizacin no muestreada donde se llevar a
cabo la prediccin. Las curvas de las ubicaciones ms cercanas al punto de prediccin tendrn
mayor influencia que las ms alejadas. Este es un primer paso y natural en el modelado de datos
espaciales funcionales.
Se considera la condicin insesgadez para encontrar el mejorPpredictor lineal insesgado
(BLU P ). De la condicin anterior, media constante, se exige que ni=1 i = 1. En geostads-
ticaclsica univariante se asume que las observaciones son Prealizaciones de una muestra aleato-
d n
ria Z(s) : s D, D R . El Kriging se define como i=1 i Z(si ) y el mejor predictor lin-
P
eal insesgado (BLU P ) se obtiene minimizando s20 = V (Z(si ) Z(si )) sujeto a ni=1 i = 1.
Por otro lado en geostadstica multivariante,
([28]), los datos, {Z(s1 ), . . . , Z(s
n )} se tienen de
observaciones de un proceso espacial Z(s) : s D, Z(s) Rm , D Rd . En este contexto
V (Z(s0 ) Z(s0 )) es una matriz y el BLU PPde m variables en una localizacin no muestreada
m
s0 se puede obtener minimizando s20 = i=1 V (Z(si ) Z(si )) sujeto a las restricciones
que garanticen la condicin de insesgadez, esto es, minimizar la traza de la matriz del error
cuadrtico medio sujeto a alguna restriccin dada por la condicin de insesgadez ([16]). Ex-
tendiendo el criterio al contexto funcional, es decir, remplazando el sumatorio por una integral,
los n parmetros en el Kriging de s0 considerados se obtienen como solucin del siguiente
problema de optimizacin:
Z
min V ((s0 )(t) (s0 )(t))dt,
1 ,...,n T
n
X
s.t. i = 1
i=1
56 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
P
Donde ni=1 i = 1 son las restricciones de insesgadez. De las condiciones de insesgadez y del
teorema de Fubini se obtiene:
Z Z
2
V (s0 (t) s0 (t)) = E (s0 (t) s0 (t)) dt
T T
n X
X n Z Z n
X Z
s20 = i j Cij (t)dt + 2
(t) 2 i Ci0 (t)dt.
i=1 j=1 T T i=1 T
Xn Z Z
j C2j (t)dt + = C20 (t)dt
j=1 T T
..
.
n
X Z Z
j Cnj (t)dt + = Cn0 (t)dt
j=1 T T
n
X
i = 1
i=j
Tambin se pueden obtener las estimaciones basadas en la traza del variograma. Asumiendo
estacionariedad, se tiene que
Entonces
Z Z Z
Cij (t)dt = 2 (t)dt si sj (t)dt
T T T
n X
X n Z n Z
X n
X
i j Cij (t)dt = Ci0 (t)dt i .
i=1 j=1 T i=1 T i=1
Z n
X Z
2 2
= (t)dt i Ci0 (t)dt .
T i=1 T
R R R
Si adems se considera la relacin T Cij (t)dt = T 2 (t)dt T si sj (t)dt, la traza de la
varianza, de la prediccin del kriging ordinario funcional basado en la traza del variograma
vendr dado por
n
X
s20 = i (h)
i=1
El parmetro definido en la ecuacin anterior debera ser considerado como una medida global
de incerteza, en el sentido que es un versin integrada de la prediccin clsica point-wise de
la prediccin de la varianza del Kriging Ordinario. Bajo alguna especificacin en la traza del
modelo del variograma, se podrn usar estimaciones de este parmetro para identificar esas
zonas que presentan gran incerteza en las predicciones. Si se fija t T y se reemplaza la traza
del variograma en la ecuacin anterior por el variograma de una variable aleatoria (t), t T
se obtendra la varianza de prediccin del Kriging Ordinario (modelo clsico), (vase en [14]).
Este resultado se puede usar para calcular intervalos de confianza point-wise.
58 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
Entonces una adaptacin del modelo clsico de los momentos (M oM ) para esta cantidad da el
siguiente estimador
1 X Z 2
(h) = si (t) sj (t) dt
2 |N (h)| T
i,jN (h)
Enfoque Multivariante 1: Cokrige First, Fit later (CFP). El vector de valores observados
si (t1 ) , . . . , si (tM ) se considera como la observacin de una variable aleatoria M -
dimensional en el sitio si . El Cokriging se aplica, entonces, para predecir los valores de
este vector aleatorio en el sitio no muestreado s0 : si (t1 ) , . . . , si (tM ) . Por tanto,
un
modelo paramtrico (; ), Rp se ajusta a los valores si (t1 ) , , si (tM ) para
reconstruir la funcin entera en s0 : (; s0 ).
Enfoque Multivariante 2: Fit first, Cokrige later (FCP). Primero, el modelo paramtrico
se ajusta a la curva observada: (; si ), i = 1, . . . , n. Los valores de los parmetros p-
dimensionales se consideran como observaciones de la variable aleatoria. El Cokriging se
aplica para predecir el valor del parmetro en la posicin s0 , decimos que s0 , y (; s0 )
es el resultado de predecir la funcin en s0 .
Enfoque de una curva kriging (CKP). Dado que las funciones si son slo conocidas para
M valores, Goulard y Voltz (1993) proponen un modelo paramtrico (; ), Rp para
estos datos para obtener (; si ) como una aproximacin de la funcin entera si . Por
tanto, el predictor s0 (t) se puede reescribir como
n
X
s0 = i ; si
i=1
Considrese ahora el caso comn donde un gran nmero de valores M son observados para
cada funcin muestreada y no hay un modelo paramtrico que los ajuste adecuadamente. En
este contexto el segundo propsito, CF P (Cokrige first, Fit later) que puede llegar a ser ex-
tremadamente caro en trminos de recursos computacionales. La razn es que CF P desarrolla
un primer paso del Cokriging donde la dimensin de la observacin multivariante es igual a M .
El coste computacional de este paso es razonable si M est en decenas, pero es inaceptable si
M es del orden de varios cientos o miles. Cuando un modelo paramtrico es adecuado para
representar las funciones observadas, la alternativa F CP (Fit first, Cokrige later) es factible,
porque en este caso el paso Cokriging tiene en cuenta p vectores dimensionales, donde p es el
nmero de parmetros en el modelos paramtrico. Aqu el problema aparece cuando el modelo
no paramtrico se considera para ajustar los valores observados. Entonces se podra hacer un
ajuste no paramtrico, pero este proceso es esencialmente equivalente al ajuste paramtrico con
nmero de parmetros pM creciente con el nmero de valores observados M . Sin embargo,
la flexibilidad extra proporcionada por un modelo no paramtrico es generalmente obtenida a
expensas de permitir grandes valores pM (incluso pM M ). Por tanto se concluye que el
coste computacional del argumento F CP podra tambin ser prohibitivo. As que nos limita-
mos a utilizar la curva de kriging predictor (CKP ). Del sistema (4.2.1) y la seccin anterior,
es evidente que, el paso crucial para la estimacin de la traza del variograma (h) y para cal-
cular los coeficientes Kriging i en el predictor s0 (t), est el clculo de integrales a travs de
R 2
T con la forma genrica T si (t) sj (t) . Cundo se ajusta bien un modelo paramtrico
60 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
los valores de las funciones observadas estn disponibles. Se trata de sustituir esta integral
R 2
por T (t; si ) (t; sj ) , que por lo general tiene una expresin analtica cerrada. Cabe
plantearse qu es lo que se puede hacer si no existe un modelo paramtrico aceptable que ajuste
las funciones observadas. La propuesta que se plantea es la de sustituir el paso paramtrico del
ajuste por uno no paramtrico.
25
20
20
15
Temperatura (C)
Temperatura (C)
10
10
5
0
0
5
10
Das Das
25
20
20
15
Temperatura (C)
Temperatura (C)
10
10
5
0
0
5
10
Das Das
Visualmente los datos se representan bien con 35 bases de Fourier. Si tenemos muchas
bases se produce un sobrestimamiento y adems el coste computacional es mayor. Para decicir
el nmero de bases ms indicado se us la libreria f da.usc de Febrero-Bande, M. y Oviedo de
la Fuente, M.. Se ha usado el mtodo min.np. Este mtodo realiza una suavizacin funcional de
los datos usando una estimacin no paramtrica del kernel con mtodos de validacin cruzada
(CV) o mediante mtodos de validacin cruzada generalizada (GCV). En la seccin siguiente se
explicar ms en detalle la eleccin del nmero de bases por tratarse de una tcnica que expresa
la solucin basada en bases de funciones. El parmetro h de la ventana es 4.56. Cuando se han
obtenido que 85 era un buen nmero para considerar de bases en el mtodo de suavizacin se ha
usado un mtodo de validacin cruzada y la matriz de estimacin calculada mediante Regresin
Local Lineal (LLR), y la traza de la matriz vale 87.49. En el caso de 35 bases el mtodo
de validacin usado es de validacin cruzada generalizada y la matriz se calcula mediante la
62 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
n
X n
X
(i)
SSEF CV = SSEF CV (i) =
si (tj ) si (tj ) |
,
i=1 i=1
25
25
KO KO
20
20
original original
Temperatura (C)
Temperatura (C)
15
15
10
10
5
5
0
0
5
5
0 100 200 300 0 100 200 300
da da
25
KO KO
20
20
original original
Temperatura (C)
Temperatura (C)
15
15
10
10
5
5
0
0
5
da da
anlogo.
Una vez que se tiene determinado que modelo se va a usar se procede a hacer la predic-
cin. La Figura 4.9 muestra el variograma obtenido al calcular la prediccin en la Facultad de
Matemticas.
En la Figura 4.10 se muestran los resultados de prediccin comparados con el dato real, pues
aunque consideramos como no muestreado la Facultad de Matemticas, se tienen los resultados
para el mismo ao de la estacin Santiago-EOAS situada a excasos metros de nuestro punto de
inters. Se verifica que el mayor correponde a la estacin ms cercana geogrficamente al
punto no muestreado. En la Figura 4.11 se prensentan todos los s.
Sergude, (est en el ayuntamiento de Boqueixn), es la estacin con el mayor y la que
tiene el menor est en Malpica. En la Tabla 4.3 se presenta un resumen de los resultados
obtenidos.
Sergude Ro do Sol Punta Candieira Malpica
0.61 0.17 0.144 -0.02
Distancia en Km 9.78 26.89 101.08 56.13
30000
20000
semivariance
5000 10000
0
distance
30000
20000
semivariance
10000
5000
0
distance
Los modelos sern combinaciones T emp0 (t) = 0 (t) + 1 (t) Altitud0 + 0 (t) (modelo1)
y T emp0 (t) = 0 (t) + 1 (t) Altitud0 + 2 (t) Latitud0 + 0 (t) (modelo2). Es decir el
modelo1 considerando la temperatura centrada o no y modelo con constante o sin ella y de modo
anlogo el modelo2. En la Tabla 4.6 se presenta un resumen del coeficiente de determinacin
para esos modelos.
A continuacin se ha hecho la estimacin del Kriging Universal primero con los modelos que
usan com variable a la altitud. Los resultados obtenidos eran muy similares a los que se tenan
en el Kriging Ordinario, por ello, se han omitido para no hacer muy extenso este trabajo. De
la Tabla 4.6 los modelos que tienen mayor coeficiente determinacin (R-Squared) corresponden
Tabla 4.5: Resumen de los residuos de validacin cruzada para el Kriging Ordinario.
66 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
Prediccin Santiago
KO
Original
20
Suavizada
15
Temperatura (C)
10
5
0
da
a aquellos que usan adems la variable latitud. En la Tabla 4.7 se consideran los tres modelos
anteriores mejores y se muestra el nmero de veces que las variables han resultado significativas.
Si nos fijamos en la Tabla 4.7 los modelos de la dos primeras filas arrojan los mismos re-
sultados. En el ltimo modelo la variable latitud ha sido siempre significativa y debido a que
el R-Squared es el mayor hemos optado por este modelo. Se va a trabajar en vez de con la
temperatura con los residuos respecto a la media del modelo que tienen a su vez estructura de
dato funcional. Luego a estos residuos se les aplicarn las tcnicas del Kriging. La Figura 4.14
muestra los residuos del modelo con altitud y latitud junto con los residuos suavizados con una
base de Fourier de 35 elementos.
R-Squared
modelo1 - no centrado sin constante 0.48
modelo1 - centrado sin constante 0.17
modelo1 - no centrado con constante 0.56
modelo1 - centrado con constante 0.56
modelo2 - no centrado con constante 0.73
modelo2 - centrado con constante 0.73
modelo2 - no centrado sin constante 0.97
modelo2 - centrado sin constante 0.56
Lambdas por KO
0.6
0.5
0.4
lambdas
0.3
0.2
0.1
0.0
50 100 150
da
Tabla 4.7: R-Squared y nmero de veces que las variables han sido significativas.
En la Figura 4.15 se tiene el variograma con los distintos modelos, y como en el caso del
Kriging Ordinario se obtiene la misma estimacin, con lo cul se optar por el esfrico nueva-
mente. Lo que si que se observa es que la varianza ha disminuido.
Se tiene la prediccin para los residuos en la Figura 4.16. Hay que decir que las estaciones
que tiene los s representativos son las mismas que en el Kriging Ordinario, por tanto no se
incidir ms en eso. El siguiente paso es deshacer el cambio en el modelo para ver la prediccin
autntica en la la Facultad de Matemticas. Ya no se presentan estos resultados porque lo que se
pretenda era ver si la el efecto de la altitud y/o la latitud ayudaban a definir que modelo usar.
Tambin se ha aplicado Kriging Universal a los datos eliminndole a los residuos el efecto de
la latitud y longitud. Los resultados obtenidos se pueden consultar en la tabla (4.14) y servirn
para decidir al final con qu metodologa nos quedamos.
68 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
Santiago
Sergude
Ro do Sol
20
Punta Candieira
Malpica
Temperatura (C)
15
10
5
da
Este predictor fue mencionado en [11]. Se asumen las mismas afirmaciones dadas en la tc-
nica anterior. Para cada t T , el predictor, s0 (t), tiene la misma expresin que el predictor
del Kriging Ordinario. En el resto del proyecto a este predictor se le llamar Kriging Continuo
4.3 K RIGING VARIACIN DE TIEMPO CONTINUA PARA LA PREDICCIN ESPACIAL DE DATOS FUNCIONALES69
variable en el tiempo para datos funcionales (CTKFD). Este procedimiento del modelo es co-
herente con el modelo linal funcional concurrente ([12], [26]) tal como se ve en la ecuacin
Y (t) = X(t)(t) + (t), en la cul la influencia de cada covariable en la respuesta es simultnea
o point-wise. En este modelo, la respuesta Yi (t) y cada covariable Xij (t), j = 1, , q son
funciones con los mismos argumentos y Xj (t) slo influye en Y (t) a travs de su valor en el
tiempo t. La estimacin de parmetros funcionales (t), j (t), j = 1, , q, se lleva a cabo
resolviendo (Ramsay and Silverman, 2005)
2
min E
Y (t) Y (t)
.
(),1 (), ,q ()
En este contexto, las covariables son las curvas observadas en n sitios de una regin y la re-
spuesta funcional es un funcin no observada en una zona no muestreada. Consecuentemente,
el problema de optimizacin es
Como en la seccin anterior, el problema de minimizacin (4.1) es una extensin del cri-
terio de minimizacin dado por en [16] al contexto funcional, h reemplazando el sumatorio i por
la integral y los vectores aleatorios [Z1 (s0 ), , Zm (s0 )] y Z1 (s0 ), , Zm (s0 ) por las vari-
ables funcionales (t) y (t) respectivamente,Pn con t T . El predictor, s0 (t) es insesgado
si E (s0 (t)) = m(t), t T , esto es, si i=1 i (t) = 1, t T . Consecuentemente, para
encontrar el BLUP, los n parmetros funcionales en el predictor propuesto vendrn dados por la
solucin del siguiente problema de optimizacin
Z n
X
2
min V (s0 (t) s0 (t)) dt, sujeto a : i (t) = 1, t T. (4.2)
1 (), ,n () T
i=1
Teniendo en cuenta que si (t), i = 1, , n son funciones aleatorias con dependencia espacial,
se asume que la matriz
a11 a12 ... a1K
a21 a22 ... a2K
A= .. .. .. .. = (1 , , K )(nK)
. . . .
an1 an2 . . . anK
donde ij = C(i , j )nn . Los coeficientes aij se asumen como una realizacin del vector
aleatorio espacial j , j = 1, , K. Se propone usar geostadstica multivariante y espec-
ficamente un modelo lineal de corregionalizacin (LMC) para la estimacin de la matriz de
covarianzas . Para establecer la condicin de insesgadez y para llevar a cabo la estimacin de
los parmetros en s0 (t), se expande cada parmetro funcional i (t) por
K
X
i (t) = bil Bl (t) = bTi B(t).
l=1
Por tanto, con las expresiones de si (t) y i (t), se obtienen para la ecuacin del predictor s0 (t):
n
X
s0 (t) = bTi B(t)B(t)T ai .
i=1
PK
Mediante i (t) y la expansin de la funcin constante 1, l=1 cl Bl (t) = cT B(t) = 1, la
restriccin de insesgadez se puede expresar como
n
X n
X
bTi B(t) T
= c B(t), t, bi = c,
i=1 i=1
o ms especficamente por:
n
X n
X
bi1 = c1 , , biK = cK .
i=1 i=1
V (s0 (t) s0 (t)) = V (s0 (t)) + V (s0 (t)) 2C (s0 (t), s0 (t))
n
!
X
= V bTi B(t)B T (t)ai + B T (t)V (a0 )B(t)
i=1
Xn
2 bTi B(t)B T (t)C(ai , a0 )B(t)
i=1
Xn
= bTi B(t)B T (t)V (ai )B(t)B T (t)bi
i=1
X
+ 2 bTi B(t)B T (t)C(ai , aj )B(t)B T (t)bj
i<j
n
X
+ B T (t)V (a0 )B(t) 2 bTi B(t)B T (t)C(a0 , ai )B(t).
i=1
T
Teniendo en cuenta = bT1 , , bTn , mT (K(n+1)x1)
, la expresin anterior an se puede
resumir a:
min T Q + D 2 T J (4.3)
donde
Q11 Q12 ... Q1n I J1
Q21 Q22 ... Q2n I J2
.. .. .. .. .. ..
Q= . . . . . ,J = .
Qn1 Qn2 . . . Qnn I Jn
I I ... I 0 c
La matriz identidad en la ecuacin anterior es de orden K. Minimizando la ecuacin del prob-
lema de minimizacin (4.3) con respecto a se obtiene:
min = Q1 J.
En la prctica, se empieza estimando ambos mediante un LMC para la variable aleatoria mul-
tivariante A = (1 , , K ) y la matriz de covarianzas . Consecuentemente, se pueden
calcular las matrices Q y J. Reemplazando estas matrices en = Q1 J, se pueden estimar bi ,
i = 1, , n y los parmetros funcionales dadosR de i (t). Por otro lado, una estimacin plug-in
de la varianza de la prediccin integrada s20 = T V (s0 (t) s0 (t)) dt vendr dada por
s20 = T Q + D 2 T J,
donde la matriz D se calcula usando, V (a0 ) el cul se obtiene por el ajuste LMC.
La prediccin integrada de la varianza s20 es una medida de incerteza en la prediccin
de toda la curva. Basados en los parmetros estimados y usando el desarrollo de la varianza,
V (s0 (t) s0 (t)), se puede estimar la varianza de prediccin point-wise.
min M
X Z
k 2 2
cR (yj (tj )) + (t) + 2 (t) dt.
j=1 T
4.3 K RIGING VARIACIN DE TIEMPO CONTINUA PARA LA PREDICCIN ESPACIAL DE DATOS FUNCIONALES73
Cuando los datos son peridicos, las bases de Fourier con un nmero impar de bases funcionales
son la opcin ms apropiada ([26]). Por tanto una base de Fourier con 35 bases de funciones ser
una buena eleccin para los datos de Galicia. Aunque que se pueden expresar en funcin de una
base de Fourier con nmero infinito de sinusoides, tomamos 365 como el lmite porque este es el
nmero de datos discretos de cada sitio en nuestro conjunto de datos. Frecuencias superiores a
365 en este caso distorsionarn la seal. Esto se conoce como el problema de aliasing (Lfeachor
y Jervis, 1993).
Se trata de predecir la curva de la temperatura en un sitio no visitado con coordenadas
536.07 (Este) y 4747.02 (Norte), que corresponde a la Facultad de Matemticas. La Facul-
tad de Matemticas est situada casi en el centro geogrfico de Galicia. El clima de Santiago se
aproxima al ocenico costero, que se caracteriza por tener temperaturas suaves en el verano y
en el invierno y precipitacins abundandantes.
En esta seccin se sigue la misma metodologa de la seccin anterior, es decir, se hace la
prediccin en el lugar no visitado y despus un anlisis de validacin cruzada. Teniendo en
cuenta que en los datos de Galicia para ajustar la media de la funcin no es constante, los
datos suavizados estn inicialmente sin tendencia usando un modelo de regresin funcional con
respuesta funcional (suavizando las curvas de temperatura) y dos covariables escalares (las co-
ordenadas: longitud y la latitud), es decir, se considera que el modelo de regresin funcional
es
En la Figura 4.24 se muestran los correspondientes residuos de este modelo, es decir los
residuos obtenidos al aplicar el Kriging a los residuos del modelo de regresin funcional de la
temperatura frente a las coordenadas, (longitud y latitud).
Deshaciendo el cambio, se obtiene la curva de prediccin para la Facultad de Matemticas
(Figura 4.17). De las Figuras 4.17 y 4.24 se puede concluir que el modelo de regresin ajustado
tiene un buen rendimiento.
Altos residuos en la Figura 4.24 se deben a malas estimaciones en las estaciones se trata de
Cabeza de Manzaneda (ayuntamiento de Manzaneda (Ourense)) y Pedro Murias (ayuntamiento
de Ribadeo (Lugo), 7124.53 y 6509.01, respectivamente. Cabeza de Manzaneda est al sur este
de Galicia, la diferencia entre la temperatura mxima y la mnima es de 28.5 C. El clima se
encuadra dentro de lo que se ha definido por ocenico de montaa que se caracteriza por tener
veranos frescos e inviernos menos fros. Por el contrario en la estacin de Pedro Murias en
Ribadeo, noreste de Galicia, posee clima ocenico costero, que se caracteriza por tener temper-
aturas suaves en el verano y en el invierno y precipitacins abundandantes. La diferencia de
temperaturas mxima y mnima es esta estacin es 25.5 C.
Por el contrario las estaciones de las Vigo-Campus (ayuntamiento de Vigo (Pontevedra)) y
Melide (A Corua), son las estaciones con menores residuos por validacin cruzada, 254.13 y
397.53, respectivamente. La diferencias entre el mximo y el mnimo son de 21.5 C y 23.4,
para cada una. En Vigo-Campus el clima es ocenico costero y en Melide ocenico continental,
se caracteriza por tener veranos clidos e inviernos fros con posibilidades de heladas.
La Figura 4.23 muestra un grfico de los parmetros funcionales estimados. El mayor
parmetro funcional estimado corresponde a la estacin de Sergude (ayuntamiento de Boqueixn
(A Corua)) que es la estacin ms cercana al punto a estimar.
Otras estaciones cercanas a la Facultad de Matemticas, y por tanto con influencia en la
prediccin, son Muralla (ayuntamiento de Lousame (A Corua)) (valores en torno a 0.16), Ro
do Sol (ayuntamiento de Coristanto (A Corua)) (alrededor de 0.13 pesos), Fontecada (ayun-
tamiento de Santa Comba (A Corua)) valores en torno a 0.009, en la Figura 4.23. La suma de
los parmetros funcionales estimados es igual a 1 para todo t (Figura 4.23)), lo que indica que la
restriccin de insesgadez se cumple. La estacin que proporcciona menos informacin es la de
Malpica, igual que sucede con la tcnica 1. La prediccin en la Facultad de Matemticas 4.17,
es consistente con los valores reales registrados.
Una comparacin entre la prediccin en validacin cruzada y las curvas suavizadas (Figuras
4.17 y 4.24) muestran que las predicciones tienen el mismo comportamiento en el tiempo que
las curvas suavizadas.
Se puede observar que hay algunas estaciones con grandes curvas residuales positivas o
negativa. Se aprecia que la desviacin estndar residual es menor en la primavera y en el verano
donde las curvas suavizadas y pronosticadas tienen menor variacin y se comprueba con los
datos de los promedios de la desviacin tpica en la Tabla 4.9.
La media residual vara alrededor de cero, lo que indica que las predicciones son insesgadas.
En la Tabla 4.10 se obtienen los promedios por estacin del ao.
En la Tabla (4.11) se muestran los estadsicos de la suma de los errores al cuadrado por
validacin cruzada para las 66 estaciones.
Estadstico CTKFD
Mnimo 865.3
1st Qu. 2373.8
Mediana 2768.0
Media 3212.3
3rd Qu. 3793.2
Mximo 10061.0
Desviacin tpica 1474.8
Suma 212009.0
Tabla 4.11: Resumen estadstico de la suma de los cuadrados de los errores de validacin
cruzada.
se utiliza este enfoque. Las metodologas propuestas con esta tcnica son del mismo modo a
las soluciones dadas en la tcnica anterior, es decir, cada curva observada es ponderada por
un parmetro funcional. Sin embargo aqu la flexibilidad aumenta porque se estima el doble
ndice de los parmetros funcionales. Ahora, cada curva se pondera por un parmetro funcional
para llevar a cabo la realizacin de la prediccin en cada momento. Esta metodologa sigue la
filosofa bsica del
R modelo lineal funcional de respuesta funcional (modelo total) de la ecuacin
Yi (t) = 0 (t) + T Xi (v) (v, t) dv + i (t), donde se debe estimar el coeficiente de regresin
bivariante (Malfait y Ramsay, 2003).
Parmetros
Variables
Por lo tanto, el predictor Cokriging de s0 (v) basado en datos funcionales (CBFD) viene
dado por
n Z
X
s0 (v) = vi (t)si (t)dt
i=1 T
donde
Z
W = B(t)B T (t)dt
T
Para cualquier base ortonormal como la base de Fourier, la matriz W de Gram es la matriz
identidad. Para otras bases de funciones tales como las bases B-Splines, W debe ser calcu-
lada usando integracin numrica. Asumiendo la hiptesis de estacionariedad de las funciones
aleatorias la matriz:
a11 a12 . . . a1K
a21 a22 . . . a2K
A= . .. . .. = (1 , , K )(nK)
.
. . . . .
an1 an2 . . . anK
y matriz de covarianzas
11 12 . . . 1K
21 22 . . . 2K
= .. .. .. ..
. . . .
K1 k2 . . . KK
78 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
min V (s0 (v) s0 (v)) sujeto a : E (s0 (v)) = E (s0 (v)) (4.5)
v1 (), ,vn ()
n
X X n
X
V (s0 (v) s0 (v)) = bTiv Mi biv + 2 bTiv Mij bjv + D(v) 2 bTiv Ni (v) (4.6)
i=1 i<j i=1
n n n
!
X X X X
min bTiv Mi biv + 2 bTiv Mij bjv + D(v) 2 bTiv Ni (v) + 2mTv biv W 1 B(v)
b1v , ,bnv ,mv
i=1 i<j i=1 i=1
T
Tomando v = bT1v , , bTnv , mTv (K(n+1)x1)
, se puede reescribir la ecuacin anterior de la
forma:
donde
M11 M12 ... M1n I
M21 M22 ... M2n I
.. .. .. .. ..
M = . . . . .
Mn1 Mn2 . . . Mnn I
I I ... I 0 [K(n+1)][K(n+1)]
y
N1 (v)
N2 (v)
..
N (v) = .
Nn (v)
W 1 B(v) [K(n+1)]1
v = M 1 N (v)
Una estimacin plug-in de la varianza de prediccin s20 (v) = V (s0 (v) s0 (v)) est dada
por
donde la matriz D(v) se calcula usando una estimacin de V (a0 ) obtenida mediante el ajuste de
medias del modelo linal de corregionalizacin (LMC).
80 C APTULO 4. E JEMPLO REAL DE K RIGING CON DATOS REALES FUNCIONALES
tal que 1 (t, v), , n (t, v) : T xT R. Notar que de acuerdo a los reemplazamientos
dados en los esquemas tanto para parmetros P como para variables en el caso del Cokriging
basado en datos funcionales, el predictor ni=1 bTiv = B T (v)W 1 se extiende al contexto
T
funcional mediante la sustitucin del vector Z1 (s0 ), , Zm (s0 ) por s0 (v), v T , y
1 1
el vector de parmetros 11 1m 11 1m , , n1 nm m
m m 1 1 m
n1 nm por
11 (t) m 1 m
1 (t) , , n (t) n (t) , t T , respectivamente.
Adems, teniendo en cuenta que v vara de forma continua en T , el conjunto discreto de
parmetros funcionales 1i (t) m i (t) , i = 1, , n se sustituye por el doble ndice del
parmetro funcional i (t, v), t, v T . Es evidente que para un fijo v T la expresin del
predictor FKTM es igual a la del Cokriging basado en datos funcionales (CBFD). El parmetro
funcional i (t, v) determina el impacto de la i-sima funcin observada en el tiempo t en la
funcin no observada al tiempo v. Este modelo es coherente con el modelo funcional lineal con
respuesta funcional (modelo total):
Z
Yi (t) = 0 (t) + Xi (v)(v, t)dv + i (t).
T
En nuestro contexto las covariables son las curvas observadas en n lugares de una regin y la
respuesta funcional es una funcin no observada en un lugar no visitado. Por lo tanto la funcin
objetivoR es E ks0 (v) s0 (v)k2 , dependiendo de 1 (, ), , n (, ) o usando el Teorema de
Fubini T E (s0 (v) s0 (v))2 dv. Teniendo en cuenta la estacionalidad de la funcin objetivo
R
se tiene, T V (s0 (v) s0 (v))2 dv.
Una vez ms, los parmetros funcionales i (t, v) de s0 (v) se calculan teniendo en cuenta
las restricciones de insesgadez y la prediccin con mnima varianza. Por lo tanto el problema de
optimizacin es
Z
min V (s0 (v) s0 (v)) sujeto a : E (s0 (v)) = E (s0 (v)) , v T. (4.8)
1 (,), ,n (,) T
4.4 D E MULTIVARIANTE A GEOSTADSTICA FUNCIONAL 81
donde
ci11 ci12 ci1K
ci21 ci22 ci2K
Ci = .. .. .. ..
. . . .
ciK1 ciK2 ciKK (KK)
s0 (v) = B T (v)a0 ,
R
donde la matriz de producto interior W , definida, W = T B(t)B T (t)dt. El predictor s0 (v)
tambin ha sido considerado por Nerini y Monestiez (2008). En su trabajo de Nerini y Monestiez
(2008) se supone que W es una matriz de identidad ya que consideran una solucin basada en
expansiones de bases ortonormales, en este caso no es una condicin necesaria. Se consideran
las propiedades de insesgadez y mnima varianza del predictor propuesto, se supone que los
coeficientes ai en la ecuacin anterior son un vector aleatorio multivariante estacionario. En
consecuencia, el valor esperado de la la curva en el sitio no visitado s0 viene dado por
Por otro lado, teniendo en cuenta el valor esperado para el estimado se tiene:
n
X
E (s0 (v)) = B T (v) CiT W v T.
i=1
Consecuentemente de las ecuaciones E (s0 (v)) y E (s0 (v)), se observa que el predictor s0 (v)
es insesgado si y slo si
n
X
B T (v) CiT W = B T (v)v T,
i=1
Los n parmetros funcionales en el predictor, s0 (v), vienen dados por la solucin del sigu-
iente problema de optimizacin
Z n
X
min V B T (v)a0 B T (v)a0 dv sujeto a : Ci = W 1 . (4.9)
C1 , ,Cn T i=1
La solucin del problema se obtiene igualando a cero estas derivadas. Esta solucin en notacin
matricial queda:
Q11 Q12 ... Q1n I C1 N1
Q21 Q22 ... Q2n I C2 N2
.. .. .. .. .. .. ..
. . . . . . = .
Qn1 Qn2 . . . Qnn I Cn Nn
I I ... I 0 m W 1
4.4 D E MULTIVARIANTE A GEOSTADSTICA FUNCIONAL 83
la Proposicin 1 sabemos que las predicciones obtenidas por CBFD coinciden con aquellas
dadas por FKTM. As que slo muestran los resultados obtenidos por FKTM por no hacer muy
extensivo este trabajo. Para cada caso, se estim una LMC y se utiliza para el clculo de las
matrices Qij , Ni , i, j = 1, , 66 en la ecuacin matricial
Q I C N
=
I 0 m W 1
y consecuentemente para la estimacin de los parmetros indicados en dicho sistema. Para ajus-
tar el LMC todos los variogramas simples (directos)y variogramas cruzados fueron modelados
como una combinacin lineal de modelos con efecto pepita (nugget) y modelo exponencial. Se
ha usado para ello la librera gstat, (Pebesma, 2004), del lenguaje R.
La Figura 4.25 muestra la prediccin en Facultad de Matemticas (punto no muestreado),
junto con una comparacin grfica entre curvas suavizadas y predichas, lo que muestra un buen
resultado de las predicciones.
La Figura 4.26 presenta los residuos obtenidos por validacin cruzada, la media y la desviacin
tpica. Se puede ver en esta Figura que hay buenas predicciones en una alta proporcin de los
sitios (teniendo residuos cercanos a cero). Residuos grandes, negativos o positivos se obtienen
en tan slo un nmero pequeo de estaciones. No se observa, dependiendo de la estacin del
ao en la que estemos que los residuos sean ms grandes o pequeos que en otras estaciones.
A final del ao se aprecian residuos superiores a 6 C, se podra decir que se tiene una mayor
incertidumbre en la prediccin durante este perodo, pero como no se nota al principio y es un
dato peridico ms bien se trate de un atpico. Si se recuerda en la Figura 1 parece que se entrev
una curva que sobresal al final del ao, lo que se sugiere que pueda tratarse de un atpico.
Se aprecia que la desviacin estndar residual es menor en el otoo y en el invierno donde
las curvas suavizadas y pronosticadas tienen menor variacin y se comprueba con los datos de
los promedios de la desviacin tpica en la Tabla 4.12.
La media residual vara alrededor de cero, lo que indica que las predicciones son insesgadas.
En la Tabla 4.13 se obtienen los promedios por estacin del ao.
Rodicio es de 27.7 C. Esto genera residuos altos en ambos casos. En estas dos estaciones el
clima que tienen se encuadra dentro de lo que se ha definido por ocenico de montaa que se
caracteriza por tener veranos frescos e inviernos menos fros que en otras zonas montaosas ms
alejadas del mar.
Por el contrario las estaciones de las Islas Ces (ayuntamiento de Vigo (Pontevedra)) e Isla
de Ons (ayuntamiento de Bueu (Pontevedra)) estn al sur oeste de Galicia son las estaciones con
menores residuos por validacin cruzada, 1040.85 y 1053.69, respectivamente. La diferencias
entre el mximo y el mnimo son de 9.3 C y 18.7, para cada una.
Con respecto a la prediccin en la Facultad de Matemticas, observamos en la Figura 4.26
que la curva predicha muestra un comportamiento estacional similar a las curvas suavizadas y
es consistente con los valores reales registrados en la estacin de Santiago.
Tres de los parmetros estimados para hacer esta prediccin se muestran en las Figuras 4.27
y 4.28, corresponden a las estaciones de A Pontenova (Lugo),Monte Aloia (ayuntamiento de Tui
(Pontevedra)), Malpica (A Corua) y Sergude (ayuntamiento de Boqueixn (A Corua)).
De la Figura 4.28 se puede destacar que los parmetros de Malpica son casi nulos, son
los ms pequeos y por el contrario en Sergude son los ms grandes. Otra vez se pone de
manifiesto la cercana al punto no muestreado. Por tanto esto quiere decir que Sergude tiene una
mayor influencia sobre la prediccin que Malpica (cuyos parmetros funcionales son casi nulos).
Adems la estimacin funcional de los parmetros revela que hay un efecto a corto temporal en la
prediccin. Ambos resultados eran de esperar. Por un lado, el primer resultado es coherente con
la filosofa de geoestadstica, es decir, los sitios ms cerca de la ubicacin de prediccin tienen
una mayor influencia que otros ms alejados. Al igual que en el caso de Malpica, otras estaciones
muy separadas de la Facultad de Matemticas tienen una baja influencia en la prediccin.
Finalemente se ha aplicado esta tcnica a los datos de la temperatura de Galicia (2009),
eliminndole a los residuos el efecto de la latitud y longitud. Los resultados obtenidos se pueden
consultar en la tabla (4.14) y servirn para concluir en la comparacin con qu metodologa nos
quedamos.
n
X M
n X
X 2
(i)
SSEF CV = SSEF CV (i) = si (tj ) si (tj )
i=1 i=1 j=1
para los residuos de la regresin. Las predicciones de temperatura para estos conjunto de datos
se obtienen agregando las predicciones residual a la tendencia.
Tabla 4.14: Resumen estadstico de la suma de los cuadrados de los errores de validacin
cruzada. (Nota: , mtodo de la columna anterior sin los efectos de la longitud y la latitud.)
Se observa en la Tabla (4.14) que donde existen las mayores diferencias entre los mtodos
son en trminos de los valores mnimos o mximos y tambin influenciadas por el efecto de la
longitud y la latitud.
Los predictores tienen un comportamiento similar cuando las curvas son relativamente ho-
mogneas y las diferencias entre los mismos con los datos de temperatura para Galicia son
fundamentalmente debidas a su desempeo en las estaciones con temperaturas extremas como
se explic anteriormente.
Los resultados mostrados en la Tabla (4.14) indican que la inclusin de un doble ndice
funcional en los parmetros (efecto temporal en el conjuntos de datos) no reflejan cambios sus-
tanciales en las predicciones del anlisis. Es decir, el trabajo de estimar tantos parmetros no
revierte mejores resultados, aunque, si a los datos se les elimina el efecto de la latitud y la longtud
se obtienen mejores
En principio si las curvas son homogneos podramos usar cualquiera de los tres enfoques.
Sin embargo, si lo observado en los datos tiene una variabilidad alta CTKFD podra ser la mejor
opcin.
En resumen, podemos concluir que OKFD sin los efectos de la longitud y la latitud es la
mejor opcin para llevar a cabo la prediccin espacial de datos funcionales en Galicia. Por
lo tanto todos ellos son buenas alternativas para hacer la prediccin espacial de los datos fun-
cionales. Teniendo en cuenta que es ms simple OKFD sin los efectos de la longitud y la latitud
que otros desde un punto de vista prctico y computacional en aplicaciones con grandes conjun-
tos de datos este mtodo puede ser preferible.
Residuos
10
Media
Desviacin tpica
20
5
Temperatura (C)
Residuos
10
0
5
0
10
10
Da Da
Figura 4.13: Izquierda: muestra una comparacin grfica entre las curva observadas (las reales)
y la predicha(utilizando FCV). Derecha: la de la derecha lo residuos de validacin cruzada
funcional, media residual y desviacin tpica residual.
Residuos Residuos suavizados
10
10
5
5
residuos
X(t)
0
0
5
4000
2000
0
distance
KO
Original
Suavizada
4
2
Temperatura (C)
0
2
4
6
da
Smoothed
Temperature (degrees C)
Prediction
Real data
10
0
10
0.00
0.01
0.01
15
Influencia de la constante
Influencia de la longitud
0.00
Influencia de la latitud
0.02
10
0.01
0.03
0.02
5
0.04
0.03
0 100 200 300 0 100 200 300 0 100 200 300
time time time
Figura 4.18: Influencia de la constante, de la longitud y latitud en el modelo.
Efecto de la longitud
1
23
4 m
c5
6
8
9
7 0a
b de c5ghm aw
vnxp
o
k2iyq
e zg u
s0
ffB
A
lC
D
G E
H iJyq
p
xW
vn
o cjF
zg
rQu
ttP
lTJIq
U 3
1
234 56
cg
m
8
9
7 a
0
b e
d g
h w
n3
k2
1
o4
pq 6 8
9
7
u
A
C
D
G s0
fBb
ME
H d
3
1W
4 jF
O
5 h
rQ
6K
N
7m
8
9M
tb
a
RPU
L
de
S O hK
N
VR
A
B
E
G
ML
S
p
ko
w
n
X
YZ OT
V
X
Q
K
u
3
2
1sY
fB
A
C
D
G vZ
P
4
E
H
MLiyIIq
S
xW O 1
zrV
jF Q2
X
lK
N 4
YtP
R U
LSJV 13
2
T
X4
Y ZI13
24
2
1m
5
3
6
8
9
7
40a
bde h w
np
koqu
A
C
D
G sM
fB E
H iyO
vxW jF
zrQ
lR
K
N tP U
LJV
S T
XY Z
3
1
24 I5 6m
7a
8
9
0
be
d cg
h ko
w
n p usM
fB
A
C
D
G E
H iyO
vxW jF
zrQ
lK
N tP
R JV
U
L
S T
XY Z I1 3
24
3
1
2
45a
m
6
8
9
0
7
bg
e
c
d
h w
no
kCpq u
A
D
G s
fB
Mv
E
Hy
x
iO
W j
z
r
Q
lR
F
K
N tPU
LSJV T
X Y Z I1 3
242 13
4 5m
6
8
9
7 a
0
bde cgh w
no
kCpq us
fB
A
D
GMv
E
Hy
x
Wj
iO
Fz
r
Q
lK
N tP
R U
LJV
S T
XY Z I1 3
24
0.00
5
3
1
2
4e
a
m
6
8
9
0
7
d
bcg
n
hp
q
u
ko
w sM
fB
A
C
D
G E
H iyO
vxW jF
zrQ
lR
K
N tPJV
U
L
S T
X Y Z I1 3
2 42 134 56 7m
8
90a
b de g
ch np
ko
w q usM
fB
A
C
D
G E
H y
vxWjF
iOzrQ
lK
N tP
R U
LJV
S T
XY Z I1 3
2
4
g
p
q y 1
234 56 7m
8
9a
0
b e
dcg
h ko
w
n pq usM
fB
A
C
D
G E
H iyO
vxW jF
zrQ
lK
N tP
R U
LSJV T
X
Y Z I1 3
24
g p iJyIcO 5
3
1
2
4e
c
a
m
6
8
9
0
7
d
bo
w
n
h
k u
s
v
f
A
B
C
D
E
G
H
Mj
x
z
r
Q
i
l
F
K
N
O
W t
P
RU
LSJ T
V
X Y ZI3
2
1 4
1
234 56
g m
8
9
7a
0
b1
25
3
4
e
c
dm
6
8
9
7
g
h0a
1
2
b
w
n
k3
d
oe
4
pc5
q
y
g
6hm
8
9
7
u
A
C
D
Ga
0
b
s
f
B
Mn
v
E
Hp
yq
e
ko
wd
x
i
WcjF
O u
h
fB
A
C
D
G
z
r
Q
l
K
N w
sM
E
H
t
P
Rko
vn
1
2U
L
3iJyq
xW
S
4
jF
O
5
zV
6
rQ
K
N
7
u
T
X
m
8
9
sY
fB
A
lC
D
G M
a
0
E
H
tb
RPxW
vZ
U
L
dS
e
jF
zg
r1
V
h
QtP
l2
K
NR
T
X
Y
3
4JIq
U
L
S
Z
p
o
w
n
k
T
V
X
Y
Z
3
2
1
4
y
u
s
x
v
i
f
A
B
C
D
E
G
H
M
WF
O Q
3
Ijzr1
2
4
l
K
Nt
P
RU
LJ
S T
V
XY Z I 3
2
14 1
23
456
7m
8
90a
b decgh ko
w
n pq usM
fB
A
C
D
G E
H iyO
vxW jF
zrQ
lK
N tP
R U
LJV
S T
XY Z I1 3
2
4
1
25
3
4m
6
8
9
70a
bde ch w
np
q
kou
DsM
fB
A
C
G vxW
E
H iOjF
zrQ
K
NtP
lR JV
U
L
S T
XY Z I1 3
2 4 cg
p
q yO cg
p
qyO m a e cg ko
w
n pq u
sM iyO
vxW jF
zrQ
cg3
k2
1
4
p5m
6
8
9
7 a
s0
vd
b e
iJycOzg
h w
np
JIq
o
k2 usY
fB
A
C
D
G E
H
M iyIcO
xW
vd jF
zg
rQ
K
NtP
l2
RJq
U
L
ST
V
X
Y
Z3
IO
2
1
4 3
1
2
45a
m
6
8
9
0
7
b
cg
g
e
c
d
p
qh w
n
kopq
iyO
u
A
C
D
Gs
f
B
Mv
E
Hy
j
x
z
i
F
O
Wr
Q
l
K
N t
P
RU
LJ
S VT
XY ZI 3
2
14 1
234 5 6m
7a
8
9
0
be
d o
w
n
h
k
cg
u
sM
f
A
B
C
D
GvxW
E
H i
p
q
jF
zrQ
l
K
N t
P
RU
LJ
S
iyO
VT
XYI
Z3
2
1
4 1
234 56 7a
m
8
9
0
be
do
w
n
h
ku
s
x
v
i
f
A
B
C
D
E
G
H
M
WjF
z
r
t
Q
l
K
N
P
RJ
U
L
S
T
V
XY Z I 3
2
1 4 1
23456 78
90b d h
m a e cg
f
A
B
C
D
G E
H
ko
w
n pq
l
K
N
u
tP
R
sM
U
LSJ
iyq
vxW jF
V
zrQ
T
X
YZI1 3
2
42 1
41
2
a
m
c5
36
8
9
0
7
b
g4
e
d
p
q
m
c5
36
8
9
7
g
h0a
b
w
vn
3
k2
1
d
oe
4
p qc5
iJyO
g
6h7m
8
9
u
fB
A
C
D
G a
s0
b
Mw
vn
E
H xp
o
d
k2
3
1iJyq
e
4
W cO
5zg
jFh
67
rV
Qu
ms0
fB
A
C
D
G
8
9
lK
N a
M
Rw
E
H
tb
Pko
vnd
U
L
3
p
iJyq
xW
e
S O
I5
zg
cjFrQ
h
6
u
lK
N
V
7T
X
m
8
9
sY
fB
A
C
D
G M
R
a
0
vn
E
H
w
tPko
U
L
ZiJyIq
xW
p
S
e
jF
cO
zg
rV
Q
lK
N
1u
T
X
fB
A
C
D
G
3
2 tP
R
sY
M
4vn
E
H
w U
L
Z
koiJyIq
S
xp
W OzrV
jF 1
QT
X
3
2
lK
Nu Y
s4vZ
tP
R U
L IjzrV
iJyO
S
xW 13
2
4
T
X
Y
tPJIV
Z 3
2
14
1
23456 m
8
9
7 0a
b1
23
d4
e 5
c6
ghm
8
9
7a
0
be
d
p
q
o
w
n
kw
n
h
u
s
v
f
A
B
C
D
E
G
H
Myq
o
x
i
Wj
z
F
Ou
fB
A
C
D
G
r
Q
l
K
N E
H
M
t
P
RxW
U
LS jFrQ
VK
NtP
lT
R
X
Y U
L
S
3
1
4
Z T
V
X
m
5
6
8
9
7
2
1 a
0
b
4Ze
f3 i5h1
j6
m3
4
l7
a
8
9
0
b
p
o
w
n
k
e
d
y
u
s
x
v
A
B
C
D
E
G
H
M
W
g
p
q
c
o
w
n
h
kz
r
t
Q
J
U
F
K
L
N
P
R
S
T
V
X
Y
y
j
u
s
x
v
z
r
t
Q
i
l
f
A
B
C
D
E
F
G
H
K
M
N
O
P
R
WI
Z
J
U
L
S3
2
1
T
V
X4
Y
ZI
13
2
4 1
25
3
4m
6
8
9
70
1
2
a
b
3
d
4
e
5
c
6
gh
m
7a
8
9
0
be
d
p
o
w
n
kqko
w
n
h
u
s
v
f
A
B
C
D
E
G
H
My
j
x
z
i
F
O
W
u
r
Q
l
K
N
sM
fB
A
C
D
G vxW
E
H
t
P
RU
LJ
S
jF
zrQ
VT
X
tP
lR
K
N
Y
JV
U
L
S
I
Z
T
X
3
2
1
Y
4
Z I1 3
242 3
1
4 5e
a
m
6
8
9
0
7
d
b h ko
w
n u
D
GsM
fB
A
C vxW
E
H jF
zrQ
K
NtP
lRJV
U
L
SI1
T
X
Y
Z 3
2
4
3
1
2
45
6
7m
8
90a e cg p
q
o
w
ny
j
u
s
x
v
zr
t
1
234 56 78
90b
1
2
d
34 56
h
7m
8
9
0a
b de cgh
fB
A
C
D
G E
H
w
n
kop O
g
NtP
lK
R
u
s
f
A
B
C
D
G
M
JyjzV
U
L
S
x
v
i
E
H
W
pqF
O
T
X
Y
Z
r
t
Q
l
J
U
K
L
N
P
R
S
y
5
3
1
2
3
I1
2
4
m
5
3
6
8
7
1
2
4
I
T
V
X
Y
Z
g
e
c
a
m
6
8
9
0
7
m
5
3
6
8
9
7
1
2
4
g
e
c
a
9
0
d
b
h
p
q
u
o
s
w
n
e
a
0
d
b
p
q
o
w
n
k
y
x
v
ko
w
n
h
u
s
v
f
A
B
C
D
E
G
H
M
j
z
r
t
y
x
i
O
W
u
C
D
G
j
z
r
Q
l
F
K
NsM
fB
A E
H
t
P
R xW
U
LS
jF
zrQ
lK
N
VT
X tP
R
Y U
L
ZS I 1T
X
3
2 Y
4
1
2Z4 b
1
2
d
34 5
h
67m
8
9 a
0
b de cgh
fB
A
C
D
G ME
H
w
n
kop q
F QlK
NR
u
s
f
A
B
C
D
G
Mv
E
H
U
L
S
x
i
WyO
j
F
T
X
z
r
Q
l
K
N
Y
tP
R
Z
U
L
I1
JV
S
3
2
4
T
X
Y ZI1 3
2
4
1
23456 m
8
9
7 0a
b decgjh w
nop
rkCq us
tG
A
Df
B
My
x
v
i
E
F
H
O
Wz
Q
l
K
N
P
RJ
U
L
S T
V
X YZ I 13
2
4 3
1
2
4e
a
m
5
6
8
9
0
7
d
bg
p
q
u
c
o
s
w
v
n
h
k
f
A
B
C
D
E
G
H
My
x
i
O
Wj
z
r
Q
l
F
K
Nt
J
U
L
P
R
SVT
X
Y Z I 3
2
1
4 1
23
45
gm
6
8
9
701
2
a
b3
d4
e
p qcg
6h7m
8
9a
0
be
p
d
o
w
n
kq
yg
p
c
o
w
n
5
3
1
2
4
h
k
u
s
x
v
i
f
A
B
C
D
E
G
H
M
Wq
y
5
j
z
F
Og
y
e
c
a
m
j
u
s
x
v
z
r
6
8
9
0
7
d
b
h
Q
i
l
f
A
B
C
D
E
F
G
H
K
M
N
O
W
m
r
5
3
6
8
7
1
2
4
t
Q
l
J
U
K
L
N
P
R
S
T
Vp
q
u
o
w
n
g
t
k
f
A
B
C
D
G
J
U
L
P
R
e
S
c
T
a
V
X
9
0
d
b
h
3
I
X
Y
Zy
j
s
x
v
z
r
y
p
q
t
Q
i
l
J
U
E
F
H
K
L
M
N
O
P
R
S
W
3
I
2
1
4
u
Y
Z
o
s
x
w
v
n
i
k
g
f
A
B
C
D
E
G
H
M
O
p
q
WT
V
X
Y
j
z
r
t
Q
l
F
K
N
P
RI
Z
J
y
U
L
S3
2
1
T
V
X4
Y Z I 13
2
4 3
1
2
4 5m
6
7a
8
9
0
b e
c
dg
h w
n
kop q Cu
s
f
A
B
D
G
Mx
v
i
E
H
Wy
j
F
Oz
r
t
Q
l
K
N
P
RJ
U
L
ST
V
XY Z I 3
2
14 3
1
2
456 m
8
9
0
7a
bdecgh w
n
kopq u
A
C
D
Gs
f
B
My
j
x
v
z
i
E
F
H
O
Wr
t
Q
l
J
U
K
L
N
P
R
S T
V
X
YI
Z3
2
14 b d h ki
f
A
B
C
D
E
F
G
H
M
O
WQ
J
l
U
K
L
N
P
R
S T
V
X
Y3
I
2
1
Z4 3
1
24 56 m
8
9
70a
b de c h o
w
n
k
3
1
2
4 564
j
u
s
x
v
z
e
c
a
m
i
f
A
B
C
D
E
F
G
H
M
O
W
8
9
0
7
d
bd
b
h
g
p
q
r
t
o
Q
w
n
l
J
U
K
L
N
P
R
S
T
V
h
k
A
C
D
Gk
f
A
B
C
D
G
y
j
u
s
x
v
z
3
r
I
2
1
X
Y
Z
Q
i
l
f
B
E
F
H
K
M
N
O
Wi
E
H
M
O
W
4
t
J
U
L
P
R
SQ
l
F
K
N
P
R
T
V
X
YJ
U
L
S
I
ZT
V
X
3
2
1Y
4 Z I 13
2 4
cg p q iyO 42 3
1
4g
e
c
a
w
m
n
5
6
8
9
0
7
d
b
hp
q
o
kdus
x
v
fBy
j
z
r
Q
iq
lCtP JyO 3 3
1
2
45a
m
6
8
9
0
7
be
dch w
n
ko us
fB
A
lC
D
GMx
v
i
E
H
W j
z
r
t
Q
l
JIV
U
F
K
L
N
JIO
P
R
S m
5
6
8
9
7
1
2
4
3
I2
T
X
Y
Z e
c
a
o
w
n
0
d
b
h
ku
s
v
f
A
B
C
D
E
G
H
M
gx
i
O
W
p
qj
z
r
Q
l
F
K
N t
P
RU
LJ
S
iyq V T
X
Y Z I 3
2
1
4 g pq y
0.01
1
23456 m
8
9
70a
bde h ko
w
n u
A
C
D
G sM
fB vxW
E
H jF
zrQtP
lR
K
N JV
U
L
ST
X
YZ 3
I1
2 a
m
5
3
6
8
9
0
7
1
2
4
beA
C
D
G
g
c5
hE
H
M
W
p
o
w
n
kF
K
N
OuR
sM
f
A
B
D
G E
HU
LS
xW
vni jF T
V
X
Y
zrQ
tP
l
K
N
R IV
Z
J
U
L
S2
1
T
X4
Y Z I 13
2 4 1
234 56 7m
8
9 a
0
b1
23
d4
e 5
c6
ghm
7a
8
9
0
be
d
p
o
w
n
kcg
qh
u
s
v
f
A
Cp
yq
ko
w
nx
ij
zu
r
Q
lsM
fB
A
C
D
G E
H
t iJyO
xW
vU jF
zrQ
K
N tP
RU
L
S T
V
X
Y
Z
3 3
2
1
4 e
c5
a
m
5
3
6
8
9
0
7
1
4
d
b
3
1
2
4ko
w
n
h
a
m
6
8
9
0
7
beu
c5
dhsM
fB
A
C
D
G
g E
H
wxp
vn
o
kW jF
Ozg
rQ
lC
K
NutP
R
sM
f
A
B
D
G E
HU
LJyq
S
xW
vni
p jF
OzgT
V
X
Y
rQ
t
l
K
N
P
RJ
U
L
S
y 3
IjzV
Z 2
1
T
X4
YZI
13
2 4 1
23
45m
6
8
9
7
ge
a
0
d
b
pqcg
h np
q
ko
wy
jusM
fB
A
C
D
G E
H iJyO
xW
vU jF
zrQtP
lT
K
NRJIV
U
L
S T
X
YZ3
I1
242 13456 m
8
9
70a
bde cgh p
q
o
w
n
kyO
u
s
x
v
i
f
A
B
C
D
E
G
Hj
Fz
r
t
Q
lJ
U I 13
24 1
234 56 7m
8
9 a
0
b de ch ko
w
n u
D
GsM
fB
A
C vxW
E
H jF
iOzrQ
lK
N tP
R U
LJV
S 3
I1
T
X
Y
Z2
4
g pq y 1
23
4m
6
8
9
7e
a
0
d
bg
c
h wo
kpq g u
s
f
A
B
C
D
G
Mv
E
Hy
j
x
i
F
O
W
p
qz
r
Q
l
K
N t
P
R U
LSJ
y VT
X Y Z I 13
2
4 5
gm
6
8
9
7 a
0
b de
p qcgh w
n
kp
o q
y Cu
s
f
A
B
D
G
Mx
v
i
E
H
Wy
j
F
OB
D
E
G
H
M
z
r
t
Q
l
K
N
P
RW
J
U
L
SF
OK
N
T
V
XYP
RL
ZS I V
1T
X
3
2Y
4Z 2
1
4 1
23
4m
6
8
9
70a
bd
3e c
5 h
67m
8
9
0awo
ke c u
s
v
f
A
B
C
D
E
G
H
M
w
nx
i
p
q
W
oF
Ogr
Q
l
K
N
ut
P
R
s
vJ
U
L
S
x
p
3
k2
1
4y
V
j
z
r
q
5
6
7T
X
m
8
9 Y
a
tb
s0 Zey5
I
c6
g m
7
1a
8
9
0
b
3
2
4w
ne
d
p
oc
qh
uo
w
n
k
s
x
vyjC
z
ru
s
f
A
B
D
G
Mv
E
H
tPx
z
i
F
O
Wr
Q
l
K
N t
P
RLS VX
YZ 3
2
1
4 M
W K
N
P
RL
ST
V
XY Z 3
1
2
45m
6
8
9
7a
0
be
dg
c
h w
n
kopq u
s
f
A
B
C
D
G
My
j
x
v
i
E
F
H
O
Wz
r
t
Q
J
l
U
K
L
N
P
R
SI
T
V
X
Y
Z 3
2
1
4
5
3
1
2
4m
6
8
9
0
7a
bdech ko
w
n u
A
C
D
G sM
fB vxW
E
H jF
iOzrQ
lR
K
N tPU
LSJV T
XY 3
42
I1
Z2 3
1
45
6
7m
8
9
0a
b d
3
1
2e
4 c56ha
m
8
9
0
7
bko
w
ne
du
cgsM
fB
A
C
D
G
h vn
E
H
w xW
o
3
k2
1p
4jF
iq
O
5z6
rQ
lC
K
N
7m
u
8
9
fB
A
D
G tb
R
a
s0
MP
E
H3
v2
1
U
L
d4
S
e
xW 5
iJycOzg
jF6
V7
rQ
hK
Na
lm
8
9
0
tb
T
X
Y
RPe
p
Z
ko
w
nU
L
S ch
JIq
d 3
2
1
u
T
V
X w
s4
fB
A
C
D
G E
H
M
Yko
vn iyIO
xW
Z jF
zrQ
K
N
1u
3
2s4
fB
A
lC
D
G ME
H
tP
R xW
vU
LS jF
iJOzV
rQ
K
NtP
lT
R
X
YJIV
U
L
S
Z T
X
Y
3
2
1
4Z 3
I1
242 14 b d
3
1
24 5 h
6kd
a
m
8
9
0
7
bechfB
A
C
D
GE
H
M
w
nW
oQ
iO
lC
F
K
Nu
fB
A
D
G R
Mvd
P
E
HU
LiJO
S
xW zh
jFVlT
rQ
K
NX
YkZ
tP
R U
L
S 3
A
D
JIV
2
1
T
XiIO
fB
C
GE
H
M
4
W
Y
Z FQ
l2
K
N
1R
3
4 JV
U
L
ST
XY Z I1 3
2
4 gp
5 mae
cq
o
w
n u
s
vy
j
xz
r 1
234 56 7a
m
8
9
0
b e
d cg
h w
n
kopq u
sM
f
A
B
C
D
G E
H yO
vxW
ijF
zrQ
t
l
J
U
K
L
N
P
R
ST
V
X
YZ3
I1
24
5
3
1
2
4g
e
ch
a
m
6
8
9
0
7
d
b ko
w
n p
q usM
fB
A
C
D
G vxW
E
H y
jF
iOzrQ
lR
K
N tPU
LJV
S T
X Y Z I1 3
24 1
234 6 8
9
70
bdh
k f
A
B
C
D
E
G
H
Mi
F
O
WQ
l
K
N t
P
RU
LJ
S V T
XY Z I 1 3
2
4 m
5
3
6
7
1
2
4e
a
8
9
0
d
bcg
h p
ko
w
n qusM
fB iyO
vxW jF
zrQtP
lKJV
U 3
cg A
C
D
G E
H NRL
SI1
T
X
Y
Z2
4 cg pq iJycO
3
1
2
4 cg
e
a
m
5
6
8
9
0
7
d
bp
q
o
w
n
h
ku
sM
f
A
B
C
D
GE
H yO
vxW
ijF
zrQ
l
K
N t
P
RU
LJ
S VT
X Y Z I 13
2 4 5
3
1
2
4e
a
m
6
8
9
0
7
d
b w
n
hp
q
kousM
fB
A
C
D
G E
H iyO
vxW jF
zrQ
lK
N tP
R U
LJV
S T
X
YZ 3
I1
2
4mg
e
c
ap
o
w
nqus
vy
xj
z
r 1
23
4 5m
6
8
9
70a
b decgh w
n
kop
q y
j
u
s
x
v
i
f
A
B
C
D
E
F
G
H
M
O
Wz
r
t
Q
l
K
N
P
RJ
U
L
ST
V
XY Z I1 3
24 2 134 56 7a
m
8
9
0
be
d
a
m
c5
3
1
2
46
8
9
0
7
b
g
n
h
e
d
p
q
ko
w h
u w
vn
sM
fB
A
C
D
G E
H
o
k2
3
14
xW 5
iyOz6
jF 7
rQu
m
8
9
lK
N
s0
fB
A
C
D
G M
a
RE
H
tb
P
xW
vd
U
Le
S
jF
zg
rQ
h
V tP
lK
NR
T
X
Y JIq
U
L
S
p
ko
w
nZ T
V
X
u
3
2
1 Y
vZ
s4
fB
A
C
D
G E
H
M iyIq
xW jF
O 1
zrQ3
2
lK
N 4tP
R U
LJV
S T
X
YZ3
I1
2
4
5
g
3cjzg
e
a
m
1
2
4
6
8
9
0
7
p
q p
q
m
o
w
n
d
b
h
5
3
6
8
7
1
2
4
yua
s0
9vk2
b d jzg
yc5
xe hp
iIq
o
w
n
r7
f
A
B
C
D
E
G
H
M
W
t
k Qu
s4
lC
F
K
N
O
gf
A
B
D
GP
R
E
H
MU
LJyq
xW
vnS
p
i jF
Ozg
rQ
VI
2
1
T
X
Y
Z
y
t
J
l
U
K
L
N
P
R
S
T
V
j3
4
3
I
2
1
X
Y
Z4 g 3
1
2
45a
m
6
8
9
0
7
bcg
e
dh ko
w
n pq usM
fB
A
C
D
G E
H iyq
vxW jF
OzrQ
NtP
lK
RJyV
U
L
S T
X
Y
Z5
3
6
1
2
4
3
I5
2
1
48
9
0
7
d
b
hkCfB
A
D
GE
H
MWQ
iO
lK
F
N tP
R U
LSJV T
X
YZ3
I1
2
4 g p
q y 1
234 5 67a
m
8
9
0
b e
d cg
h ko
w
n p u
A
C
D
GsM
fB E
H iyO
vxW jF
zrQ
NtP
lK
RJV
U
L
S 3
I1
T
X
Y
Z2
4
3
1
2
4 m
5
6
7
ga
8
9
0
b3
1
2
4
e
d5
ce
c
a
m
6
8
9
0
7
d
b
g
p
q
o
w
n
h
k
yo
w
n
h
k
y
u
s
x
v
i
f
A
B
C
D
E
G
H
M
O
WF j
u
s
x
v
z
r
Q
i
l
f
A
B
C
D
E
F
G
H
K
M
N
O
W
r
t
Q
J
l
U
K
L
N
P
R
S
T
VXt
P
R
Y 3
1
U
L
Z4
J
S
I 6
Ve
a
m
8
9
0
d
b
T
X
Y
Z
1
2
4
3 c
h
1
5
6
73
2
m
8
9w
a
0
bo
k
de c hu
s
x
v
z
r
Q
i
l
f
A
B
C
D
E
F
G
H
K
M
N
O
W
p
q
o
w
n
k
A
C
D
Gt
J
U
L
P
R
S
T
V
X
y
j
u
s
x
v
z
r
Q
i
l
f
B
E
F
H
K
M
N
O
WI
Y
Z
t
J
U
L
P
R
S3
2
1
4
I
2
1
T
V
X
Y
Z3
4 1
234 56 m
7a
8
9
0
be
d p
q
c
o
w
n
h
ky
j
u
s
x
v
z
i
f
A
B
C
D
E
F
G
H
M
O
Wr
Q
l
K
Nt
P
RU
LJ
S T
V
XY Z I 3
2
1 4 1
25
3
4m
6
8
9
70a
bde cg w
nop u
sx
vj
z3
1
2
4
r
tg
e
c
a
m
6
8
9
0
7
d
bp
q
o
w
n
h
k
Cu
s
x
v
i
f
A
B
D
E
G
H
M
Wy
j
F
Oz
r
Q
l
K
Nt
P
RJ
U
L
SVT
XY Z I 13
2
4 1
234 56 7m
8
90a
b de c h o
w
n
ku
s
v
f
A
B
C
D
E
G
H
Mj
x
i
F
O
Wz
r
Q
l
K
N t
P
R U
LSJ VT
X Y Z I 13
2
4
m a1
234
e 5
c6
g 7m
8
9a
0
be
d
p
o
w
nqc
hu
sp
o
w
n
k
x
vq
y
j
zj
u
s
x
v
z
i
f
A
B
C
D
E
F
G
H
M
O
W
rr
t
Q
J
l
U
K
L
N
P
R
S I
2
1
T
V
X
Y
Z34 3
1
24 5 6g
e
c
a
m
8
9
0
7
d
b
hp
q
u
o
w
n
k
f
A
B
C
D
Gy
j
s
x
v
i
E
F
H
M
O
Wz
r
t
Q
J
l
U
K
L
N
P
R
S
T
VX
Y Z I 3
2
14 m a e cg p
o
w
nqy
j
u
s
x
vz
r 1
234 56h7m
8
90a
bkde cgh f
A
B
C
D
G
Mi
E
H
W
p
o
w
n
3
1
2
4
kF
O
q
5Q
J
l
U
K
L
N
P
R
S
y
e
a
m
u
s
x
v
6
8
9
0
7
d
b
i
f
A
B
C
D
E
G
H
M
WI
T
V
X
Y
Z
g
p
q
c
o
w
n
j
z
r
h
k
t
Q
l
J
U
F
K
L
N
O
P
R
S3
2
1
4
y
j
u
s
x
v
z
r
Q
i
l
f
A
B
C
D
E
F
G
H
K
M
N
O
W
I
1
T
V
X
Y
Zt
J
U
L
P
R
S
3
2
4 T
V
XYZI
13
24 1
23456 7m
8
9
0a
b decghp
q
o
w
n
ku
s
v
f
A
B
C
D
E
G
H
My
j
x
i
F
O
Wz
r
Q
l
K
N t
P
RU
LSJ VT
XY Z I 13
24 1
23