You are on page 1of 13

ESTIMAO DE MATRIZ DE COVARINCIA DE ERRO PREVISTO PARA O

SISTEMA DE ASSIMILAO DE DADOS DO CPTEC


Alexandre Guirland Nowosad
Resumo
O sistema de assimilao de dados usado no Centro de Previso do Tempo e Estudos Climticos
(CPTEC-INPE), Physical-Space Analysis System (PSAS) (Sistema de Anlise em Espao
Fsico) da NASA, usa mtodo estatstico variacional que requer especificao da covarincia do
erro previsto (ou erro de chute inicial ou background error) para o estado da atmosfera. Este
erro escrito como uma matriz e deveria ser calculado ou estimado a partir dos dados disponveis a
tempo de ser usado em cada assimilao. Este artigo descreve trabalho feito no CPTEC para estimar
a matriz a partir dos dados de observao-menos-previso disponveis l. Pensando na direo do
tamanho enorme do vetor descritor do estado da atmosfera em atuais sistemas (no s o do
CPTEC), parametrizaes estatsticas foram feitas para diminuir o tempo de computao tentando
manter preciso aceitvel para o pblico consumidor. O sistema precisou estimar o erro apesar da
falta ou invalidez de alguns dados. A matriz de covarincia de erro estimada resultou
estatisticamente consistente.
Abstract
The data assimilation system used at the Center for Weather Prediction and Climatic Studies at
INPE (CPTEC-INPE), NASAs Physical-Space Analysis System (PSAS), uses statistical
variational method requeriring specification of covariance of the predicted (or background) error for
the (first-guess) state of the atmosphere. This error is described as a matrix and should be
calculated or estimated from the available data in time to be used at each assimilation. This article
describes work done at CPTEC to estimate the matrix from the observation-minus-forecast data
available there. Thinking towards the enormous size of the vector describing the state of the
Diviso de Modelagem e Desenvolvimento
CPTEC-INPE
Av. dos Astronautas, 1758
12201-970 So Jos dos Campos-SP
alex@cptec.inpe.br
atmosphere in present-days systems (not only CPTECs), statistical parametrizations were made to
decrease the computing time trying to mantain precision acceptable to the consumer public. The
system had to estimate the error despite lack or desqualification of some data. The estimated
covariance matrix resulted statistically consistent.
1. INTRODUO
H muitos mtodos disponveis para analisar objetivamente os dados meteorolgicos requeridos
para inicializar um modelo de Previso Numrica do Tempo (veja por exemplo Daley, (1991) e
Kalnay (2003)) (Purser et al, 2003). Os baseados em princpios estatsticos formais, que permitem
levar apropriadamente em considerao aspectos multivariados do problema , em geral superaram
os mtodos determinsticos de correes sucessivas. Um destes mtodos, o Physical-Space
Analysis System (PSAS), mtodo estatstico variacional tridimensional. A partir da previso
feita por um modelo atmosfrico especificado em grade tridimensional mais observaes da regio
espacial calcula a anlise na grade do modelo.
A equao de erro previsto (ou de erro de chute inicial) no PSAS na posio ( ) z y x , , :
onde
f
xyz
w
o estado atmosfrico previsto e
r
xyz
w
o estado verdadeiro (real). Os dados
observacionais so armazenados num vetor abstrato
o
w cujas componentes esto relacionadas ao
vetor
v
xyz
w
atravs da aplicao de um operador de interpolao linear H junto com um erro de
medida
o
e :
Note que a distribuio espacial de
o
w (e conseqentemente de
o
e ) pode ser (e geralmente )
sensivelmente diferente da grade de
f
xyz
w
. E tipicamente a dimenso de
o
w ser bem menor que a
dimenso de
o
w .
Adotando as suposies tpicas de processamento estatstico de sinais
( ) 1
r
xyz
f
xyz
f
xyz
w w e
( ) 2
r
xyz
o o
Hw w e
{ } ( ) 3 0
f
e E
{ } ( ) 4 0
o
e E
onde { } E o operador valor esperado, a anlise de varincia mnima
a
w obtida requerendo que
o funcional escalar ( ) ( ) { }
r
xyz
a
xyz
T
r
xyz
a
xyz
w w S w w E seja mnimo para todas as matrizes quadradas S ,
resultando nas equaes de anlise (Cohn, da Silva, Guo, Sienkiewicz e Lamich, 1998):
Aqui a matriz K , chamada matriz de ganho, geralmente no quadrada. A matriz de ganho K
depende da matriz de covarincia do erro previsto (ou erro no chute inicial)
{ } ( ) { } ( ) { } ( ) 7
T
f f f f f
e E e e E e E P
e da matriz de covarincia de erro de observao
{ } ( ) { } ( ) { } ( ) 8
T
o o o o
e E e e E e E R

que suposta diagonal, equivalente a supor os erros espaciais de observao estatisticamente
independentes.
O algoritmo PSAS resolve as equaes de anlise resolvendo primeiro para
y
a equao
( ) ( ) 9
f o T f
Hw w y R H HP +
e depois o estado analisado obtido da equao
( ) 10 y H P w w
T f f a
+
Portanto necessrio calcular (ou estimar) a matriz
f
P
. J que, na prtica, o valor verdadeiro do
estado da atmosfera inacessvel, estima-se a matriz usando-se uma verso dos resduos
observado-menos-previstos definidos em (Dee e da Silva,1999)
( ) ( ) 11
f o f o
w w H Hw w H e
+ +
onde
+
H
operador interpolador linear que executa a funo inversa de H . Estima-se portanto
f
P
usando
{ } ( ) { } ( ) { } ( ) 12
T f
e E e e E e E P P
O outro problema o tempo de computador necessrio para calcular o produto na equao. Note
que como o vetor
[ ] ( ) 13
1
T
L
u i
e e e

( ) ( ) 6
f
xyz
o f
xyz
a
xyz
Hw w K w w +
( ) ( ) 5 R H HP H P K
T f T f
+
(onde i o ndice do ponto de grade) contm os resduos das L variveis meteorolgicas (p. ex.
vento zonal
u
e altura geopotencial

) ento a matriz P tem estrutura


O nmero de multiplicaes envolvido no clculo de P portanto
No PSAS global no Centro de Previso do Tempo e Estudos Climticos (CPTEC-INPE) se est
usando
( )
6
10 L N N N O
z y x
(como em outros centros de previso de tempo), e a idia futura
ir alm. A ordem de grandeza do nmero de multiplicaes dever ento ser
[ ] ( ) ( ) 16 10
12 2
L N N N O
z y x
que nmero formidvel, significando no mximo s
9
10 2 . 7

para cada multiplicao, sem contar
o resto das computaes do ciclo de assimilao de dados. interessante adotar mtodos para
reduzir o nmero de operaes envolvidas no clculo.
Uma maneira de fazer isto estimando a matriz usando nmero pequeno de parmetros atravs
de estimao de verossimilhana mxima e a forma original dos os resduos observado-menos-
previstos j citados (Dee e da Silva,1999)
( ) 17
f o
Hw w v
A idia deles supor inicialmente que a matriz P pode ser escrita
ou seja, a covarincia vertical separvel da covarincia horizontal, sendo o fator

normalizado.
Em seguida eles supem que

homogneo, ou seja, em nosso caso


( ) ( ) ( ) 19 , , , ,
n m l k n m l k
y y x x y y x x
,
o que resulta na estrutura
( ) ( ) 15
2
L N N N
z y x

( ) 14
2 1
2 2 2 1 2
1 2 1 1 1
1
1
1
1
1
]
1

z y x z y x z y x z y x
z y x
z y x
N N N N N N N N N N N N
N N N
N N N
e e e e e e
e e e e e e
e e e e e e
P

( ) ( ) ( ) ( ) 18 , , , , , , , , ,
n m l k j i n m l k j i
y y x x z z s y y x x z z P
com
Isto facilita a parametrizao estatstica de

ao permitir o uso de leis de potncia ou polinmios


(ou ainda composies destes) e consequentemente a estimativa de P . Alm disso possibilita usar
mdias espaciais no clculo, uma necessidade prtica.
Neste trabalho usaram-se parte destas idias e tambm foi necessrio estimar P enfrentando
problema de falha nos dados disponveis. A invs de usar o mtodo da mxima verossimilhana
global usou-se o mtodo de ajuste de parametrizaes por minimizao do quadrado dos erros
locais (de

nas direes
x
e
y
em cada nvel de presso
z
, da varincia ( ) ) , (
2
z z s z ao longo
do eixo vertical
z
). Esta metodologia e os dados usados sero explicados em seguida na seo 2
onde tambm se mostraro os resultados. Na seo 3 apresentam-se as concluses.
2. DESENVOLVIMENTO E RESULTADOS
O modelo de covarincia adotado foi
A covarincia vertical deveria ser calculada usando-se
O operador { } E requer a disponibilidade de um conjunto de realizaes do produto em. No CPTEC
no se dispunha deste conjunto, por isso usou-se conjunto de arquivos contendo a diferena entre o
estado da atmosfera previsto pelo modelo meteorolgico Eta e o estado observado da atmosfera,
um arquivo para cada horrio de previso. Os arquivos, no total de 91, continham dados relativos
( ) 20
, 2 , 1 ,
, 2
2
22 21
, 1 12 11
1
1
1
1
1
]
1




z y x z y x z y x z y x
z y x
z y x
N N N N N N N N N N N N
N N N
N N N
s s s
s s
s s s
P

( ) ( )
( ) ( )
( ) 21
, 0 ,
, 0 0 , 0
1
1 1 1
1
1
1
]
1

'

1
1
1
]
1

y x x
y
y x y x y x
y x
N N N
N
N N N N N N
N N
e e e e
e e e e
E



( ) ( ) ( ) ( ) 22 , , , , , y x z z s y x z z P
j i j i

( ) ( ) ( ) { } [ ] ( ) ( ) { } [ ] { } ( ) 23 ,
j xy j xy i xy i xy j i
z e E z e z e E z e E z z s
aos horarios 0 h, 6 h, 12 h e 18h, de 12 de abril a 6 de maio de 2003. Chamados arquivos
Observao-Menos-Previso (OMP) (em ingls Observed-Minus-Forecast ou OMF), estes
arquivos continham cada um a diferena entre o valor medido em cada ponto de grade
tridimensional de cada uma das variveis de interesse e o seu respectivo valor previsto naquele
ponto. Cabe salientar que, na verdade, a grade de observao diferente da grade do modelo Eta. A
primeira no-estruturada, isto , seus pontos esto irregularmente espaados no domnio
horizontal e vertical. Seus pontos variam inclusive ao longo do tempo. J a segunda espacialmente
e temporalmente uniforme, geralmente contendo mais pontos que a primeira. Portanto h um passo
intermedirio de interpolao da observao para a grade da previso para se poder computar a
diferena, passo este realizado por uma subrotina computacional apropriada.
O uso da mdia temporal (ou espacial) para calcular a mdia do conjunto de realizaes do erro
de mdia nula no apresenta nenhum problema do ponto de vista terico, conforme pode ser visto
em Papoulis (1991). J o clculo da covarincia pela mdia temporal (ou espacial) supe que o sinal
seja ergdico temporal (espacial) de covarincia. Esta hiptese tipicamente adotada tanto em
processamento estatstico de sinais quanto em meteorologia (Dee e da Silva, 1999). Em particular,
se os erros forem gaussianos de mdia nula, a ergodicidade temporal (ou espacial) de covarincia de
um processo estocstico ( ) t e (ou ( ) x e ) garantida se a covarincia decair em funo do tempo (ou
espao), isto ,
( ) 0

t
t P
(ou
( ) 0

x
x P
).
Ento a covarincia vertical foi estimada calculando-se primeiramente a mdia temporal
em seguida a covarincia vertical em cada ponto horizontal da grade
e finalmente
( ) ( ) ( ) 24
1


T
xyt xy xy
e
T
z e z e
( ) ( ) ( ) [ ] ( ) ( ) [ ] { } ( ) 25
1
,


T
T
j xy j xyt i xy i xyt j i xy
z e z e z e z e
T
z z s
( ) ( ) ( ) 26 ,
1
,

xy
j i xy
y x
j i
z z s
N N
z z s
No campo de cada dado disponvel nos arquivos havia informaes indicativas de sua qualidade.
Todos os clculos foram feitos em programao FORTRAN 90. Neste trabalho usaram-se dados das
variveis vento zonal, vento meridional, altura geopotencial, umidade e presso da superfcie do
mar (Surface Level Pressure ou SLP). Nem todos os dados estavam qualificados.
Para a maioria das variveis normalizou-se
( )
j i
z z s ,
e consideraram-se invlidas as varincias
( ) ( )
i i i
z z s z ,
2
menores que
% 10
do valor mximo da varincia
2
max
. Ento estimou-se a
varincia por ajuste de erro quadrtico mnimo do polinmio
( ) ( ) ( )

m
i
i
i
m z a z
0
27 /
onde
m
o nmero de dados vlidos. Com isto se obteve a energia do erro de cada varivel em
cada nvel de presso. Para recuperar a covarincia vertical ( ) z z s , ' reverteu-se a operao ( ) z z s , '
usando-se a parametrizao de covarincia de Lnnberg e Hollingsworth (1986)
( ) ( ) ( ) ( ) ( ) 28 ln ' ln exp , '
b
z
z z z z s
onde ( ) ln o logaritmo natural, 6 . 1 b e

foi determinado por minimizao de erro quadrtico


descartando covarincias com amplitude menor que
6
10

. No caso da varivel SLP (que s existe


para
mb z 1000
) s existe varincia e portanto o desvio padro calculado foi.
Os resultados para cada uma das demais variveis podem ser vistos na figura 1, mostrando o desvio
padro (em funo de
z
) dos erros de vento zonal, vento meridional, altura geopotencial e umidade
especfica, respectivamente. A linha tracejada mostra o clculo bruto de ( ) z e a linha cheia sua
estimativa ( ) z
. Os dados de erro de vento zonal foram os nicos com qualidade suficiente para
dispensar a estimativa polinomial.
Para estimar a covarincia horizontal normalizada calculou-se primeiro, em cada nvel
z
, e para
( ). 29 163
Figura 1: desvio padro em funo do nvel de presso
z
dos erros de a) vento zonal, b) vento
meridional, c)altura geopotencial, e d) umidade especfica.
cada instante de tempo
t
, usando a hiptese de ergodicidade espacial da covarincia
depois
e em seguida
( ) ( ) ( ) [ ] ( ) ( ) [ ] ( ) 30 , , , ,
1
,
,

+ + + +


y x
zt zt zt zt
y x
zt
y x e y x e y y x x e y y x x e
N N
y x
( ) ( ) ( ) [ ] ( ) ( ) [ ] ( ) 31 , , , ,
1
,

+ + + +
t
zt zt zt zt z
y x e y x e y y x x e y y x x e
T
y x
( )
( )
( )
( ) 32
0 , 0
, 1
,



z z
z
z
y x
N
y x

Finalmente, para parametrizar e corrigir

, usou-se idia semelhante de Purser et al (2003). Em


cada nvel
z
ajustou-se por minimizao do erro quadrtico as correlaes s parametrizaes
para cada linha de
y
e
para cada linha de x . Novamente descartaram-se correlaes menores que
6
10

. A correlao
total obtida multiplicando-se em cada ponto ( ) y x ,
Resultados podem ser parcialmente vistos nas figuras 2 e 3 a seguir. O eixo
x
corresponde
direo oeste para leste e o eixo
y
direo norte para sul. As amplitudes so mximas na origem
tanto nas correlaes brutas quanto nas parametrizadas, portanto a estimativa estatisticamente
consistente. As correlaes estimadas (parametrizadas) decaem mais devagar porque as falhas nos
dados no clculo das correlaes brutas diminuem a energia do erro, ou seja, subestimam o
erro. Correlao subestimada pode ser perigosa ao esconder a verdadeira incerteza na Previso
Numrica do Tempo.
Finalmente, note-se que este mtodo permite grande reduo no nmero de multiplicaes
necessrios para calcular P . Primeiramente, ao obter-se ( ) z , se for suposto
( ) 0 ,
j i
z z s
para
j i
(os erros verticais so considerados independentes), a matriz de covarincia ser
( ) 36
0 0
0 0
0 0
2
1
1
1
1
1
1
]
1




z
N
P

reduzindo-se o total de multiplicaes (veja inequao (16)) para


Alm disso, sendo

homognea poder ser calculada usando-se o algoritmo da Transformada


Rpida de Fourier (Fast Fourier Transform- FFT) (Oppenheim e Schafer, 1975), reduzindo-se
ainda o total de multiplicaes (veja inequao (37)) em duas ordens de grandeza para ento
( ) ( ) ( ) ( ) 33 exp x x
y y



( ) ( ) ( ) ( ) 34 exp y y
x x



( ) ( ) ( ) ( ) 35 , y x y x
y x

[ ][ ] ( ) ( ) 37 10 log log
11
L N N N N N O
z y y x x
[ ][ ][ ] ( ) ( ) 38 10 log log
9 2
L N N N N N O
z y y x x
Figura 2: covarincias horizontais brutas (e, g, i) e parametrizadas (f, h, j) de erro de vento zonal
(e e f), vento meridional (g e h) e altura geopotencial (i e j).
Figura 3: correlaes horizontais brutas (k, m) e parametrizadas (l, n) de erro de umidade
especfica (k e l) e presso de superfcie do mar SLP (m e n).
3. CONCLUSES
Mostrou-se aqui o mtodo usado para calcular a matriz de covarincia de erro previsto ( ou
background ) a ser usada no sistema de assimilao de dados PSAS (Physical-Space Analysis
System Sistema de Anlise em espao Fsico) em implementao no Centro de Previso do
Tempo e Estudos Climticos (CPTEC-INPE). Ele baseado em modelos paramtricos de
covarincia que concentram a energia do erro no fator covarincia no-homognea vertical e cujo
fator correlao horizontal homognea por isto normalizado. O mtodo foi testado em dados
disponveis gerados pela verso regional do PSAS com o modelo Eta. Os dados apresentavam
bastante falhas que no atrapalharam o mtodo devido s propriedades do modelo. Os resultados
mostraram que a covarincia obtida estatisticamente consistente e mais realista que a covarincia
bruta calculada sem a parametrizao. Alm disso permite reduo em trs ordens de grandeza do
total de tempo de computao da matriz. Este mtodo ser futuramente usado no clculo da
covarincia do PSAS global.
4. AGRADECIMENTOS
O autor agradece colega de trabalho Elizabeth Espinoza Silvestre pelos arquivos OMP
(OMF) fornecidos que tornaram possvel este trabalho. Agradece tambm a ela, Rosngela Cintra,
Dirceu Herdies (tambm colegas de trabalho) e Haroldo Fraga de Campos Velho (do LAC-INPE)
pelos comentrios feitos durante a realizao do trabalho e redao deste artigo.
5. BIBLIOGRAFIA
Cohn, S. A; da Silva, A.; Guo, J.; Sienkiewicz, M; Lamich, D. Assessing the Effects of Data
Selection with the DAO Physical-space Statistical Analysis System, Monthly Weather Review,
vol. 126, 11, 1999, p. 2913-2926.
Daley, R. Atmospheric Data Analysis, Cambridge University Press, New York, E. U. A., 1991.
Dee, D.; da Silva, A. M. Maximum-Likelihood Estimation of Forecast and Observation Error
Covariance Parameters. Part I: Methodology, Monthly Weather Review, vol. 127, 1999, p. 1822-
1834.
Kalnay, E. Atmospheric Modelling, Data Assimilation and Predictability, Cambridge University
Press, Cambridge, Reino Unido, 2003.
Lnnberg, P; Hollingsworth, A. The Statistical Structure of Short-range Forecast Errors as
Determined from Radiosonde Data. Part II: the covariances of height and wind errors, Tellus, 38A,
1986, p. 137-161.
Oppenheim, A. V.; Schafer, R. W. Digital Signal Processing, Prentice-Hall, Englewood Cliffs,
New Jersey, E. U. A., 1975.
Papoulis, A. Probability, Random Variables, and Stochastic Processes, 3
rd
Edition, McGraw-
Hill, New York, E. U. A., 1991.
Purser, J; Wu, W-S. ; Parrish, D. E. ; Roberts, N. M. Numerical Aspects of the Application of
Recursive Filters to Variational Statistical Analysis. Part I: Spatially Homogeneous and Isotropic
Gaussian Covariances, Monthly Weather Review, vol. 131, 2003, p. 1524-1535.

You might also like