You are on page 1of 142

CAPTULO 1

INTRODUO GERAL

1
1. Introduo geral

A qumica analtica encontra-se em uma fase muito peculiar de seu


desenvolvimento. Existem mtodos bem estabelecidos, precisos e eficientes
para a determinao qualitativa ou quantitativa de quase todos os compostos
inorgnicos e para boa parte dos compostos orgnicos. Infelizmente, a
grande maioria destes mtodos so dispendiosos, envolvem vrias etapas e,
principalmente, geram quantidades razoveis de resduos extremamente
poluentes e agressivos ao meio ambiente. Alm disso, tais mtodos
incentivam uma ampla gama de indstrias de reagentes qumicos que, em
geral, ainda utilizam processos altamente poluentes, fechando um ciclo
vicioso que, a longo prazo, pode causar danos irreversveis ao meio
ambiente. Assim sendo, um dos grandes desafios da pesquisa em qumica
analtica o desenvolvimento de mtodos de anlises in situ que no
necessitem de pr-tratamento de amostras, que sejam rpidos, no
destrutivos, robustos e que no poluam o meio ambiente.
Uma tcnica espectroscpica que preenche todos os pr-requisitos
anteriores para um grande nmero de substncias, em diferentes tipos de
matrizes (por exemplo: alimentos, frmacos e plsticos), a espectrocopia
de reflectncia difusa no infravermelho prximo1.
A espectroscopia de reflectncia difusa no infravermelho prximo
permite analisar quantitativamente um grande nmero de substncias em
diferentes tipos de matrizes(2-9), sem a necessidade da abertura qumica da
amostra, reduzindo o consumo de reagentes, o tempo de anlise e
possibilitando anlises in situ10. Estas vantagens conferem tcnica,
caractersticas particularmente teis anlises de rotina e controle on line de
processos industriais(11-12).

2
Aplicaes analticas(13-14) do infravermelho prximo vem sendo
exploradas desde o incio da dcada de cinquenta mas, devido s dificuldades
instrumentais, a sua aplicao como tcnica quantitativa s teve incio trinta
anos mais tarde, com o desenvolvimento e uso generalizado de
microcomputadores. Graas ao interfaceamento entre equipamentos e
microcomputadores, tornou-se simples obter e armazenar grandes
quantidades de dados, de modo rpido e eficiente.
Uma vez superadas as dificuldades para a obteno dos espectros de
reflectncia difusa no infravermelho prximo, o passo seguinte foi obter
informaes quantitativas destes espectros. Nesta fase observou-se que
medidas de reflectncia difusa no infravermelho prximo podem ser
relacionadas concentrao de uma ou mais substncias presentes na
amostra, mas no de uma maneira direta, dificultando ou impossibilitando a
aplicao de procedimentos clssicos de calibrao univariada.
Atualmente, com o desenvovimento da quimiometria, o que se faz
medir a reflectncia em um grande nmero de comprimentos de onda, e
utilizar um mtodo de calibrao multivariada15 para estabelecer a relao
entre a reflectncia difusa e concentrao, ou outra propriedade de interesse.
Dentre tais mtodos destacam-se os no-lineares de calibrao
multivariada16 e mais recentemente as redes neurais17 e as redes neurais com
apodizao18.

3
CAPTULO 2

A ESPECTROSCOPIA DE REFLECTNCIA
DIFUSA NO INFRAVERMELHO
PRXIMO ( NIRR ).

2. Espectroscopia de reflectncia difusa no infravermelho


prximo ( NIRR ).
4
A origem do espectro no infravermelho prximo19

O infravermelho prximo20 (NIR) a regio do espectro


eletromagntico situada entre 800 nm e 2500 nm. Quando uma molcula
absorve energia nesta regio, observam-se transies do estado fundamental
para o segundo e terceiro estados excitados, gerando as bandas de sobreton21
(overtone). Uma vez que poucas molculas atingem os estados excitados,
relativos ao primeiro e segundo sobreton, a intensidade de tais bandas so
muito menores do que a intensidade da transio do estado fundamental para
o primeiro estado excitado, observadas no infravermelho mdio22.
Transies superiores so possveis mas, como o nmero de molculas
que executam esta transio muito pequeno, as bandas relativas a estas
transies so muito pouco intensas e, portanto, possuem pouco significado
prtico.
A absoro de radiao no infravermelho prximo por substncias de
origem animal e vegetal23 pode ser atribuida, fundamentalmente, pequena
massa do tomo de hidrognio. tomos de hidrognio ligados
covalentemente a tomos mais pesados e eletronegativos ( O, N, C, etc )
formam dipolos oscilantes anarmnicos que absorvem energia em regies de
alta frequncia, isto , na regio do infravermelho prximo. Devido
anarmonicidade24 existente na vibrao da ligao entre tomos de
hidrognio e tomos mais pesados, as bandas de sobreton no ocorrero em
submultiplos inteiros ( 1/2, 1/3 ) do comprimento de onda da transio24
fundamental, mas prximas aos submultiplos (no inteiros) desta transio.
A maioria das oscilaes fundamentais das ligaes dos tomos de
hidrognio situam-se na faixa de 2700 a 3600 nm. A maioria das bandas de
sobreton so encontradas entre 400 e 2200 nm. As vibraes fundamentais
5
podem combinar-se e gerar as bandas de combinao. A regio entre 1800 e
2500 nm ocupada pelas bandas de combinao24.
Toda matria de origem animal e vegetal composta, basicamente, de
protenas, amido, acares, lipdios, celulose etc. Uma vez que todos estes
contituintes possuem grupos funcionais (osciladores) em que os tomos de
hidrognio encontram-se ligados a tomos mais pesados (C, N,O ), todos so
candidatos apresentarem absoro no infravermelho prximo. Os
osciladores mais comuns24 (dentre outros) so: -OH, -NH-, etc.
Como veremos no prximo tem desta introduo, a espectroscopia de
reflectncia difusa no infravermelho prximo um mtodo capaz de fornecer
informaes quantitativas a respeito da composio da amostra e portanto,
torna-se uma ferramenta analtica muito til para anlise de protenas, amido,
nitrognio, celulose, nitrognio, etc.

A Reflectncia Difusa1, 25

Quando uma superfcie rugosa ou particulada, como um p por


exemplo, irradiada com radiao NIR, uma parte da radiao incidente
refletida diretamente pela superfcie. A este tipo de reflexo d-se o nome de
reflectncia especular. definio resumida, ora tecida sobre a reflectncia
especular, devemos acrescentar que a reflexo no impede que as partculas
da superfcie, simultaneamente, absorvam a radiao NIR. Em verdade, alm
da reflexo e absoro, tambm possvel que ocorra, simultaneamente,
dependendo do ndce de refrao da partcula, a refrao e a difrao da
radiao NIR incidente.
A natureza da radiao refletida depende da natureza do feixe
incidente e das propriedades pticas da superfcie em questo. Tal
dependncia, em relao as propriedades pticas da superfcie pode ser
utilizada na caracterizao de certos materiais entretanto, a aplicao da
6
reflectncia especular para fins quantitativos, na maioria dos casos, ainda
pouco explorada, dado que no processo de reflectncia especular a radiao
incidente interage com um pequeno nmero de molculas da superfcie e,
portanto, o feixe refletido praticamente no atenuado, possuindo quase a
mesma intensidade da radiao incidente e para todos efeitos prticos, no
fornece informaes quantitativas sobre a amostra.
Uma outra parte da radiao incidente penetra na superfcie da amostra
e a reflexo ocorre logo abaixo da superfcie (alguns milmetros), isto ,
dentro da amostra. Uma vez que as partculas do interior da amostra
apresentam-se com suas faces, estatisticamente distribuidas sob todos os
possveis ngulos, a radiao refletida no interior da amostra seguir a
mesma distribuio. Dado que as partculas em questo encontram-se no
interior da amostra, a radiao refletida por uma partcula poder ser
novamente refletida por uma partcula vizinha e assim por diante, at que a
radiao, por algum caminho estatisticamente provvel, consiga retornar
atravs da superfcie e deixar a amostra. Este tipo de reflexo, que ocorre
abaixo da superfcie, chamada de reflectncia difusa. A associao entre
reflectncia especular e reflectncia difusa, d origem ao que se chama,
genericamente, de espalhamento de luz. Um exemplo familiar deste
fenmeno o espalhamento da luz solar, pelas molculas da atmosfera
terrestre. Se esta no existisse, o cu diurno pareceria negro, exceto na
direo do Sol.
Na reflectncia difusa, a radiao incidente entra em contacto milhares
de vezes com as partculas da amostra e portanto, severamente atenuada
(perde energia), logo a radiao que deixa a amostra poder fornecer
informaes qualitativas e quantitativas, sobre a amostra. O processo de
reflectncia difusa pode ser visualizado na Figura 2.1.

7
Figura 2.1. Representao esquemtica da reflectncia difusa

Naturalmente, existiro alguns caminhos, tambm estatisticamente


provveis, pelos quais a radiao no retornar pela superfcie mas, ser
absorvida ou at mesmo atravessar as paredes do porta amostra, conforme
representado na Figura 2.1.
A espectroscopia de reflectncia difusa no infravermelho prximo
(NIRR) permite analisar qualitativa e quantitativamente vrios tipos de
amostras slidas, neste caso folhas modas de trigo, milho e algodo, sem
necessidade de abertura qumica da amostra. Devido a esta caracterstica,
o consumo de reagentes e tempo de anlise so bastante reduzidos.
Entretanto, para que a espectroscopia NIRR possa adquirir finalidades
quantitativas necessrio estabelecer uma relao matemtica entre a
intensidade da radiao espalhada ou que sofreu reflectncia difusa, e a
concentrao da substncia de interesse presente na amostra. Existem,
basicamente, duas maneiras de estabelecer-se tal relao: a primeira delas
a teoria de Kubelka-Munk e a segunda uma adaptao da lei Beer para a
reflectncia difusa. Comeemos com a primeira.

A Teoria de Kubelka - Munk: Mtodo das equaes diferenciais 1, 25

8
A teoria fenomenolgica desenvolvida por Kubelka e Munk em 1931,
assume que a radiao que incide sobre uma superfcie rugosa ou particulada
(um p por exemplo), pode ser dividida em dois fluxos. Um fluxo I que
representa a radiao que penetra e absorvida pela amostra, na direo do
feixe incidente, e um fluxo J que retorna da amostra, devido reflectncia
difusa, conforme representado na Figura 2.2.

I0
x=0

dx

I J
x=d

Figura 2.2. Representao grfica dos fluxos envolvidos no modelo de Kubelka - Munk.
I0 a intensidade da radiao incidente, I a frao absorvida e J frao que sofreu
reflectncia difusa.

Uma equao diferencial pode ser facilmente escrita para a variao (


dI ) da intensidade do feixe incidente medida que este atravessa um
elemento diferencial dx , da referida superfcie (Fig. 2.2). A intensidade da
radiao absorvida ou atenuao do feixe incidente pode ser escrita como
sendo linearmente proporcional intensidade do feixe incidente e
espessura do elemento dx , como segue:

dI = K I dx eq.2.1

O feixe incidente I, tambm ser atenuado por perdas devidas refrao,


difrao e reflexo, isto , perdas devidas reflectncia difusa. A atenuao

9
do feixe incidente devido reflectncia difusa pode ser descrita pela equao
2.2, como segue:

dI = S I dx eq.2.2

em que S a constante relativa s perdas por espalhamento. Combinando as


equaes 2.1 e 2.2, temos a atenuao total do feixe incidente, como segue:

dI = K I dx S I dx eq.2.3

Para encerrarmos a deduo das equaes da teoria de Kubelka e


Munk, devemos ainda levar em considerao que a radiao do feixe I que
foi espalhada, aumenta a intensidade do feixe J e vice versa. Assim sendo, a
equao 2.3, que descreve a atenuao total no feixe I, torna-se:

dI = ( K + S ) I dx + S J dx eq2.4

Aplicando o mesmo raciocnio anterior podemos obter a equao que


descreve o fluxo de reflectncia difusa (J), como segue:

dJ = ( K + S ) J dx S I dx eq2.5

As equaes 2.4 e 2.5, formam um conjunto de equaes diferenciais


ordinrias acopladas, as quais podem ser facilmente resolvidas atravs do
mtodo da transformada de Laplace. A transformada de Laplace direta,
transformar as equaes diferenciais em duas equaes algbricas lineares
simultneas. Resolve-se estas equaes algbricas e atravs da transformada
de Laplace inversa, obtm-se a soluo do sistema de equaes diferenciais

10
ordinrias. Obtida a soluo, basta aplicar as seguintes condies de
contorno:

quando: x=0 I = I0

esta condio reflete o fato de que, na superfcie no h atenuao do feixe,


o que naturalmente uma aproximao questionvel mas, necessria
soluo do sistema.

A segunda condio a seguinte:

quando: x=d j=0

Esta condio representa o fato, ou melhor, a aproximao de que nas


superfcies internas do porta amostra no h fluxos relativos a espalhamento.
Aplicando as condies de contorno soluo previamente obtida
para o sistema, finalmente obtemos as equaes que descrevem os fluxos I e
J, como segue:

I x =d 4
T= = eq2.6
I0 (1 + ) e (1 ) 2 e d
2 d

RD =
J x=d
=
(1 2 ) ( e d e d )
eq2.7
I0 (1 + 2 ) e d (1 ) 2 e d

em que:

11
= ( K( K + 2 S )) eq.2.8

=
K
eq.2.9
K + 2S

A interpretao fsico-qumica para os fluxos I e J, pode ser feita se


considerarmos os limites do modelo desenvolvido por Kubelka e Munk.

Interpretao do fluxo I (transmitncia) :

Analisemos o que ocorre com a transmitncia, quando as perdas por


espalhamento tendem a zero:
lim T = e K d
s 0

portanto, no limite quando S tende a zero, isto , quando no h espalhamento


de luz, a expresso para T, torna-se :

T = e K d eq.2.10

A semelhana da eq2.10 com a lei de Beer bvia, o que nos leva escrever:
K = C eq.2.11
Assim, K pode ser interpretado, princpio, como o produto C , da lei de
Beer. Entretanto, as coisas no so to simples assim, pois na lei de Beer as
absores ocorrem, exclusivamente, na mesma direo do feixe incidente e
na teoria de Kubelka-Munk, podem existir absores de feixes refletidos por
partculas vizinhas, aumentando o caminho ptico, conforme descrevemos

12
no incio deste tem. Tais fatos permitem absores em direes diferentes
quela do feixe incidente e portanto a analogia feita com lei de Beer, no
absolutamente vlida. Algumas correes podem ser feitas para incorporar
tal diferena. possvel demonstrar que se existe uma distribuio isotrpica
dos feixes incidentes, o caminho mdio percorrido pela luz ,
aproximadamente, duas vezes o caminho percorrido na direo do feixe
incidente e podemos escrever:

K =2 C eq2.12
A anlise do efeito do espalhamento de luz na transmitncia (eq2.6),
derivada na teoria de Kubelka e Munk, pode ser simplificada, se
observarmos a Figura 2.3.

Figura 2.3. Superfcie relativa ao comportamento da transmitncia em funo do


espalhamento e da absoro, derivada da teoria de Kubelka e Munk.

Na superfcie representada na Figura 2.3, podemos observar que medida


que o espalhamento de luz tende a zero, a variao na transmitncia se
13
aproxima variao exponencial, prevista pela lei de Beer. Alm disso,
tambm possivel observar que, a espalhamentos elevados, a transmitncia
sempre baixa, indicando que pouca, ou nenhuma radiao, atravessa a
amostra.

Interpretao do fluxo J (Reflectncia) :


A interpretao direta do fluxo J complexa e polmica, pois este
depende da interao simultnea de vrios fatores relativos ao espalhamento
da radiao. Entretanto, uma anlise menos ambiciosa indica que a
intensidade deste fluxo inversamente relacionada, fundamentalmente, ao
tamanho das partculas pois, medida que diminuimos a granulometria de
um material, aumentamos a intensidade da luz espalhada. Isto ocorre pois,
ao diminuirmos a granulometria aumentamos o nmero de superfcies
capazes de refletir, absorver, difratar e refratar a luz incidente e, portanto,
aumentamos a intensidade do espalhamento de luz. Um exemplo familiar
deste fato a cor branca do sal de cozinha, que na forma de grandes cristais
transparente e torna-se branco devido ao processo de moagem, em que se
reduz a granulometria.
A interpretao da reflectncia difusa ( R D ) descrita na teoria de
Kubelka e Munk (eq.2.7), pode ser simplificada se analisarmos a Figura 2.4.

14
Figura 2.4. Superfcie relativa ao comportamento da Reflectncia difusa (Rd) em funo
do espalhamento e da absoro, derivada da teoria de Kubelka e Munk.

Na Figura 2.4 podemos observar que a intensidade da reflectncia


difusa ( RD ) aumenta medida que aumenta o espalhamento e diminui
medida que aumenta a absoro. Uma vez que o espalhamento de luz
inversamente proporcional granulometria, se desejarmos aumentar a
intensidade de medidas de reflectncia, devemos reduzir a granulometria.
O fato de medidas de reflectncia difusa serem mais intensas para
amostras com menor granulometria representa, em algumas situaes, uma
sria limitao ao seu uso para finalidades analticas quantitativas, pois
amostras com a mesma concentrao da substncia de interesse, podem
possuir espectros de reflectncia difusa no infravermelho prximo, com
intensidades diferentes, impossibilitando procedimentos de calibrao. Uma
maneira experimental de contornar este problema a padronizao da
granulometria das amostras, o que representa um procedimento experimental
de razovel complexidade, pois envolveria diversas operaes de peneirao
15
e subsequentes medidas da distribuio do tamanho de partcula. Entretanto,
existem atualmente alguns mtodos matemticos que nos permitem eliminar
ou reduzir significativamente, os efeitos relativos ao espalhamento luz
devido granulometria, conforme veremos mais adiante no texto.
A teoria de Kubelka e Munk pode apresentar uma soluo
extremamente simples para o fluxo J, isto , para a reflectncia difusa, nos
casos em que a amostra espessa o suficiente para evitar que a radiao
incidente a atravesse completamente. Nestes casos a equao que descreve a
reflectncia pode ser escrita como:

1
R= eq.2.13
1+

em que dado pela eq.2.9. Com algumas manipulaes matemticas,


tediosas, possvel rescrever a eq.2.13, como segue:

f ( R) =
(1 R)
2

=
K
eq.2.14
2R S

uma vez que (eq.2.11):

K C

obtemos:


f ( R) = C eq.2.15
S

16
em que, a funo f ( R ) geralmente chamada de funo K-M.
Experimentalmente observado que o fator S dependente do
comprimento de onda mas, felizmente a dependncia observada muito
pequena ou praticamente nula para a maioria dos casos. Assim sendo, a
variao da reflectncia com o comprimento de onda deve possuir as mesmas
caractersticas de um espectro de transmitncia, dado que ambos so
relacionados por uma constante multiplicativa: o fator S. luz da discusso
anterior, podemos deduzir que, analogamente ao que ocorre com espectros
de absoro, a concentrao de espcies absorventes pode ser relacionada
funo K-M, como segue:

f ( R) C

Em ltima anlise, a relao anterior que, segundo a teoria de


Kubelka e Munk, permite utilizar a espectroscopia de reflectncia difusa no
infravermelho prximo para finalidades analticas quantitativas.
A grande dificuldade encontrada na aplicao da teoria de Kubelka e
Munk em anlises quantitativas a obteno de padres de referncia com
100% de reflectncia, isto , um material de referncia essencialmente no
absorvente. A utilizao de padres com reflectncia inferior resultar em
funes K-M com valores negativos para regies espectrais onde a absoro
for baixa.
Durante muitos anos o padro primrio para a reflectncia difusa foi o
xido de magnsio finamente particulado. Superfcies preparadas com MgO
tendem a ser frgeis e a deteriorar-se com tempo. Assim, a utilizao de
padres secundrios tornou-se comun, ainda que estes apresentem
reflectncia inferior do MgO. Os materiais utilizados como padres

17
secundrios, mais comuns, so: NaF, NaCl, MgSO4 , Li2CO3 , SiO2 , Al2O3
, BaSO4 e Teflon finamente particulado.
Conforme pudemos observar, a teoria de Kubelka e Munk um
excelente exerccio para compreenso dos fenmenos envolvidos em
medidas de reflectncia difusa e de fundamental importncia no projeto de
novos mtodos de anlises quantitativas fundamentados na espectroscopia
de reflectncia no infravermelho prximo. Entretanto, a aplicao prtica da
funo K-M limitada pela dificuldade de obteno de padres com 100%
de reflectncia, estveis no tempo.

Adaptao da lei de Beer reflectncia difusa: O mtodo emprico1,25

Neste mtodo o que se faz associar diretamente a absorbncia


descrita na lei de Beer, com a reflectncia difusa para os casos em que a
espessura da amostra suficientemente grande para evitar que a radiao
incidente atravesse-a completamente. A justificativa para tal liberdade
cientfica, a seguinte: a intensidade da radiao incidente convertida em
reflectncia difusa, atenuada nos comprimentos de onda absorvidos pela
amostra, anloga intensidade da radiao atenuada pela amostra em
espectroscopia de transmitncia de solues. Sendo a analogia anterior
verdadeira, podemos escrever:

R
A = Log10 eq.2.15
R0

em que R a porcentagem de reflectncia difusa da amostra e R0 a


porcentagem de reflectncia difusa do padro.

18
Neste mtodo no h a necessidade de que o padro apresente 100%
de reflectncia difusa pois, todas as medidas so feitas em relao ao mesmo
padro e cada aplicao envolve o uso de uma equao nica, empiricamente
derivada. O procedimento para a construo de uma curva de calibrao
usando espectros de reflectncia exatamente igual ao utilizado para
espectros de transmitncia (ou absorbncia).
Naturalmente, a analogia utilizada para a obteno da equao 2.15
uma simplificao da situao fsica, pois associada reflectncia difusa
encontra-se, invariavelmente, a reflectncia especular. Uma consequencia
desta associao a perda da uniformidade do caminho ptico entre as
amostras. O caminho nestes casos passa a ser funo dos seguintes
parmetros: tamanho, forma, orientao das partculas, empacotamento das
partculas na amostra, distribuio de granulometria, etc.
Assim sendo, o caminho ptico torna-se uma varivel extra na
equao 2.15 e, portanto, mesmo nos casos em que s um componente da
amostra absorve radiao em um nico comprimento de onda, sero
necessrias medidas de absobncia em outros comprimentos de onda para
que se possa montar um sistema de equaes algbricas relacionando o
caminho ptico e concentrao, com a absorbncia. Este fato foi durante
alguns anos, um fator limitante ao uso da espectroscopia de reflectncia
difusa no infravermelho prximo em anlises quantitativas.
Atualmente, o que se faz medir a intensidade da reflectncia em um
grande nmero de comprimentos de onda (no espectro de reflectncia difusa
no infravermelho prximo) e utilizar um mtodo de calibrao multivariada
para estabelecer a relao entre reflectncia e concentrao.
Neste ponto encerramos a introduo sobre espectroscopia de
reflectncia difusa no infravermelho prximo. No houve a pretenso de
descrever todos os aspectos tericos mas somente o necessrio

19
compreenso de como esta tcnica foi aplicada, neste trabalho,
determinao de nitrognio em folhas de trigo, milho e algodo.

CAPTULO 3

TCNICAS DE PR-PROCESSAMENTO
DE SINAIS

20
3. Tcnicas de Pr-Processamento de Sinais

3.1 A suavizao e a remoo de rudo instrumental26, 27

Sinais analticos so os dados originais obtidos de processos


analticos. Geralmente os sinais analticos representam a variao de uma
propriedade fsico-qumica, em funo do tempo e/ou espao. Em qumica
analtica, os sinais mais frequentemente encontrados so: espectros,
voltamogramas, registros de um pH-metro em funo do tempo, etc.
Infelizmente, a maioria dos sinais provenientes de instrumentos
analticos apresentam-se contaminados (digamos, misturados) com rudo,
dificultando a interpretao e modelamento das propriedades associadas
estes sinais. Tipicamente, em qumica analtica, o rudo instrumental afeta os
limites de deteco, de deciso e de determinao, os quais so figuras de
mrito extremamente importantes na avaliao do desempenho de
instrumentos e mtodos analticos28.
Uma classificao, simplificada, dos tipos de rudos instrumentais29,30
pode ser estabelecida se levarmos em considerao as frequncias que os
caracterizam. A classificao mais simples a seguinte:
21
Rudo de baixa frequncia.

Rudo de frequncia intermediria.

Rudo de alta frequncia.

O rudo de baixa frequncia caracteriza-se, na prtica, por


deslocamentos, drifts e trends na linha base, de sinais analticos. Este
tipo de rudo pode ser minimizado instrumentalmente, acoplando-se a
frequncia da fonte de sinais com a frequncia usada na deteco, atravs de
um aplificador lock-in. Tambm possvel minimizar rudos de baixa
frequncia atravs de software, para tanto basta eliminar do sinal suas
componentes de baixa frequncia. Entretanto esta possibilidade menos
vivel que a alternativa anterior pois a grande maioria dos sinais analticos
possuem informaes teis na regio de frequncias baixas, as quais seriam
eliminadas conjuntamente com o rudo de baixa frequncia.
Na classe de rudos de frequncia intermediria encontramos
bsicamente o rudo de interferncia. O rudo de interferncia mais comum
o rudo de interferncia da linha de energia energia eltrica, com frequncia
fundamental da ordem de 60 Hz e suas harmnicas. Este tipo de rudo pode
ser removido instrumentalmente, modulando-se a frequncia da fonte de
sinais e a frequncia usada na deteco, longe da faixa de frequncias
associada ao rudo de interferncia. Este tipo de rudo pode tambm, ser
minimizado, com alguma facilidade, atravs de softwares projetados para
esta finalidade. Veremos, claramente, como se faz isto, quando
apresentarmos a teoria do filtro de transformada de Fourier.

22
Na ltima classe (classe dos rudos de alta frequncia), encontramos o
tipo de rudo mais difcil de ser tratado: o rudo branco ou rudo gaussiano.
A caracterstica marcante deste tipo de rudo a inexistncia de uma
frequncia caracterstica, mas uma distribuio de frequncias caractersticas
aleatriamente espalhadas, sobre todas as frequncias que compem o sinal
analtico. Este tipo de rudo origina-se no movimento trmico ou movimento
Browniano dos eltrons em componentes de estado slido, presentes em
instrumentos eletrnicos. Este tipo de rudo torna-se particularmente crtico
em detectores de radiao eletromagntica, tanto que em alguns casos
resfria-se o detector, na tentativa de reduzir este tipo de rudo. Entretanto,
gerar frio , geralmente, algo caro ( proximadamente, cinco vezes mais
caro que gerar calor) e pouco prtico, especialmente para o caso de
detectores. Alm disso, como todos sabemos, impossvel atingir o zero
absoluto ( 0 K ) e, portanto, impossvel eliminar este tipo de rudo ou
mesmo, reduz-lo a nveis tolerveis, em boa parte das situaes prticas.
Entretanto, pode-se minimizar, em alguns casos, este tipo de rudo atravs
de softwares que apliquem filtros de transformada de Wavelet ou filtros de
transformada de Fourier, como descreveremos mais adiante, nesta tese.

3.1.1 A suavizao de rudo instrumental: O filtro de Savitzky-Golay e o


filtro de mdia mvel.

Filtro de mdia mvel31

O filtro de mdia mvel tornou-se, nos ultimos anos, uma ferramenta


de uso comum para a suavizao de rudo em sinais analticos. O motivo para
tal popularidade deve-se sua simplicidade terica e a sua incorporao a
23
diversos softwares comerciais, como por exemplo: Microcal Origin,
Excel, Lotus, etc.
A idia bsica do mtodo dividir o sinal analtico em uma srie de
intervalos com a mesma largura, sequencialmente e ponto ponto, e
substituir o valor do primeiro ponto do intervalo pelo valor mdio do
intervalo. O processo executado na seguinte sequncia:

Define-se a origem do sinal ( x i =1 ).

Define-se o nmero de pontos do intervalo (n).


n
xi
Obtm-se a mdia dos pontos do intervalo: x = i =1

x primeiro ponto do novo sinal: x1novo

repete-se o processo (1 - 4) para x i = 2

Atualiza-se o valor de e repete-se a etapa 5 at todo sinal ter sido


suavizado.

O filtro de mdia mvel simples de entender, fcil de implementar e


de execuo rpida. Entretanto, como nada perfeito, os resultados que este
tipo de filtro produz para sinais com picos estreitos extremamente pobre.
Tipicamente, este tipo de filtro distorce sinais analticos, sendo esta distoro
diretamente proporcional largura do intervalo, como ilustrado para o
fiagrama da Figura 3.1.

24
Original, dez pontos, cinco pontos, trs pontos

x
i

50 100 150 200 250 300 350 400

i
Figura 3.1. Representao do efeito da largura do intervalo usado no filtro de mdia mvel
para a suavizao de rudo em um fiagrama.

O filtro de mdia mvel reduz rudo proporcionalmente largura do


intervalo mas, simultaneamente e proporcionalmente, distorce o sinal
analtico. Assim sendo, a aplicao do filtro de mdia mvel fica redizida a
sinais de banda extremamente larga, em que a largura do intervalo necessrio
a reduo do rudo, no critica.

O filtro de Savitzky-Golay 32, 33

O Filtro de Savitzky-Golay um clssico entre os filtros de suavizao


de sinais analticos e tambm encontra-se incorporado na maioria dos
softwares comerciais para tratamento de dados. A idia bsica do mtodo
de Savitzky-Golay a seguinte:

Defini-se a origem do sinal


25
Define-se a largura do intervalo

define-se o ponto central do intervalo

remove-se o ponto central do conjunto de pontos do intervalo

Ajusta-se atravs do mtodo de mnimos quadrados, um polinmio de


grau varivel aos pontos restantes.

Utiliza-se o polinmio para estimar o valor do ponto removido.

Desloca-se o intervalo para o ponto seguinte do sinal original e repete-se


o processo anterior.

O filtro de Savitzky-Golay menos sensvel largura do intervalo pois


o novo ponto, isto , o ponto do sinal j suavizado, obtido atravs do ajuste
dos pontos do intervalo por um polinmio e no pela simples mdia dos
pontos vizinhos, como ocorre com o filtro de mdia mvel. Esta
caracterstica possibilita que o filtro de Savitzky-Golay seja aplicado a sinais
analticos com picos estreitos, apresentando resultados superiores aos
obtidos com o filtro de mdia mvel. Entretanto, ainda se observa distoro
do sinal medida que o nmero de pontos utilizado no intervalo aumenta,
conforme pode ser observado na Figura 3.2.

26
Original, nove pontos, sete pontos, cinco pontos

xi

Figura 3.2. Representao do efeito da largura do intervalo usado na suavizao de rudo


com o filtro de Savitzky-Golay, em um fiagrama.

Conforme descrevemos, os filtros de suavizao de rudo


instrumental atuam diretamente sobre o sinal analtico e no sobre as
frequncias que compem tal sinal. Esta caracterstica torna os filtros de
suavizao pouco seletivos, isto , incapazes de diferenciar o que sinal do
que rudo e, portanto, no processo de suavizao de rudo uma parte da
informao til contida no sinal simultaneamente removida.
Felizmente, existem filtros que atuam diretamente sobre as
frequncias que compem o sinal, possibilitando a remoo seletiva de rudo.
Estes filtros so conhecidos como filtros de remoo de rudo. Os mais
populares so os filtros baseados em transformada de Fourier e em
transformada de Wavelet, conforme descreveremos no prximo tem desta
introduo.

27
3.1.2 A remoo de rudo instrumental: O filtro de transformada de
Fourier e o filtro de transformada de Wavelet.

O filtro de transformada de Fourier 34 - 37

A idia bsica deste tipo de filtro aplicar-se a transformada de


Fourier direta38 - 40
, dada pela equao 3.1, para que se obtenha o sinal
analtico representado no domnio das frequncias (w ) , ou melhor,
aplicamos a transformada de Fourier direta para obter o espectro de
frequncias F(w), do sinal analtico.

Eq. 3.1

Na equao 3.1, representa o domnio original do sinal analtico e f ( ) o

sinal analtico. Para espectros, representa os comprimentos de onda, para


cromatogramas ou fiagramas, representa a varivel tempo e assim por
diante.
Uma vez obtido o espectro de frequncias do sinal analtico, devemos
cortar as frequncias altas, visto serem estas frequncias, na grande maioria
dos casos, relacionadas ao rudo instrumental.
Finalmente aplicamos a transformada de Fourier inversa, dada pela
equao 3.2 e recuperamos o sinal analtico inicial, livre de rudo.

Eq. 3.2

28
A sequncia de operaes utilizada no processo de remoo de rudo, atravs
da transformada de Fourier, podem ser facilmente entendidas se observarmos
a Figura 3.3.

Transformada de Fourier Espectro de frequncias


Sinal Analtico direta do sinal analtico,
com rudo com as frequncias
do rudo

Corte das frequncias


relativas ao rudo
instrumental

Espectro de frequncias
Sinal Analtico do sinal analtico,
sem rudo Transformada de Fourier sem as frequncias
inversa do rudo

Figura 3.3. Representao esquemtica da sequncia de operaes utilizada na aplicao


do filtro de transformada de Fourier.

Para exemplificarmos a aplicao do filtro de transformada de Fourier


escolhemos um sinal complexo, em que muitas frequncias esto envolvidas.
Este sinal no proveniente de nenhum processo analtico, mas permitir
ilustrar, de modo didtico, alguns aspectos importantes do filtro de
transformada de Fourier. Vejamos o exemplo.

Sinal inicial

29
Figura 3.4. Sinal original, isto , sinal + rudo.

Espectro de frequncias do sinal inicial

No espectro de frequncias pode-se observar claramente que o sinal


formado pela seguintes frequncias caractersticas:

- 5 Hz

-10 Hz

- Frequncias altas, relativas a rudo

30
Figura 3.5. Espectro de frequncias do sinal original.

Corte de frequncias superiores a 10 Hz e retorno ao domnio do tempo.

Nesta etapa devemos cortar frequncias superiores a 10 Hz. Para tanto,


multiplicamos o espectro de frequncias pelo valor 1, at a frequncia 10 Hz,
acima desta frequncia multiplicamos por zero. Efetuado o corte de
frequncias, aplicamos a transformada de Fourier inversa e obtemos o sinal
livre de rudo.

31
Figura 3.6. Sinal livre do rudo.

Uma vez apresentado os conceitos fsicos e o mtodo de


funcionamento do filtro de transformada de Fourier, podemos apresentar a
sua elegante definio matemtica.

O filtro de transformada de Fourier pode ser entendido como a


transformada de Fourier inversa ( 1 ), da transformada de Fourier direta ()
de um sinal f() convolvido com uma funo de apodizao h(). A
transformada de Fourier direta de f() convolvido com h() dada por:

F ( S ) = ( f ( ) h( )) Eq.3.3

32
Uma vez que a transformada de Fourier da convoluo de duas funes o
produto das transformadas, podemos escrever:

F ( S ) = ( f ( )) (h( )) Eq.3.4

No domnio das frequncias a convoluo anterior (Eq. 3.4) se reduz


simples multiplicao das correspondentes transformadas de Fourier, como
segue:

F (S) = F( w ) H( w ) Eq.3.5

em que:

1 se w wcritica ( freq. de corte)


H ( w) =
0 se w > wcritica

aplicando a transformada de Fourier inversa funo F(S)

F( ) = 1 ( F(S )) Eq.3.6

obtemos o sinal f() livre de rudo.


Vale lembrar que o elegante desenvolvimento matemtico absolutamente
idntico ao desenvolvimento didtico, utilizado no incio da descrio do
filtro de transformada de Fourier. A prefncia por um dos dois
desenvolvimentos fica reduzida questes estticas ou a idiossincrasias do
leitor.
33
Enquanto nos filtros de suavizao o fator crtico a largura do
intervalo utilizado na suavizao, nos filtros de transformada de Fourier, o
fator crtico a frequncia de corte. Se o corte de frequncias for efetuado
em uma posio errada, corre-se o risco de eliminar informao til do sinal.
Na Figura 3.7 ilustramos o que ocorreria se, por algum motivo, fosse cortado
do espectro de frequncias da Figura 3.5, todas frequncias acima de 5 Hz e
em seguida fosse aplicada a transformada de Fourier inversa.

Figura 3.7. Sinal distorcido em funo de um corte errado nas frequncias.

Conforme pode ser observado na Figura 3.7, uma escolha errada da


frequncia crtica de corte, produz uma distoro catastrfica no sinal. O
sinal tratado com o filtro de transformada de Fourier, neste caso, no
apresenta nenhuma relao com o sinal original.

34
Felizmente, a escolha da frequncia crtica geralmente uma tarefa
muito simples pois o rudo geralmente apresenta frequncia altas e o sinal
til, frequncias baixas. Na dvida, devemos efetuar o corte bem longe das
frequncia baixas. Neste caso, talvez no estejamos cortando todo o rudo,
mas certamente uma parcela ser eliminada e no corremos o risco de
distorcer o sinal.
O grande problema do filtro de transformada de Fourier certamente
no a escolha da frequncia crtica, mas a sua aplicao a sinais no
estacionrios, isto , sinais cujas frequncias caractersticas variam com
tempo (comprimento de onda para espectros, potencial para voltamogramas,
etc).
Imagine dois sinais completamente diferentes, mas que apresentem
espectros de frequncias idnticos. Por exemplo, um sinal pode ser composto
por duas frequncias combinadas durante todo o intervalo de tempo, um
segundo sinal pode possuir as mesmas duas frequncias entretanto, estas
podem aparecer, no sinal, em tempos diferentes. Os sinais seriam totalmente
diferentes mas seus espectros de frequncia, idnticos. Na Figura 3.8
podemos observar um sinal (sinal 1) com duas frequncias distribudas sobre
todo o sinal. Na Figura 3.9 representamos um segundo sinal (sinal 2)
formado pelas mesmas frequncias do sinal anterior mas divididas em dois
intervalos: no primeira metade do sinal temos somente a frequncia 10 Hz e
na segunda metade a frequncia 20 Hz.

35
Figura 3.8. Sinal com duas frequncias (10Hz e 20Hz), distribudas sobre todo intervalo
de tempo.

Figura 3.9. Neste sinal temos uma frequncia (10 Hz) na primeira metade do sinal e outra
frequncia (20 Hz) na segunda metade .

36
Nas Figuras 3.10 e 3.11, representamos os espectros de frequncia dos sinais
1 e 2, respectivamente. Observe que os espectros de frequncia dos dois
sinais apresentam, basicamente, as mesmas frequncias caractersticas. Este
fato nos levaria uma interpretao errada dos sinais pois seramos tentados
a pensar que os sinais so, no mnimo, muito parecidos. Entretanto, os sinais
so absolutamente diferentes.
O resultado prtico do fato descrito no pargrafo anterior que se
aplicarmos o filtro de transformada de Fourier a um sinal no estacionrio,
no momento em que aplicarmos a transformada inversa podemos recuperar
um sinal com caractersticas diferentes do sinal inicial.

Figura 3.10. Transformada de Fourier do sinal 1.

37
Figura 3.11. Transformada de Fourier do sinal.

Este fato ocorre porque a transformada de Fourier atua no sinal como


um todo e no sobre segmentos, de modo a discriminar os tempos em que as
frequncias aparecem. A transformada de Fourier atua no sinal todo porque
as funes utilizadas na decomposio do sinal para a obteno do espectro
de frequncias, so funes seno e cosseno que rigor, estendem-se de
menos infinito at mais infinito, isto , a transformada de Fourier utiliza para
a decomposio do sinal, funes que no possuem suporte compacto no
domnio do tempo. Observe novamente a equao utilizada na transformada
de Fourier direta, reescrita abaixo, e o fato da falta de suporte compacto,
tornar-se- bvio.

+ +

f ( ) (cos( w) + i sen( w)) d


1 1
F ( w) = f ( ) e i w d
2 2

Eq. 3.7

38
A soluo para o problema da falta de suporte compacto das funes
seno e cosseno, aplicar a transformada de Fourier a segmentos do sinal e
no diretamente sobre o sinal todo, num procedimento conhecido como
transformada de Fourier de pequenos intervalos31 (STFT, short time Fourier
transform). Quando bem aplicada, a STFT fornece informaes exatas
sobre os tempos em que as frequncias ocorrem. Assim sendo, devemos
utilizar a STFT quando desejarmos aplicar o filtro de transformada de
Fourier a sinais no estacionrios. A nica desvantagem prtica deste
procedimento o aumento do tempo computacional. Matematicamente a
STFT pode ser escrita como segue:

( f ( ) l ( , )) e
1
STFT F ( w) = i w
d Eq.3.8
2
i f

(
Na equao 3.8, o termo l i , f ) representa a largura do intervalo utilizado
na STFT.
Quando aplicamos a STFT para sinais no estacionrios que mudam
suas frequncias em intervalos de tempo muito rpidos, a largura do intervalo
deve ser inversamente proporcional mudana de frequncias do sinal, isto
, quanto mais rapidamente o sinal muda de frequncia, menor deve ser a
largura do intervalo usado na STFT. Neste ponto, nos deparamos com um
problema terico muito interessante, qual seja: at quando possvel reduzir
a largura do intervalo utilizado na STFT, ou melhor, com que exatido, no
domnio do tempo, as frequncias podem ser determinadas em um sinal no
estacionrio ?
A resposta para questo anterior dada pelo princpio da incerteza de
Heisenberg41, 42. O princpio da incerteza de Heisenberg mostra que no

39
possvel conhecer exatamente e simultaneamente, tempo (t) e frequncia (w),
mas somente a seguinte relao entre estas grandezas:
1
w t
4
Este fato, nos leva ao seguinte problema de resoluo: quanto menor o
intervalo de tempo utilizado na STFT, pior a resoluo nas frequncias e
vice-versa.
Assim sendo, a transformada de Fourier nos fornece boa informao
sobre as frequncias de um sinal, mas no fornece informaes exatas sobre
o tempo em que estas frequncias ocorrem. J a STFT nos fornece boa
informao sobre o tempo em que as frequncias ocorrem mas no fornece
informaes exatas sobre as frequncias. As caractersticas dos dois tipos de
transformada de Fourier esto resumidas na Tabela 1.

Tabela 1. Desempenhos da STFT e da transformada de Fourier.


Resoluo
Tempo Frequncia
Transformada de Pobre Boa
Fourier
STFT Boa Pobre
Apesar das dificuldades anteriormente descritas, os filtros de rudo
fundamentados em transformada de Fourier (FT ou STFT) apresentam bons
resultados para a maioria dos sinais encontrados na prtica e so
considerados como tcnica padro, para a remoo de rudo, em diversas
reas da cincia e da engenharia.

O filtro de transformada de Wavelet 43 - 52

40
Com o objetivo de superar os problemas de resoluo apresentados
pela transformada de Fourier e pela transformada de Fourier de pequenos
intervalos (STFT), foi desenvolvida no incio da dcada de setenta, por
Ingrid Daubechie53 no AT&T Bell Laboratrios, a transformada de Wavelet.
A transformada de Wavelet uma transformao linear que
analogamente transformada de Fourier, nos permite representar um sinal
no domnio das frequncias que o compem. No domnio das frequncias
tambm possvel cortar frequncias e atravs da transformada de Wavelet
inversa, recuperar o sinal livre de rudo.
A nica diferena entre as transformadas de Fourier e de Wavelet so
as funes de base utilizadas na decomposio do sinal. Nas transformadas
de Fourier as funes de base para a transformao de domnio so as
familiares funes seno e cosseno, as quais apresentam os problemas de falta
de suporte compacto, anteriormente mencionados. Para a transformada de
Wavelet, as funes de base so muito menos familiares e chamadas de
wavelets (ondinhas). Estas funes de base, as wavelets, apresentam como
principal caracterstica, suporte altamente compacto, isto , as wavelets no
se estendem de - at + no domnio do tempo, mas possuem um ponto de
incio e um ponto de trmino muito bem definidos.
Ao contrrio da transformada de Fourier, em que temos um nico tipo
de funes de base (senos e cossenos), na transformada de wavelet temos
vrios tipos diferentes de funes de base, isto , vrios tipos diferentes de
wavelets, divididas em famlias. As famlias de wavelets mais comums so
as seguintes: Daubechies, Morlets, Coiflets, Haar e as Symmlets. Um
exemplo clssico de funo de base utilizada em transformadas de Wavelet
a wavelet da famlia das Morlets, dada pela equao 3.9 e representada
na Figura 3.12.

41
g = ei w t e t
2
/2
Eq. 3.9

Figura 3.12. Funo de base (wavelet) de MORLET.

Na Figura 3.12 podemos observar claramente que as wavelets possuem


suporte altamente compacto, isto , alta localizao no eixo do tempo.
Observe que a wavelet da Figura 3.12, oscila em torno do valor zero e devido
a este fato estas funes de base foram denominadas wavelets, isto ,
ondinhas.
A idia bsica do filtro de transformada de Wavelet fazer a
convoluo do sinal inicial (sinal + rudo), x ( ) , com uma wavelet (uma

morlet, por exemplo), g ( ) , cuja transformada de Fourier g$ ( ) apresente


valor zero acima de uma certa frequncia crtica ( wcritica ), como segue:

W ( ) =
x ( ) g ( ) d

Eq. 3.10

42
Uma vez que as wavelets utilizadas em filtros de rudo instrumental,
so compostas exclusivamente por frequncias baixas, isto , apresentam
frequncia crtica baixa, ao fazermos a convoluo da equao 3.10
automaticamente cortaremos frequncias altas, eliminando simultaneamente
o rudo instrumental.
Uma funo de base pode ser comprimida (por exemplo, perodo
reduzido a metade, frequncia crtica dobrada), no domnio tempo
(comprimento de onda para espectros, tempo para cromatogramas, diferena
de potencial para voltamogramas, etc.), de modo que podemos representar
um mesmo sinal em escalas cada vez menores, removendo rudo
sequencialmente em cada uma destas escalas. Alm disso a wavelet
transladada atravs do sinal, permitindo remover rudo de sinais
estacionrios ou no estacionrios. A transformada de Wavelet seria anloga
a uma STFT em que se pudesse reduzir indefinidamente a largura do intevalo
de anlise do sinal (janela), sem violar o princpio da incerteza de
Heisenberg. Entretanto, a relao entre a resoluo no domnio do tempo ou
das frequncias um jogo em que o Croupier o princpio da incerteza de
Heisenberg, que independentemente dos jogadores, isto , independente do
tipo de transformada utilizada, far valer suas regras. Assim sendo, se nas
transformadas de Wavelet, devido possibilidade de compresso das
wavelets, possvel obter alta resoluo no domnio do tempo, o princpio
da incerteza nos diz que algo deve ser perdido. De fato, medida que
comprimimos uma wavelet ganhamos resoluo no tempo, mas
simultaneamente, aumentamos sua frequncia de corte. Portanto, s
possvel cortar frequncias altas nos sinais em que estas frequncias, estejam
limitadas a pequenos intervalos de tempo. Resumindo, se uma wavelet for
comprimida, ganhamos resoluo no tempo, mas devido a alterao na
frequencia da wavelet, perdemos preciso na frequncia crtica de corte
43
utilizada no corte de frequncias altas. Portanto, o uso da transformada de
Wavelet apresentar melhores resultados quando o sinal em questo possuir
componentes de alta frequncia de curta durao e componentes de baixa
frequncia de longa durao. Felizmente, a maioria dos sinais encontrados
na prtica possuem as caractersticas anteriores.
As wavelets geradas por compresso e translao de uma wavelet
inicial (wavelet me), podem ento, ser escritas como52:

1 b
g a b ( ) = g Eq. 3.11
a a

Na Figura 3.13, representamos uma sequncia de wavelets de Morlet, com


diferentes parmetros de escala (a), isto , com diferentes frequncias
caractersticas.

Inicial, a.1, a.2, a.3

0 50 100 150 200

Tempo

Figura 3.13. wavelets de Morlet com diferentes valores de escala (a).

44
Naturalmente, a transformada de wavelet torna-se funo dos parmetros de
escala (a e b) e deve ser reescrita como segue:

W f (a, b) =


x ( ) g a b ( ) d Eq. 3.12

em que a representa a escala (compresso) e b o deslocamento.


Assim sendo, cada valor de a define um tipo de filtro, isto , um tipo
de corte nas frequncias. Na Figura 3.14, representamos a transformada de
Wavelet como um banco de filtros31, 54, sendo cada tipo de filtro responsvel
pela extrao de um tipo de informao, do sinal original.

g1 b ( ) W1

g 2 b ( ) W2

f ( )

g 3 b ( ) W3

g 4 b ( ) W4

Figura 3.14. Representao esquemtica de um banco de filtros de wavelets.

Por exemplo, a wavelet mais comprimida, deve remover o rudo do sinal. A


segunda wavelet deve extrair uma segunda frequncia que compe o sinal.

45
Frequncia esta que pode ser associada a alguma propriedade de interesse,
embutida no sinal e assim por diante.
O sinal inicial, livre de rudo, pode ser recuperado aplicando-se a
transformada de Wavelet inversa relativa wavelet mais comprimida, dada
pela equao 3.13.


da
x ( ) = W f (a, b) g a b ( ) db Eq. 3.13
a2
0

Atravs da transformada inversa, alm do sinal livre de rudo, tambm


possvel obter a representao, no domnio inicial, das caractersticas
capturadas por outras wavelet, do banco de filtro. Para tanto, basta utilizar na
transformada inversa a wavelet correspondente caracterstica desejada.
O processo de obter informaes sobre um sistema, em diferentes
escalas uma nova alternativa para anlise de sinais, conhecida como anlise
em multiplas escalas55 (MRA). A anlise de sinais em multiplas escalas
anloga a observao de um mapa em diferentes escalas, grandes escalas
correspondem a uma viso no detalhada (continentes, por exemplo) ,
pequenas escalas correspondem uma viso mais detalhada de uma
determinada regio (limites de uma cidade, por exemplo). Para sistemas
fractais, por exemplo, a MRA apresentar sempre as mesmas caractersticas,
independentemente da escala utilizada.
O campo das Transformadas de Wavelet relativamente novo (cerca
de 10 anos) e ainda no existem textos com boas caractersticas didticas
sobre o assunto. Alm disso, a maioria dos textos dirigido a matemticos e
talvez (ou melhor), certamente ainda no dominei, nem descrevi, todos os
aspectos tericos do assunto. Entretanto, para a maioria das aplicaes em

46
qumica analtica, os detalhes tericos no so necessrios e a introduo
anterior suficiente.

3.2 Correo de espalhamento de luz56,57 (MSC)

Uma das principais fontes de erro encontrada em determinaes


quantitativas, atravs da espectroscopia de reflectncia difusa no
infravermelho prximo, o espalhamento de luz. O espalhamento de luz
altera a relao funcional entre a intensidade das medidas de reflectncia e
concentrao das espcies absorventes presentes na amostra. A reflectncia
torna-se funo no somente da concentrao das espcies absorventes, mas
tambm da no homogeneidade ptica da amostra, devida basicamente a
diferenas de granulometria, geometria, empacotamento e orientao das
partculas nas amostras, conforme descrito no captulo 2 desta tese. Uma vez
que, em determinaes quantitativas, a intensidade da reflectncia a
varivel dependente, que deve ser modelada em funo da concentrao das
espcies absorventes, temos duas opes: modelar simultaneamente
reflectncia e espalhamento de luz, ou minizar o espalhamento luz e em
seguida construir um modelo para a relao entre a reflectncia e a
concentrao das espcies absorventes, presentes na amostra.
Modelar, simultaneamente espalhamento e reflectncia uma tarefa
extremamente difcil (impossvel em alguns casos), pois a geometria e a
orientao das partculas variam aleatoriamente, de amostra para amostra.
Assim, se desejarmos construir modelos precisos e robustos, s nos resta a
segunda opo, qual seja: minimizar o espalhamento de luz.
O mtodo MSC (Multiplicative Scattering Correction) uma tcnica
para corrigir o efeito do espalhamento de luz em espectros de reflectncia
difusa. O fundamentado do mtodo, est no fato de que a dependncia
47
funcional, em relao ao comprimento de onda, do espalhamento de luz
diferente daquela observada para a reflectncia difusa. Assim, possvel
utilizar um grande nmero de comprimentos de onda para diferenciar o
espalhamento de luz da reflectncia difusa.
No mtodo MSC a interferncia relativa ao espalhamento de luz
minimizada corrigindo-se os espectros de reflectncia difusa de modo que
todos os espectros possuam o espalhamento ideal e por ideal entenda-se
mdio, visto ser este o nico espalhamento possvel de ser calculado. A
tcnica muito simples e pode ser facilmente entendida se acompanharmos
a sequncia de operaes abaixo.

Matematicamente (e resumindo), a correo feita da seguinte forma:

1- A partir do conjunto total de espectros de reflectncia difusa, calcula-se


o espectro mdio x .

2- Faz-se a regresso linear para cada um dos k espectros ( x i k ), do conjunto

total de espectros, contra o espectro mdio, sobre todos os i comprimentos


de onda:

x i k = u k + v k xi eq.3.14

3- Correo final:

x ( corrigido )
=
( x(nao corrigido )
ik uk ) eq.3.15
ik
vk

48
O mtodo MSC, quando bem aplicado, capaz de reduzir
significativamente os efeitos relativos ao espalhamento de luz. Tipicamente,
obtm-se uma melhora expressiva na desempenho dos modelos contrudos
para a relao existente, entre a intensidade de reflectncia e a concentrao
das espcies absorventes.

3.3 Compresso de dados: A anlise de componentes principais


(PCA) e Transformada de Fourier.

Os instrumentos analticos modernos nos permitem medir


simultaneamente, de modo rpido e eficinte um grande nmero de
parmetros de um determinado sistema qumico. Esta caracterstica,
extremamente til e desejvel, pode tornar-se um srio problema pois um
aumento no nmero de dados, no representa necessariamente um maior
conhecimento sobre o sistema, uma vez que nem todos os dados possuem
informaes relevantes. Alm disso, o excesso de dados gera dificuldades
computacionais relacionadas ao armazenamento e processamento destes
dados. Assim, torna-se necessrio a utilizao de mtodos matemticos que
nos permitam comprimir ou reduzir o conjunto de dados obtidos em
determinado experimento, uma coleo muito menor, mas que ainda
retenha as informaes realmente teis, para a anlise e modelamento do
sistema. Existe uma srie de mtodos destinados compresso de dados,
entretanto, os mais utilizados so mtodos fundamentados na transformada
de Fourier e o mtodo da anlise de componentes principais (PCA).

Compresso de sinais atravs da transformada de Fourier

49
Na compresso de dados pela tcnica da transformada de Fourier, a
idia bsica utilizar o espectro de frequncia ao invs do sinal analtico
propriamente dito. No espectro de frequncia possvel cortar frequncias
relativas ao rudo instrumental e frequncias relativas a informaes sem
importncia, reduzindo sua dimenso. O espectro de frequncia assim
tratado, pode ser armazenado ocupando menos espao. O sinal analtico pode
ser resgatado com grande facilidade, atravs da transformada de Fourier
inversa. O mtodo da transformada de Fourier encontra grande aplicao na
rea de compresso e tratamento de imagens. O famoso algoritmo JPEG
(Joint Photographics Experts Group), utilizado para compresso de imagens,
aplica o mtodo da transformada de Fourier ( em duas dimenses), em uma
de suas principais etapas. Com o algoritmo JPEG possvel alcanar taxas
de compresso da ordem de 45%, sem distoro significativa da imagem.

Compresso de sinais atravs da anlise de componentes principais


(PCA) 15, 26, 58, 59.

A idia bsica da anlise de componentes principais encontrar


combinaes lineares das variveis independentes, de modo a reduzir sua
dimenso a uma coleo muito menor de parmetros, que ainda descreva
suas principais caractersticas. Na anlise de componentes principais, a
matriz das variveis independentes decomposta em uma soma de matrizes
menores, que no podem mais ser reduzidas, mais uma matriz de erros,
como segue:

X = t1 p1T + t 2 p2T + L + t k pkT + E eq. 3.16

50
em que E uma matriz de erros, t i e p i so os escores e loadings,
respectivamente, da matriz das variveis independentes.
Esta a definio que se encontra em boa parte dos livros e artigos
sobre calibrao multivariada. A definio anterior est totalmente correta,
mas quase impossvel de entender, pelo menos para a grande maioria dos
mortais. Acompanhe o exemplo abaixo, e tudo se tornar claro (pelo menos
teoricamente!!! ).
Imagine que voc deseja determinar simultaneamente dois ons
metlicos, utilizando um complexante cromognico inespecfico, atravs de
espectroscopia de absoro, na regio do visvel (400 - 700 nm). Para tanto,
voc prepara diversas misturas, com diferentes propores dos ons
metlicos e adiciona o complexante cromognico inespecfico. Em seguida,
voc obtm para cada uma das misturas, o respectivo espectro na regio do
visvel. Executado o procedimento experimental anterior, voc poder
montar a seguinte matriz de dados:

Matriz X Matriz Y
10%a 90%b
40%a 60%b
60%a 40%b
90%a 10%b

350 650 nm

Na matriz X representamos os espectros na regio do visvel, cada uma das


linhas ( m) corresponde ao espectro de uma mistura e as colunas ( n ) so as

51
absorbncias lidas em diferentes comprimentos de onda. Na matriz Y, temos
as respectivas propores dos ons metlicos, presentes nas misturas.
No passo seguinte devemos centrar as colunas da matriz X na mdia
para obter X (basta subtrair de cada elemento da coluna, o valor mdio da
coluna toda) e calcular a covarincia de X , atravs da equao 3.17.

( )
Cov X =
X X
m 1
Eq.3.17

( )
Agora devemos obter a direo de maior variao da matriz Cov X . Isto

feito resolvendo-se a seguinte equao de autovalores e autovetores:

( )
Cov X pi = i pi Eq.3.18

em que i o autovalor associado ao autovetor pi .


A esta altura, o leitor deve estar se perguntando: porque se utiliza a
matriz covarincia e no a matriz original? Qual o significado da covarina
de uma varivel com ela mesma? A resposta para estas questes a seguinte:
a matriz de covarincia fornece informaes de quanto uma absorbncia lida
em um determinado comprimento de onda se relaciona uma absorbncia
lida em outro comprimento de onda. Se uma absorbncia lida em certo
comprimento de onda se relaciona muito com a absorbncia lida em outro
comprimento de onda, temos uma indicao de que estas duas absorbncias
podem ser substitudas por um valor correspondente combinao linear
delas. Naturalmente se observamos que um grupo de comprimentos de onda
possuem alta covarincia, podemos substituir o grupo todo pela combinao
linear de suas absorbncias. A maneira matemtica de se obter estes grupos

52
de alta covarincia resolver a equao 3.18, obtendo seus autovalores e em
seguida seus autovetores
Tipicamente, a equao 3.18 apresenta como soluo uma srie de
autovalores, a partir dos quais obtm-se os respectivos autovetores. O
primeiro autovetor, correspondente ao maior autovalor, fornece a direo no
espao das variveis (colunas de X ) que descreve a maior porcentagem da
varincia das amostras. Nos casos em que toda a varincia do sistema no
puder ser descrita usando um nico autovetor, um segundo autovetor,
ortogonal ao primeiro, pode ser obtido e assim por diante at que toda a
varincia das amostras seja capturada. Nesta etapa possvel utilizar um
nmero de autovetores (ou autovalores) muito menor que o nmero de
colunas da matriz X ( nmero de comprimentos de onda) e ainda assim
capturar a maior parte da varina dos dados, resultando na compresso dos
dados.
Uma vez obtidas as direes de maior varincia das amostras, o
prximo passo projetar a matriz X nesta nova base, como segue:

X pi = t i Eq. 3.19

Na anlise de componentes principais, os termos t i so chamados de escores.

Resolvendo a equao 3.19, atravs do mtodo dos mnimos quadrados,


obtemos:

X = t i piT ( pi piT ) Eq. 3.20

em que os elementos de:

53
piT ( pi piT )

so chamados, na anlise de componentes principais, de loadings.

Assim, demonstramos que a matriz inicial pode ser representada


atravs de combinaes lineares de escores ( t i ) e loadings ( pi ) , conforme
descrevemos no incio. Alm disso, possvel utilizar um nmero menor de
loadings e escores para representar a matriz X, possibilitando a compresso
dos dados. O nmero de escores necessrio para a descrio da matriz X
escolhido em funo da varincia capturada pelo autovalor e geralmente
reduz severamente a dimenso do sistema.
Os escores so muito teis, pois podemos relacion-los com a
concentrao das espcies (a e b) nas misturas do nosso exemplo, em um
tpico procedimento de calibrao, com a vantagem de que tal relao feita
para um nmero reduzido de escores e no para todas absorbncias lidas em
todos comprimentos de onda do espectro. Trocando em midos: Para todos
os efeitos, os escores podem ser usados como absorbncias em
procedimentos de calibrao. A maioria dos mtodos de calibrao
multivariada utilizam os escores ao invs das absorbncia, por exemplo: no
mtodo de calibrao multivariada PCR58,59 (regresso dos componentes
principais) uma relao linear entre os escores da matriz das variveis
independentes e as concentraes da matriz das concentraes,
estabelecida. No mtodo dos mnimos quadrados parciais, obtm-se os
escores da matriz X e da matriz Y, e a calibrao estabelecida entre os
escores de X e os escores de Y. Em nosso exemplo, poderamos utilizar o
PCR, para estabelecer a relao entre os escores dos espectros e a
concentrao das espcies a e b, presentes nas misturas.

54
Resumindo, os escores so extremamente versteis e podem ser
usados, com vantagens, em substituio s absorbncias (ou outra varivel)
em qualquer procedimento de calibrao multivariada.

CAPTULO 4

TCNICAS QUIMIOMTRICAS DE
MODELAMENTO DE DADOS

55
4. Tcnicas quimiomtricas de modelamento de dados

4.1 Redes Neurais 60

Recentes avanos em neurofisiologia tm desvendado vrios


mecanismos sobre o fluxo e o processamento de informaes que ocorrem
no crebro humano. Alguns destes mecanismos foram modelados
matematicamente permitindo a elaborao de algoritmos computacionais
que simulam, ainda que de modo simplificado, a mais bsica das estruturas
cerebrais: o neurnio 61.
A capacidade de implementar computacionalmente verses
simplificadas de neurnios biolgicos deu origem a uma subespecialidade da
inteligncia artificial, conhecida como redes neurais. Existem vrias
definies para redes neurais62, portanto adotaremos aquela que nos parece
mais geral e aplicvel a qualquer rea da cincia.

Redes neurais o nome dado a um conjunto de mtodos matemticos e


algoritmos computacionais especialmente projetados para simular o
processamento de informaes e aquisio de conhecimento do crebro
humano.

56
Operacionalmente podemos considerar uma rede neural como uma
caixa de processamento que pode ser treinada para que, a partir de um
conjunto de dados de entrada (inputs), possa gerar uma ou mais sadas
(outputs), conforme representado na Figura 4.1.
Entradas

Processamento

Sadas

Figura 4.1. Representao operacional de uma rede neural.

Por exemplo, pode-se treinar uma rede neural para que a partir do
espectro de RMN-H (input) de um composto orgnico ela apresente como
saida (output) a estrutura molecular do mesmo, ou ainda os inputs podem ser
dados clnicos de um paciente e os outputs o diagnstico e tipo de evoluo.
Enfim, as aplicaes so extremamente variadas e esto presentes em quase
todas as reas do conhecimento humano.
Neste ponto do texto, j temos uma viso geral sobre redes neurais e,
portanto, estamos aptos a aprofundar nossos conhecimentos sobre o assunto.
Como veremos, esta uma tarefa fcil visto que as redes neurais so
elaboradas a partir de cinco conceitos bsicos, extremamente simples. Estes
elementos so:
Neurnios artificiais

Sinapses e pesos

Funes de transferncia

Arquitetura de redes neurais


57
Treinamento de redes neurais.

4.1.1 Neurnios artificiais17, 60 - 64

Neurnios artificiais so as unidades bsicas de processamento da


informao, projetadas para simular o comportamento de neurnios
biolgicos. Simplificadamente, um neurnio biolgico pode ser descrito
como um corpo celular contendo dois conjuntos de ramificaes: dendritos
e axnio (Figura 4.2A). Analogamente aos neurnios biolgicos, os
neurnios artificiais possuem um corpo de processamento de informao
com duas ramificaes: entradas (dendritos) e sada (axnio), conforme
representado na Figura 4.2B.

dendritos

corpo celular

axnio

Figura 4.2A. Neurnio biolgico

Entradas

Sada
58
Figura 4.2B. Neurnio artificial

4.1.2 Sinapses e pesos: A transmisso de sinais pelos neurnios65, 66

Sem entrar na fsico-qumica do processo, a transmisso de sinais


entre neurnios pode ser entendida do seguinte modo: O sinal entra no
neurnio pelos dendritos, passa pelo corpo celular e em seguida transmitido
para outros neurnios, da rede neural, atravs do axnio. A passagem do sinal
de um neurnio, para os dendritos de um outro neurnio chamado de
sinapse.
Sinapses representam barreiras que modulam o sinal que trocado
atravs delas e a quantidade de sinal trocado em uma sinapse, depende de
um parmetro chamado de intensidade da sinapse. Em um neurnio
artificial a intensidade da sinapse simulada por um fator de ponderao
chamado peso da sinapse ou simplesmente peso, conforme ilustrado a Figura
4.3.

E n tr a d a ( in p u t )

P o n d e r a o

s a d a ( o u tp u t)

Figura 4.3. Representao da sinapse artificial

59
O sinal total que entra no corpo de processamento de um neurnio
artificial costumeiramente chamado de Net, cujo valor calculado atravs
da simples multiplicao do sinal que chega ao neurnio pelo peso da sinapse
em questo.

Net = Sinal de entrada (input) x Peso

Neurnios possuem um grande nmero de dendritos e portanto,


podem estabelecer vrias sinapses com outros neurnios da rede neural,
simultaneamente (Figura 4.4). Assim, o clculo do net deve ser generalizado
para n entradas (inputs).

x
x 1
2
x n

N et

sa d a
Figura 4.4 Representao generalizada da sinapse

Chamando os sinais de entrada de xi e os pesos de wi , o valor de net ser


dado por:
n

Net = X W
i =1
i i eq.4.1

60
At o momento vimos como calcular o sinal que entra em um
neurnio, mas qual ser o sinal de sada de um neurnio?

4.1.3 Funes de transferncia17, 60, 67

Como j poderiamos imaginar, a sada de um neurnio (output) ser


obtida em funo do sinal de entrada (input), isto , a sada ser funo do
net.

sada = f (net) eq.4.2

A funo f (net) deve possuir as propriedades:

1) No negativa
A funo de transferncia deve ser no negativa, pois ou o neurnio troca
sinal com outro neurnio ou no troca, no h como trocar sinal negativo.

2) Contnua
A funo de transferncia deve ser contnua, pois um neurnio no pode
trocar sinal com outro neurnio, indefinidamente.

Dentre as vrias funes que preenchem os pr-requisitos anteriores,


somente trs so rotineiramente usadas, as quais sejam:

1) Funo sigmoidal ou logstica

Com certeza esta a funo de transferncia mais utilizada em redes neurais.


Esta funo tambm a que mais se aproxima da sada de um neurnio
biolgico. Matematicamente, escrevemos a funo sigmoidal como segue:
61
1
saida = f ( net ) = eq.4.3
1 + e ( net )

Funo sigmoidal
-10 -5 0 5 10

1.0 1.0
Out=f(Net)

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0.0 0.0

-10 -5 0 5 10

Net

Figura 4.5. Funo sigmoidal

2) Funo degrau de Heaviside

Como podemos observar na Figura 4.6, a funo de heavside muito


simples e s pode assumir os valores 0 ou 1.

1 se net > valor lim ite


out = f ( net ) =
0 se net valor lim ite( arbitrario )

62
Funo de Heaviside
-10 -5 0 5 10

1.0 1.0

0.8 0.8

Out=f(Net)
0.6 0.6

0.4 0.4

0.2 0.2

0.0 0.0

-10 -5 0 5 10

Net

Figura 4.6. Funo degrau de Heaviside

3) Funo Linear

Esta funo, naturalmente, dispensa comentrios. A sada do neurnio ser


dada por:
sada = a (net) + b a , b R+* eq.4.4

4.1.4 Arquitetura de redes neurais

Uma rede neural artificial possui sempre uma camada de entrada e


uma camada de sada. Entre a camada de entrada e a de sada, existe um
nmero varivel de camadas intermedirias. A esta disposio das camadas
e nmero de neurnios por camada, d-se o nome de arquitetura da rede
neural. Na Figura 4.7 podemos observar a arquitetura tpica de uma rede
neural utilizada neste trabalho.

63
-Log(R/Ro)
0.38

0.36

0.34

0.32

0.30

0.28

0.26

0.24

1400 1600 1800 2000 2200 2400


nm

1 2 3 4 ... 277

Sigmoidal

Linear

Teor de nitrognio

Figura 4.7. Representao de uma rede neural tpica, utilizada neste trabalho.

Esta rede neural possui a seguinte arquitetura: 1 camada de entrada


com 277 neurnios, uma camada intermediria com 5 neurnios e uma
camada de sada com 1 neurnio. As funes de tranferncia utilizadas esto
representadas na prpria Figura 4.7. As entradas(inputs) foram as
intensidades, isto , valores de (-log(R/Ro)) lidos em diferentes
comprimentos de onda, em espectros de reflectncia difusa na regio do

64
infravermelho prximo (NIRR) de folhas de trigo, milho ou algodo. A sada
(output) foi a concentrao de nitrognio nestas folhas.
Vale ressaltar que o nmero de camadas intermedirias e nmero de
neurnios nestas, um parmetro ajustvel conforme veremos adiante.

4.1.4.1 Clculo do Net em uma rede neural

J demonstramos (tens 4.1.2 e 4.1.3) como calcular o Net e a sada


(output) para um neurnio. Vejamos agora como generalizar o clculo do Net
para uma rede neural.
fcil imaginar que em uma rede neural com vrias camadas, a sada
de uma camada ser o input da camada seguinte. Portanto, para calcular a
sada final de uma rede neural basta calcular sequencialmente as entradas e
sadas por toda a rede neural. Este clculo que conceitualmente muito
simples, pode se tornar tedioso e complexo se a rede possuir vrias camadas
e muitos neurnios nestas camadas. Uma maneira mais simples e
computacionalmente mais eficiente de se fazer isto, escrever a rede
neural de modo matricial. Assim, uma camada com n neurnios, cada um
com m pesos, representada por uma matriz W com n linhas e m columas
(Wn,m). Para uma rede neural com vrias camadas, cada uma das camadas
ser representada por uma matriz Wl (em que l indica a camada). Para a rede
1 2 3
neural representada na Figura 4.7, temos: W277 277 , W51385 e W15 .

Camada de entrada:

65
w1,1 w1,2 w1,3 L w1,277

w2 ,1 w2 ,2 w2 ,3 L w2 ,277
1
W277 277 = w3,1 w3,2 w3,3 L w3,277

M M M M
w w277 ,2 w277 ,3 L w277 ,277
277 ,1

Camada intermediria:

w1,1 w1,2 w1,3 w1,4 w1,5 L w1,1385



w2 ,1 w2 ,2 w2 ,3 w2 ,4 w2 ,5 L w2 ,1385
W521385 = w3,1 w3,2 w3,3 w3,4 w3,5 L w3,1385

w4 ,1 w4 ,2 w4 ,3 w4 ,4 w4 ,5 L w4 ,1385

w5,1 w5,2 w5,3 w5,4 w5,5 L w5,1385

Camada de sada:

W135 = [ w1,1 w1,2 w1,3 w1,4 w1,5 ]

As entradas, isto , valores de (-log(R/Ro)) lidos em diferentes


comprimentos de onda, no espectro de reflectncia difusa no infravermelho
prximo podem ser escritas vetorialmente do seguinte modo:

xil = [ x1 x2 x3 x4 x5 L x277 ]

O clculo do net para cada um dos neurnios, da camada de entrada, por


exemplo, pode ser escrito como:

66
w1,1 w1,2 w1,3 L w1,277
x
w2 ,1 w2 ,2 w2 ,3 L w2 ,277 1
x2
Net = [ Net1 , Net 2 ,K Net 277 ] = w3,1 w3,2 w3,3 L w3,277
M
M M M M
w x277
277 ,1 w277 ,2 w277 ,3 L w277 ,277

O clculo do Net pode ser generalizado, para qualquer camada, atravs da


seguinte equao:
m

Net lj =
W
i =1
l
ji xil eq.4.5

Uma vez que toda entrada de uma camada pode ser relacionada com a sada
da camada anterior, podemos reescrever a equao 4.5 como segue:

Net =
l
j
i =1
Wjli outil 1 eq.4.6

Conhecidos o Net e as funes de transferncia, podemos propagar o sinal


pela rede, desde a entrada (input) at a sada (output).

4.1.5 Treinamento de redes neurais 68

Para que uma rede neural execute tarefas como reconhecimento de


padres ou modelamento de dados (calibrao), devemos trein-la. Vejamos
como se faz isto.
Na etapa de treinamento, uma srie de entradas so apresentadas e
propagadas pela rede neural. Neste trabalho, os inputs foram intensidades

67
lidas em diferentes comprimentos de onda, para vrios espectros de
reflectncia difusa na regio do infravermelho prximo de folhas de trigo,
milho ou algodo. Uma vez propagados, podemos calcular a sada da rede
neural, isto , o valor previsto da concentrao de nitrognio nestas folhas,
conforme representamos na Figura 4.7.
Uma vez obtidos os valores previstos pela rede neural, podemos
calcular um erro de previso (E), o qual pode ser definido, em princpio,
como o somatrio do quadrado da diferena entre o valor previsto pela rede
(sada) e o valor real (target), como segue:

E=
k =1
( y k y$ k ) 2 eq.4.7

onde y o valor real (target) e y$ o valor previsto (output) da concentrao


de nitrognio para cada um dos n espectros (NIRR) utilizados no treinamento
da rede neural. Conhecido o erro de previso, quais parmetros da rede
neural devemos corrigir para minimiz-lo ? A resposta para esta pergunta
muito simples, pois uma vez fixada a arquitetura da rede neural, os nicos
parmetros passveis de correes so os pesos, dado que no h outros
parmetros. Existem alguns mtodos para se fazer tal correo, entretanto
somente dois so usados com frequncia, os quais sejam: a
retropropagao de erros69 e o mtodo de Marquardt-Levenberg 70.
No mtodo da retropropagao de erros, o processo de correo dos
pesos iniciado na ltima camada e prossegue em direo primeira
camada, da o nome retropropagao. Este processo pode ser visualizado na
Figura 4.8.

68
Entrada
W1 Corrigido

W1
W2 Corrigido

W2
W3 Corrigido

W3
Correo

Sada
Erro
Objetivo
Figura 4.8. Representao da retropropagao para uma rede com uma camada de
entrada(W1), uma intermediria(W2) e uma camada de sada(W3)

Sem entrar em dedues matemticas, a equao para a correo dos


pesos pode ser escrita como:
Wjli = jl out l 1 + Wjprevio
i eq.4.8

De acordo com a equao anterior, a correo dos pesos composta


pela soma de dois termos que atuam conjuntamente para minimizar o erro de
previso. Vejamos o que cada um representa:

Primeiro termo:

lj out l 1

69
O fator de correo lj obtido utilizando-se o mtodo do gradiente
descendente, cuja essncia que o erro (E) deve apresentar um mnimo em
funo do parmetro que o causa, ou melhor, lj fornecer os pesos que
minimizam o erro (E). O parmetro chamado de velocidade de
treinamento introduzido para ponderar as correes, de modo a evitar
grandes correes principalmente no final do processo iterativo, quando boa
parte dos pesos j foi corrigido e uma correo muito acentuada pode
comprometer todas as correes efetuadas.

Segundo termo:

W jprevio
i

A constante desloca o peso timo obtido pelo primeiro termo,


forando que o erro seja reavaliado neste novo peso. Este processo evita
convergncias para mnimos locais, pois um erro maior indica que o mnimo
obtido pelo primeiro termo era realmente global; caso contrrio, o mnimo
era local e a busca pelo mnimo prossegue. Resumindo, o segundo termo atua
como dispositivo de segurana do primeiro termo, evitando mnimos locais.
No segundo mtodo de treinamento as correes dos pesos so feitas
de acordo com uma variante do mtodo de Gauss-Newton71-73, conhecida
como mtodo de Marquardt-Levenberg. Neste mtodo as correes dos
pesos so calculadas de acordo com a equao:

( )
1
W = J T J + I JT E eq.4.9

70
onde J a matriz jacobiana do erro para cada um dos pesos, um escalar
positivo, I a matriz identidade e E o vetor de erros dado pela equao 4.7.
Em ambos os casos, a etapa de treinamento se encerra quando o erro
atingir o critrio de convergncia previamente estabelecido. Neste ponto, a
rede est treinada e podemos utilizar um conjunto de espectros de NIRR,
diferente daquele utilizado no treinamento, para avaliar as propriedades de
generalizao da rede neural artificial, as quais so geralmente boas,
especialmente em situaes em que os dados apresentem no linearidades.
Entretanto, em alguns casos, as redes neurais artificiais, mesmo depois de
terem sido treinadas, apresentam baixos erros de calibrao e elevados erros
de previso, isto , sobreajuste (overfitting), devido ao nmero excessivo de
neurnios utilizados na camada intermediria. O nmero de neurnios na
camada intermediria atua de modo anlogo ao nmero de componentes
principais utilizado na regresso de componentes principais74-75 (PCR), ou
ordem do polinmio utilizado em regresso polinomial76, por exemplo.
Portanto, um procedimento fundamental para evitar-se sobreajuste
(overfitting), isto , pequenos erros de calibrao e elevados erros de
previso, a otimizao do nmero de neurnios da camada intermediria.

4.1.6 A otimizao da Arquitetura

A seleo do nmero timo de neurnios na camada intermediria ou


otimizao da arquitetura feita variando-se o nmero destes neurnios e
repetindo-se o processo de correo dos pesos. Escolhe-se ento a
configurao que apresentar os menores erros de calibrao (%SEC) e
previso (% SEP), dados pelas eqs. 4.10 e 4.11

71
nc

1
( yi y$i )2
% SEC = i =1
100 eq. 4.10
cc nc k 1

np

1
( yi y$i )2
% SEP = i =1
100 eq.4.11
cp np

em que c c e c p so as concentraes mdias da amostras utilizadas no

conjunto de calibrao e previso respectivamente, n c e n p representam,

respectivamente, o nmero de amostras usadas na calibrao e na previso,


y i o valor real e y$ i o valor previsto pelo modelo e k o nmero de
parmetros usados no modelo. Para redes neurais artificiais o nmero de
parmetros utlizado no modelo no conhecido e n p utilizado como uma

aproximao, para o denominador da equao 4.10.


O leitor atento, a esta altura j deve ter observado que para construir
modelos com redes neurais o conjunto de previso tambm utilizado na
escolha da arquitetura tima. Portanto, devemos ter um terceiro conjunto de
espectros para realmente verificar as capacidades de previso da rede neural
otimizada. Afinado com este tipo de problema sempre utilizamos neste
trabalho, trs conjuntos de dados (calibrao, validao e previso) como
veremos adiante no texto.
Conforme descrevemos, a otimizao da arquitetura basicamente
uma tarefa de tentativa e erro e um tanto tediosa mas existe um modo de
evit-la, como veremos no prximo tem.

72
4.2 Redes Neurais com Apodizao77, 78

A idia bsica deste mtodo inicializar a rede neural com um nmero


razovel de neurnios na camada intermediria e, durante a etapa de
treinamento cortar as conexes (ou pesos) dos neurnios que possuam pouca
influncia no erro E (eq.4.7). Neurnios que tiverem todas as conexes
cortadas sero eliminados e, portanto, ao final dos cortes, sobraro
somente os neurnios realmente necessrios ao modelamento. A tcnica de
apodizao (pruning) reduz a complexidade da rede neural, melhorando suas
capacidades de previso, pois evita modelos sobre parametrizados (muitos
neurnios) em que a possibilidade de sobreajuste (overfitting) grande.
Existem basicamente dois mtodos para a apodizao de redes
neurais: Optimal Brain Damage79 (OBD) and Optimal Brain Surgeon80,81,82
(OBS). Em ambos os mtodos as conexes (ou pesos) so cortadas e a
correspondente variao no erro E, chamada de salincia, avaliada.
No mtodo OBD as conexes so cortadas durante a etapa de
treinamento e a rede neural no retreinada aps os cortes. No mtodo OBS,
as conexes so cortadas e, aps o corte de uma conexo, a rede retreinada,
permitindo que um nmero maior de cortes seja efetuado. Alm disso, no
mtodo OBS a rede neural retreinada, aproximando-se os erros de
treinamento por uma funo quadrtica, de modo a garantir a existncia de
um mnimo.
Resumidamente, o que se faz no mtodo OBS adicionar um termo,
chamado termo de regularizao83,84, funo erro (E) dada pela equao 4.7,
para obter a funo custo:

1
C(W ) = E (W ) + W T D W eq.4.12
2

73
O termo de regularizao simplesmente penaliza pesos com valores
elevados, sendo esta penalizao, ponderada pelo fator D. O fator de
regularizao auxilia no processo de pruning e assegura a estabilidade
numrica do mtodo. Em seguida, expande-se a funo custo em srie de
Taylor at termos de segunda ordem, em torno de um possvel mnimo W0 ,
como segue:

C(W ) = C(W0 ) + (
1 2
2
E + D) ( dW )
2
eq.4.13

em que dW = W W0 .

Em seguida, devemos cortar conexes e minimizar a funo custo


simultaneamente, o que pode ser conseguido aplicando-se o mtodo dos
multiplicadores de Lagrange, como segue:

C(W ) = W eq.4.14

em que o multiplicador de Lagrange. Resolvendo a equao anterior


obtemos o extremo vinculado:

d W = H 1 eq.4.15

em que H a Hessiana da funo custo com termo de regularizao, dada


por :

(
H = 2 E + D ) eq.4.16

74
Neste ponto pode-se voltar a equao 4.12, explicitar a funo E(W),
substituir o valor de dW e obter a seguinte equao para a salincia:

H ( E + D) H 1
1 2 1 2
dE (W ) = W0 D H 1 + eq.4.17
2

A equao da salincia (eq.4.17) nos fornece um critrio matemtico para o


corte das conexes.
As tcnicas de apodizao de redes simplifica enormemente o
processo de otimizao da arquitetura e nos permite modelos com pequena
possibilidade de sobreajuste (overfitting).

4.3 O mtodo dos mnimos quadrados parciais85,86 ( PLS )

A base do PLS decompor a matrix (X) das variveis independentes


e a matriz (Y) das variveis dependentes, em um produto de duas matrizes
menores mais uma matriz de erro, como segue:

X = TP + E eq.4.18

Y = UQ + F eq.4.19

onde as matrizes T e U so chamadas de matrizes dos escores; P e Q


matrizes dos loadings; E e F as matrizes de erro de X e Y respectivamente.
Esta decomposio muito til nos casos em que a matriz X mal
condicionada, ou ainda, quando o nmero de amostras menor que o
nmero de variveis independentes visto que podemos utilizar uma matriz T
de dimenso inferior a da matriz X sem perda de informao til, eliminando
rudo e colinearidade dos dados.
75
Efetuada a decomposio anterior, o prximo passo ajustar uma
relao linear, quando possvel, entre U e T, como segue:

U =bT + eq.4.20

onde b o coeficiente do ajuste, usualmente obtido com o algoritmo


NIPALS86. Finalmente, podemos substituir o valor de U na equao 4.19, e
obter:

Y =bT Q+G eq.4.21

e portanto, podemos obter os escores da matriz Y a partir dos escores da


matriz X e vice-versa. Terminada a etapa de calibrao pode-se fazer
previses87 para amostras desconhecidas. Para tanto basta obter os escores
da matriz X, o qual pode ser facilmente transformado em concentrao,
atravs da eq.4.21.

4.4 Outras tcnicas de modelamento de dados no lineares 88: O PLS


polinomial (POLIPLS) e o PLS redes Neurais (NNPLS).

Algumas extenses do mtodo do PLS podem ser feitas nos casos em


que os escores da matriz das variveis independentes (matriz X) e os escores
da matriz das variveis dependentes (matriz Y), no possuam uma relao
linear. Dentre estas, destacamos o PLS polinomial (POLIPLS) e o PLS rede
neural (NNPLS).
O PLS polinomial basicamente idntico ao PLS linear, com a nica
diferena de que a relao entre os escores da matriz das variveis
independentes (u) e os escores da matriz das variveis independentes (t),

76
feita por um polinmio de grau varivel, o que nos permite modelar relaes
no lineares entre t e u, como segue:

t = a0 + a1 u + a2 u 2 + a3 u 3 + L + an u n eq.4.22

Uma combinao muito eficiente entre as redes neurais artificiais e o


PLS, o PLS rede neural (NNPLS). No PLS rede neural a relao entre os
escores da matriz das variveis independentes (u) e os escores da matriz das
variveis independentes (t), feita por uma rede neural artificial, de
arquitetura varivel, conforme representado na Figura 4.9. Assim sendo,
possvel modelar os casos lineares, bem como aqueles no-lineares. Para
modelar relaes lineares, basta utilizar na rede neural, funes de
transferncia lineares e para as relaes no lineares deve-se utilizar funes
de transferncia no lineares, como por exemplo, a funo sigmoidal. As
outras etapas do PLS rede neural so idnticas as do PLS linear. Deve-se ter
em mente que a diferena entre os modelos feitos com redes neurais
artificiais e com o PLS rede neural, que este baseado em fatores (escores)
e as redes neurais, geralmente, no.
Todavia, possvel elaborar modelos com redes neurais artificiais
utilizando escores como entradas (inputs), conforme descrito no tem 3.3
desta tese. Alis, optamos por esta estratgia em nosso trabalho e obtivemos
uma reduo extremamente significativa no tempo computacional e na
qualidade dos resultados.

77
ui ti

Figura 3.9. Representao esquemtica do NNPLS. As linhas tracejadas indicam que a


arquitetura da rede neural ajustvel.

CAPTULO 5
78
OBJETIVOS

5. OBJETIVOS

O objetivo deste trabalho implementar, desenvolver e avaliar o


desempenho relativo de mtodos matemticos e estatisticos, ainda pouco
explorados em qumica analtica, aplicados ao pr-processamento de sinais
e modelamento de dados que possibilitem a anlise in situ do teor de
nitrognio em folhas de plantas, com pequenos erros, atravs da
espectroscopia de reflectncia difusa no infravermelho prximo (NIRR). O
teor de nitrognio em plantas um parmetro agronmico extremamente
importante pois permite prever a produtividade de um determinado cultivar,
possibilitando a aplicao, racional, de medidas (adubao, por exemplo)
que melhorem-na.

79
CAPTULO 6

PARTE EXPERIMENTAL

80
6. Parte Experimental

6.1 Determinao de nitrognio em plantas: O mtodo Kjeldahl

Obtivemos, junto ao INSTITUTO AGRONMICO DE CAMPINAS


(IAC), amostras de folhas de trigo, milho e algodo, provenientes de diversos
cultivares, localizados em diferentes cidades do estado de So Paulo. Foram
obtidas 80 amostras, assim distribuidas: 60 amostras de folhas de trigo, 10
de milho e 10 de algodo.
O teor de nitrognio de cada uma das amostras foi determinado atravs
do mtodo Kjeldahl89. O fundamento do mtodo Kjeldahl, oxidar o
nitrognio das folhas a amnio, com uma mistura de cido sulfrico e
perxido de hidrognio. Em seguida adiciona-se NaOH ao meio reacional,
pois o on amnio, em meio bsico gera amnia, a qual destilada por arraste
de vapor e recebida em uma soluo de cido brico, gerando borato.
Finalmente a soluo contendo o borato, recm formado, titulada com
cido sulfrico, utilizando uma mistura de indicadores (vermelho de metila
e verde de bromo cresol) para deteco do ponto final.

81
Na etapa anterior determinao de nitrognio pelo mtodo Kjeldahl,
as folhas foram lavadas com uma soluo de gua e detergente (1%) e
enxaguadas vrias vezes com gua destilada e uma vez com gua deionizada.
Em seguida, as folhas foram colocadas em sacos de papel (para
identificao), secas em estufa a 65C ( mnimo de 24 h), modas em um
moinho do tipo Wiley com abertura de 2 mm e peneiradas em peneira de 80
mesh. Esta etapa do procedimento experimental est representada na Figura
6.1.

Recebimento Limpeza das


Secagem
das amostras folhas

Moagem

Determinao de
Peneirao
nitrognio - Kjeldahl

Figura 6.1. Representao da sequncia de operaes experimentais executadas.

6.2 Obteno dos espectros de reflectncia difusa no infravermelho


prximo.

As amostras de folhas modas foram peneiradas e a frao que passou


atravs da peneira de 80 mesh foi dividida em trs alquotas. Para cada uma
destas alquotas, obtivemos um espectro de reflectncia na regio do
infravermelho prximo entre 1500 e 2400 nm. O espectro final para cada

82
uma das amostras foi a mdia dos espectros das trs alquotas. Antes da
aquisio do espectro de cada alquota (e para todas amostras), obteve-se o
espectro do padro de reflectncia utilizado como referncia em clculos
posteriores (padro n 99 da empresa LabSphere, Inc.). Assim, foram
obtidos 6 espectros para cada amostra, resultando em um total de
aproximadamente, 500 espectros de reflectncia difusa no infravermelho
prximo.
Os espectros NIRR foram obtidos em um espectrofotmetro de
infravermelho prximo com monocromador baseado em filtro ptico
acstico sintonizvel90-93 (AOTF), desenvolvido e gentilmente cedido pelo
Prof. Dr. Clio Pasquini (IQ-UNICAMP) e pelo Sr. Renato Guchardi. Na
montagem utilizada para as medidas de reflectncia, adaptou-se ao
espectrofotmetro uma fibra ptica bifurcada (um feixe conduz a radiao
NIR at a amostra e o outro conduz a radiao NIR atenuada, devido s
absores, at o detector). Esta adaptao permitiu que as medidas de
reflectncia fossem feitas diretamente sobre as folhas modas (ou sobre o
padro de reflectncia, Teflon finamente particulado), como representado
nas Figuras 6.2.A, 6.2.B e 6.2.C.

83
Detector Radiao NIR

Ponta de prova

Porta amostra

Figura 6.2.A. Representao da configurao utilizada para as medidas de reflectncia


difusa.

Figura 6.2.B A. Nesta foto pode-se observar o porta amostra (carregado com folhas de
trigo modas) e a ponta de prova, da fibra ptica.

84
Figura 6.2.C. Nesta foto pode-se observar o padro de reflectncia e a ponta de prova da
fibra ptica.

Na montagem utilizada, apresentada na Figura 6.2.A, optou-se pelo


uso de uma fibra ptica com baixo teor de hidroxilas para evitar-se a
absoro da radiao NIR, pela prpria fibra ptica.
Na fotografia apresentada na Figura 6.3, podemos observar, em
detalhe, o porta amostra, o padro de referncia e alguns frascos com
amostras de folhas de trigo, modas.

Figura 6.3. Foto do porta amostra, padro de referncia e frascos com amostras de folhas
de trigo modas.

O espectrofotmetro de infravermelho prximo utilizado para a


obteno dos espectros de reflectncia apresentava a configurao
representada na Figura 6.4.
85
Gerador de rdio
frequencias

Lock in

Lmpada de tungstnio
Detector de PbS Ponta de Prova AOTF 100W , bulbo de quartzo

Porta Amostra

Figura 6.4. Representao, esquemtica e simplificada, do espectrofotmetro NIRR.

O espectrofotmetro utilizado para a varredura, nos comprimentos de


onda, apresentava o seguinte princpio de funcionamento:
O gerador de rdio frequncias, controlado pelo microcomputador, aplica
sobre um material piezoeltrico (LiNbO3), acoplado AOTF, uma diferena
de potencial uma determinada frequncia, conforme representado na Figura
6.5.

Gerador de
rdio frequncias

Piezoeltrico

Cristal
Radiao de
incudente TeO 2

Figura 6.5. Representao simplificada, de uma AOTF.

86
Materiais piezoeltricos, quando submetidos diferenas de potencial
respondem expandindo-se ou contraindo-se; se a diferena de potencial
aplicada com uma determinada frequncia, o piezoeltrico executa um
movimento vibratrio. Uma vez que o material piezoeltrico est acoplado a
um cristal de TeO2, a vibrao mecnica se propagar atravs deste cristal.
Vibraes mecnicas (o som, por exemplo) quando se propagam em meios
materiais, como o cristal de TeO2, geram regies, internas ao cristal, de
compresso e rarefao, como representado na Figura 6.6.

Gerador de
rdio frequncias

Piezoeltrico

Radiao
incidente

Figura 6.6. Representao simplificada do princpio de funcionamento da AOTF. As


regies claras indicam rarefao e as escuras, compresso.

A compresso e a rarefao alteram significativamente a densidade


do meio (cristal de TeO2), em diferentes posies, medida que a onda se
propaga. Consequentemente, teremos nestas posies, uma correspondente
alterao do ndice de refrao e devido a estas variaes peridicas (no
espao) no ndice de refrao, o cristal ir difratar a luz seletivamente. Assim,
controlando-se a frequncia aplicada sobre o cristal de TeO2 , possvel
controlar a processo de difrao, o que, em ltima anlise, torna a AOTF um
87
tipo de grade de difrao94,95, isto , um tipo de filtro que permite selecionar
determinados comprimentos de onda.
Uma vez efetuada a seleo dos comprimentos de onda, atravs da
AOTF, a radiao direcionada para um dos feixes da fibra ptica, sendo
conduzida at a amostra. A radiao incide sobre a amostra, sofre o
processo de reflectncia difusa, sendo em seguida capturada pela outra
extremida da fibra e conduzida at o detector. Uma vez detectada a
intensidade luminosa (atenuada nos comprimentos de onda absorvidos pelos
componentes da amostra), o sinal segue para o amplificador lock-in. Neste
d-se o acoplamento das frequncias, do sinal proveniente do detector com
a frequncia aplicada, pelo gerador de rdio frequncias, na AOTF. Esta
modulao permite que as medidas de reflectncia difusa sejam feitas com o
espectrofotmetro aberto, sem sofrer interferncia da luz ambiente ou de
outras fontes, eventualmente presentes no local. Na Figura 6.7 apresentamos
a foto de uma vista geral do espectrofotmetro utilizado.

88
Figura 6.7. Vista geral do espectrofotmetro utilizado para a obteno dos espectros de
reflectncia difusa no infravermelho prximo.

6.3 Programas computacionais para o tratamento dos espectros 96-98.

Desenvolvemos os seguintes programas para o tratamento dos dados


espectroscpicos:

O programa para a correo de espalhamento de luz (MSC) foi


desenvolvido e implementado em Fortran Power Station ( MICROSOFT ),
e posteriormente, adaptado para MATLAB (The MathWorks, Inc.).

O programa para o filtro de Wavelets foi desenvolvido e implementado em


Fortran Power Station ( MICROSOFT ) e, posteriormente, adaptado para
MATLAB (The MathWorks, Inc.).

Desenvolvemos interfaces grficas amigveis (GUI) utilizando a


linguagem e subrotinas do MATLAB (The MathWorks, Inc.) para as
seguintes tcnicas de modelamento e pr-processamento de espectros (NIR):
filtro de transformada de Fourier, Redes Neurais, PLS rede neural e Redes
neurais com apodizao. Por exemplo, o programa para modelamento dos
dados atravs de redes neurais, apresentava a seguinte sequncia de telas:

89
Escolhendo a arquitetura da rede neural .......

Selecionando o nmero de neurnios na camada intermediria ( no caso


de s uma camada intermediria ter sido escolhida) ........

90
Selecionando a funo de transferncia para a camada intermediria........

Selecionando a funo de transferncia para a camada de sada ..........

Conforme pode ser observado na sequncia de telas anteriores, a utilizao


de redes neurais ( e das outras tcnicas de modelamento, tambm), no uma
tarefa complicada.

91
CAPTULO 7
RESULTADOS E DISCUSSO

7 Resultados e Discusso

7.1 Os espectros obtidos

92
Os espectros foram traados lanando-se nas abscissas os
comprimentos de onda ( em nm) e nas ordenadas o logaritmo na base 10,
da razo entre a reflectncia da amostra (R) e a reflectncia do padro (R),
isto , utilizamos o mtodo emprico descrito no tem 2 desta tese. Na Figura
7.1 representamos trs espectros tpicos, um para cada tipo de amostra.

1400 1600 1800 2000 2200 2400


0.42 0.42

0.40 0.40
Trigo
0.38 0.38
Milho
0.36 Algodo 0.36
-Log(R/Ro)

0.34 0.34

0.32 0.32

0.30 0.30

0.28 0.28

0.26 0.26

0.24 0.24

1400 1600 1800 2000 2200 2400

Comprimento de onda em (nm)

Figura 7.1. Espectros NIRR de folhas de milho, trigo e algodo.

Este tipo de transformao pode ser utilizada para os espectros obtidos


neste trabalho pois tomamos o cuidado de construir o porta amostra em
Teflon grafitado, impedindo que a radiao incidente o atravessa-se
completamente eliminando os problemas tericos, relativos esta
transformao, j discutidos no tem 2 da introduo desta tese. Conforme
descrito na parte experimental, no utilizamos um padro com 100% de
reflectncia, o que nos impede, pelo menos teoricamente, de utlizar a
transformao de Kubelka-Munk. Alm disso, a transformao emprica
muito mais simples de se implementar computacionalmente.

93
7.1.1 Homogeneidade das amostras99

As amostras foram separadas em trs alquotas (ou em trs fraes)


pois devemos garantir que o espectro NIRR realmente represente a
composio global da amostra. Esta precauo necessria pois no de se
esperar que uma folha apresente a mesma concentrao de nitrognio em
toda sua extenso. Na verdade, esta precauo deve ser tomada em todos os
tipos de anlises em que no possvel, ou pouco vivel, obter a partir da
amostra, uma soluo verdadeira. No caso das solues verdadeiras temos
uma situao realmente confortvel pois a difuso ou uma simples agitao
resolve o problema.
Constatamos que os espectros para as trs alquotas, em todas as
amostras, apresentavam variaes iguais quelas observadas em trs
espectros obtidos de uma mesma alquota. Na Figura 7.2, podemos observar
os espectros de trs alquotas de uma certa amostra (observe como difcil
diferenci-los visualmente). O desvio mdio calculado da ordem de 0,005
unidades de reflectncia. Portanto, os espectros NIRR obtidos refletem de
modo fiel a composio global das amostras de folhas de trigo, milho e
algodo.

94
alquota1, alquota2, alquota3
0.32

0.30

0.28
-Log( R / R0 )

0.26

0.24

0.22

0.20

0.18
1400 1600 1800 2000 2200 2400

Comprimento de onda (nm)

Figura 7.2. Espectros sobrepostos, de trs alquotas de uma mesma amostra.

Alm do fato anterior, as medidas feitas com trs alquotas nos


ajudariam a identificar possveis problemas instrumentais durante a obteno
dos espectros de reflectncia.

7.2 Filtros para a minimizao do rudo em espectros NIRR

Os espectros obtidos apresentaram quantidades razoveis de rudo.


Esta caracterstica pode inviabilizar determinaes quantitativas com NIRR,
dado que nesta regio do espectro eletromagntico as intensidades das
absores so extremamente baixas (10 a 100 vezes menor que no
infravermelho mdio) e problemas de resoluo tornam-se particularmente
importantes. Portanto, para viabilizar a determinao quantitativa de
nitrognio nas folhas utilizando espectroscopia NIRR tivemos que minimizar
o nvel de rudo dos espectros.
7.2.1 Filtro de transformada de Fourier
95
Como foi descrito na introduo sobre pr-processamento de sinais
(tem 3, desta tese), devemos representar os espectros no domnio das
frequncias, cortar as frequncias visto serem estas associadas ao rudo e
atravs da transformada inversa recuperar o espectro, sem rudo. Entretanto,
qual o limite inferior para este corte, isto , qual a menor frequncia que
pode ser cortada do espectro de frequncias sem que, ao aplicarmos a
transformada de Fourier inversa, alteremos o espectro ?
A resposta para a questo anterior no trivial, e este ainda (e
possivelmente sempre ser) um problema no resolvido. Existem algumas
sugestes na literatura; entretanto, todas elas so relacionadas a tipos
especficos de sinais e no so diretamente extrapolveis para espectroscopia
NIRR. Na falta de melhor guia, resolvemos adotar a seguinte estratgia para
o corte de frequncias: cortvamos as frequncias e avalivamos a
distribuio dos resduos (espectro original menos espectro filtrado).
Enquanto esta distribuio permanecesse gaussiana, prosseguiamos no corte;
caso a forma da distribuio se alterasse, encerravamos o processo de corte.
O suporte terico para o procedimento adotado o seguinte: uma vez que o
rudo que desejamos minimizar possui caracterticas aleatrias, a sua funo
de distribuio deve ser gaussiana. Logo a distribuio dos resduos da
aplicao do filtro de transformada de Fourier (STFT ou FT simples), isto ,
espectro tratado menos o espectro original, tambm deve ser gaussiana. Na
Figura 7.3 temos os espectros tratados com o filtro de FFT sobrepostos aos
no tratados. Apresentamos somente os resultados da aplicao do filtro de
transformada de Fourier para os espectros das folhas de trigo mas o mesmo
comportamento foi observado para as amostras de folhas de milho e algodo.
Na Figura 7.4 representamos a distribuio dos resduos aps o corte das
frequncias altas, para os espectros das folhas de trigo.

96
Figura 7.3. Efeito do filtro de transformada de fourier.

Distribuio de resduos para o filtro de Transformada de Fourier

80

60
Frequncia

40

20

-0.0008 -0.0006 -0.0004 -0.0002 0.0000 0.0002 0.0004 0.0006 0.0008


Resduo

Figura 7.4. Distribuio dos resduos do filtro de transformada de Fourier (STFT).


O processo adotado para o corte das frequncias relativas ao rudo, nos
garante que apenas rudo ser excluido do espectro original, mas no nos
garante, exatamente, que o rudo excluido todo o rudo, presente no
espectro (ou em outro sinal qualquer).

97
7.2.2 Filtro de transformada de Wavelet

A estratgia utilizada para a reduo de rudo foi muito semelhante


quela utilizada no filtro de transformada de Fourier. A nica diferena que
no caso das wavelets avalivamos a distribuio dos resduos em funo do
grau de compresso da funo de base (Daubechies 4) usada na convoluo
com o espectro NIRR. Obtivemos que uma nica compresso (reduo do
perodo da funo de base metade) foi suficiente para a reduo do rudo,
compresses superiores distocem o espectro NIRR. Na Figura 7.5 temos os
espectro tratados com o filtro de wavelets sobrepostos aos no tratados e na
Figura 7.6 representamos a distribuio dos resduos aps a primeira
compresso.

Figura 7.5. Efeito do filtro de wavelet.

98
Distribuio de resduos para o filtro de Wavelet

80

Frequncia 60

40

20

-0.0010 -0.0008 -0.0006 -0.0004 -0.0002 0.0000 0.0002 0.0004 0.0006 0.0008
Resduo

Figura 7.6. Distribuio dos resduos do filtro de wavelet.

7.2.3 Filtro de Savitzky-Golay

Antes de apresentarmos os resultados vale lembrar que este tipo de


filtro suaviza os espectros mas no remove rudo, como o caso dos filtros
de transformada de Fourier e Wavelets. Neste filtro, descrito na introduo
(seco 3), a interpolao foi feita a cada onze pontos usando a funo x2 .

Outras interpolaes (nmero de pontos e funo) foram testadas mas


descartadas pois causavam distores nos espectros. Na Figura 7.7 temos os
espectro tratados com o filtro de Savitzky-Golay sobrepostos aos no
tratados e na Figura 7.8 representamos a distribuio dos resduos aps a
aplicao do filtro de Savitzky-Golay.

99
Figura 7.7. Espectros tratados com o filtro de Savitzky-Golay, sobrepostos aos no
tratados.

Distribuio de resduos para o filtro Savitzky - Golay


80

60
Frequncia

40

20

-0.0004 -0.0002 0.0000 0.0002 0.0004


Resduos

Figura 7.9. Resduos do filtro de Savitzky-Golay

7.2.4 Comparao dos filtros utilizados


Um modo de comparar os filtros utilizados avaliar a rea da
gaussiana ajustada distribuio dos resduos. Assim sendo, o filtro cuja
gaussiana apresentar a maior largura meia altura (ou a maior rea) ser o

100
mais eficiente. Gaussianas fortemente centradas em torno do valor zero
(pequena largura), indicam que, possivelmente, pouco rudo foi removido.
Resumindo, os resduos devem apresentar distribuio gaussiana, centrada
em zero e quanto mais larga a gaussiana, melhor o filtro.
Os filtros de Fourier e Wavelets apresentaram desempenho
equivalente, visto que a rea da gaussiana relativa ao filtro de Fourier (rea=
0,025) foi, para todos efeitos prticos, igual rea da gaussiana relativa ao
filtro de Wavelet (rea = 0,023). Todavia, tanto o filtro de transformada de
Fourier quanto o de transformada de Wavelet foram significativamente
melhores que o filtro de Savitzky-Golay (rea = 0,01).
Alm do mtodo anterior avaliamos a desempenho dos filtros de pr-
processamento em funo dos resultados que produziram nos modelos
utilizados (PLS, PLS polinomial, PLS rede neural, redes neurais e redes
neurais com prunning), isto , avaliamos o filtro que permite construir
modelos de melhor qualidade, isto , menores erros. Discutiremos este fato
aps termos apresentado os resultados obtidos com os modelamentos.

7.3 Correo do espalhamento de luz (MSC, Multiplicative Scattering


Correction)

Conforme podemos observar nas Figuras 7.10 e 7.11, a correo do


espalhamento de luz ( MSC ) nos permitiu normalizar os espectros, isto ,
removemos a inclinao da linha base (drift) e o deslocamento dos
espectros em relao s ordenadas. Estes efeitos, conforme discutido na
introduo desta tese, so relativos, basicamente, ao espalhamento de luz, o
qual causado por diferenas de granulometria entre as amostras e no por
diferenas de concentrao, das espcies absorventes.

101
Figura 7.10. Espectros de folhas de trigo, antes do MSC.

Figura 7.11. Espectros de folhas de trigo aps o MSC.

7.4 A umidade das amostras


102
A gua possui bandas de absoro muito intensas no infravermelho
prximo, sendo que as duas principais absores ocorrem em 1450 e 1940
nm. Como 98% do nitrognio presente nas folhas se apresenta ligado em
molculas de protena, as quais absorvem em regies prximas as absores
da gua, teremos alguma sobreposio entre as bandas de gua e as bandas
utilizadas para a determinao de nitrognio. Assim, se a umidade variar
aleatoriamente de amostra para amostra, teremos mais uma varivel para
modelar, sobre a qual no temos nenhuma informao ou controle.
Entretanto seria muito fcil quantificar tal varivel, basta fazer uma anlise
termogravimtrica100 (TGA) para cada amostra e incluir o valor da umidade
nos modelos. Todavia, seria este procedimento realmente necessrio?
Alm de desnecessrio, este procedimento indesejvel visto que,
conforme descrevemos na introduo, desejamos mtodos rpidos para
anlise in situ. Para evitar este procedimento resolvemos utilizar em todos os
modelos (PLS, POLIPLS, NNPLS, Redes neurais e Redes neurais com
apodizao) no os espectros NIRR, mas os escores destes espectros, pois
conforme descrevemos na introduo desta tese (seco 3.3), podemos
utilizar somente os escores relativos aos primeiros componentes principais,
os quais no devem capturar variaes aleatrias, como por exemplo, a
umidade das amostras. Utilizando os escores relativos aos componentes que
capturam a maior parte da varina dos dados, filtramos ( reduzimos) o
efeito da umidade. Naturalmente, os escores foram obtidos aps o pr-
processamento completo dos espectros.
Fizemos a anlise termogravimtrica das amostras e observamos que
todas apresentavam, praticamente, a mesma umidade, cerca de 5%. Na
sequncia de Figuras abaixo, apresentamos as curvas de perda de massa em
funo da temperatura, para a amostra que apresentou o maior teor de

103
umidade (Figura 7.12), para a amostra com menor teor de umidade (Figura
7.13) e para uma amostra com teor de umidade intermedirio (Figura 7.14 ).

Figura 7.12. Curva representativa da variao da massa em funo da temperatura para a amostra
com maior teor de umidade (5,5 %).

Figura 7.13. Curva representativa da variao da massa em funo da temperatura para a amostra
com menor teor de umidade (4,65 %).

104
Figura 7.14. Curva representativa da variao da massa em funo da temperatura para a
amostra com teor de umidade intermedirio (5,09 %).

O fato de todas as amostras apresentarem, praticamente a mesma


umidade, indica que o processo de secagem foi igualmente eficiente (todas
amostram com a mesma umidade) e que possivelmente o uso dos escores dos
espectros para a construo dos modelos, possivelmente eliminar o efeito
da umidade.

7.5 Seleo das amostras101

As amostras foram separadas em trs conjuntos distintos. Um


conjunto para calibrao, outro para validao e outro conjunto para
previso. As amostras de folhas trigo foram distribuidas da seguinte maneira:
36 para calibrao, 12 para validao e 12 para previso.
Para executar a seleo das amostras de modo eficiente fizemos a
anlise de componentes principais (PCA) dos espectros (j tratados com
filtro de Fourier e MSC) obtidos para as folhas de trigo. O grfico dos escores
do primeiro componente principal PC1 versus os escores do segundo
componente principal (PC2), nos permite reduzir a dimenso do sistema e

105
visualizar possveis agrupamentos (clusters) dos espectros, possibilitando
a seleo homognea das amostras usadas na calibrao, validao e
previso ( Figura 7.15 ).

Figura 7.15. Diagrama utilizado para a seleo das amostras.

No diagrama apresentado na Figura 7.15, as cruzes vermelhas


representam uma determinada amostra e quanto mais prximas as cruzes,
mais semelhantes sero os espectros das amostras.
Alm disso, o diagrama da Figura 7.15 nos auxilia a garantir que os
espectros referentes ao menor e ao maior teor de nitrognio, estejam no
conjunto de calibrao, visto que estamos construindo modelos locais, para
os quais no devemos, princpio, fazer extrapolaes.

7.6 Modelamentos

106
Desenvolvemos modelos de calibrao exclusivamente para as
amostras de folhas de trigo. As amostras de milho e algodo foram utilizadas
com outra finalidade que se tornar clara, mais adiante no texto.
Os modelos foram construdos combinando-se todas as tcnicas de
pr-processamento de sinais com todas as tcnicas de modelamento,
resultando em um total de oitenta modelos.
A construo dos modelos foi feita utilizando-se, no o espectro todo
( todas intensidades de reflectncia, lidas em todos os comprimentos de onda
) mas, os cinco primeiros componentes principais ( PCs ) deste espectros,
os quais capturavam aproximadamente, 95% da varincia dos dados. A
opo por cinco PCs deve-se ao fato de que se fosse utilizado um nmero
superior ou inferior a este, aumentvamos os erros de validao e previso
em todos os modelos. Entretanto, nos modelos em que empregamos a
derivada segunda dos espectros utilizamos vinte componentes principais
(PCs), visto que neste caso estes PCs forneceram modelos com menores
erros de calibrao, validao e previso.

7.6.1 Avaliao do desempenho dos modelos

Com o objetivo de avaliar a desempenho das tcnicas de pr-


processamento e de modelamento, executamos todas as combinaes
possveis entre as tcnicas de pr-processamento e os mtodos de
modelamento e avaliamos a porcentagem de erro padro, para os conjuntos
de calibrao (%SEC), validao (%SEV) e previso (%SEP). As equaes
utilizadas para o clculo destes erros foram as equaes 7.1 e 7.12,
respectivamente.

107
nc

1
( y y$ )
i =1
i i
2

eq.7.1
% SEC = 100
cc nc k 1

np

1
( y y$ )
i =1
i i
2

eq.7.2
% SEP = 100
cp np

onde cc e c p so as concentraes mdias do conjunto de calibrao e

previso respectivamente, nc e n p representam o nmero de amostras usadas

na calibrao e na previso, k o nmero de componentes principais (PCs)


utilizados nos modelos, yi valor real e y$i o valor do teor de nitrognio
previsto pelo modelo. A equao usada para o clculo da %SEV idntica
equao da %SEP. Alm dos parmetros anteriores, lanamos em grfico yi
contra y$i , ajustamos uma relao linear entre eles e calculamos o coeficiente
de correlao ( r 2 ), o coeficiente angular ( a ) e o linear ( b ), para os trs
conjuntos (calibrao, validao e previso).
Uma vez calculados os parmetros anteriores, podemos avaliar a
desempenho individual e relativa dos modelos. Esta comparao foi feita
utilizando-se basicamente os valores de %SEC, %SEV e %SEP sendo que
os demais parmetros (coef. de correlao, coef. angular e coef. linear)
serviram de modo auxiliar. Utilizamos a seguinte estratgia:

1) Desempenho individual

Modelos que apresentavam %SEP e/ou %SEV duas vezes maior que
o %SEC, foram foram imediatamente descartados, visto ser esta uma

108
indicao de sobreajuste (overfitting), isto , modelos com baixos erros de
calibrao e altos de previso e validao. Alm disso, tambm foram
descartados modelos com erros ( % SEC, % SEP ou % SEV) muito acima
do aceitvel (digamos 15 % de erro). Esta estratgia reduziu
consideravelmente o nmero de modelos a serem analisados, isto ,
comparados.
Assim sendo, a prxima tarefa comparar todos os modelos restantes
e escolher aqueles que apresentem melhor desempenho. Uma maneira de
estabelecer esta comparao construir uma tabela (Tabela 1) com os valores
de % SEC, % SEV, % SEP, coeficiente de correlao ( r2 ), coeficiente
angular e coeficiente linear, para cada um dos modelos e em seguida,
compar-los. Esta tarefa extremamente tediosa pois muitos modelos
apresentam bons valores de % SEP, % SEC e % SEP mas, valores runs para
os outros parmetros, dificultando a escolha dos melhores modelos.
Entretanto, existe um modo de facilitar as coisas, como veremos seguir.

Tabela 1. Resultados obtidos com os mtodos de modelamento


N0 / modelo Filt. Der SEC SEP SEV r2c r2p r2v ac ap av bc bp bv
1 FFT no 4.78 6.98 6.13 0.99 0.99 0.99 1.00 0.99 0.99 0.01 0.00 0.03
RN
2 FFT no 4.80 7.00 5.80 0.99 0.99 0.99 0.99 0.99 0.99 0.00 0.01 0.02
RNP
3 FFT no 6.10 8.80 6.24 0.99 0.99 0.99 0.98 0.99 0.99 0.05 0.01 0.03
PLSRN
4 FFT no 6.75 6.81 10.5 0.99 0.99 0.98 0.98 0.98 0.99 0.06 0.06 0.01
PLS
5 FFT no 6.42 7.83 11.1 0.99 0.98 0.98 0.96 0.92 0.97 0.15 0.26 0.09
POLIPLS
6 FFT sim 5.03 6.33 10.5 0.99 0.99 0.97 0.98 1.03 0.99 0.06 0.04 0.11
RN
7 FFT sim 5.63 7.40 9.99 0.99 0.99 0.98 0.99 1.00 1.02 0.03 0.04 0.03
RNP
8 FFT sim 6.13 6.19 8.60 0.99 0.99 0.99 0.98 0.99 0.99 0.05 0.00 0.04
PLSRN
9 FFT sim 5.46 7.61 10.7 0.99 0.98 0.97 0.98 0.97 0.93 0.04 0.19 0.19
PLS

109
10 FFT sim 3.94 5.00 11.3 0.99 0.99 0.97 0.99 1.00 1.00 0.04 0.05 0.03
POLIPLS
11 SG no 5.09 8.84 10.9 0.99 0.98 0.96 0.98 0.97 0.95 0.06 0.06 0.09
RN
12 SG no 6.43 6.55 8.65 0.98 0.99 0.97 0.98 0.96 0.97 0.04 0.06 0.04
RNP
13 SG no 6.59 8.30 9.40 0.99 0.98 0.98 0.98 0.92 0.97 0.11 0.20 0.09
PLSRN
14 SG no 5.91 6.20 8.00 0.99 0.99 0.98 0.98 0.95 0.96 0.06 0.2 0.1
PLS
15 SG no 5.42 7.83 11.1 0.99 0.98 0.97 0.95 0.92 0.96 0.15 0.26 0.01
POLIPLS
16 SG sim 4.98 16.5 16.4 0.99 0.95 0.93 0.99 1.08 1.03 0.01 0.34 0.27
RN
17 SG sim 6.43 6.55 8.61 0.99 0.99 0.98 0.98 0.96 0.97 0.05 0.13 0.13
RNP
18 SG sim 6.60 8.20 9.40 0.99 0.98 0.98 0.97 0.92 0.97 0.11 0.20 0.10
PLSRN
19 SG sim 4.90 15.7 11.5 0.99 0.93 0.96 0.99 1.19 1.04 0.02 0.71 0.01
PLS
20 no no 5.49 5.99 11.9 0.99 0.99 0.95 0.98 0.96 0.94 0.06 0.17 0.12
RN
21 no no 6.51 6.9 8.1 0.99 0.99 0.98 0.98 0.95 0.96 0.03 0.14 0.15
RNP
22 no no 4.60 6.85 9.42 0.99 0.98 0.98 0.99 0.95 0.97 0.03 0.15 0.10
PLS
23 no no 4.98 8.56 12.0 0.99 0.98 0.96 0.96 0.92 0.97 0.13 0.19 0.02
POLIPLS

* Na construo da Tabela 1 utizamos as seguintes abreviaes: Redes neurais com apodizao (RNP),

Redes neurais (RN), Mnimos Quadrados Parciais - redes neurais (NNPLS), Mnimos Quadrados Parciais
(PLS), Mnimos Quadrados Parciais-ajuste polinomial (POLIPLS), Filtro de transformada de Fourier
(FFT), Filtro de Savitzky-Golay (SG) e derivada (Der.). Os sub ndices c, v e p, indicam calibrao,

validao e previso, respectivamente.

Um modo de transpor a dificuldade anterior aplicar a anlise de


componentes principais ( PCA ) aos resultados obtidos com os modelos. A
aplicao foi feita do seguinte modo: elaboramos uma matriz em que as
linhas, representavam um mtodo de modelamento e as colunas os
parmetros utilizados na avaliao do modelo (% SEP, % SEC , etc). Em
seguida aplicamos a anlise de componentes principais (PCA) sobre esta
matriz e traamos, em trs dimenses, o grfico paramtrico dos escores,

110
para os trs primeiros componentes principais ( um escore em cada
coordenada) os quais capturavam 99,5% da varina dos dados. O objetivo
deste procedimento absolutamente idntico ao utilizado para a seleo das
amostras ( tem 7.5 desta tese ), isto , observar possveis agrupamentos dos
resultados. O grfico obtido, est apresentado na Figura 7.16.

III
II

PC 3
4

I
IV

PC 2
PC 1

Figura 7.16. Grfico utilizado para a seleo dos modelos.

No grfico apresentado na Figura 7.16, podemos observar que existem


quatro grupos bsicos de resultados. Naturalmente, as curvas que delimintam
os grupos so seces retas de superfcies envoltrias destes grupos, dado
que estamos trabalhando em um espao tridimensional.
Na anlise anterior, no incluimos os modelos em que se utilizou o
filtro de transformada de Wavelet pois, os resultados obtidos com os modelos
em que se utilizou este tipo de filtro, so praticamente idnticos aos
construdos com filtro de transformada de Fourier. Portanto, a incluso

111
destes resultados no acrescentaria nada existncia ou no de possveis
agrupamentos entre os dados, mas prejudicaria muito a visualizao destes
agrupamentos, devido ao aumento de pontos no grfico da Figura 7.16.

A comparao dos componentes de um determinado grupo com a


Tabela 1, nos leva seguinte classificao:

Grupo 1 : modelos com o melhor desempenho relativa

Neste grupo encontramos os modelos 1, 2 e 3. Como pode ser observado, na


Tabela 1, todos estes modelos so baseados em redes neurais.

Grupo 2 : modelos com desempenho intermedirio

Neste grupo encontramos os modelos 8, 17, 18 e 21, todos baseados em redes


neurais.

Grupo 3 : modelos com desempenho satisfatrio


Neste grupo encontramos os modelos 4 e 5. O modelo 4 um modelo
constrdo com o PLS e o modelo 5, com o PLS polinomial.

Grupo 4 : modelos com desempenho insatisfatrio


Neste grupo (obviamente) encontramos os modelos restantes, os quais no
sero discutidos dado sua baixa desempenho. Neste grupo, dentre outros,
encontramos: modelos em que no se empregou filtro para rudo, modelos
em que se utilizou a derivada primeira dos espectros e filtro de Savitzky-
golay.
Terminada a anlise anterior, fica simples obter os modelos que
apresentaram melhores resultados, para cada um dos mtodos de
112
modelamento de dados. Escolhemos um modelo para cada mtodo de
modelamento, j que um dos nossos objetivos avaliar a desempenho
relativa dos seguintes mtodos de modelamento: Redes Neurais com
Apodizao (RNP), Redes Neurais (RN), PLS redes neurais (NNPLS), PLS
e PLS polinomial (POLIPLS).
Escolhemos os modelos do grupo I e do grupo III. No escolhemos
os modelos do grupo II, pois este grupo formado exclusivamente por
modelos baseados em redes neurais, os quais j foram escolhidos, quando
selecionamos os modelos do grupo I. Assim sendo, os modelos selecionados
foram:

Redes neurais com apodizao, correo de espalhamento de luz (MSC)


e filtro de transformada de Fourier.

Redes neurais, correo de espalhamento de luz (MSC) e filtro de


transformada de Fourier.

PLS Redes Neurais, correo de espalhamento de luz (MSC) e filtro de


transformada de Fourier.

PLS, correo de espalhamento de luz (MSC) e filtro de transformada de


Fourier.

PLS Polinomial, correo de espalhamento de luz (MSC) e filtro de


transformada de Fourier.

2) Desempenho relativa102:

113
Selecionados os modelos que desejamos comparar ( modelos 1 at 5
da pgina anterior), centralizaremos toda a anlise subsequente sobre estes
modelos, para obtermos uma classificao dos mtodos de modelamento,
isto , na etapa anterior fizemos uma classificao grosseira, que ser
refinada nesta etapa.
Uma vez que os modelos selecionados anteriormente no apresentam
sobreajuste (overfitting), podemos fundir os conjuntos de validao e
previso em um nico conjunto, aqui chamado de conjunto de previso
combinado, e calcular para este conjunto o erro padro de previso
combinado (% SEPC). Lembre-se, o objetivo de separar o conjunto de
amostras de teste (previso + validao) em dois conjuntos de 12 amostras (
12 para validao e 12 para previso ), foi somente o de identificar modelos
com sobreajuste.
A seguir apresentaremos em detalhe a desempenho de cada um dos
cinco mtodos de modelamento selecionados.
PLS

Utilizamos correo de espalhamento de luz (MSC), 5 PCs e filtro de


Fourier. Os resultados dos modelos utilizando o filtro de Wavelets ou Fourier
foram estatisticamente (teste F) iguais, portanto, a opo por um deles pode
ser feita em funo da facilidade de implementao e no caso especfico
destes dados, optamos pelo filtro de transformada de Fourier.

% SEC % SEPC
6,75 8,91

114
PLS
6

4
NIRR-PLS, % N

2 Calibrao
Previso
1

0
0 1 2 3 4 5
KJELDAHL, % N

Figura 7.17. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
PLS versus o valor obtido com o mtodo Kjeldahl.

PLS Polinomial (POLIPLS)

Utilizamos correo de espalhamento de luz(MSC), 5 PCs e filtro de


transformada de Fourier. A funo utilizada para modelar a relao entre os
escores da matriz dos espectros e os escores da matriz das concentraes foi
a quadrtica ( x 2 ).

% SEC % SEPC
6,42 9,65

115
PLS polinomial (POLIPLS)

5
NIRR-PLS-Polinomial, % N

2
Calibrao
Previso
1

0
0 1 2 3 4 5
KJELDAHL, % N

Figura 7.18. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
POLIPLS versus o valor obtido com o mtodo Kjeldahl.
Redes Neurais(RN)

Utilizamos como tcnicas de pr-processamento: correo de


espalhamento de luz(MSC), 5 PCs e filtro de Fourier.

% SEC % SEPC
4,78 6,53

116
Redes Neurais
6

NIRR-REDES NEURAIS, % N 5

Calibrao
1 Previso

0
0 1 2 3 4 5
KJELDAHL, % N

Figura 7.19. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
RN versus o valor obtido com o mtodo Kjeldahl.

A arquitetura da rede neural que formeceu os menores erros de


calibrao (a arquitetura foi otimizada da maneira descrita no tem 4.1.6),
validao e previso est representada na Figura 7.20 .

117
PC1 PC2 PC3 PC4 PC5

sigmoidal

Linear

%N
Figura 7.20. Representao da rede neural utilizada no nodelamento. Esta rede possui
uma camada de entrada com cinco neurnios, uma camada intermediria com quatro
neurnios e uma camada de sada com um nico neurnio. A funo de transferncia
utilizada entre a camada intermediria e a camada de sada foi a funo sigmoidal. Na
camada de sada utilizou-se a funo linear.

PLS Rede Neural (NNPLS)

Utilizamos correo de espalhamento de luz (MSC), 5 PCs e Filtro


de transformada de Fourier.

% SEC % SEPC
6,10 7,64

118
PLS redes neurais ( NNPLS )
6

4
NIRR-NNPLS, % N

2
Calibrao
Previso
1

0
0 1 2 3 4 5
KJELDAHL, % N

Figura 7.21. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
NNPLS versus o valor obtido com o mtodo Kjeldahl.

Nesta verso no-linear do PLS a relao entre os escores da matriz


dos espectros e os escores da matriz das concentraes foi modelada por uma
rede neural com a seguinte arquitetura: uma camada de entrada com 5
neurnios(um para cada PC), trs na camada intermediria e um na camada
de sada. Entre a camada intermediria e a camada de sada utilizamos a
funo sigmoidal e na camada de sada a funo linear.

Redes Neurais com Apodizao (RNP)

Utilizamos como tcnicas de pr-processamento: correo de


espalhamento de luz (MSC), 5 PCs e filtro de transformada de Fourier.
119
% SEC % SEPC
4,8 6,29

Redes Neurais com Apodizao (Pruning)


6
NIRR-REDES NEURAIS com Apodizao, % N

2
Calibrao
1
Previso

0
0 1 2 3 4 5
KJELDAHL, % N

Figura 7.22. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
RNP versus o valor obtido com o mtodo Kjeldahl.

A rede neural foi inicializada com a arquitetura apresentada na Figura


7.23:

120
PC1 PC2 PC3 PC4 PC5

s L s L s L s L s L

Figura 7.23. Rede neural de inicializao. L representa a funo de transferncia linear e


S a funo de transferncia sigmoidal. Nesta rede neural temos uma camada de entrada
com cinco neurnios, uma camada intermediria com dez neurnios e uma camada de
sada com um neurnio.

Observe na Figura 7.23 que os neurnios da camada intermediria


foram inicializados alternando-se as funes de transferncia linear (L) e
sigmoidal (S). Assim sendo, esta rede pode modelar igualmente bem relao
lineares e no-lineares. Alm disso, ao final do processo de apodizao
podemos verificar quais neurnios foram eliminados e, portanto, se somente
os lineares tiverem sido eliminados, temos uma indicao de que os sistema
em questo apresentava caractersticas realmente no-lineares; caso
contrrio o sistema seria linear. Naturalmente, se restassem neurnios
lineares e no-lineares, teramos ainda um sistema no-linear.
Aps o treinamento da rede neural, restaram somente dois neurnios.
Foram eliminamos oito neurnios e com eles a possibilidade de sobreajuste
(overfitting). A arquitetura da rede neural aps a apodizao dos neurnios
dispensveis, est representada na Figura 7.24:

121
PC1 PC2 PC3 PC4 PC5

s L s L s L s L s L

%N
Figura 7.24. Rede neural aps o corte dos neurnios desnecessrios, apenas dois
neurnios so suficientes para o modelamento.

conforme podemos observar na Figura 7.24, restaram somente neurnios no


lineares e, portanto, nosso sistema possui caractersticas no-lineares.
Uma grande vantagem de utilizar-se redes neurais com prunning que
evitamos a caracterstica mais perigosa das redes neurais: o sobreajuste
(overfitting). Outra vantagem que no necessitamos testar vrias
arquiteturas, isto , no necessitamos variar o nmero de neurnios na
camada intermediria para em seguida escolhermos aquele que apresenta os
menores erros de calibrao, validao e previso. Neste mtodo matamos
dois coelhos com uma cajadada s.
Para confirmarmos que os modelos no apresentam sobrejuste
(overfitting), apresentamos em um grafico de barras (Figura 7.25), os valores
de % SEC e % SEPC para cada um dos modelos selecionados.

122
RNP RN NNPLS PLS POLIPLS

10

6
Valor

% SEC % SEPC

Figura 7.25. Grfico de barras dos valores de % SEC e % SEP, para todos modelos

testados.

Conforme pode ser facilmente observado na Figura 7.25, os modelos

realmente no apresentam sobreajuste (overfitting) pois os valores de %SEC

e %SEPC no so significativamente diferentes.

A anlise, superficial, dos valores de % SEPC, apresentados para cada

um dos modelos nos indica que a rede neural com apodizao (pruning) foi

o mtodo de modelamento mais eficiente, seguido pelas redes neurais

ordinrias, PLS redes neurais, PLS e PLS polinomial. A desempenho das

redes neurais com pruning foi 5 % melhor que as redes neurais ordinrias,

18 % melhor que o PLS redes neurais, 30 % melhor que o PLS e 35 % melhor

que o PLS polinomial. Entretanto, seriam estas diferenas entre os valores

123
de %SEPC, estatisticamente significativas, de modo a justificar a

classificao anterior ?

Para comparar dois valores de %SEPC, podemos utilizar o teste F,

dado pela equo 7.3, em que p i e p j so o nmero de amostras utilizadas

no conjunto de previso102, 103.

2
SEPi
F( p i , p j ) = eq.7.3
SEPj

O valor crtico do teste Fcritical anterior, no nvel de 95 % de confiana, para o

conjunto de 24 amostras utilizadas na previso, :

Fcritical = 1,98

valores calculados de F, maiores que o valor de Fcritical indicam que o

desempenho dos modelos so significativamente diferentes, caso contrrio

os desempenhos dos modelos, sero iguais.

Quando aplicamos o teste F aos valores de % SEPC, obtidos com os

diferentes mtodos de modelamento selecionados, observamos que as redes

neurais com pruning so significativamente melhores que o PLS (F = 2.1) e

o PLS polinomial (F = 2.4). Entretanto, quando comparamos, utilizando o

124
teste F, as redes neurais com pruning com o PLS Rede neural (F = 1.5) e

com as redes neurais ordinrias (F = 1.1), observamos que as diferenas

verificadas nos valores de %SEPC, no so significativas no nvel de 95 %

de confiana.

Os resultados obtidos com o teste F, no nvel de 95 % de confiana,

nos indicam que a desempenho dos cinco algoritmos de modelamento, pode

ser finalmente classificada, basicamente, em duas classes. Na classe com

menores erros, temos os modelos construdos com as redes neurais com

pruning (RNP), redes neurais (RN) e PLS rede neural (NNPLS). Na classe

com maiores erros, temos os modelos construdos com o PLS e PLS

polinomial (POLIPLS). Modelos pertecentes a uma determinada classe, no

apresentam diferenas nos valores de %SEPC, significativas ao nvel de 95

% de confiana. Na Figura 7.26, apresentamos o grfico de barras dos valores

do teste F, para cada um dos mtodos de modelamento, onde se pode

observar as duas classes de modelos, anteriormente citadas.

125
RNP RN NNPLS PLS POLIPLS

2.4
2.2 FCritical = 1.98
2.0
1.8

Teste F 1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
A B

Grupos

Figura 7.26. Grfico de barras dos valores de teste F, utilizados para a comparao da

desempenho dos modelos. (A) grupo de menores erros, (B) grupo de maiores erros.

Finalmente, a classificao dos modelos, segundo o teste F, a


seguinte:

1) Redes Neurais com apodizao (prunning), Redes neurais e PLS redes


neurais.

2) PLS e PLS polinomial

Conforme observamos no h diferenas significativas entres os


modelos da primeira classe e a opo por um deles pode ser feita em funo
da velocidade de processamento, disponibilidade de softwares, etc. Neste
caso especfico fao a opo pelas redes neurais com apodizao, visto que
dentre outras vantagens, no necessitamos otimizar a arquitetura da rede,
tarefa esta que consome algum tempo (pacincia tambm). Alm disso,
126
podemos combinar, facilmente, o modelo obtido com as redes neurais com
apodizao com reconhecimento de padres, como veremos a seguir.

7.7 Redes Neurais e o Reconhecimento de Padres

Neste etapa do nosso trabalho desejvamos construir uma rede neural


que a partir dos espectros de reflectncia no infravermelho prximo (NIRR)
fosse capaz de identificar (reconhecer padres) entre amostras de folhas de
trigo, milho e algodo, aquela que deu origem ao espectro. Para tanto,
utilizamos os espectros de dez amostras de folhas de milho (cinco para
calibrar e cinco para prever), dez de algodo (cinco para calibrar e cinco para
prever) e cinquenta e quatro amostras de folhas de trigo (cinco para calibrar
e 49 para prever). As entradas(inputs) da rede neural foram os espectros de
trigo, milho e algodo e as sadas foram codificadas da seguinte maneira:

trigo = [ 1 0 0 ]

milho = [0 1 0 ]

algodo = [ 0 0 1 ]

A rede neural utilizada para tal tarefa, foi treinada com o mtodo de
Marquardt-Levenberg e apresentava a arquitetura representada na Figura
7.27:

127
-Log(R/Ro)
0.38

0.36

0.34

0.32

0.30

0.28

0.26

0.24

1400 1600 1800 2000 2200 2400


nm

1 2 3 4 ... 277

sigmoidal

sigmoidal
Trigo Milho Algodo

Figura 7.27. Representao da rede neural utilizada na classificao dos espectros. Esta
rede neural possui uma camada de entrada com 277 neurnios, uma camada intermediria
com oito neurnios e uma camada de sada com trs neurnios. A funo de transferncia
utilizada entre a camada de intermediria e a camada de sada foi a funo sigmoidal. Na
camada de sada, utilizou-se a funo sigmoidal.

Utilizando a rede neural anterior, obtivemos 100% de classificaes corretas,


isto , apresentvamos um espectro NIRR rede neural e ela informava
o tipo de amostra (folhas de trigo, milho ou algodo) que deu origem ao
espectro. Enfim, a rede neural foi capaz de separar os espectros em trs
classes distintas.

128
7.8 Unindo classificao e modelamento

Uma vez que foi possvel classificar os espectros utilizando redes


neurais elaboramos um programa em MATLAB em que inicialmente uma
rede neural j treinada (a rede do tem anterior) classifica os espectros em
uma das trs classes (trigo, milho ou algodo). Aps a classificao segue-
se a quantificao do teor de nitrognio via uma rede neural com prunning
previamente treinada com as amostras da calibrao. Executamos o trabalho
de modelamento (calibrao) para o trigo conforme apresentado
anteriormente, mas naturalmente o mesmo trabalho pode ser feito para o
milho, o algodo ou outro tipo qualquer de cultura.
A vantagem de combinar classificao e modelamento em um nico
programa computacional, isto , em um sistema especialista a sua aplicao
em laboratrios de rotina. O operador do espectrofotmetro NIR no
necessita conhecer quimiometria, basta que o mesmo obtenha o espectro
NIRR das amostras de folhas e o programa se encarregar do resto do
trabalho, qual seja: a classificao e a previso do teor de nitrognio.

129
CAPTULO 8

CONCLUSES

8. Concluses

130
Neste trabalho podemos obter vrias concluses, umas ligadas s
tcnicas de pr-processamento e modelamento e outras ligadas aplicaes
prticas. Comeemos com aquelas ligadas s tcnicas de pr-processamento
e modelamento.
A partir dos resultados obtidos podemos concluir que se desejarmos
utilizar, com eficincia, a espectroscopia de reflectncia difusa no
infravermelho prximo (NIRR) para determinar nitrognio em folhas
devemos invariavelmente tratar o espectro obtido de modo a remover rudo
e espalhamento de luz; caso contrrio os erros de previso sero elevados.
Para remover o espalhamento de luz, devido s diferentes granulometrias das
amostras, devemos usar o mtodo MSC e, para remover o rudo, podemos
optar entre o filtro de Fourier e o filtro de Wavelets, visto que ambos
apresentaram desempenhos equivalentes.
A avaliao dos mtodos de modelamento fundamentada
simplesmente na comparao dos erros de previso, pode induzir a
concluses incorretas. Portanto, para avaliar o desempenho de mtodos de
modelamento, deve-se invariavelmente aplicar testes de significncia
estatstica, como por exemplo, o teste F.
Os mtodos de modelamento testados foram classificados em dois
grupos. Um grupo, com menores erros de previso, formado pelas redes
neurais com apodizao, redes neurais e PLS redes neurais e um segundo
grupo, com maiores erros de previso, formado pelo PLS e PLS polinomial.
Internamente a estes grupos no h diferenas significativas, no nvel de 95
% de confiana, entre os valores de % SEC e % SEPC.
Conforme descrevemos, os modelos baseados em redes neurais
apresentaram desempenhos significativamente superiores aos outros
mtodos de calibrao multivariada. Uma vez que, os trs mtodos baseados
em redes neurais no apresentaram diferenas significativas nos valores de
131
% SEPC, a opo por um deles deve ser feita considerando fatores como o
tempo computacional, a facilidade de implementao do mtodo, a
disponibilidade de softwares, etc. Entretanto podemos considerar que as
redes neurais com apodizao oferecem um maior potencial de aplicao em
calibrao multivariada que os demais mtodos, pois o seu uso no requer a
otimizao da arquitetura da rede neural e reduz significativamente a
possibilidade de overfitting. Alm disso, somente as redes neurais com
apodizao oferecem a possibilidade de diagnosticar e modelar dados,
independentemente das relaes de linearidade ou de no-linearidade entre
as variveis dependente e independentes.
Os bons resultados obtidos e a possibilidade de unificao entre
modelamento e classificao em um nico software tem incentivado a
substituio do tradicional mtodo Kjeldahl para anlise de nitrognio em
plantas pela metodologia desenvolvida neste trabalho, nos laboratrios de
rotina do INSTITUTO AGRNOMICO DE CAMPINAS (IAC).

132
CAPTULO 9
Referncias bibliogrficas

9. Bibliografia

[1] P. William e K. Norris,Near-infrared Technology: in agricultural e

foods industries, Americam Association of Cereal Chemists, Minnesota,

1990.

133
[2] D. L. Wetzel, Anal. Chem. 55(12), 1165A (1983).

[3] M. Twoney, G. Downey e P. B. McNulty, J. Sci. Food Agric. 67, 77

(1984).

[4] D. H. McQueen, R. Wilson e A. Kinnunen, Talanta, 42, 2007 (1995).

[5] E. Dreassi, G. Ceramelli, P. Corti, P. L. Perruccio e S. Lonard, Analyst,

121, 219 (1996).

[6] D. Jouan-Rimbaud, M. S. Khots, D. L. Massart, I. R. Last e K. A. Prebble,

Anal.Chim. Acta, 315, 243 (1995).

[7] R. Tkachuk, J. Am. Oil Chem. Soc., 58, 819 (1981).

[8] M. Hana, W. F. McClure e T . B. Whitaker, J. Near Infrared Spectrosc.,

3, 133 (1995).

[9] D. Wienker, W. Broek, W. Melssen, L. Buydens, R. Feldhoff, T.

Kantimm, T. H. Fehre, L. Quick e K Cammann, Anal. Chim. Acta, 317, 1

(1995).

[10] M. Martin, A. Garrison, M. Roberts, P. Hall e C. Moore, Process

Control Qual., 5, 187 (1993).

[11] D. Lambert, B. Descartes, J. R. Llinas, A. Espinosa, S. Osta, M. Sanchez

e A. Martens, Analusis, 23(4), M9-M13 (1995).

[12] D. Lambert, B. Descartes, A. Espinosa, M. Sanchez, S. Osta, J. Gil, A.

Martens e M. Valleur, Analusis, 23(4), M20-M25 (1995).

[13] W. Kaye, Spectrochim. Acta, 6, 257 (1954).

[14] W. Kaye, Spectrochim. Acta, 7, 181 (1955).


134
[15] H. Martens e T. Naes, Multivariate Calibration, John Wiley & Sons,

Chichester, 1989.

[16] S. Sekulic, M. B. Seasholtz, Z. Wang, S. E. Lee, B. R. Holt e B. R.

Kowalski, Anal. Chem. 65(19), 835 A (1993).

[17] J. Zupan e J. Gasteiger, Neural Networks for chemists: an introduction,

VCH, Weinhein, 1992.

[18] J. Hertz, A. Krogh e R. G. Palmer, Introduction to the Theory of Neural

Computation, Addison Wesley, Menlo Park, 1991.

[19] L. Bokobza, J. Near. Infrared spectroscopy, 6, 3 (1998).

[20] O. H. Wheeler, J. Chem. Education, 37, 234 ( 1960 ).

[21] S. E. Krikorian e M. Mahpour, Spectrochim. Acta, 29A, 1233 (1973 ).

[22] A. L. Smith, Applied infrared Spectroscopy, John Wiley & Sons, New

York, 1979.

[23] B. Osborne e T. Fearn, Near infrared Spectroscopy in Food Analysis,

John Wiley & Sons, New York, 1986.

[24] J. J. Workman, Appl. spectrosc.Reviews, 31(3), 251 ( 1996 ).

[25] W. W. M. Wendlant e H. G. Hecht, Reflectance Spectroscopy, John

Wiley & Sons, New York, 1966.

[26] M. J. Adams, Chemometrics in Analytical Spectroscopy, The Royal

Society of Chemistry, Wolverhampton(UK), 1995.

[27] V. J. Barclay, R. F. Bonner e I. P. Hamilton, Anal. Chem. 69(1), 78

(1997).
135
[28] J. C. Miller e J. N. Miller, Statistics for Analytical Chemistry, Ellis

Horwood, Chichester, UK, 1993.

[29] C. L. Erickson, M. J. Lysaght e J. B. Callis, Anal. Chem., 64, 1155

(1992).

[30] S. E. Bialkowski, Anal. Chem., 60, 355 ( 1988 ).

[31] W. H. Press, S. A. Teukolsky, W, T. Vetterling e B. P. Flannery,

Numerical Recipes in Fortram: The Art of Scientific Computing, 2nd ed.,

Cambridge University Press, New York, 1992.

[32] A. Savitzky e M. J. E. Golay, Anal. Chem., 36, 1627 ( 1964).

[33] J. Steiner, Y. Tertonia e J. Deltour, Anal. Chem., 44, ( 1972).

[34] R. Bracewell, The Fast Fourier Transform e its Application, McGraw-

Hill, New York, 1965.

[35] H. J. Nussbaumer, Fast Fourier Transform e Convolutions algorithms,

Springer-Verlag, New York, 1982.

[36] P. Bloomfield, Fourier Analysis of time series, John Wiley, New York,

1976.

[37] C. Canuto, M. Y. Hussaini, A Quarteroni e T. A. Zang, Spectral

methods in fluid dynamics, Springer-Verlag, New York, 1988

[38] J. P. Gollub e G. L. Baker, Chaotic Dynamics, Cambridge University

Press, 1990.

[39] Eugene Butkov, Fsica Matemtica, Guanabara Koogan, Rio de

Janeiro, 1982.
136
[40] G. B. Arfken e H. J. Weber, Mathematical Methods for Physicists,

4th Edition, Academic Press, New York, 1995.

[41] H. Eisberg e R. Resnick, Quantun Physics, John Wiley & Sons, New

York, 1986.

[42] D. Halliday, R. Resnick e J. Walker, Fundamentals of Physics, 5th

Edition, John Wiley & Sons, New York, 1990.

[43] Y. Meyer e R. D. Ryan, Wavelets: Algorithms e Applications, SIAM,

Philadelphia, 1993.

[44] U. Depczynski, K. Jetter, K. Molt, A. Niemoller, Chemom. Intell.

Lab.Sys. 39, 19 (1997).

[45] B. Walczak, B. van der Bogaert e D. L. Massart, Anal. Chem. 68, 1742

(1996).

[46] D. J. Rimbaud, B. Walczak, R. J. Poppi e D. L. Massart. Anal. Chem.,

69, 4317 (1997)

[47] V. J. Barclay, R. F. Bonner e I. P. Hamilton, Anal. Chem., 69(1), 78

(1997).

[48] M. Wolkenstein, H. Hutter, S. G. Nikolov, I. Schmitz e M.

Grasserbauer, J. Trace e Micropobe Techniques, 15(1), 33 (1997 ).

[49] M. Wolkenstein, H. Hutter, S. G. Nikolov, I. Schmitz e M.

Grasserbauer, Fresenius J. Anal. Chem., 357, 783 ( 1997 ).

[50] R. Castleman, Digital Image Processing, Prentice Hall, New Jersey,

1996.
137
[51] G. Strang, American Scientist, 82, 250 (1994).

[52] M. Bos e E. Hoogendam, Anal. Chim. Acta,267, 73 (1992).

[53] I. Daubechies, Ten Lectures on Wavelets, SIAM, Philadelphia, 1992.

[54] P. P. Vaidyanatham, Multirate Systems e Filter Banks, Englewood

Cliffs, New Jersey, 1993.

[55] B. Walczak e D. L. Massart, Trends in anal. chem., 16(8), 451 (1997).

[56] T. Isaksson e B. R. Kowalski, Appl. Spectrosc., 47 (6), 702 (1993).

[57] P. Geladi, D. MacDougall e H. Martens, Appl. Spectrosc., 39, 491

(1985).

[58] B. M. Wise e N. B. Gallagher, PLS Toobox, for use with MATLABTM

, Eigenvector Technologies, P.O. Box 483, 196 Hyacinth Avenue, Manson,

WA 98831. ( E-mail: 73633.2451@compuserve.com) , (FAX (509) 964-7-

3973).

[59] R. Kellner, J. M. Mermet, M. Otto e H. M. Widmer (Eds.), Analytical

Chemistry, Wiley-VCH, New York, 1998.

[60] J. Zupan e J. Gasteiger, Anal. Chim. Acta, 248, 1 (1991).

[61]] W. MacCulloch e W. Pitts, Bull. Math. Biophy., 5, 115 (1943).

[62] Y. A. Liu e D. R. Baughman, Neural networks in bioprocessing e

chemical engineering, Academic Press, San Diego (1995).

[63] B. Katz, Nerve Muscle e Synapse, MacGraw Hill, New York (1996).

[64] H. M. Cartwright, Applications of Artificial Intelligence in

Chemistry, Oxford University Press, New York, 1995.


138
[65] G. Katerman e J. R. Smits, Anal. Chim. Acta, 277, 179 (1993).

[66] P. J. Gemperline, Chemom. e Intell. Lab. Sys.39, 29 (1997).

[67] P. De B. Harrington, Anal. Chem., 65(15), 2167 (1993).

[68] J. R. Long, V. G. Gregoriou e P. J. Gemperline, Anal. Chem., 62, 1791

(1990).

[69] B. Wythoff, Chemom.Intell. Lab. Sys. 18, 115 (1993).

[70] J. R. S. Jang, C. T. Sun e E. Mizutani, Neuro Fuzzy e soft computing,

Prentice Hall, Upper Saddle River (1997).

[71] C. Cunha, Mtodos Numricos para Engenharias e Cincias

Aplicadas, Editora da UNICAMP, 1993.

[72] S. C. Chapra e R. P. Canale, Numerical methods for engineers,

MacGraw-Hill, New York (1990).

[73] F. S. Acton, Numerical Methods that Works, Harper e Row, New

York, 1970.

[74] E. V. Thomas e D. M. Haale, Anal. Chem., 62, 1091 (1990).

[75] R. G. Brereton, Chemometrics, Ellis Horwood, Chichester, UK, 1990.

[76] A. F. Carley e P. H. Morgan, Computational Methods in the Chemical

Sciences, Ellis Horwood, Chichester, UK, 1989.

[77] J.Heitz, A. Kragh, R. G. Palmer, Introduction to the theory of neural

computation, Addison-Wesley, New York (1991).

[78] B. Hassibi e D. G. Stork, Advances in neural information processing

systems, Morgan Kaufmann, 1993.


139
[79]Y. Le Cun, B. Boser, J. S. Denker ans S. A. Solla, Optimal brain

damage: Advances in Neural information processing systems , vol.2,

Morgan Kaufman, San Mateo, 1990, p.598

[80]R. J. Poppi e D. L. Massart, Anal. Chim. Acta., aceito para publicao

em 1998.

[81]C. Goutte, On use of a prunning prior neural networks, in neural

network for signal processing IV, Proceedings of IEEE International

workshop, Piscataway (1996).

[82] S. E. Fahlman e C. Libiere, in: D. S. Touretzsky (Ed.), Advances in

Neural Information Processing Systems, Vol. 2, Morgan Kaufmann, San

Mateo, 1990, p.524.

[83]J. Larsen e L. K. Hansen, Generalization desempenho of regularized

neural network models, Proc. of the IEEE workshop on neural networks for

signal Proc. IV, Piscataway, New Jersey, 1994, p.164.

[84]M. Norgaard, Neural Network Based System Identification TOOLBOX

for use with MATLABTM , version 1.1, Technical University of Denmark,

1997.

[85]K. R. Beebe, B. R. Kowalski, Anal. Chem. 59(17), 1007A (1987).

[86]S. Wold, N. Kettaneh-Wold e B. Skagerberg, Chemom. e Intell. Lab.

Syst., 14, 1989.

[87] E. V. Thomas, Anal. Chem. 66(15), 795 A (1994).

[88]S. J. Quin e T. J. McAvoy, Computers Chem. Engng. 16(4), 379 (1992).


140
[89] O. C. Bataglia, J. P. F. Teixeira, A.M.C. Furlani e J. R. Gallo.Mtodos

de Anlise Qumica de Plantas, Boletim Tcnico No 78 do Instituto

Agronmico de Campinas, Campinas 1983.

[90] D. C. Tran, Anal. Chem., 64(20), 917A (1992).

[91] J. Xu, R. Stroud, Acousto-Optic Devices: Principles, Design e

Applications, Wiley-Interscience, New York, 1992.

[92] R. Guchardi, P. A. Costa Filho, R. J. Poppi e C. Pasquini, J. of Near

Infrared Spectrosc., 6, 333 ( 1998 ).

[93] R. Guchardi, Construo e Avaliao de um Espectrofotmetro

Infravermelho Prximo com Monocromador Baseado em Filtro ptico

Acstico Sintonizvel (AOTF), Dissertao de Mestrado, Unicamp,

Campinas 1997.

[94] I. Kurtz, R. Dwelle e P. Katzka, Rev. Sci. Instrum., 58(11), 1996 (1987).

[95] C. I. Chang, Appl. Phys. Lett., 25(7), 370 (1974).

[96] H. Farrer, C. G. Becker, E. F. Chaves, H. F. Matos, M. A. Santos, M. L.

Maia,Fortran Estruturado, Guanabara-Koogan, Rio de Janeiro, 1992.

[97] Matlab, The Mathworks Inc., 24 primer Park Way, Natick, Mass., USA

(1995)

[98] H. Demuth e M. Beale, Neural Network Toolbox for use with Matlab,

Manson, USA (1996).

[99]B. Kratochvil, J. K. Taylor, Anal. Chem., 53(8), 925A (1981).

141
[100] D. A. Skoog, F. J. Holler e T. A. Nieman,Principles of Instrumental

Analysis, 5th ed., Saunders College Publishing, Philadelphia, 1998.

[101] J. C. Davies, Statistics Data Analysis in Geology,John Wiley & Sons,

New York, 1988.

[102] P. J. Gemperline, J. R. Long e V. G . Gregoriou, Anal. Chem. 63, 2313

(1991).

[103] P. E. G. Box, G. W. Hunter e J. S. Hunter, Statistics for

Experimenters, John Wiley & Sons, New York, 1985.

142

You might also like