You are on page 1of 14

1

Departamento de Construo Civil, Programa de Ps-Graduao em Mtodos Numricos em Engenharia PPGMNE,


Universidade Federal do Paran UFPR, CP 19081, CEP 81531-990, Curitiba PR
2
Coordenao da Engenharia de Produo, Programa de Ps-Graduao em Mtodos Numricos em Engenharia PPGMNE,
Universidade Federal do Paran UFPR, CP 19081, CEP 81531-990, Curitiba PR
3
Instituto Tecnolgico SIMEPAR, Centro Politcnico da UFPR, Programa de Ps-Graduao em Mtodos Numricos em Engenharia
PPGMNE, Universidade Federal do Paran UFPR, Jardim das Amricas, CP 19100, CEP 81531-980, Curitiba PR
4
Programa de Ps-Graduao em Mtodos Numricos em Engenharia PPGMNE, Universidade Federal do Paran UFPR,
Universidade Estadual do Oeste do Paran UNIOESTE, Campus Francisco Beltro, Rua Maring, 1200, Vila Nova,
CEP 85605-010, Francisco Beltro PR
Recebido em 25/5/2009 Aceito em 7/8/2010
Suporte nanceiro: CAPES, CNPq e PICDT/CAPES/UNIOESTE.
Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
Abstract: Itaipu, the greatest hydroelectric power plant in operation in the world, has more than 2,200 monitoring
instruments, which have been storing readings in databases for more than 30 years. The large data sets of high
dimensionality and the large amount of records inserted into databases are non-trivial problems when conducting
a search for knowledge through the data. This paper introduces a study using Visual Data Mining (VDM)
algorithms integrating Data Mining (DM) techniques with Visualization of Information (VI) techniques to analyze
the data collected at Itaipu dam. The main objective was to establish relationships between the variables in order
to detect undesirable failures that can compromise the security and integrity of the dam. More information may be
more easily extracted when different techniques of Visualization of Information, together with techniques of Data
Mining, are applied for data analysis. The visual analysis of the data has proved efcient in detecting patterns of
anomalies, and thus it can be considered a valuable tool to support decision making.
Keywords: KDD process. Information visualization. Data mining. Visual data mining. Dam monitoring.
Resumo: A usina de Itaipu, maior geradora de hidroeletricidade do mundo, possui mais de 2.200 instrumentos
que monitoram seu comportamento geotcnico e estrutural, os quais possuem leituras armazenadas em um banco
de dados h mais de 30 anos. A alta dimensionalidade e a grande quantidade de registros contidos nas bases de
dados so problemas no triviais tendo-se em vista a busca pelo conhecimento a partir desses dados. Neste artigo
apresentado um estudo no qual foram utilizados algoritmos de Minerao Visual de Dados (MVD), integrando
tcnicas de Minerao de Dados (MD) com tcnicas de Visualizao de Informao (VI), para analisar estes dados de
instrumentao, tendo como objetivo estabelecer relaes existentes entre diferentes instrumentos, que possibilitem
detectar falhas indesejveis no sistema de monitoramento e possveis danos segurana e integridade da barragem.
Um maior nmero de informaes pde ser extrado mais facilmente quando diferentes tcnicas de VI, juntamente
com as de MD, so aplicadas aos dados. A anlise visual dos dados mostrou-se eciente por agilizar a deteco de
anomalias nos dados, sendo uma valiosa ferramenta de apoio tomada de decises.
Palavras-chave: Processo KDD. Visualizao de informaes. Minerao de dados. Minerao visual de dados.
Monitoramento de barragens.
Tcnicas de minerao visual de dados aplicadas
aos dados de instrumentao da barragem de Itaipu
Visual data mining techniques applied for the analysis
of data collected at Itaipu power plant
Marco Aurlio Silva Neto
3

Rosangela Villwock
4

Srgio Scheer
1

Maria Teresinha Arns Steiner
2

Andra Sell Dyminski
1
1 Introduo
Uma vez que os potenciais prejuzos e riscos
decorrentes de acidentes em barragens podem
assumir grandes dimenses, um projeto seguro, uma
construo adequada e a correta operao de barragens
so preocupaes de mbito mundial. Alm disso,
um efetivo monitoramento em grandes barragens
722 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
imprescindvel para a segurana da estrutura.
Diretrizes internacionais visando a segurana de
barragens e muitas discusses produtivas sobre este
tema tm sido propostas e conduzidas, tais como a
da Comisso Internacional de Grandes Barragens
(ICOLD International Comission on Large Dams)
(INTERNATIONAL..., 2008). No Brasil, diretrizes
visando segurana de barragens foram publicadas
pelo Comit Brasileiro de Grandes Barragens em
1983 (COMIT..., 1983) e um projeto de lei sobre
assunto tramita pelo congresso nacional desde 2003
(BRASIL, 2009).
O monitoramento da estrutura de uma barragem,
de importncia bem conhecida, pode gerar uma
enorme massa de dados, denidos em domnios
multidimensionais, cuja anlise e interpretao nem
sempre so triviais. A anlise minuciosa dos dados
dos instrumentos de auscultao exige a combinao
de conhecimentos de engenharia com matemtica e
estatstica, bem como experincia prvia do engenheiro
ou tcnico responsvel pela interpretao destes dados,
consumindo muito tempo e muitas vezes inviabilizando
o cumprimento rpido desta tarefa. Por esta razo, o
uso de tcnicas e ferramentas computacionais, que
auxiliem o tomador de decises, relevante.
O objetivo do presente artigo analisar a integrao
de tcnicas de Minerao de Dados (MD) com tcnicas
de Visualizao de Informaes (VI) utilizando dados
reais obtidos de instrumentos de monitoramento da
barragem de Itaipu. O resultado da integrao destas
tcnicas conhecida na literatura por Minerao Visual
de Dados (MVD) (WONG, 1999). O uso de tcnicas
e ferramentas para a MVD permite ao analista extrair
informaes existentes e escondidas nos dados,
alm de identicar grupos, anomalias e correlaes
de padres, de forma visual, rpida e efetiva.
Num grande volume de dados, frequentemente h
informao escondida e que no est prontamente
evidente. Segundo Tan et al. (2005), analistas humanos
podem levar semanas para descobrir este conhecimento
e muitos dados nunca so analisados. Enquanto
aumenta a quantidade de dados, aumenta a aplicao
de tcnicas de MVD. Para Witten e Frank (2000),
dados inteligentemente analisados so um valioso
recurso para tomada de decises.
Este artigo est organizado da seguinte forma: na
seo 2, so apresentadas as principais informaes
sobre a barragem de Itaipu e sobre os extensmetros,
instrumentos cuja base de dados foi aqui analisada.
Na seo 3, aborda-se a questo da extrao de
conhecimento a partir de bases de dados, ou seja,
sobre o processo KDD (Knowledge Discovery in
Databases ou Descoberta de Conhecimento em Bases
de Dados) e apresentada uma introduo ao tema
de agrupamento de dados (padres ou instrumentos
no problema aqui apresentado), forma utilizada para
o tratamento. Na seo 4, encontra-se o detalhamento
da metodologia adotada; na seo 5, so mostrados
e analisados os resultados, seguidos das concluses,
na seo 6.
2 A barragem de Itaipu e
obteno dos dados
Nesta seo feita uma apresentao sucinta da
Itaipu Binacional, maior hidreltrica em produo de
energia do mundo, enfatizando a sua instrumentao
e, na sequncia, so apresentados os dados sobre os
instrumentos utilizados no presente estudo.
A Itaipu Binacional teve o incio da sua construo
em 1973 em um trecho do Rio Paran conhecido por
Itaipu que, em tupi, quer dizer a pedra que canta,
localizado no corao da Amrica do Sul na divisa
entre o Paraguai e o Brasil (ITAIPU, 2008). Em 1982,
chegaram ao m as obras da barragem, sendo a ltima
unidade geradora inaugurada em 2008.
Atualmente, a barragem de Itaipu possui 20 unida des
geradoras de 700 MW (megawatts) cada, gerando uma
potncia total instalada de 14.000 MW. No ano 2000,
a Itaipu Binacional bateu seu recorde em gerao de
energia, cerca de 93,4 bilhes de quilowatts-hora
(KWh). responsvel pelo abastecimento de 95%
da energia eltrica consumida no Paraguai e 24% de
toda a demanda do mercado brasileiro.
A barragem de Itaipu possui 7.919 m de extenso e
altura mxima de 196 m, dimenses que transformaram
esta obra em referncia nos estudos de concreto e na
segurana de barragens. composta por dois trechos
de barragens de terra, um trecho de barragem de
enrocamento e trechos de concreto, compondo as
estruturas mais altas do conjunto. A Figura 1, a seguir,
mostra um esboo da estrutura geral da barragem e
a Tabela 1 apresenta as principais caractersticas dos
trechos da barragem apontados na Figura 1.
Em toda sua extenso, para acompanhar o desem-
penho das estruturas de concreto e fundao, so
encontrados 2.218 instrumentos (1.362 no concreto
e 856 nas fundaes e aterros) sendo que destes, 270
esto automatizados; alm disso, existem 5.239 drenos
(949 no concreto e 4.290 nas fundaes). Todas estas
leituras ocorrem em diferentes frequncias, podendo
ser, por exemplo, diria, semanal, quinzenal, mensal,
dependendo do tipo de instrumento.
Embora os nove trechos da barragem de Itaipu
sejam instrumentados e monitorados, um trecho da
Barragem Principal (trecho F) merece destaque e um
estudo mais aprofundado. No trecho F encontram-se
as turbinas para a gerao da energia eltrica, alm
de ser o trecho de maior altura em coluna de gua
e o mais instrumentado. Este trecho constitudo
de vrios blocos, sendo que cada um deles possui
instrumentos que fornecem dados a respeito de seu
comportamento fsico, tanto na estrutura de concreto
como na sua fundao.
723 Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
Por estes motivos, optou-se por estudar o trecho
F de Itaipu, no qual se encontram 30 extensmetros,
74 piezmetros, 11 medidores triortogonais, 4
medidores de nvel de gua e 9 medidores de vazo
(SILVA NETO, 2008). Destes, foram selecionados
para anlise os extensmetros, que so do tipo
mltiplo de hastes, instalados em furos de sondagem.
Este tipo de instrumento considerado um dos mais
importantes para o monitoramento da barragem,
pois so responsveis pelas medies de recalques
de uma barragem de concreto. Estes recalques, ou
deslocamentos verticais, consistem em uma das
observaes mais importantes na superviso do
comportamento da estrutura durante os perodos de
construo, enchimento do reservatrio e operao
da barragem. Segundo Silveira (2003), nos blocos
onde h galerias de acesso transversais ao eixo, a
instalao de extensmetro a montante e a jusante
permite medir deslocamentos angulares da barragem
junto fundao.
Tambm se utilizam extensmetros para medir
deslocamentos verticais do macio rochoso basltico,
onde a fundao da barragem tem sua base. So
importantes no monitoramento de uma barragem,
sendo dada especial ateno a descontinuidades no
macio rochoso, tais como juntas, falhas e contatos
entre rochas. Cada extensmetro instalado em
um local especco e pode ser composto por vrias
hastes de comprimentos diferentes. Assim, possvel
controlar separadamente o deslocamento vertical de
cada descontinuidade geolgica, conforme se pode
observar na Figura 2.
Vale salientar que o estudo aqui desenvolvido
a respeito dos extensmetros pode ser facilmente
estendido de forma similar aos demais instrumentos.
2.1 Coleta de dados
Os dados com os quais o presente trabalho foi
desenvolvido referem-se, conforme j mencionado, aos
instrumentos de monitoramento da barragem de Itaipu,
mais especicamente, aos extensmetros instalados
no trecho F da barragem. Neste trecho F, esboado na
Figura 1, esto localizados 30 extensmetros, cada
um com uma, duas ou trs hastes totalizando, assim,
72 medidas de deslocamento. Como estas 72 medidas
so independentes, sero aqui denominadas de hastes
de extensmetros. Estas medidas so aqui identicadas
da seguinte forma: equip4_1, que signica haste 1
do extensmetro 4 e assim por diante.
Os registros histricos das hastes de extensmetros,
contidos no banco de dados da empresa, contm dados
mensais, datados de janeiro/1995 a dezembro/2004,
totalizando 120 leituras. O perodo foi assim deter-
minado por sugesto da equipe de engenheiros da
Itaipu, pois posterior construo da hidreltrica
e anterior implantao do sistema de aquisio
automtica de dados. Vale salientar que, durante a
fase de instalao deste sistema, alguns instrumentos
caram sem leituras manuais e que, alm disso, as
24 hastes de extensmetros j automatizadas sofreram
modicaes que podem ter inuenciado as leituras
posteriores. Desta forma, as referidas 120 leituras
mensais referentes s 72 hastes de extensmetros
caram isentas destas irregularidades.
Estes 120 registros histricos foram analisados
segundo o processo KDD, descrito em linhas gerais
na seo 3, a seguir, particularizado para o problema
aqui descrito, na seo 4.
Tabela 1. Caractersticas dos trechos da Barragem de Itaipu com destaque ao trecho F analisado neste estudo.
Trecho Estrutura Comprimento (m) Altura mxima (m)
1 L-Barragem Auxiliar Terra 2294 30
2 K-Barragem Auxiliar Enrocamento 1984 70
3 e 7 E, I e D-Barragens Laterais Contraforte 1438 81
4 H-Estrutura de Desvio Concreto Macio 170 162
5 F-Barragem Principal Gravidade Aliviada 612 196
9 Q-Barragem Auxiliar Terra 872 25
Outros Trechos Caractersticas
8 A-Vertedouro 350 m de largura
6 U-Casa de Fora 20 Unidades Geradoras
Figura 1. Um esboo da estrutura geral do complexo de
Itaipu (ITAIPU, 2008).
724 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
Formatao, Minerao de Dados e Interpretao,
conforme ilustrado na Figura 3.
O processo inicia-se com o entendimento do
domnio da aplicao e dos objetivos a serem
atingidos. Ento uma seleo poder ser realizada
nestes dados a m de se trabalhar com os dados de
interesse. A etapa de pr-processamento responsvel
pela anlise e tratamento de dados faltantes ou
inconsistentes. Na etapa de formatao, h uma
preparao dos dados visando a aplicao da MD
como, por exemplo, transformando dados categricos
em valores numricos ou, ento, usando mtodos de
reduo de dimensionalidade nos dados. As etapas
de pr-processamento e formatao, segundo Silver
(1996), podem levar at 80% do tempo necessrio
para todo o processo.
Prosseguindo no processo, chega-se etapa de
MD, principal etapa do processo KDD, na qual
diversos mtodos podem ser usados para extrao de
informaes, as quais, por sua vez, so apresentadas na
3 O processo Descoberta de
Conhecimento em Bases
de Dados KDD
O processo KDD denido por Fayyad et al.
(1996) como um processo no trivial de descoberta de
padres vlidos, novos, teis e acessveis. A principal
vantagem do processo de descoberta que no so
necessrias hipteses, sendo que o conhecimento
extrado dos dados sem conhecimento prvio.
KDD refere-se ao amplo processo de descoberta de
informaes em banco de dados, no qual se enfatiza a
aplicao de alto nvel dos mtodos de MD. Enquanto
a etapa de MD se destaca pela extrao de padres
escondidos nos dados, o processo completo KDD
mais amplo e abrange vrias etapas necessrias para
que isso ocorra, tornando possvel, aps tcnicas de
MD, avaliar e interpretar os resultados obtidos.
O processo KDD um conjunto de atividades
contnuas composto, basicamente, por cinco etapas:
Seleo dos Dados, Pr-Processamento e Limpeza,
Esquema geral de instalao Detalhes dos componentes Perfil tpico de instalao
Material solto
Areia ou cascalho fino
Argamassa de ancoragem
1 - barra de ancoragem
2 - cone de ancoragem
3 - haste c/ tubo de proteo
4 - cabea de leitura
5 - apoio p/ o relgio
comparador
4
3
5
1
2
Cabea de leitura
Concreto
Basalto vesicular
Descontinuidade
deformvel
Basalto denso
Basalto denso
Brecha
Descontinuidade
deformvel
Relgio comparador
Tubo de proteo PVC 3/4''
Haste de ferro galvanizado
Furo de sondagem
Cascalho
Sistema de ancoragem
Calda de cimento
0,5/1 (peso)
Figura 2. Ilustrao de um extensmetro mltiplo de haste (MATOS, 2002), instrumento utilizado para o desen volvimento
do presente estudo.
725 Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
3.1 Agrupamento de padres
Fayyad et al. (1996) mostram que as tarefas de
MD podem ser, de uma forma geral, preditivas ou
descritivas. As preditivas usam algumas variveis para
prever valores desconhecidos ou futuros de outras
variveis, enquanto que as descritivas encontram
padres para descrever os dados. As principais
tarefas de MD esto relacionadas Classicao,
Agrupamento e Associao de padres. Conforme
j comentado, neste artigo, a tarefa da MD o
agrupamento de padres.
O Agrupamento ou Segmentao (Clustering)
procura grupos de padres tais como padres
pertencentes a um mesmo grupo so mais similares
uns aos outros e dissimilares a padres em outros
grupos. Segundo Hair Jr. et al. (2005), a anlise de
agrupamentos uma tcnica analtica para desenvolver
subgrupos signicativos de objetos. Seu objetivo
classicar os objetos em um pequeno nmero de
grupos mutuamente excludentes. Para Freitas (2002),
na anlise de agrupamento importante favorecer
um nmero pequeno de grupos.
Os algoritmos de agrupamentos podem ser divididos
em categorias de diversas formas de acordo com
algumas caractersticas. As duas principais classes
de algoritmos de agrupamentos so os mtodos
hierrquicos, dentre os quais se destaca o Mtodo de
Ward (da Anlise Estatstica Multivariada), utilizado
neste estudo e mtodos de particionamento como,
por exemplo, o mtodo k-mdias.
Mtodos hierrquicos englobam tcnicas que
buscam hierarquicamente os grupos e, por isso,
admitem obter vrios nveis de agrupamento. Os
mtodos hierrquicos podem ser subdivididos em
divisivos ou aglomerativos. O mtodo hierrquico
aglomerativo considera, a princpio, cada padro
como um grupo e, iterativamente, agrupa o par de
ltima etapa, a interpretao, em que o conhecimento
adquirido. Se o resultado nal no for satisfatrio, todo
o processo pode ser realimentado alterando algumas
informaes as quais podem ser reprocessadas nas
etapas anteriores.
O principal objetivo do processo KDD obter
o conhecimento de informaes escondidas nos
dados que sejam teis nas tomadas de decises,
utilizando mtodos, algoritmos e tcnicas de diferentes
reas cientcas que, segundo Tan et al. (2005) e
Gimenes (2000), incluem aprendizagem de mquina,
reconhecimento de padres, estatstica e matemtica,
aquisio de conhecimento para sistemas especialistas
e visualizao de dados.
J a VI um processo indispensvel na etapa de
MD, segundo Rezende (2003). Para Keim (1979),
a VI permite ao usurio adquirir percepes sobre
os dados, podendo provocar o surgimento de novas
hipteses. Este autor acrescenta que quando comparada
s tcnicas automticas de MD, como Estatstica
e Aprendizagem de Mquina, a explorao visual
dos dados apresenta vantagens excedentes, tais
como: lida mais facilmente com dados altamente
heterogneos e ruidosos, intuitiva, e no requer
maior entendimento de complexos algoritmos ou
parmetros da matemtica ou estatstica. Ankerst e
Keim (2001) denem MVD, como sendo um passo
no processo KDD, utilizando a VI como um canal
de comunicao entre o computador e o usurio.
A essncia deste artigo apresentar algumas das
tcnicas de MD para o agrupamento de padres
(extensmetros) e de VI (melhor visualizao dos
resultados), vericando o relacionamento entre os
padres de um mesmo grupo, conforme detalhamento
apresentado nas sees a seguir.
Figura 3. Etapas do processo KDD (FAYYAD et al., 1996).
726 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
J para a 3. etapa, o agrupamento dos padres (ou
hastes de extensmetros), o mtodo utilizado foi o
Mtodo de Ward, um mtodo hierrquico aglomerativo.
Segundo Johnson e Wichern (1998), o Mtodo de
Ward faz a juno de dois grupos baseando-se na
perda de informao. Considera-se como critrio
de perda de informao a soma do quadrado do
erro (SQE ou SQE Square Quadratic Error). Para
cada grupo i, calcula-se a mdia (ou centroide) do
grupo e a soma do quadrado do erro do grupo i
(SQE
i
), que a soma do quadrado do erro de cada
padro do grupo em relao mdia. Assim, para k
grupos, tem-se SQE
1
, SQE
2
, ..., SQE
k
, em que SQE
denida pela Equao 1.
SQE = SQE
1
+ SQE
2
+ ... + SQE
k
(1)
Para cada par de grupos m e n, primeiramente,
calcula-se a mdia (ou centroide) do grupo formado
(grupo mn). Em seguida, calcula-se a soma do
quadrado do erro do grupo mn (SQE
mn
), segundo a
Equao 2.
SQE = SQE
1
+ SQE
2
+ ...
... + SQE
k
SQE
m
SQE
n
+ SQE
mn
(2)
Os grupos m e n que apresentarem o menor
aumento na SQE, ou seja, tiverem menor perda de
informao, sero unidos. Segundo Hair Jr. et al.
(2005), este mtodo tende a obter grupos de mesmo
tamanho devido a sua minimizao de variao interna.
Uma forma de representar um agrupamento
hie rrquico por meio de um dendrograma. Um
grupos com maior similaridade em um novo grupo at
formar um nico grupo contendo todos os padres.
O mtodo hierrquico divisivo, encontrado em Diniz
e Louzada-Neto (2000), ao contrrio, inicia com um
nico grupo e executa um processo de sucessivas
subdivises.
Outra forma de analisar a formao de grupos,
fazendo o relacionamento entre padres, por meio
de tcnicas de VI, em que parmetros visuais, como
cores, forma, tamanho, posio so usados para
representar caractersticas e propriedades dos dados
(ARTERO, 2005; KEIM, 1996). Outros parmetros
estudados em Computao Grca, como tipo de
material, luminosidade e transparncia, e tcnicas
interativas, como rotaes e passeios por meio dos
dados, convidam os usurios a explorar e manipular
sistemas de informaes grandes e complexos,
tambm pode ser usado para facilitar a busca do
conhecimento (SILVA NETO, 2008).
Com base nestas formas de interao e navegao,
diversas tcnicas de VI esto sendo desenvolvidas com
o objetivo de facilitar a interpretao de dados. Silva
Neto (2008) utiliza estas tcnicas baseando-se nas
caractersticas e natureza dos dados. Um levantamento
das tcnicas existentes mostrando suas vantagens e
desvantagens podem ser encontradas no trabalho
deste autor.
Neste artigo, a tcnica de MD utilizada para o
agrupamento de padres foi o Mtodo de Ward. J as
tcnicas de VI aplicadas aos dados foram Coordenadas
Paralelas, Matrizes de Disperso, Orientadas a Pixels
e baseadas em cones. Estas tcnicas utilizadas,
enquadradas na metodologia aplicada ao problema,
so apresentadas na seo 4 a seguir.
4 Metodologia adotada
O processo KDD, apresentado de forma genrica
na seo 3 e Figura 3, pode ser particularizado para
o problema aqui abordado, por meio da Figura 4 que
compe a metodologia aqui proposta. Tal metodologia
foi aplicada aos dados de instrumentao da barragem
de Itaipu, mais especicamente s 72 hastes de
extensmetros que, por sua vez, geraram 120 registros
histricos, conforme j comentado na seo 2.1
(1 etapa da Figura 4).
Para a maioria das 72 hastes de extensmetros
analisadas, tem-se uma leitura mensal, porm algumas
delas apresentaram mais de uma leitura por ms
sendo que, nestes casos, foi obtida a mdia mensal.
Por outro lado, algumas hastes de extensmetros
apresentaram leituras faltantes e, nestas situaes,
foram realizadas interpolaes por sries temporais
garantindo que todos as 72 hastes tivessem exatamente
120 leituras (2. etapa da Figura 4). Para um melhor
detalhamento a respeito de tcnicas de interpolao
envolvendo Sries Temporais, sugere-se o livro de
Box e Jenkins, (1976). Figura 4. Etapas da metodologia adotada.
727 Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
extensmetros) e, normalmente, o intervalo de valores
de cada atributo mapeado linearmente sobre o eixo
correspondente. Cada item de um dado exibido
como uma linha poligonal que intercepta cada eixo no
ponto correspondente ao valor do atributo associado.
Esta tcnica permite observar o relacionamento
entre as 72 hastes de extensmetros, analisando
as linhas entre os eixos. Se acontecerem poucos
cruzamentos, ento h um bom relacionamento;
muitos cruzamentos indicam um relacionamento ruim.
Por outro lado, Matrizes de Disperso (ScatterPlots
Matrices) buscam comparar diversos atributos
simultaneamente (dois a dois) mapeando os dados
para um espao bidimensional. Informaes como
correlaes e disperses dos dados podem ser extradas
neste tipo de visualizao, contribuindo para um
maior entendimento dos dados, alm de apoiar
no procedimento de reduo de dimensionalidade
(WARD, 1994).
Outras tcnicas como as Orientadas a Pixel,
encontradas em Keim e Kriegel (1996); Faces de
Chernoff, introduzida por Chernoff (1973); ou Star
Glyphs, em Pickett e Grinstein (1998), geram imagens
para cada uma das 72 hastes de extensmetros.
O relacionamento entre estas variveis pode ser
observado visualmente, pela semelhana entre
elas, ou seja, imagens parecidas indicam um bom
relacionamento entre as variveis.
4.1 Minerao Visual de Dados MVD:
integrao entre Minerao
de Dados MD e Visualizao
de Informaes VI
Tcnicas de minerao podem apoiar a explorao
visual de grandes conjuntos de dados, e tambm serem
apoiadas por recursos visuais. Percebe-se que os dois
problemas crticos em MD tambm so crticos na VI.
O primeiro a alta dimensionalidade e o segundo
a grande quantidade de registros contidos nas bases
de dados atuais, demandando o uso de algoritmos
cada vez mais ecientes.
A integrao de tcnicas de MD com tcnicas de
VI facilita a anlise dos dados tornando-se um valioso
recurso na tomada de decises, de forma que estas
podem ser usadas para auxiliar ou serem auxiliadas
pelas tcnicas de MD.Neste estudo, em particular,
os resultados da tcnica de MD (Mtodo de Ward)
que agrupou os padres (hastes de extensmetros)
permitiu a aplicao das tcnicas de VI (Coordenadas
Polares; Matiz de Disperso; Orientada a Pixel; Faces
de Chernoff e Star Glyphs) que foram aplicadas,
ento, a cada um dos grupos separadamente. Vale
salientar que, em geral, as tcnicas de VI s podem
ser aplicadas a um nmero pequeno de registros.
dendrograma representa o agrupamento dos padres
e os nveis de similaridade em que os grupos se
formam. Pode ser quebrado em diferentes nveis,
que para Jain et al. (1999), faz a subdiviso em
diferentes grupos.
A similaridade entre variveis pode ser medida a
partir do coeciente de correlao. Desta forma, este
coeciente r, que calculado pela Equao (3), a
seguir, uma medida pertencente ao intervalo [-1, 1]
que identica o nvel de correlao entre pares de
variveis. Quanto mais prximo dos extremos, -1
ou 1, maior a relao entre os dados. Quando
os dados so prximos de -1, as variveis so
inversamente correlacionveis, ou seja, os valores
crescentes de uma das variveis estaro associados
aos valores decrescentes da outra, e quando este
coeciente prximo de 1, estas variveis possuem
comportamentos prximos. Coecientes prximos de
zero sugerem que as variveis no possuem relao
(KACHIGAN, 1986). Assim, tem-se:


i i
x y
(x x)(y y)
r = , i n
(n )S S
1
1

(3)
em que x representa a mdia do conjunto de valores
de x e denido pela Equao (4); y representa a
mdia do conjunto de valores de y e denido pela
Equao (5); (x
i
x) representa o desvio entre x
i
e a
mdia do conjunto x; (y
i
y) representa o desvio entre
y
i
e a mdia do conjunto y; S
x
representa o desvio
padro do conjunto x e denido pela Equao (6)
e S
y
representa o desvio padro do conjunto y e
denido pela Equao (7).

n
i
j=1
x = x
n
1


(4)

1
1

n
i
j=
y = y
n

(5)

2
1
i
x
(x x)
S =
(n )


(6)

2
1
i
y
(y y)
S =
(n )


(7)
Para denir o relacionamento entre os padres,
podem ser aplicadas, tambm, aos grupos anterior-
mente definidos, tcnicas de Visualizao de
Informaes como, por exemplo: Coordenadas
Paralelas, Matrizes de Disperso, Faces de Chernoff,
Star Glyphs e Orientada a Pixel (4 etapa da Figura 4).
Artero (2005) dene Coordenadas Paralelas
como um espao de dimenso n mapeado para um
espao bidimensional, usando n eixos equidistantes
e paralelos a um dos eixos principais. Cada eixo
representa um atributo (neste caso, as 72 hastes dos
728 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
corte 2 da Figura 5), a sua inclinao a Montante
(M) ou a Jusante (J), o afastamento em relao ao
eixo da barragem em metros e a feio onde a haste
est instalada.
A Figura 6, mais adiante, mostra o grco das
leituras das 72 hastes de extensmetros durante
o perodo analisado. As linhas foram coloridas
conforme o grupo a que as hastes pertencem (preto,
azul e amarelo para grupos 1, 2 e 3, respectivamente),
podendo assim, identicar visualmente a distino
entre os grupos.
A Tabela 3, por sua vez, mostra os coecientes
de correlao multivariada aplicada s hastes do
grupo 1, deste 2 corte. Deve-se salientar que a
anlise aqui mostrada, foi feita somente para o
grupo 1, do 2 corte, por ser o grupo cujas hastes
de extensmetros so de extrema importncia no
monitoramento da barragem. Deve-se salientar que
uma anlise semelhante tambm poderia ser feita aos
demais grupos ou ento para quaisquer subconjuntos
de dados disponibilizados pela Itaipu.
Valores maiores que 0,5 foram coloridos em
vermelho (correlao alta) e valores menores que 0,5
foram coloridos em azul (correlao baixa) na referida
Tabela 3. Pode-se observar que, para a maioria das
hastes de extensmetros, a correlao alta. A haste
de extensmetro equip26_1 a nica cuja correlao
com as outras hastes menor.
J com as tcnicas de VI, foi possvel a comparao
e o surgimento de novas interpretaes para o referido
corte 2, grupo 1. A Figura 7, apresentada a seguir,
foi gerada pelo software ParVis (disponvel em:
http://home.subnet.at/o/mv/parvis/) e utiliza a
tcnica Coordenadas Paralelas para visualizar os
dados das 72 hastes de extensmetros do trecho
F da barragem de Itaipu. Observe-se que os eixos
foram propositadamente ordenados conforme ordem
gerada pelo Mtodo de Ward para este grupo (ver
dendrograma da Figura 5).
Como era de se esperar, a Figura 7 induz a concluir
que, em geral, estas hastes realmente esto bem
relacionadas, comprovando a semelhana existente
entre elas, j observada pela tcnica de Ward. Nesta
Figura 7, observa-se que algumas hastes so mais
semelhantes entre si; destacam-se os grupos {equip1_1
e equip1_2} e {equip4_1 e equip4_2} pela existncia
de poucos cruzamentos entre as linhas que ligam os
eixos correspondentes a estas variveis. Da mesma
forma, como j observado pela Tabela 3 (coecientes
de correlao), possvel vericar aqui, tambm, a
semelhana entre alguns grupos de hastes, o caso de
{equip1_1 e equip1_2; coeciente=0,97}, {equip4_1 e
equip4_2; coeciente=0,99} e {equip6_1 e equip6_2;
coeciente=0,99}.
Esta tcnica (Coordenadas Paralelas) apresenta
a grande vantagem da visualizao imediata dos
resultados, porm, como desvantagem, no permite
5 Obteno dos resultados
Fazendo a implementao das tcnicas descritas
na seo 4 ao problema em pauta, tem-se que na
interpolao por Sries Temporais, por meio do uso
do software Statgraphics Centurium XV, o modelo
foi escolhido automaticamente, segundo o critrio
de Akaike (AIC), observando-se, tambm, a raiz
do erro quadrtico mdio (REQM ou RMSE Root
Mean Squared Error). Foi observado o periodograma
acumulado dos resduos e, em alguns casos, aps
anlise dos valores-p nos testes t dos parmetros, o
modelo foi substitudo por outro considerado mais
adequado.
Realizadas as interpolaes por Sries Temporais,
foi ento aplicada a Anlise de Agrupamento (Mtodo
de Ward), utilizando-se o mesmo software. O
dendrograma da Figura 5 mostra a formao dos grupos
para os dados de Itaipu (72 hastes de extensmetros).
Observando-se o 1. corte da Figura 5, resultam
dois grupos. O primeiro grupo, denominado grupo 1,
um grupo formado por hastes de extensmetros
extremamente importantes para o monitoramento da
barragem; so hastes instaladas no eixo do bloco, a
montante da barragem e inclinados 60 a montante.
O segundo grupo, grupo 2, formado pelas demais
hastes.
Observando-se o 2. corte, tem-se a formao
de trs grupos. O primeiro grupo coincide com o
grupo 1, denido pelo primeiro corte. O segundo
grupo, denominado grupo 2, possui a maioria das
hastes de extensmetros instaladas nos derrames
baslticos B, C e D (A e B so camadas de rochas mais
profundas; C e D so camadas de rochas superciais)
e nos contatos litolgicos B/C e C/D. O terceiro grupo,
denominado grupo 3, possui a maioria das hastes de
extensmetros instaladas nas juntas (entre camadas
rochosas) A e B e no contato litolgico A/B. Nota-se
aqui que os instrumentos foram agrupados segundo
as caractersticas geolgicas relevantes do macio
de fundao, mesmo no tendo sido explicitamente
apresentadas aos mtodos de MD.
Observando-se o 3. corte, o grupo 1 continua o
mesmo dos demais cortes; o grupo 2 foi dividido
em dois grupos denominados grupo 2_1 e grupo
2_2. Destaca-se o grupo 2_2, que formado, em
sua maioria, por hastes de extensmetros instalados
no derrame B. O grupo 3 foi dividido em dois
grupos denominados grupo 3_1 e grupo 3_2.
Dyminski et al. (2008) apresentam uma metodologia
para identicar as hastes de extensmetros mais
importantes nestes cinco grupos, utilizando a Anlise
Fatorial aplicada dentro de cada grupo.
Para um melhor entendimento, considerando os
trs grupos formados por meio, especicamente,
do 2 corte, apresenta-se a Tabela 2, a seguir. Nesta
Tabela 2, apresentada cada uma das 72 hastes dos
extensmetros separadas por grupo (conforme o
729 Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
Figura 6. Grco das 72 hastes de extensmetros durante o perodo analisado.
Figura 5. Dendrograma mostrando a formao dos grupos por meio do Mtodo Ward.
analisar o relacionamento entre variveis que no
estejam em eixos vizinhos. Desta forma no se
pode, por exemplo, saber o relacionamento entre as
variveis {equip6_1 e equip6_2}. Porm, de forma
interativa, possvel alterar a posio dos eixos
permitindo analisar o relacionamento entre quaisquer
pares de variveis.
Outra forma de analisar o relacionamento entre
pares de variveis, mostrada na Figura 8, a seguir,
pela aplicao da tcnica matriz de disperso.
Pode-se observar nesta matriz, gerada pelo software
XmdvTool (WARD et al., 2007), que as hastes so
altamente correlacionveis, ou seja, o aumento de uma
implica num aumento da outra. Esta concluso pode
ser extrada da matriz analisando-se a distribuio
dos pontos como, por exemplo, na linha da haste
equip1_1 e coluna da haste equip1_2, os dados
esto distribudos se aproximando de uma reta
crescente o que induz a um bom relacionamento
entre estas variveis.
Da mesma forma, possvel analisar o relacio-
namento entre outras variveis, o caso de {equip1_1
730 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
Tabela 2. As 72 hastes de extensmetros enquadradas em cada um dos trs grupos da Figura 5 (2. corte).
Grupo Haste Inclinao Afastamento do eixo da barragem Feio
1 equip 1_1 60 a M 125,5 m a M Junta B
1 equip 1_2 60 a M 105,4 m a M Contato B_C
1 equip 4_1 60 a M 65,3 m a M Contato C_D
1 equip 4_2 60 a M 60,4 m a M Rocha Fraturada
1 equip 6_1 60 a M 150,8 m a M Junta A
1 equip 6_2 60 a M 110,5 m a M Derrame B
1 equip 21_1 60 a M 159,8 m a M Junta A
1 equip 21_2 60 a M 135,1 m a M Derrame B
1 equip 26_1 60 a M 139,2 m a M Junta B
1 equip 26_2 60 a M 115,6 m a M Contato B_C
1 equip 31_1 60 a M 64,7 m a M Contato C_D
2 equip 2_1 0 32,0m a M Contato C_D
2 equip 2_2 0 32,0 m a M Rocha Fraturada
2 equip 3_1 0 32,0 m a M Derrame C
2 equip 3_2 0 32,0 m a M Derrame D
2 equip 5_1 0 13,0 m a J Contato C_D
2 equip 5_2 0 13,0 m a J Derrame D
2 equip 7_3 0 13,0 m a J Derrame B
2 equip 8_2 0 84,0 m a M Rocha Fraturada
2 equip 8_3 0 84,0 m a M Derrame B
2 equip 12_1 60 a J 47,2 m a J Rocha Fraturada
2 equip 12_2 60 a J 42,5 m a J Basalto Denso
2 equip 13_2 0 44,0 m a J Rocha Fraturada
2 equip 13_3 0 44,0 m a J Derrame B
2 equip 14_2 0 54,0 m a J Rocha Fraturada
2 equip 14_3 0 54,0 m a J Derrame B
2 equip 15_1 0 80,0 m a M Rocha Fraturada
2 equip 15_2 0 80,0 m a M Derrame B
2 equip 18_3 0 33,0 m a J Derrame B
2 equip 19_3 0 55,0 m a J Derrame B
2 equip 20 _2 0 82,0 m a M Rocha Fraturada
2 equip 20_3 0 82,0 m a M Derrame B
2 equip 23_3 0 36,0 m a J Rocha Fraturada
2 equip 24_3 0 62,0 m a J Derrame B
2 equip 25_2 0 75,0 m a M Derrame B
2 equip 25_3 0 75,0 m a M Derrame B
2 equip 27_1 30 a M 16,6 m a J Junta B
2 equip 27_2 30 a M 22,6 m a J Contato B_C
2 equip 29_2 30 a J 55,7 m a J Contato B_C
2 equip 32_1 30 a M 36,5 m a M Junta B
2 equip 32_2 30 a M 14,6 m a M Derrame C
2 equip 32_3 30 a M 7,5 m a M Contato C_D
2 equip 33_1 0 0,0 Junta B
2 equip 33_2 0 0,0 Derrame C
2 equip 33_3 0 0,0 Contato C_D
2 equip 34_3 30 a J 7,5 m a J Contato C_D
2 equip 35_1 90 a M 0,0 Concreto
2 equip 35_2 90 a M 0,0 Concreto
3 equip 7_1 0 13,0 m a J Junta A
3 equip 7_2 0 13,0 m a J Contato A_B
3 equip 8_1 0 84,0 m a M Contato A_B
3 equip 11_1 0 81,0 m a M Junta A
3 equip 13_1 0 44,0 m a J Contato A_B
3 equip 14_1 0 54,0 m a J Contato A_B
3 equip 18_1 0 33,0 m a J Junta A
3 equip 18_2 0 33,0 m a J Rocha Fraturada
3 equip 19_1 0 55,0 m a J Junta A
3 equip 19_2 0 55,0 m a J Rocha Fraturada
3 equip 20_1 0 82,0 m a M Rocha Fraturada
3 equip 22_1 0 68,0 m a M Junta A
3 equip 22_2 0 68,0 m a M Rocha Fraturada
3 equip 22_3 0 68,0 m a M Derrame B
3 equip 23_1 0 36,0 m a J Junta A
3 equip 23_2 0 36,0 m a J Rocha Fraturada
3 equip 24_1 0 62,0 m a J Junta A
3 equip 24_2 0 62,0 m a J Rocha Fraturada
3 equip 25_1 0 75,0 m a M Junta A
3 equip 28_1 0 40,0 m a J Junta B
3 equip 28_2 0 40,0 m a J Contato B_C
3 equip 29_1 30 a J 63,5 m a J Junta B
3 equip 34_1 30 a J 36,6 m a J Junta B
3 equip 34_2 30 a J 21,0 m a J Derrame C
731 Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
T
a
b
e
l
a

3
.

C
o
e

c
i
e
n
t
e
s

d
e

C
o
r
r
e
l
a

o

M
u
l
t
i
v
a
r
i
a
d
a

a
p
l
i
c
a
d
a

s

h
a
s
t
e
s

d
o

g
r
u
p
o

1
,

2


c
o
r
t
e
.
e
q
u
i
p
1
_
1
e
q
u
i
p
1
_
2
e
q
u
i
p
4
_
1
e
q
u
i
p
4
_
2
e
q
u
i
p
6
_
1
e
q
u
i
p
6
_
2
e
q
u
i
p
2
1
_
1
e
q
u
i
p
2
1
_
2
e
q
u
i
p
2
6
_
1
e
q
u
i
p
2
6
_
2
e
q
u
i
p
3
1
_
1
e
q
u
i
p
1
_
1
1
0
,
9
7
3
7
8
9
0
,
8
8
9
4
1
5
6
0
,
9
1
0
0
1
6
0
,
8
2
5
6
7
5
3
0
,
7
6
7
9
6
5
0
,
8
4
0
1
5
1
9
0
,
8
6
3
0
0
2
3
0
,
5
1
4
3
4
2
4
0
,
9
1
0
8
7
2
6
0
,
5
7
7
0
4
3
3
5
e
q
u
i
p
1
_
2
0
,
9
7
1
0
,
8
1
9
5
5
0
1
0
,
8
4
7
6
5
6
0
,
7
5
2
4
7
9
4
0
,
6
7
6
2
2
1
0
,
8
3
6
1
2
7
4
0
,
8
2
9
7
4
7
3
0
,
4
7
0
9
5
6
6
0
,
9
3
8
7
3
4
0
,
4
6
2
2
2
9
5
9
e
q
u
i
p
4
_
1
0
,
8
9
0
,
8
2
1
0
,
9
9
0
2
5
8
0
,
8
8
4
5
9
2
5
0
,
8
8
2
7
7
6
0
,
7
8
6
3
4
6
2
0
,
8
4
0
3
1
6
9
0
,
5
9
3
8
7
8
0
,
7
8
9
4
6
5
9
0
,
7
9
8
4
6
5
3
1
e
q
u
i
p
4
_
2
0
,
9
1
0
,
8
5
0
,
9
9
1
0
,
8
9
3
0
2
6
4
0
,
8
8
2
6
3
3
0
,
8
2
2
1
1
1
8
0
,
8
6
4
4
4
9
4
0
,
5
1
6
0
9
3
7
0
,
8
2
8
2
0
3
8
0
,
7
7
1
9
7
7
2
4
e
q
u
i
p
6
_
1
0
,
8
3
0
,
7
5
0
,
8
8
0
,
8
9
1
0
,
9
8
9
0
0
3
0
,
9
1
0
5
6
9
7
0
,
9
5
6
3
9
4
0
,
3
6
6
2
9
1
4
0
,
7
3
1
9
5
0
2
0
,
8
2
5
2
6
6
1
8
e
q
u
i
p
6
_
2
0
,
7
7
0
,
6
8
0
,
8
8
0
,
8
8
0
,
9
9
1
0
,
8
5
7
6
8
6
7
0
,
9
1
6
5
3
4
7
0
,
3
8
0
4
9
3
6
0
,
6
5
5
5
6
1
8
0
,
8
7
1
9
5
1
3
3
e
q
u
i
p
2
1
_
1
0
,
8
4
0
,
8
4
0
,
7
9
0
,
8
2
0
,
9
1
0
,
8
6
1
0
,
9
8
0
9
7
5
1
0
,
1
9
6
7
1
1
6
0
,
8
4
7
0
1
2
8
0
,
6
0
9
4
3
6
8
4
e
q
u
i
p
2
1
_
2
0
,
8
6
0
,
8
3
0
,
8
4
0
,
8
6
0
,
9
6
0
,
9
2
0
,
9
8
1
0
,
2
8
2
3
9
7
3
0
,
8
1
5
9
2
5
1
0
,
6
9
1
0
0
3
3
2
e
q
u
i
p
2
6
_
1
0
,
5
1
0
,
4
7
0
,
5
9
0
,
5
2
0
,
3
7
0
,
3
8
0
,
2
0
,
2
8
1
0
,
3
5
8
2
1
1
1
0
,
4
4
3
9
6
8
2
8
e
q
u
i
p
2
6
_
2
0
,
9
1
0
,
9
4
0
,
7
9
0
,
8
3
0
,
7
3
0
,
6
6
0
,
8
5
0
,
8
2
0
,
3
6
1
0
,
4
8
e
q
u
i
p
3
1
_
1
0
,
5
8
0
,
4
6
0
,
8
0
,
7
7
0
,
8
3
0
,
8
7
0
,
6
1
0
,
6
9
0
,
4
4
0
,
4
8
1
732 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
Figura 8. Representao da tcnica matriz de disperso para as hastes de extensmetros (grupo 1, 2. corte).
Figura 9. Uso das tcnicas a) Orientadas a Pixel, b) Faces de Chernoff e c) Star Glyphs na anlise de relacionamentos entre
hastes de extensmetros (grupo 1, 2 corte).
Figura 7. Uso da tcnica Coordenadas Paralelas para a visualizao dos dados das hastes de extensmetros (grupo 1, 2. corte).
e equip1_2}, {equip4_1 e equip4_2}, {equip6_1 e
equip6_2} e {equip21_1 e equip21_2}.
A Figura 9, a seguir, gerada pelo software MatLab,
mostra o uso de trs tcnicas: a) tcnica Orientada a
Pixel, em que os pixels so mapeados conforme valores
da matriz de dados; b) tcnica Faces de Chernoff,
que mapeia as informaes seguindo caractersticas
baseadas em cones, caractersticas faciais (tamanho
733 Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
do rosto, tamanho e forma das sobrancelhas, etc.); e
c) tcnica Star Glyphs, que representa os atributos
pelas pontas das estrelas com tamanho proporcional
ao valor representado.
Observando-se a Figura 9a, pode ser visto que
algumas hastes so mais semelhantes entre si. o
caso de {equip1_1, equip1_2, equip21_1, equip21_2
e equip26_2} e {equip4_1, equip4_2, equip6_1,
equip6_2, equip26_1 e equip31_1}. J nas Figuras 9b
e 9c, esta semelhana ocorre em {equip1_1, equip1_2,
equip21_1, equip21_2 e equip31_1} e {equip4_1,
equip4_2, equip6_1, equip6_2, equip26_1 e equip26_2}.
Considerando-se todas as tcnicas abordadas,
pode-se dizer que, de uma forma geral, no grupo 1
(2 corte) analisado, todas as hastes possuem bons
relacionamentos, porm, como visto pelas diversas
tcnicas, algumas hastes so mais semelhantes entre si.
Algumas tcnicas so mais renadas do que outras
(por exemplo, o dendrograma apresentado quando
aplicado Anlise de Agrupamento pelo Mtodo
Ward, mostra a similaridade entre as hastes em todos
os nveis), enquanto que outras so mais facilmente
interpretadas (por exemplo, as Faces de Chernoff).
Os resultados atingiram as expectativas esperadas e
as tcnicas de VI integradas s de MD mostraram ser
ecientes do ponto de vista computacional e facilidade
de uso. No entanto, devido grande quantidade de
tcnicas, a escolha daquelas que melhor se ajustam
aos dados em anlise no uma tarefa fcil e devem
ser escolhidas de acordo com o que se est buscando.
6 Concluses
Neste artigo apresentada a abordagem de um
importante problema de engenharia, anlise de
dados de instrumentao de grandes obras, usando
tcnicas de MVD. Como aplicao destas tcnicas,
procurou-se conhecer o relacionamento entre os dados
de instrumentao da barragem de Itaipu, o qual
foi tratado por meio do processo KDD. Para tanto,
foram utilizadas tcnicas para o pr-processamento
e agrupamento de dados e de relacionamento entre
os dados dentro de um mesmo grupo.
Para o agrupamento de dados, que uma das
possveis tarefas desempenhadas pela MD, foi utilizado
o Mtodo de Ward. J para vericar o relacionamento
entre os dados, em cada um dos grupos obtidos por
este mtodo, foram utilizadas algumas tcnicas de
VI: coordenadas paralelas; matriz de disperso;
orientada a pixel; faces de Chernoff e Star Glyphs.
Conhecer o relacionamento entre os instrumentos
de uma barragem de suma importncia, pois, se
sabendo destas relaes, ao ocorrer uma anomalia
num determinado instrumento em leituras futuras,
os outros instrumentos relacionados devero ser
analisados para conrmar a anomalia, fazendo com
que as medidas cabveis sejam tomadas pela empresa.
Para o desenvolvimento do trabalho, foram obtidos
os dados relativos a 72 hastes de extensmetros
localizados no bloco F da barragem no decorrer de
120 meses. Na anlise de agrupamento, foi mostrada
a formao de possveis 2, 3 ou 5 grupos (Figura 5).
Pode-se observar justicativas tcnicas para tais
formaes. No grco das leituras das hastes de
extensmetros (Figura 6), por exemplo, foi possvel
identicar visualmente a formao de 3 grupos.
A sequncia da anlise deu-se sobre a formao dos
3 grupos (2. corte, Figura 5), do qual selecionou-se o
grupo 1, por conter instrumentos bastante importantes
para o monitoramento da barragem. Para este grupo 1
de instrumentos, mostrou-se que, para a maioria das
hastes de extensmetros, a correlao alta (Tabela 3),
justicando mais uma vez a formao deste grupo.
Com as tcnicas de VI aplicadas ao grupo 1
(2 corte), obtido pelo Mtodo de Ward, foi possvel a
comparao e o surgimento de novas interpretaes,
sendo que a grande vantagem destas tcnicas a
visualizao imediata dos resultados. Com a tcnica
de Coordenadas Paralelas (Figura 7), por exemplo, foi
possvel concluir que, em geral, as hastes do grupo 1
esto realmente bem relacionadas. Estas tcnicas
permitem, sem a necessidade de conhecimentos
em reas como estatstica ou matemtica, analisar
visualmente a imagem formada pelas variveis e
nela, intuitivamente, formar os grupos.
Este tipo de abordagem mostrou-se bastante til no
agrupamento de instrumentos segundo sua relevncia
em relao ao comportamento da barragem, bem como
os agrupou segundo critrios no explicitados no banco
de dados, como a localizao em diferentes feies
geolgicas. Anomalias em leituras de instrumentos
tambm podem ser facilmente detectadas, pois as
correlaes com os demais instrumentos devero
mudar abruptamente caso aconteam. Desta forma,
a introduo de tcnicas de MVD em sistemas de
tomada de deciso bastante recomendvel.
Agradecimentos
Os autores agradecem equipe de Engenharia Civil
da Itaipu Binacional o apoio tcnico, FINEP o apoio
nanceiro ao projeto CT-HIDRO AIEVC Anlise
de Incertezas e Estimao de Valores de Controle para
o Sistema de Monitorao Geotcnico-Estrutural na
Barragem de Itaipu e CAPES a bolsa concedida
segunda autora.
Referncias
ANKERST, M.; KEIM, D. Visual data mining and
exploration of large databases. In: EUROPEAN
CONFERENCE ON PRINCIPLES AND PRACTICE
OF KNOWLEDGE DISCOVERY IN DATABASES,
5., 2001, Freiburg, Proceedings
734 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010
JOHNSON, R. A.; WICHERN, D. W. Applied multivariate
statistical analysis. 4. ed. Upper Saddle River: Prentice
Hall, 1998.
KACHIGAN, S. K. Statistical analysis: an interdisciplinary
introduction to univariate and multivariate methods.
New York: Radius Press, 1986.
KEIM, D. A. Visual exploration of large data sets.
Communications of the ACM, v. 44, n. 8, p. 38-44, 1979.
KEIM, D. A.; KRIEGEL, H. P. Visualization techniques
for mining large databases: a comparison. IEEE Trans.
Knowledge & Data Engineering, v. 8, n. 6, p. 923-936,
1996.
MATOS, S. F. Avaliao de instrumentos para
auscultao de barragem de concreto. Estudo de
Caso: deformmetros e tensmetros para concreto na
barragem de Itaipu. 2002. Dissertao (Mestrado em
Engenharia Civil)Universidade Federal do Paran,
Curitiba, 2002.
PICKETT, R. M.; GRINSTEIN, G. G. Iconographic
displays for visualizing multidimensional data. In:
IEEE CONFERENCE ON SYSTEMS, MAN AND
CYBERNETICS, 1988, Piscataway. Proceedings
REZENDE, S. O. Sistemas inteligentes: fundamentos e
aplicaes. Barueri: Manole, 2003.
SILVA NETO, M. A. Minerao visual de dados: extrao
do conhecimento a partir de tcnicas de visualizao
da informao e minerao de dados. Experimentos:
ITAIPU e SIMEPAR. 2008. Dissertao (Mestrado em
Mtodos Numricos em Engenharia)Universidade
Federal do Paran, Curitiba, 2008.
SILVEIRA, J. F. A. Instrumentao e comportamento
de fundaes de barragens de concreto. So Paulo:
Ocina de Textos, 2003.
SILVER, D. L. Knowledge discovery and data mining.
Technical Report MBA6522. CogNova Technologies
London Health Science Center, 1996.
TAN, P. N.; STEINBACH, M.; KUMAR, V. Introduction to
data mining. Boston: Addison-Wesley Longman, 2005.
WARD, M. O. et al. XmdvTool release: the multivariate
data visualization tool. Disponvel em: <http://davis.
wpi.edu/~xmdv/>. Acesso em: 26 jan. 2007.
WITTEN, I. H.; FRANK, E. Data mining: practical machine
learning tools and techniques with Java implementations.
San Francisco: Morgan Kaufmann, 2000.
WARD, M. O. XmdvTool: integrating multiple methods for
visualizing multivariate data. In: IEEE VISUALIZATION,
1994, Washington, DC. Proceedings
WONG, P. C. Visual data mining. IEEE Computer
Graphics and Applications, v. 19, n. 5, p. 20-21, 1999.
ARTERO, A. O. Estratgias para apoiar a deteco
de estruturas em visualizaes multidimensionais
percentualmente sobrecarregadas. 2005. Tese (Douto-
rado) Universidade de So Paulo, So Carlos, 2005.
BOX, G. E. P.; JENKINS, G. M. Time series analysis,
forecasting and control. San Francisco: Holden Day,
1976.
BRASIL. Projeto de Lei n 1.181, de 2003. Estabelece
diretrizes para vericao da segurana de barragens
de cursos de gua para quaisquer ns e para aterros de
conteno de resduos lquidos industriais. Disponvel
em: <http://www.emtermos.com.br/ABMS/PL_1181.
pdf>. Acesso em: 19 jun. 2009.
CHERNOFF, H. The use of faces to represent points in
K-dimensional space graphically. Journal of American
Statistical Association, v. 68, p. 361-368, 1973.
COMIT BRASILEIRO DE GRANDES BARRAGENS
CBGB. Diretrizes para a inspeo e avaliao de
segurana de barragens em operao. Rio de Janeiro,
1983.
DINIZ, C. A. R.; LOUZADA NETO, F. Data mining:
uma introduo. So Paulo: ABE, 2000.
DYMINSKI, A. S.; STEINER, M. T. A.; VILLWOCK, R.
Hierarchical ordering of extensometers readings from
Itaipu dam. In: INTERNATIONAL SYMPOSIUM
ON LIFE-CYCLE CIVIL ENGINEERING, Varenna,
2008. Proceedings
FAYYAD, U.M. et al. Advances in knowledge discovery
and data mining. Massachusetts: AAAI Press, 1996.
FREITAS, A. A. Data mining and knowledge discovery
with evolutionary algorithms. New York: Springer, 2002.
GIMENES, E. Data Mining Data Warehouse: a
importncia da minerao de dados em tomadas de
decises. 2000. Monograa de concluso de curso
(Tecnlogo em Processamento de Dados)Centro
Estadual de Educao Tecnolgica Paula Souza,
Faculdade de Tecnologia de Taguaritinga, Taquaritinga,
2000.
HAIR JUNIOR, J. F. et al. Anlise multivariada de dados.
So Paulo: Bookman, 2005.
INTERNATIONAL COMMISSION ON LARGE DAMS
ICOLD. Ttulo do texto/diretriz que foi consultada.
Disponvel em: <http://www.icold-cigb.org>. Acesso
em: dia ms 2008.
ITAIPU. ITAIPU Binacional. Disponvel em: <http://www.
itaipu.gov.br>. Acesso em: dia ms 2008.
JAIN, A. K.; MURTY, M. N.; FLYNN, P. J. Data clustering:
a review. ACM Computing Surveys, v. 31, n. 3, 1999.

You might also like