O projecto RENA (Remote Detection of Mediterranean Water Eddies in
the Northeast Atlantic) teve início em 2004, estando neste momento a meio do
2º ano. O principal objectivo do projecto é a definição de uma metodologia para
a identificação remota de vórtices de Água Mediterrânica
(Meddies) através da utilização conjugada de
dados de sensoriais remotos, de modelos
numéricos de circulação oceânica e de redes neuronais artificiais. Será tentado um census
dos Meddies no Atlântico Nordeste com
o objectivo de possibilitar estimar a frequência de geração deste fenómeno.
O trabalho inicial que motiva
este projecto foi desenvolvido pelo Instituto de Oceanografia da Faculdade de
Ciências da Universidade de Lisboa (IOFCUL) no sentido da identificação da
assinatura de superfície de Meddies detectados
in situ. As
medidas efectuadas incluíram, por exemplo, a medição de trajectórias de
flutuadores de sub-superficie, ou a construção de
escalas de conductividade-temperatura-profundidade.
Esta análise contribuiu para a caracterização das correntes e Eddies no Golfo de Cadiz e
na costa oeste Portugesa. Estes fenómenos foram
igualmente analisados e detectados em mapas térmicos da superfície marítima (TSM) derivados de dados sensoriais de satélite (figura .1).Estes mapas são o principal
instrumento para o trabalho realizado no CENTRIA, no âmbito do projecto RENA.
|
Fig. 1. Mapa térmico de superfície marítima (TSM). As regiões a branco representam nuvens e terra (áreas costeiras de Portugal, Espanha e Marrocos). |
Os primeiros contactos tiveram início em 2002. O primeiro artigo relativo a este trabalho foi publicado em 2003 ([MN2003a]). Até ao momento, foram analisados dados de satélite no domínio dos infravermelhos, do visível e das micro-ondas para os períodos de tempo em que existiam observações in situ realizadas pelo IOFCUL, através da analise das trajectórias de flutuadores de subsuperfície. Os resultados do IOFCUL associaram os vórtices de água Mediteranica com a presença de assinaturas à superfície nos mapas TSM.
O autor tem vindo a coordenar a participação da FCT/UNL neste projecto. Assim, salienta-se para além do trabalho inicial com a Doutora Ning Chen, o desenvolvimento com o Doutor Marco Castellani de uma rede neuronal treinada com um conjunto seleccionado de dados de TSM, nos quais haviam sido previamente identificados vórtices. Esta rede mostrou uma elevada capacidade de detecção, tendo o método revelado um potencial prometedor para utilização no reconhecimento de padrões de vórtices.
Até agora, o autor participou em várias etapas, já concluídas, com vista a tornar possível a classificação supervisionada no contexto do projecto RENA: revisão de trabalho relacionado relativamente ao que seriam os melhores extractores de características para classificação automática de Eddies, etiquetagem manual de exemplos previamente conhecidos de Eddies e construção de um conjunto de dados supervisionado.
Na revisão efectuada na literatura, foram analisados os procedimentos standard
para filtro de imagens sobre os TSM disponíveis. Os testes preliminares
apresentaram dois métodos promissores: o método de gradiente e o método de Laws. Foi construído um primeiro protótipo do conjunto de
extractores de atributos para estes métodos utilizando a linguagem matlab. Após a etiquetagem
dos mapas TSM relativamente à presença e ausência de Eddies,
foi construído um conjunto de dados balanceado para classificação supervisionada.
Infelizmente o primeiro protótipo construído demorava diversas horas
para conclusão do processamento de uma única imagem. Neste momento o autor
orienta uma bolsa BIC (atribuída no âmbito do projecto) para construção de um
conjunto de extractores de atributos mais eficiente. O sistema está
praticamente concluído e consegue efectuar o processamento de uma imagem em
menos de 1 minuto.
Após o estudo preliminar com os mapas auto-organizados ([CM03]) o trabalho de investigação
continuou relativamente à utilização dos SOM (self-organizing
maps) para a melhoria da detecção das fronteiras dos Eddies. As redes SOM são algoritmos que
permitem a aplicação de métodos não supervisionados para agrupamento de dados (clustering). As redes SOM possibilitam uma
redução na dimensionalidade dos dados através da sua
projecção para um mapa conceptual. Contrariamente a outros métodos as redes SOM
apresentam vantagens por terem em conta noções de vizinhança entre posições
próximas no mapa conceptual. Os testes realizados confirmaram a utilidade dos
mapas SOM para este tipo de problemas. No entanto a comparação dos
resultados com um simples método de histograma mostrou que apesar do SOM
produzir uma segmentação da imagem mais definida e bem representada que os
métodos de histograma.
Como próximo passo nesta linha de pesquisa, e para tentar validar
objectivamente os resultados obtidos com os mapas SOM, tentou-se a
utilização de uma representação da assinatura do fenómeno dos Meddies (usualmente semelhante a uma espiral)
utilizando splines. A identificação desta
assinatura será um primeiro passo para identificação do centro do Eddy, o seu raio e velocidade de deriva (através da
análise de sequências de mapas). Estes resultados ainda necessitam de mais
trabalho: os splines obtidos eram ainda
demasiado instáveis para a descrição correcta dos Eddies:
quer utilizando os resultados dos SOM, quer – especialmente - utilizando
os resultados dos histogramas. De acordo com os resultados obtidos, os
parâmetros dos splines descrevendo um Eddy necessitam ainda de maior restrição antes de
ser possível obter resultados mais fiáveis. Infelizmente, principalmente devido
a problemas de financiamento, este estudo teve que ser interrompido devido ao
fim da bolsa de Pós-Doutoramento da Doutora Chen no CENTRIA, e consequente regresso desta investigadora
à China. O autor considera este um tema extremamente relevante para pesquisa
futura nesta área, no entanto, a necessidade imediata de resultados para o
projecto forçou o autor a concentrar-se na obtenção de bons resultados na
classificação de Eddies.
A aplicação de um algoritmo de classificação de imagens deverá ser sujeita a dois passos: o pré-processamento da imagem para extracção de um conjunto de atributos, seguida pela identificação. O primeiro passo deve extrair descritores de alto nível relativos ao movimento da água num Meddy partindo da imagem de satélite. Cada um destes padrões deve em seguida ser classificado como Eddy ou não Eddy.
Para o primeiro passo (i.e. o pré-processamento da imagem) estão a ser utilizados dois métodos. A utilização de técnicas de reconhecimento de padrões de imagem utilizada pelo chamado método de Laws e a utilização do método de Gradiente. O método de Laws é um método genérico que identifica níveis, cantos, pontos, ondas e irregularidades numa dada zona da imagem. Esta identificação é efectuada de forma ponderada e conjugada entre as várias componentes, sendo criado um vector descrevendo as propriedades estruturais da região que rodeia o ponto em causa. Já o método de Gradiente identifica gradientes térmicos entre regiões da imagem (figura 2).
Em ambos os casos é treinado um classificador utilizando redes neuronais artificiais para reconhecer os padrões numéricos que revelam a presença (ou ausência) de estruturas típicas de um Eddy. Os primeiros resultados experimentais indicam que a abordagem proposta possibilita o treino de soluções de elevada performance que possibilitam a identificação dos pontos no núcleo de um Eddy [CM2005].
De acordo com os resultados até agora obtidos, ambos os algoritmos para pré-processamento da imagem produzem vectores de atributos significativos, que possibilitam à rede neuronal obter resultados com correcções acima do limiar dos 95%. Particularmente relevante (pois os Eddies ocupam apenas uma pequena parte do oceano) são as baixas percentagens de detecção de falsos positivos (2,5%). Quando comparados com outros algoritmos para identificação de fenómenos marinhos, a simplicidade, modularidade e rapidez de ambos os métodos e em particular a riqueza e generalidade do método de Laws justifica a escolha efectuada.
|
Fig.
2. exemplos dos campos de gradiente térmicos obtidos
no mapa TSM da figura 1. |
Durante o segundo ano do projecto (2005/2006) pretende-se obter um módulo operacional para efectuar directamente a extracção de atributos e consequente classificação de Eddies em todos os mapas térmicos disponíveis no IOFCUL. Segundo resultados preliminares o extractor de atributos, já implementado no âmbito da bolsa BIC atribuída a este projecto, consegue tempos de processamento por imagem térmica inferiores a 1 segundo. Este processamento incluirá todo o tratamento de imagem: desde a sua leitura no repositório em disco até à marcação e registo em ficheiro em disco de pontos classificados como Eddies. Para tal será utilizada a rede previamente treinada para a classificação de Eddies em mapas térmicos.
Será importante referir nesta fase o trabalho realizado - a titulo gratuito - pelo colaborador no projecto Eng. Gracindo Machado. De facto, este antigo aluno da parte escolar do mestrado em Eng. Informática, tem vindo a efectuar um estudo mais pormenorizado dos resultados obtidos com o método de Laws. Este trabalho insere-se no âmbito de uma possível proposta para tese de Mestrado da sua parte. Neste quadro o aluno desenvolveu já rotinas Matlab que possibilitam a visualização directa da marcação obtida nos mapas de temperatura. Graças a esta visualização está neste momento a ser efectuada uma validação da marcação efectuada e uma validação mais qualitativa dos resultados obtidos na classificação. Em principio este trabalho - juntamente com uma maior validação do método de Laws - virá a ser proposto em breve (i.e. durante Fevereiro de 2006) com vista à elaboração de uma tese de Mestrado.
Foram igualmente adquiridas recentemente, e financiadas pelo e no
âmbito do projecto, dois servidores de processamento SUN Z20. Estas
máquinas têm sido essenciais para trabalho com a selecção de atributos e treino
das diversas topologias de rede neuronal
testadas. Neste quadro saliente-se o trabalho efectuado em conjunto com o
Doutor Marco Castellani no âmbito do sistema FeaSANNT [CM04]
que tem vindo a ser extensivamente utilizado nestas experiências. Assim que o
módulo de classificação esteja pronto estas máquinas serão igualmente
utilizadas para testes exaustivos sobre a classificação efectuada, antes da
passagem a um ambiente de produção em equipamentos equivalentes existentes no
IOFCUL.
De igual forma as máquinas estão disponíveis para investigação mais
fundamental, nomeadamente nas áreas de processamento paralelo e distribuído com
bases de dados relacionais e com redes neuronais.
Este trabalho pode ser enquadrado numa perspectiva mais lata dos sistemas de
informação e do Text e Data Mining.
Por fim resta referir que o contacto com o IOFCUL não se deve esgotar
no presente projecto em curso, que embora importante, devido ao financiamento
sempre limitado, não é por certo suficiente para estudar todas as questões que
se levantam numa área desta importância. Para este relatório basta referir o
caso do trabalho com SOMs
e splines. De facto, pretende-se relacionar a
presença de um Meddy
detectado numa imagem de satélite com um modelo de circulação oceânica, será
por certo necessário caracterizá-lo. Para tal será necessária uma análise mais
fina que a sua simples detecção. Pela sua flexibilidade os splines
serão um excelente método para o fazer. No entanto, como a figura 3 pode
demonstrar, um spline não parametrizado pode
ser ajustado de múltiplas formas. Apenas algumas destas formas podem ser
típicas da presença de um Eddy. Assim
interessa restringir as múltiplas formas que os diversos parâmetros que
caracterizam o spline podem assumir. Para tal,
a utilização de técnicas que se relacionam com gramáticas independentes do
contexto que se possam ajustar a observações pode ser importante. Este
resultado tornar-se-á especialmente relevante se enquadrado em outras técnicas
que também são aplicadas à análise de texto, como será analisado na próxima
secção.
|
|
(b) |
|
Fig. 3. (a) Eddy num detalhe de um mapa térmico da superfície marinha e (b) resultado da aplicação do algoritmo SOM de [CM03] à imagem (a) sobreposto com alguns splines possíveis após ajuste às fronteiras detectadas. |
|
terça-feira, 30 de Maio de 2006