Projecto RENA

 

O projecto RENA (Remote Detection of Mediterranean Water Eddies in the Northeast Atlantic) teve início em 2004, estando neste momento a meio do 2º ano. O principal objectivo do projecto é a definição de uma metodologia para a identificação remota de vórtices de Água Mediterrânica (Meddies) através da utilização conjugada de dados de sensoriais remotos, de modelos numéricos de circulação oceânica e de redes neuronais artificiais. Será tentado um census dos Meddies no Atlântico Nordeste com o objectivo de possibilitar estimar a frequência de geração deste fenómeno.

 

 O trabalho inicial que motiva este projecto foi desenvolvido pelo Instituto de Oceanografia da Faculdade de Ciências da Universidade de Lisboa (IOFCUL) no sentido da identificação da assinatura de superfície de Meddies detectados in situ. As medidas efectuadas incluíram, por exemplo, a medição de trajectórias de flutuadores de sub-superficie, ou a construção de escalas de conductividade-temperatura-profundidade. Esta análise contribuiu para a caracterização das correntes e Eddies no Golfo de Cadiz e na costa oeste Portugesa. Estes fenómenos foram igualmente analisados e detectados em mapas térmicos da superfície marítima (TSM) derivados de dados sensoriais de satélite (figura .1).Estes mapas são o principal instrumento para o trabalho realizado no CENTRIA, no âmbito do projecto RENA.

 

Fig. 1. Mapa térmico de superfície marítima (TSM). As regiões a branco representam nuvens e terra (áreas costeiras de Portugal, Espanha e Marrocos).

 

Os primeiros contactos tiveram início em 2002. O primeiro artigo relativo a este trabalho foi publicado em 2003 ([MN2003a]). Até ao momento, foram analisados dados de satélite no domínio dos infravermelhos, do visível e das micro-ondas para os períodos de tempo em que existiam observações in situ realizadas pelo IOFCUL, através da analise das trajectórias de flutuadores de subsuperfície. Os resultados do IOFCUL associaram os vórtices de água Mediteranica com a presença de assinaturas à superfície nos mapas TSM.

 

O autor tem vindo a coordenar a participação da FCT/UNL neste projecto. Assim, salienta-se para além do trabalho inicial com a Doutora Ning Chen, o desenvolvimento com o Doutor Marco Castellani de uma rede neuronal treinada com um conjunto seleccionado de dados de TSM, nos quais haviam sido previamente identificados vórtices. Esta rede mostrou uma elevada capacidade de detecção, tendo o método revelado um potencial prometedor para utilização no reconhecimento de padrões de vórtices.

 

Detecção de Padrões em Mapas de Temperatura Marítima utilizando SOMs e Redes Neuronais FeedForward

 

Até agora, o autor participou em várias etapas, já concluídas, com vista a tornar possível a classificação supervisionada no contexto do projecto RENA: revisão de trabalho relacionado relativamente ao que seriam os melhores extractores de características para classificação automática de Eddies, etiquetagem manual de exemplos previamente conhecidos de Eddies e construção de um conjunto de dados supervisionado.

Na revisão efectuada na literatura, foram analisados os procedimentos standard para filtro de imagens sobre os TSM disponíveis. Os testes preliminares apresentaram dois métodos promissores: o método de gradiente e o método de Laws. Foi construído um primeiro protótipo do conjunto de extractores de atributos para estes métodos utilizando a linguagem matlab. Após a etiquetagem dos mapas TSM relativamente à presença e ausência de Eddies, foi construído um conjunto de dados balanceado para classificação supervisionada.

Infelizmente o primeiro protótipo construído demorava diversas horas para conclusão do processamento de uma única imagem. Neste momento o autor orienta uma bolsa BIC (atribuída no âmbito do projecto) para construção de um conjunto de extractores de atributos mais eficiente. O sistema está praticamente concluído e consegue efectuar o processamento de uma imagem em menos de 1 minuto.

 

Self-organizing maps (SOM)

 

Após o estudo preliminar com os mapas auto-organizados ([CM03]) o trabalho de investigação continuou relativamente à utilização dos SOM (self-organizing maps) para a melhoria da detecção das fronteiras dos Eddies. As redes SOM são algoritmos que permitem a aplicação de métodos não supervisionados para agrupamento de dados (clustering). As redes SOM possibilitam uma redução na dimensionalidade dos dados através da sua projecção para um mapa conceptual. Contrariamente a outros métodos as redes SOM apresentam vantagens por terem em conta noções de vizinhança entre posições próximas no mapa conceptual. Os testes realizados confirmaram a utilidade dos mapas SOM para este tipo de problemas. No entanto a comparação dos resultados com um simples método de histograma mostrou que apesar do SOM produzir uma segmentação da imagem mais definida e bem representada que os métodos de histograma.

 

Como próximo passo nesta linha de pesquisa, e para tentar validar objectivamente os resultados obtidos com os mapas SOM, tentou-se a utilização de uma representação da assinatura do fenómeno dos Meddies (usualmente semelhante a uma espiral) utilizando splines. A identificação desta assinatura será um primeiro passo para identificação do centro do Eddy, o seu raio e velocidade de deriva (através da análise de sequências de mapas). Estes resultados ainda necessitam de mais trabalho: os splines obtidos eram ainda demasiado instáveis para a descrição correcta dos Eddies: quer utilizando os resultados dos SOM, quer – especialmente - utilizando os resultados dos histogramas. De acordo com os resultados obtidos, os parâmetros dos splines descrevendo um Eddy necessitam ainda de maior restrição antes de ser possível obter resultados mais fiáveis. Infelizmente, principalmente devido a problemas de financiamento, este estudo teve que ser interrompido devido ao fim da bolsa de Pós-Doutoramento da Doutora Chen no CENTRIA, e consequente regresso desta investigadora à China. O autor considera este um tema extremamente relevante para pesquisa futura nesta área, no entanto, a necessidade imediata de resultados para o projecto forçou o autor a concentrar-se na obtenção de bons resultados na classificação de Eddies.

 

Redes Neuronais Feedforward para Classificação

 

A aplicação de um algoritmo de classificação de imagens deverá ser sujeita a dois passos: o pré-processamento da imagem para extracção de um conjunto de atributos, seguida pela identificação. O primeiro passo deve extrair descritores de alto nível relativos ao movimento da água num Meddy partindo da imagem de satélite. Cada um destes padrões deve em seguida ser classificado como Eddy ou não Eddy.

 

Para o primeiro passo (i.e. o pré-processamento da imagem) estão a ser utilizados dois métodos. A utilização de técnicas de reconhecimento de padrões de imagem utilizada pelo chamado método de Laws e a utilização do método de Gradiente. O método de Laws é um método genérico que identifica níveis, cantos, pontos, ondas e irregularidades numa dada zona da imagem. Esta identificação é efectuada de forma ponderada e conjugada entre as várias componentes, sendo criado um vector descrevendo as propriedades estruturais da região que rodeia o ponto em causa. Já o método de Gradiente identifica gradientes térmicos entre regiões da imagem (figura 2).

Em ambos os casos é treinado um classificador utilizando redes neuronais artificiais para reconhecer os padrões numéricos que revelam a presença (ou ausência) de estruturas típicas de um Eddy. Os primeiros resultados experimentais indicam que a abordagem proposta possibilita o treino de soluções de elevada performance que possibilitam a identificação dos pontos no núcleo de um Eddy [CM2005].

De acordo com os resultados até agora obtidos, ambos os algoritmos para pré-processamento da imagem produzem vectores de atributos significativos, que possibilitam à rede neuronal obter resultados com correcções acima do limiar dos 95%. Particularmente relevante (pois os Eddies ocupam apenas uma pequena parte do oceano) são as baixas percentagens de detecção de falsos positivos (2,5%). Quando comparados com outros algoritmos para identificação de fenómenos marinhos, a simplicidade, modularidade e rapidez de ambos os métodos e em particular a riqueza e generalidade do método de Laws justifica a escolha efectuada.

 

 

 

Fig. 2. exemplos dos campos de gradiente térmicos obtidos no mapa TSM da figura 1.

 

 

 

Trabalho futuro

 

Durante o segundo ano do projecto (2005/2006) pretende-se obter um módulo operacional para efectuar directamente a extracção de atributos e consequente classificação de Eddies em todos os mapas térmicos disponíveis no IOFCUL. Segundo resultados preliminares o extractor de atributos, já implementado no âmbito da bolsa BIC atribuída a este projecto, consegue tempos de processamento por imagem térmica inferiores a 1 segundo. Este processamento incluirá todo o tratamento de imagem: desde a sua leitura no repositório em disco até à marcação e registo em ficheiro em disco de pontos classificados como Eddies. Para tal será utilizada a rede previamente treinada para a classificação de Eddies em mapas térmicos.

 

Será importante referir nesta fase o trabalho realizado - a titulo gratuito - pelo colaborador no projecto Eng. Gracindo Machado. De facto, este antigo aluno da parte escolar do mestrado em Eng. Informática, tem vindo a efectuar um estudo mais pormenorizado dos resultados obtidos com o método de Laws. Este trabalho insere-se no âmbito de uma possível proposta para tese de Mestrado da sua parte. Neste quadro o aluno desenvolveu já rotinas Matlab que possibilitam a visualização directa da marcação obtida nos mapas de temperatura. Graças a esta visualização está neste momento a ser efectuada uma validação da marcação efectuada e uma validação mais qualitativa dos resultados obtidos na classificação. Em principio este trabalho - juntamente com uma maior validação do método de Laws - virá a ser proposto em breve (i.e. durante Fevereiro de 2006) com vista à elaboração de uma tese de Mestrado.

 

Foram igualmente adquiridas recentemente, e financiadas pelo e no âmbito do projecto, dois servidores de processamento SUN Z20. Estas máquinas têm sido essenciais para trabalho com a selecção de atributos e treino das diversas topologias de rede neuronal testadas. Neste quadro saliente-se o trabalho efectuado em conjunto com o Doutor Marco Castellani no âmbito do sistema FeaSANNT [CM04] que tem vindo a ser extensivamente utilizado nestas experiências. Assim que o módulo de classificação esteja pronto estas máquinas serão igualmente utilizadas para testes exaustivos sobre a classificação efectuada, antes da passagem a um ambiente de produção em equipamentos equivalentes existentes no IOFCUL.

De igual forma as máquinas estão disponíveis para investigação mais fundamental, nomeadamente nas áreas de processamento paralelo e distribuído com bases de dados relacionais e com redes neuronais. Este trabalho pode ser enquadrado numa perspectiva mais lata dos sistemas de informação e do Text e Data Mining.

 

Por fim resta referir que o contacto com o IOFCUL não se deve esgotar no presente projecto em curso, que embora importante, devido ao financiamento sempre limitado, não é por certo suficiente para estudar todas as questões que se levantam numa área desta importância. Para este relatório basta referir o caso do trabalho com SOMs e splines. De facto, pretende-se relacionar a presença de um Meddy detectado numa imagem de satélite com um modelo de circulação oceânica, será por certo necessário caracterizá-lo. Para tal será necessária uma análise mais fina que a sua simples detecção. Pela sua flexibilidade os splines serão um excelente método para o fazer. No entanto, como a figura 3 pode demonstrar, um spline não parametrizado pode ser ajustado de múltiplas formas. Apenas algumas destas formas podem ser típicas da presença de um Eddy. Assim interessa restringir as múltiplas formas que os diversos parâmetros que caracterizam o spline podem assumir. Para tal, a utilização de técnicas que se relacionam com gramáticas independentes do contexto que se possam ajustar a observações pode ser importante. Este resultado tornar-se-á especialmente relevante se enquadrado em outras técnicas que também são aplicadas à análise de texto, como será analisado na próxima secção.

 

(a)

 

 

(b)

Fig. 3. (a) Eddy num detalhe de um mapa térmico da superfície marinha e (b) resultado da aplicação do algoritmo SOM de [CM03] à imagem (a) sobreposto com alguns splines possíveis após ajuste às fronteiras detectadas.

 

 

terça-feira, 30 de Maio de 2006