*RAINDROP*

COMPUTAÇÃO VISUAL

2009

2010

A Computação Visual, em seu sentido mais amplo, se constitui na área da Matemática Aplicada ao Processamento de Objetos Gráficos, tais como modelos geométricos, imagens digitais e dados volumétricos. Desse ponto de vista, a Computação Gráfica, engloba as subáreas de Análise, Processamento e Síntese de Imagens, Modelagem Geométrica e Animação, além dos campos de aplicações relacionadas com Multimídia, Realidade Virtual, Jogos, e Interfaces Gráficas.

Portanto, as pesquisas em Computação Gráfica visam à criação de modelos matemáticos para descrever objetos gráficos, de técnicas para manipulá-los, e de algoritmos para visualizá-los.

Como em outras áreas da Matemática Aplicada Computacional, o problema mais geral que se coloca é o de desenvolver métodos e formular modelos, passíveis de representação e de implementação no computador. Neste sentido, uma das estratégias mais efetivas para a atuação nessa área é a investigação de métodos unificados para a analise e síntese de objetos gráficos. Essa abordagem permite integrar técnicas de visão computacional e computação gráfica na solução do problema. De fato, pode-se notar essa tendência na pesquisa de ponta da área, com o aparecimento de novas subáreas tais como:  a Modelagem e Visualização baseada em Imagens; a Fotografia Computacional e outras.

1 – Linhas de Pesquisa

As principais linhas de pesquisa em Computação Gráfica objetivam por um lado consolidar o desenvolvimento das subáreas clássicas e por outro lado explorar novas oportunidades nas subáreas emergentes.

1.1 - Modelagem Geométrica

A modelagem geométrica é um dos problemas básicos da Computação Gráfica, com implicações em praticamente todas as áreas de atuação dessa disciplina. O problema engloba os vários aspectos relacionados com a descrição e manipulação de objetos gráficos no computador. Assim, sua solução deve ser equacionada em diversos níveis de abstração, que incluem: a escolha de um modelo matemático apropriado para o estudo da classe dos objetos de interesse; o estabelecimento de um esquema de representação baseada no modelo; e a formulação de estruturas de dados e rotinas para implementar a representação no computador. Além disso, um sistema de modelagem deve suportar uma vasta gama de recursos computacionais para a manipulação desses objetos. Dentre estes, os mais importantes dizem respeito à criação, modificação, simulação e armazenamento de dados.

Uma grande variedade dos objetos reais é representada por superfícies e, portanto métodos de descrição e representação de superfícies são extremamente importantes. Existem basicamente duas descrições funcionais de superfícies: a descrição implícita e a paramétrica. Essas duas descrições são complementares em muitos aspectos. 

1.1.1 Superfícies Implícitas

A descrição implícita constitui um poderoso mecanismo para a criação e manipulação de formas geométricas. Um objeto implícito é definido por uma função escalar F(x,y,z) no espaço ambiente. A superfície implícita é uma superfície de nível da função F, dada pela equação F(x,y,z)=c. As funções escalares em três variáveis F(x,y,z) representam descrições analíticas de objetos gráficos volumétricos e as superfícies implícitas F(x,y,z)=c representam superfícies onde a densidade do objeto volumétrico é constante. 

1.1.2 Superfícies Paramétricas

A descrição paramétrica é muito conveniente do ponto de vista computacional, apesar de ser limitada para representar globalmente objetos com uma topologia complexa. Para resolver esse problema em geral subdivide-se a superfície em retalhos de modo a obter uma descrição paramétrica por partes (Bézier, Splines, NURBS etc.). Esse método apresenta o problema da diferenciabilidade da superfície na junção dos diferentes retalhos. Um outro método de descrever superfícies paramétricas é por subdivisão, no qual a superfície é descrita a partir de uma malha de controle inicial que possui a topologia desejada. A essa malha associa-se um esquema de subdivisão que permite refinar a malha inicial gerando uma superfície limite, chamada de superfície de subdivisão. As superfícies de subdivisão possuem várias propriedades interessantes, tais como boa classe de diferenciabilidade e uma estrutura de representação global para superfícies com topologia complexa. 

Esta linha de pesquisa é representada no projeto por Luiz Velho e interlocução com Demetri Terzopoulos, um dos pioneiros na aplicação de métodos físicos em modelagem variacional e recipiente do “Computer Vision Significant Researcher Award”.

1.2 - Processamento de Imagens

Processamento Digital de Imagens é uma área da Matemática Aplicada que engloba várias sub-áreas, dedicadas ao processamento da informação pictórica. Podem ser mencionadas as áreas de Realce e Restauração, Reconstrução, Codificação, Análise de Imagens e Reconhecimento de Imagens. 

As ferramentas matemáticas utilizadas englobam um amplo espectro. Envolvem Análise  de Fourier, incluindo Wavelets, Álgebra Linear, Estatística, Métodos Numéricos, Análise Funcional, Morfologia Matemática, Equações Diferenciais a Derivadas Parciais, etc..

Os problemas que se colocam envolvem a manipulação de imagens para uma melhor visualização pelo observador humano (Realce), a resolução de problemas inversos mal condicionados para obtenção de uma estimativa da imagem original a partir de imagens degradadas por borramento e ruído (Restauração), a recuperação de imagens a partir de projeções degradadas por espalhamento, atenuação e ruído a partir de suas projeções (Reconstrução), a compressão de grande volume de dados para armazenamento ou transmissão (Codificação), a análise de dados visando várias aplicações como detecção de contornos, segmentação, superposição de imagens (Análise de Imagens) ou a atribuição de “pixels” ou regiões de imagens a diferentes classes (Reconhecimento de Imagens). 

As aplicações de Processamento Digital de Imagens incluem um número crescente de áreas, como Aplicações Médicas, Telecomunicações, Sensoriamento Remoto, Bioinformática, Visão Robótica, Astronomia, Microscopia, etc. 

1.2.1 Restauração

As técnicas de restauração têm por objetivo inverter um processo de borramento da imagem, devido a causas como movimento do sensor em relação ao objeto, desfocalização, turbulência atmosférica, difração. Deve ser também levada em conta a presença do ruído, que pode ser aditivo, independente ou não do sinal, multiplicativo ou Poisson, devido à baixa contagem de fótons em microscopia ou astronomia, por exemplo. Um modelo simplificado do problema é modelado pela Equação Integral de Fredholhm do Primeiro Tipo. O problema básico em restauração é o chamado mal condicionamento, segundo o qual, pequenas perturbações na imagem observada, devido ao ruído, levam a enormes variações na imagem restaurada, se não for utilizado um conhecimento a priori adequado. Isso é característico dos problemas inversos da Física Matemática. 

O conhecimento a priori pode ser determinístico ou estatístico. No primeiro caso uma aproximação da imagem original é obtida por métodos como mínimos quadrados regularizados, que dependem de uma adequada escolha de um parâmetro de regularização.  A informação a priori pode ser incorporada por meio de restrições na solução expressa por conjuntos convexos (POCS – Projection Onto convex Sets). O método estatístico clássico de restauração é o Filtro de Wiener para ruído aditivo. No caso de ruído  multiplicativo (como speckle de radar de abertura sintética, ultra-som  ou laser) ou Poisson (como em microscopia de fluorescência), destaca-se o critério Maximum a Posteriori, que, como o filtro de Wiener, representa uma abordagem bayesiana para lidar com o mal condicionamento. Pode-se também utilizar,para imagens de fluorescência, uma abordagem combinando extrapolação do espectro além do limite de difração com restauração, por meio do Algoritmo de Richardson-Lucy (que implementa a máxima verossimilhança), combinando com regularização por Total Variation (que tende a preservar as bordas da imagem) e restrições espaciais. Este trabalho vem sendo desenvolvido por Nelson Mascarenhas e seus estudantes, em conjunto com Paulo Ferreira do IEETA da Universidade de Aveiro. O conhecimento estatístico pode ser incorporado de várias formas, uma das quais utiliza o modelo de Gibbs de Campos Aleatórios Markovianos. 

Os métodos iterativos de restauração têm sido utilizados por permitir um processo de regularização pela parada das iterações antes de atingir o mal condicionamento e por facilitar a incorporação de conhecimento a priori determinístico na forma de restrições.Outro problema que se coloca freqüentemente  em restauração é o desconhecimento da função de espalhamento e é um tópico atual de pesquisa a busca de métodos da chamada blind deconvolution, onde se estima simultaneamente a imagem e a função de espalhamento.

Uma área que, de certa forma, representa uma evolução do problema de restauração é o de super-resolução. Trata-se de obter uma imagem de maior resolução, a partir de várias imagens de baixa resolução (freqüentemente degradadas por borramento e ruído), separadas por frações de pixels, de modo a não haver redundância na informação. Estas imagens podem ser resultado de vídeo ou, por exemplo, seqüências de imagens PET ou  NMR do trato vocal. Um trabalho nesse sentido está sendo desenvolvido por Nelson Mascarenhas e seus estudantes, em colaboração com o grupo de Processamento de Sinais do IEETA  de Aveiro. 

1.2.2 Reconstrução de Imagens

O problema de reconstrução de imagens tem sido aplicado principalmente em tomografia médica, mas outras aplicações como teste não-destrutivo de materiais, astronomia, etc, têm surgido. Duas modalidades básicas são utilizadas: a) tomografia de transmissão, onde uma fonte de raios-X ou raios gama provenientes de uma fonte radioativa atravessam um corpo e, a partir dessas projeções obtidas por sensores, são utilizados algoritmos para reconstruir a imagem original; b) tomografia de emissão, onde isótopos radioativos são injetados no paciente, que produzem radiação coletada por sensores. Há também dois tipos de tomografia de emissão: SPECT (Single Photon Emission Computed Tomography) ou PET (Positron Emission Tomogaphy). Dois tipos de algoritmos têm sido utilizados: os de convolução-retroprojeção ou filtragem-retroprojeção, que partem de um modelo contínuo do problema, que é discretizado e os métodos algébricos, que já partem de um modelo discretizado. No caso de tomografia de emissão, o algoritmo EM (Expectation-Maximization) tem sido utilizado, para obter o estimador de máxima-verossimilhança sob o modelo Poisson do ruído de contagem de fótons. Como no caso da restauração, a reconstrução de imagens é um problema inverso mal condicionado e conhecimento a priori semelhante ao de restauração tem sido usado.Uma possibilidade é explorar nas técnicas algébricas os métodos POCS, que podem ser combinados com métodos derivados de Teoria de Estimação que já foi objeto de tese de doutorado e agora está sendo objeto de dissertação de mestrado, orientadas por Nelson Mascarenhas.

1.3 - Visão Computacional

O objetivo da Visão Computacional é a inferência a partir de imagens para determinar modelos dos objetos que estão representados nelas. Uma grande variedade de problemas é obtida conforme a natureza das imagens e as características a serem obtidas. Em sua forma mais clássica, uma imagem é uma aplicação com domínio em uma região do R2 e com valores em um espaço de cores, o que corresponde a um modelo matemático do agregado de energia luminosa que atinge a retina. Podem ser considerados, no entanto, modelos mais gerais de imagem, de modo a incluir resultados produzidos a partir de sensores diversos (por exemplo, a imagem tridimensional formada pelos valores de densidade fornecidos por uma tomografia computadorizada). 

O desenvolvimento de algoritmos computacionais capazes de extrair informações presentes em uma imagem é fortemente influenciado pela compreensão dos processos de aquisição de imagens e de sua percepção no sistema visual do homem e de outros animais. O clássico modelo de Marr para visão, por exemplo, inclui "módulos de visão" que vão desde o processamento de "baixo nível" (aquisição da imagem no olho, filtragem, detecção de arestas, agrupamento), passando por detecção de formas (usando informações de textura, movimento, sombreamento e visão estéreo) até o processamento de "alto nível" (formação e reconhecimento de objetos via comparação com protótipos). Tais módulos são a motivação para diversas áreas de Análise de Imagens e Visão Computacional, que freqüentemente avançam baseadas em descobertas relativas à função correspondente desempenhada por órgãos de visão natural. 

1.3.1  Espaços de Escala e Wavelets

Uma tal descoberta é a de que processamos, mesmo nos níveis mais baixos, toda a informação visual que recebemos em diversas escalas simultaneamente - em outras palavras, a visão natural consegue obter características de estruturas grandes de uma imagem ignorando distrações que venham de seus detalhes menores. Esta propriedade é essencial para a robustez de qualquer sistema (por exemplo, é por causa desta natureza multi-escala que podemos entender imagens com ruído, mosaicos e até mesmo imagens de televisão). Um modelo matemático e computacional que tem esta característica é o modelo dos Espaços de Escala. Na verdade, os espaços de escala são a base de toda uma linha de pesquisa de Equações Diferenciais Parciais aplicadas ao Processamento de Imagens que tem se revelado extremamente ativa recentemente (incluindo tópicos como Snakes, Wavelets e Level Set Methods). Neste projeto, tal linha de pesquisa é representada por Luiz Velho, com a colaboração de Roberto Marcondes. 

1.3.2  Reconhecimento de Padrões

Por outro lado, nos níveis mais altos do processamento visual temos o processo de percepção visual, onde imagens adquiridas são comparadas com imagens e modelos já armazenados na memória, para fins de reconhecimento de padrões já observados. Um aspecto fundamental da área é a construção de modelos probabilísticos para as variáveis do processo de visão (as imagens observadas; a forma, posicionamento, textura e iluminação dos objetos, etc.) e a obtenção de amostras e estimativas a partir de tais modelos. Esta linha de pesquisa é representada neste projeto por Roberto Marcondes, e interlocução com David Mumford, responsável por importantes contribuições nas áreas de Geometria Algébrica e Visão Computacional e recebedor da Medalha Fields. 

As técnicas de Reconhecimento de Padrões têm sido freqüentemente empregadas para classificar imagens de sensoriamento remoto, documentos, imagens biométricas como impressões digitais, face e íris ou aplicações não convencionais como classificação de imagens tomográficas de Ciência dos Solos. Os processos de classificação podem ser supervisionados (quando há amostras de treinamento) ou não supervisionados, como nas técnicas de aglomeração de dados (clustering). As técnicas de classificação podem ser classificadas também como paramétricas ou não-paramétricas, a depender da existência ou não de um modelo probabilístico das densidades de probabilidade das classes.Com o objetivo de melhorar o desempenho de classificação, têm sido utilizados combinadores de classificadores usando classificadores convencionais ou redes neurais. Exploram-se também as possibilidades de classificação não supervisionada utilizando mistura de distribuições para classificar imagens de radar de abertura sintética, como no trabalho de Nelson Mascarenhas e  sua estudante Michelle  Horta, em colaboração com Alejandro Frery. A possibilidade de modelar imagens multiespectrais de sensoriamento remoto ou de NMR por campos aleatórios markovianos multivariados, com a finalidade de classificação dessas imagens, está sendo explorada por Nelson Mascarenhas e seu estudante Alexandre Levada. As aplicações biométricas de Reconhecimento de Imagens têm crescido em importância. Dentre elas se destaca o Reconhecimento de Faces, que é objeto de dissertação de mestrado sendo orientada por Nelson Mascarenhas e seu colega da UFSCar Jander Moreira, por meio das chamadas técnicas holísticas. 

Ainda no contexto do reconhecimento de padrões, há amplo espaço para o uso de modelos e técnicas advindas da estatística não paramétrica e da teoria da informação. Nesse sentido, Alejandro C. Frery vem investigando o uso de testes livres de distribuições para a identificação de bordas e o desenvolvimento de testes de hipóteses baseados em distâncias estocásticas para imagens com baixa relação sinal-ruído,

1. 4 - Animação e Métodos Físicos

A animação por computador estuda o comportamento dinâmico dos objetos gráficos. O uso de modelos físicos em animação consiste em estudar o movimento dos corpos a partir dos seus agentes causadores (forças e torques).  Nesta abordagem, são estabelecidas e resolvidas (em geral, numericamente) as equações diferenciais que descrevem a relação entre tais agentes e as posições dos corpos.  A situação mais fácil é aquela em que o problema resultante é um problema de valor inicial.  Neste caso, o movimento dos corpos pode ser obtido através da aplicação da Lei de Newton.   Os principais tópicos de pesquisa neste tipo de problema dizem respeito à detecção e tratamento das colisões e contatos dos corpos envolvidos. 

1.4.1  Animação Comportamental

Problemas mais difíceis resultam quando se deseja determinar que forças são necessárias para a geração de um determinado movimento. Essas técnicas são importantes na área de animação comportamental (“behavorial animation”). Neste caso, tem-se um problema de controle, para cuja solução são tipicamente utilizados métodos variacionais. O uso de redes neurais tem sido também proposto para alguns problemas desta classe. 

Esta linha de pesquisa é representada neste projeto por Luiz Velho e interlocução de Ken Perlin, recipiente do “ACM-SIGGRAPH Achievement Award”. 

2 - Plano de Atividades

O plano de atividades inclui apoio para organização de workshops locais sobre temas específicos da área, conferencias regionais e nacionais, auxilio a vinda de professores visitantes estrangeiros e para a mobilidade de pesquisadores no pais. 

2.1 – Desenvolvimento da Área

A área de Computação Gráfica no Brasil tem se desenvolvido com grande vigor nas duas ultimas décadas. Uma demonstração expressiva desse desenvolvimento pode ser observada nas atividades da área no Colóquio Brasileiro de Matemática. Elas se iniciaram com um curso sobre Métodos Simpliciais e Computação Gráfica, em 1989. Desde 1991 o Colóquio tem em seu programa uma Sessão Especial sobre Computação Gráfica. 

De fato, a Computação Gráfica no Brasil atinge a sua maioridade este ano, em 2008, com o XXI SIBGRAPI – Simpósio de Computação Gráfica, Visão e Processamento de Imagens, a área completa 21 anos. Nesse período a Computação Gráfica amadureceu e ganhou importância, se estabelecendo como uma área de destaque na Ciência da Computação e na Matemática Aplicada. 

Uma demonstração inequívoca do papel de destaque da Computação Gráfica Brasileira no cenário internacional pode ser constatada observando os eventos científicos principais da área, que ocorreram no Brasil em 2007, a saber:  a CGI 2007 – Computer Graphics International Conference, em Petrópolis no mês de Março; a ICCV 2007 – International Conference of Computer Vision e o ISMM 2007 – International Symposium of Mathematical Morphology, ambas no Rio de Janeiro em Outubro de 2007. 

Apesar do grande desenvolvimento atual da área, pretendemos com esse projeto obter um avanço considerável da Computação Gráfica Brasileira no período dos próximos 5 anos. Com isso, esperamos fomentar uma mudança de patamar da área, tanto no plano da pesquisa científica, quanto em relação à formação acadêmica de recursos humanos e aplicações na sociedade. 

2.2 – Atividades de Pesquisa

As atividades de pesquisa abrangem os projetos dos pesquisadores participantes e seus colaboradores nas subáreas de Modelagem Geométrica, Processamento de Imagens, Visão Computacional e Animação. 

Como conseqüência dos projetos de pesquisa, teremos um programa de intercambio nacional entre as instituições participantes, a saber: IMPA, UFSCAR, UFAL, IME-USP e UNICAMP. 

Os projetos incluem a participação de centros em desenvolvimento com boa perspectiva para pesquisa e pós-graduação. Entre eles podemos citar a UFC, UFMA, UFAM, UFPE, e UFF. 

Para complementar as atividades dos projetos teremos um programa de visitantes estrangeiros, com expoentes da área tais como: Prof. Mattew Turk, da USC; Dr. Jos Stam, da Autodesk; Prof. Bianca Faldicieno, do IMA; Prof. Mario Costa Sousa, da University of Calgary;, Paulo Ferreira, do IEETA da Universidade de Aveiro, além de pesquisadores do INRIA e da University of Utah. 

Planejamos também realizar atividades semestrais envolvendo os principais grupos de pesquisa no pais para discutir temas relevantes e recentes da área. Essas atividades podem incluir workshops e escolas conjuntas, possivelmente abrangendo áreas correlatas. 

Além disso, temos a intenção de apoiar atividades nos eventos tradicionais da área, tais como conferencias e simpósios. Isso inclui o fomento de programas no SIBGRAPI, SRV, Webmedia, SBGAMES, CNMAC, ERMAC, WVC e no Colóquio Brasileiro de Matemática. 

2.3 - Formação de Recursos Humanos

Uma das conseqüências das atividades do projeto será o incremento da formação de recursos humanos na área, incluindo alunos de mestrado e doutorado, bem como de pesquisadores em pós-doutorado.

Estimamos o numero médio de doutores formados anualmente na área de Computação Gráfica em aproximadamente 15 doutores. Com o crescimento global da área no pais, inclusive fomentado pelas atividades do projeto, podemos fazer uma projeção de incremento considerável na formação de doutores nos próximos 5 anos. Acreditamos ser possível atingir a meta de 25 doutores formados por ano na área. 

Em vista dos objetivos expostos acima, procuraremos atuar no sentido de obter bolsas de doutorado e pós-doutorado para não apenas suprir a demanda atual, como também induzir o desenvolvimento potencial. 

2.4 - Transferência de Conhecimento para a Sociedade

No que concerne a transferência de conhecimento para a sociedade, bem como a interação com o sistema produtivo, o projeto contempla parcerias com organizações não governamentais e empresas. 

Dentro das iniciativas previstas, podemos citar a continuidade do projeto MUAN, com o AnimaMundi e apoio tecnológico da IBM, que desenvolve software livre para aplicação em educação, no âmbito do projeto AnimaEscola. 

Temos também parcerias em processo com a empresa Digitok, com a qual estamos fazendo a transferência de tecnologia para aplicações em realidade virtual através do projeto Visorama, aplicações em divulgação da Astronomia com a o sistema Domo de visualização para planetários, em o desenvolvimento de interfaces Multitouch. Alem disso, temos uma colaboração com Embrapa para aplicações de instrumentação e agropecuária. 

3 - Equipe:

A equipe do projeto é composta por um grupo de pesquisadores com grande representatividade e atuação na área. 

3.1 – Pesquisadores Nacionais:

O projeto é coordenado na área de Computação Gráfica por Luiz Velho do IMPA (CPF 330.176.547-53) e por Nelson Mascarenhas da UFSCAR (CPF 075.040.124-91). A equipe de pesquisadores nacionais é integrada pelos pesquisadores Alejandro Frery da UFAL (CPF 159605098-57) e Alexandre Falcão do IC-UNICAMP (CPF 510.077.974-87). 

3.2 - Colaboradores Estrangeiros:

O projeto conta  também com a colaboração dos seguintes pesquisadores estrangeiros: 

  • David Mumford, Brown University, Fields Medal 1974;
  • Demetri Terzopulos, University of Califórnia, ICCV  Significant Researcher Award 2007;
  • Ken Perlin, New York University, ACM-SIGGRAPH Achievement Award 2008;
  • Gabriel Taubin, Brown University, IEEE Fellow.
  • Rangaraj Rangayyan, University of Calgary IEEE Fellow
  • Paulo J. S. G. Ferreira, , IEETA, Universidade de Aveiro, Editor of the journal Sampling Theory in Signal and Image Processing. 

3.2 – Colaboração Especial:

Os  pesquisadores do projeto tem colaborações ativas com Junior Barrera e Roberto Marcondes Cesar Junior da USP, que estão submetendo um projeto para um Instituto Nacional de C&T na área de Bioinformática. Caso ambos projetos seja aprovados, planejamos fomentar uma  colaboração especial entre os dois institutos.