quarta-feira, 24 de agosto de 2011

O que é Processamento Digital de Imagens?

A visão humana é um dos sentidos mais avançados e, talvez, o mais comumente utilizado. Portanto, não é surpreendente que as imagens desempenhem um dos papéis mais importantes na percepção humana. Por essa razão, uma das principais motivações para estudar e usar técnicas de processamento de imagens refere-se ao melhoramento da informação visual para a interpretação humana. Outras motivações compreendem o armazenamento, a transmissão e a representação destas informações visuais.
O que uma pessoa enxerga é o resultado de uma conversão da energia presente em ondas eletromagnéticas (refletidas pelos objetos) em impulsos elétricos. Esta conversão é realizada por células especializadas (cones e bastonetes) encontradas no olho humano. Entretanto, a capacidade de percepção destas células não é ilimitada. Ela se concentra em uma estreita faixa do espectro total (Figura 1), conhecida por espectro visível ou espectro da luz visível. Diferentemente dos humanos, os equipamentos artificiais que desempenham função similar aos cones e bastonetes não são limitados a uma banda específica e podem cobrir quase todo o espectro, desde raios gamma até ondas de rádio.
Figura 1 - Espectro eletromagnético, destacando a faixa visível pelos humanos. Fonte: Wikipedia

Estes equipamentos podem gerar imagens a partir de fontes que normalmente não seriam associadas a imagens como o ultrassom, o raio x, a microscopia eletrônica e o infravermelho. Dessa forma, considerando que a aquisição de imagens pode ser realizada a partir de todo o espectro de energia, o processamento de imagens engloba uma ampla variedade de campos de aplicação. Alguns exemplos de imagens com espectros de luz diferentes são apresentados na Figura 2.

Figura 2 - Exemplo de imagens. A imagem da esquerda foi obtida através do espectro de luz visível e a da direita a partir de raios x. Fontes: The Lenna Story - www.lenna.org e http://www.altechimaging.com/.

O Processamento Digital de Imagens refere-se ao processamento de uma imagem digital por um computador. Uma imagem digital é formada por elementos básicos chamados de pixels. Cada pixel possui duas propriedades básicas: a primeira refere-se a sua localização espacial (coordenadas x e y) no plano definido pela imagem e a segunda é a intensidade. Mais formalmente, uma imagem digital é uma função bidimensional f(x,y), na qual x e y referem-se às coordenadas espaciais e a amplitude f representa a intensidade em um determinado ponto. A Figura 3 apresenta um exemplo de imagem digital.


Figura 3 - Imagem bidimensional f(x,y), em que cada pixel tem uma itensidade. Nesse exemplo, 0 corresponde à intensidade que representa a cor preta e 1 a cor branca.

Não existe consenso entre os autores quanto ao escopo de Processamento de Imagens e áreas correlatas como a Análise de Imagens e Visão Computacional. Uma das possíveis definições seria que Processamento de Imagens é a área na qual tanto a entrada como a saída são imagens. Por sua vez, a Visão Computacional possui como objetivo principal emular a capacidade de visão humana em computadores, incluindo o aprendizado, de forma a poder realizar inferências e a executar ações baseadas em informações visuais. Já a área de Análise de Imagens fica compreendida entre o Processamento de Imagens e a Visão Computacional.
Como exemplo do que é Processamento de Imagens, podemos citar a eliminação de ruído, como pode ser visto na Figura 4. Através da aplicação de um filtro simples é possível eliminar praticamente todo o ruído da imagem original. É importante salientar que a entrada é uma imagem [ruidosa] e a saída é outra imagem [sem ruído]. Nesse caso não houve qualquer processo de decisão, apenas processamento puro da imagem de entrada para gerar uma saída.

Figura 4 - Processamento de Imagem: aplicação de um filtro para remoção de ruído. Fonte: Gonzales, R.; Woods, R. Digital Image Processing. 3rd Edition.

Já como exemplo do que é Visão Computacional, considere a Figura 5. Um algoritmo é aplicado sobre uma imagem para detectar a posição e a orientação da face de uma pessoa. A informação relevante é a posição e a orientação da face. A obtenção desse tipo de informação está associada diretamente ao sistema visual humano. Pessoas reconhecem outras sem esforço, são capazes de inferir pra onde outras estão olhando, etc. Esse tipo de habilidade exige uma certa inteligência e capacidade de decisão. Visão Computacional busca alcançar essa inteligência e capacidade de decisão por meio de um dispositivo computacional.
Figura 5 - Visão Computacional: um algoritmo detecta a localização e a orientação da face de uma pessoa.


Nenhum comentário:

Postar um comentário