O que uma pessoa enxerga é o resultado de uma conversão da energia presente em ondas eletromagnéticas (refletidas pelos objetos) em impulsos elétricos. Esta conversão é realizada por células especializadas (cones e bastonetes) encontradas no olho humano. Entretanto, a capacidade de percepção destas células não é ilimitada. Ela se concentra em uma estreita faixa do espectro total (Figura 1), conhecida por espectro visível ou espectro da luz visível. Diferentemente dos humanos, os equipamentos artificiais que desempenham função similar aos cones e bastonetes não são limitados a uma banda específica e podem cobrir quase todo o espectro, desde raios gamma até ondas de rádio.
Figura 1 - Espectro eletromagnético, destacando a faixa visível pelos humanos. Fonte: Wikipedia
Figura 2 - Exemplo de imagens. A imagem da esquerda foi obtida através do espectro de luz visível e a da direita a partir de raios x. Fontes: The Lenna Story - www.lenna.org e http://www.altechimaging.com/.
Figura 3 - Imagem bidimensional f(x,y), em que cada pixel tem uma itensidade. Nesse exemplo, 0 corresponde à intensidade que representa a cor preta e 1 a cor branca.
Não existe consenso entre os autores quanto ao escopo de Processamento de Imagens e áreas correlatas como a Análise de Imagens e Visão Computacional. Uma das possíveis definições seria que Processamento de Imagens é a área na qual tanto a entrada como a saída são imagens. Por sua vez, a Visão Computacional possui como objetivo principal emular a capacidade de visão humana em computadores, incluindo o aprendizado, de forma a poder realizar inferências e a executar ações baseadas em informações visuais. Já a área de Análise de Imagens fica compreendida entre o Processamento de Imagens e a Visão Computacional.
Como exemplo do que é Processamento de Imagens, podemos citar a eliminação de ruído, como pode ser visto na Figura 4. Através da aplicação de um filtro simples é possível eliminar praticamente todo o ruído da imagem original. É importante salientar que a entrada é uma imagem [ruidosa] e a saída é outra imagem [sem ruído]. Nesse caso não houve qualquer processo de decisão, apenas processamento puro da imagem de entrada para gerar uma saída.
Figura 4 - Processamento de Imagem: aplicação de um filtro para remoção de ruído. Fonte: Gonzales, R.; Woods, R. Digital Image Processing. 3rd Edition.
Já como exemplo do que é Visão Computacional, considere a Figura 5. Um algoritmo é aplicado sobre uma imagem para detectar a posição e a orientação da face de uma pessoa. A informação relevante é a posição e a orientação da face. A obtenção desse tipo de informação está associada diretamente ao sistema visual humano. Pessoas reconhecem outras sem esforço, são capazes de inferir pra onde outras estão olhando, etc. Esse tipo de habilidade exige uma certa inteligência e capacidade de decisão. Visão Computacional busca alcançar essa inteligência e capacidade de decisão por meio de um dispositivo computacional.
Figura 5 - Visão Computacional: um algoritmo detecta a localização e a orientação da face de uma pessoa.
Nenhum comentário:
Postar um comentário