Share Button

Como a união das áreas de tecnologia e comunicação podem facilitar o registro e a análise de milhares de imagens retiradas da web.

(Cecilia Moronari e Karina Mauro) Quando navegamos pela internet passeamos por milhares de imagens: das timelines do Facebook aos portais de notícias, as imagens se fazem cada vez mais fundamentais na hora de se contar uma história. Em 2013, o Brasil passou por uma série de protestos que renderam infinitas imagens que, a cada minuto, podiam se perder no grande espaço que é a internet. Se quiséssemos fazer um apanhado de todas feitas nesta época, postadas em redes sociais e grandes portais, que se relacionam com o tema do protesto, como isso seria possível? Como identificar, nesse universo de imagens, quais foram as mais compartilhadas? Quais foram as mais curtidas? Mais do que isso, como identificar as possíveis semelhanças entre elas.

O Labic – Laboratório de Estudos sobre Imagem e Cibercultura, que funciona na Ufes, sob a coordenação dos professores Fábio Malini e Fábio Goveia, tem uma de suas pesquisas voltada para o campo de captura e análise de imagens. O laboratório integra pesquisadores e alunos das áreas da comunicação e tecnologia, contando hoje com 18 bolsistas das áreas da Comunicação Social, artes, Engenharia Mecânica, Engenharia da Computação e Ciência da Computação.

A pesquisa começou a ser desenvolvida em junho de 2013, junto com as manifestações que tiveram início contra o aumento das passagens de ônibus. Entre os dias 15 de junho e 15 de julho de 2013, foram extraídas do Twitter 85.595 imagens, associadas a diversas hashtags relacionadas ao movimento (#vemprarua, #protestoes, #protestobr, #vandalismo, #passelivre). O grupo também preserva este arquivo iconográfico e desenvolve ferramentas para facilitar a visualização e análise de todas elas.

Hue-x-Saturacao_reduzida

Imagens distribuídas por cor e saturação (Imagem em zoom: http://zoom.it/tAaW)

Brilho-x-Saturacao_reduzida2

Imagens distribuídas por saturação e brilho (Imagem em zoom: http://zoom.it/G8jg)

Imagens distribuidas por compartilhamento. As maiores foram as mais replicadas (Imagem em zoom: http://zoom.it/tYhZ)

O pesquisador e professor do curso de Comunicação Social da Ufes, Fábio Goveia, afirma que a problemática deste campo de pesquisa é fazer estudos de um grande volume de imagens, desenvolver ferramentas que permitam visualizá-las, encontrar padrões, identificar diferenças. O primeiro tendência é tentar encontrar nas imagens digitais a mesma lógica de relações que existiam nas analógicas. Há a necessidade da preservação da memória destas imagens. Outro desafio é analisar um grande volume de imagens em uma “tela”, manualmente. A organização de poucas imagens em categorias (por semelhança, cor, brilho, tema) é possível de ser feita sem o uso de softwares, porém, fazer o mesmo com milhares de imagens torna a tarefa complicada.

O laboratório iniciou este trabalho, primeiramente, com a intenção de que todas aquelas imagens produzidas nos períodos de protestos não se perdessem. Os pesquisadores – professores e estudantes – desenvolveram uma série de scripts e softwares que capturam as imagens de suas páginas originais, e guardam, também, os seus dados, como quem as fotografou, postou e compartilhou. A organização, após essa coleta, tem sido feita com esses scripts, que podem ordená-las de acordo com diversas variáveis: brilho, cor, saturação, contraste, cronologia, número de compartilhamentos, semelhanças, etc.

O primeiro passo foi trabalhar com um programa que já existia (Image Plot), do pesquisador Lev Manovich – “Software Studies Iniciative”, fazendo diversas  melhorias, pois apresentava algumas limitações. “Tem uma série de filtros que nós desenvolvemos para este software para atender as nossa necessidades. Ainda não está disponível para download, mas a intenção é deixá-lo em breve: uma nova versão melhorada do Image Plot.” afirma.

Com a extração e análise de um grande banco de imagens, um problema comum é capturar e separar imagens consideradas iguais. Você pode rastrear só imagens  idênticas, o que é útil pra encontrar os memes, por exemplo. Porém. se alguém aplica um filtro ou diminui o tamanho, a imagem já deixa de ser idêntica. O bolsista do laboratório, Vitor Pereira Almeida, sob a orientação do Prof. de Ciência da Computação Patrick Marques Ciarelli, desenvolveu um script que solucionou esse problema: o Aisi (Automatic Identifier of Similar Images). Atualmente, dentro do Aisi, essa margem de similaridade pode ser ampliada: imagens que sejam 50% idênticas, por exemplo. “Claro que o olho humano deve fazer o trabalho de refino. Só o script não vai dar conta de todos os problemas técnicos de análise de imagem.” acrescenta Fábio Goveia.

O próximo ponto de partida do laboratório é a tentativa de complexificar um pouco mais os dados coletados. A ideia é poder relacionar a pesquisa das imagens com o trabalho desenvolvido pelo prof. Fábio Malini com as narrativas nas redes sociais. Dessa forma, será possível identificar se as imagens compartilhadas têm alguma relação com um tweet, por exemplo. “Por experiência, a gente percebe que os posts que têm imagem incluída, normalmente, são mais compartilhados do que os que não têm. Porque as pessoas  tendem a identificar mais rapidamente a imagem do que os posts que trazem só texto e acabam por não ter tanto apelo.” explica Goveia.

A ideia é fazer esse “link” para até mesmo os profissionais de comunicação entenderem a importância de se ter uma imagem, qual tipo de imagem atinge mais um público específico. Então esse é um caminho que o laboratório está tentando tomar, porque essas duas áreas do Labic ainda que estejam próximas, trabalham de maneiras distintas, com softwares distintos.

Um outro passo mais próximo a ser dado pelo Labic é lançar um programa, ainda numa versão experimental, o qual captura uma imagem compartilhada por um tweet, para que do texto escrito do tweet sejam tiradas palavras-chaves. Ele vai permitir que se categorize essa imagem automaticamente a partir das palavras relacionadas a ela. Depois de categorizadas, será possível fazer uma pesquisa diretamente pelas palavras. Por exemplo: a palavra “sol” recuperará todas as imagens relacionadas a ela. O software vai ordenar pela frequência das palavras, pela hashtag, pela legenda ou pelo texto do post.

Além da criação de softwares e scripts que facilitam a captura e categorização automática de grandes volumes de imagens, é preciso saber o que se quer com isso: o que fazer com essas informações depois que estas foram coletadas. O Labic tenta não somente desenvolver ferramentas “técnicas” para isso, bem como trabalhar para criar “motivos” para que tais softwares existam. “Nós temos que formular as questões para que os softwares nos deem as respostas. Se a gente não souber qual pergunta vamos fazer, o programa não pode fazer nada. Então agora, estamos no estágio de criar as perguntas para este conjunto de imagens que temos.” conclui Goveia.

Share Button

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *