Métodos quantitativos para uma análise exploratória de discursos sobre energia

Por Luís Junqueira

A participação nas redes sociais como o Facebook, Twitter e Instagram vem a ganhar uma importância cada vez maior na nossa interação com o mundo: veja-se, por exemplo, o papel do Twitter nas eleições americanas de 2016 ou do Facebook na mobilização para a manifestação “Que se lixe a troika” em 2013. Estas plataformas são cada vez mais espaços onde se estabelecem relações, se expressam representações sociais e se desenvolvem controvérsias. A exploração destas na sua componente relacional foi já referida num post anterior, mas ficou por fazer uma discussão sobre as possibilidades de análise do seu conteúdo. A massificação da internet trouxe também o acesso alargado a bases de documentação digitalizada, das quais as mais proeminentes são as bases de artigos de imprensa, mas que abrangem também debates parlamentares, documentos de políticas públicas, bases de livros ou de artigos científicos, entre outros.

Os estudos destas comunidades online e bases de documentos digitalizados pode beneficiar do uso de abordagens extensivas ao conteúdo, possibilitadas pelo crescente acesso a aplicações para a sua extração e análise. Atualmente existem múltiplas técnicas que permitem explorar este tipo de dados: métodos de reconhecimento de entidades, que identificam as entidades (pessoas, organizações, lugares) nomeadas num texto; métodos de análise de orientação, que classificam conteúdos como tendo sentido positivo ou negativo; ou métodos de classificação de texto, que agrupam textos com base na sua semelhança em termos de estrutura ou vocabulário.

Estes métodos têm potencial como ferramentas para as ciências sociais, mas a sua implementação requer algum conhecimento técnico ou aplicações específicas. No entanto, o uso de outros métodos extensivos mais acessíveis, como, por exemplo, a contagem de palavras, associados a visualizações interessantes podem ser ferramentas úteis para um olhar exploratório a corpus textuais de maior dimensão.

Existem ferramentas que permitem analisar e visualizar corpos textuais disponíveis online. Uma das mais populares é o Ngram Finder da Google, que permite fazer pesquisas de termos na extensa base de dados de livros da Google e traçar a evolução do seu uso ao longo de um período de tempo. Fica um exemplo da evolução das referências a duas formas de energia, em que se nota, a partir dos anos 80, uma diminuição das menções à energia nuclear e um aumento das referências às energias renováveis, refletindo mudanças no contexto social e político.

postluisjunqueira
Figura 1 – Frequência dos termos renewable energy e nuclear power na base de livros da Google. Fonte: https://books.google.com/ngrams

Outra ferramenta interessante é o Textexture (e a sua versão mais recente Infranodus), que permite criar uma visualização de rede interativa das relações de proximidade entre os termos mais frequentes de um texto. Este tipo de visualização pode ser usado como ferramenta exploratória de um texto ou corpus textual, dando uma visão global de como algumas palavras-chave são usadas no texto. Permite ainda ver o contexto em que essas palavras surgem no texto, o que torna esta ferramenta interessante como ponto de partida para uma abordagem qualitativa ao texto, em que os excertos a analisar são selecionados com base na rede de palavras. A rede pode ainda ser extraída em formato compatível com software para aplicação de métodos de análise de redes ou para mais liberdade na construção da visualização (ver post anterior).

post2luisjunqueira
Figura 2 – Visualização do texto da introdução da comunicação da Comissão Europeia – Energia 2020 enquanto rede. Fonte: COM/2010/0639 final/ Communication from the Commission to the European Parliament, the Council, the European Economic and Social Committee and the Committee of the Regions – Energy 2020, A strategy for competitive, sustainable and secure energy

Como exemplo, introduzi a secção introdutória da comunicação da Comissão Europeia sobre a estratégia Energia 2020 no textexture e extraí os dados para visualização em Gephi. Numa primeira abordagem aos dados saliento a centralidade das referências às energias renováveis, que têm vindo a marcar política europeia de energia ao longo das últimas décadas, assim como o mercado da energia, que reflete os objetivos de integração da rede energética europeia e de competitividade económica das energias renováveis.

Mas como qualquer outra análise extensiva, estas técnicas têm limitações, sendo a mais óbvia a perda do contexto em que os termos são utilizados. Um termo pode ser usado com diferentes intenções ou referido com mais do que um sentido em textos diferentes ou até no mesmo texto. A perda destes matizes é o trade-off de escolher uma abordagem extensiva para a análise de conteúdo. Contudo, são ferramentas adicionais (e talvez mesmo necessárias) para lidar com novos tipos de dados, que numa tradição de pluralismo metodológico das ciências sociais poderão ser combinadas com metodologias complementares.

Este post tinha por objetivo despertar alguma curiosidade para métodos de análise quantitativa de texto que penso poderem ser interessantes na exploração de corpus textuais muito extensos e dificilmente analisáveis da forma tradicional. Estes têm valor em si mesmos, mas penso que a sua dimensão mais interessante é o potencial de suporte aos métodos de análise qualitativa. Podem dar um contributo para a análise, por exemplo, como forma de exploração inicial, identificando os termos que definem o texto e os excertos relevantes para análise posterior, ou como forma de contextualizar o uso na totalidade do texto de termos identificados como relevantes numa análise qualitativa.


Luís Junqueira é doutorando no Instituto de Ciências Sociais da Universidade de Lisboa (ICS-ULisboa), e o seu tema de dissertação incide sobre a “Investigação em energias renováveis. Redes, práticas e instituições”, sob a orientação de Ana Delicado, investigadora no Observa. luis.junqueira@ics.ulisboa.pt

 

Anúncios

Comentar / Leave a Reply

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão /  Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão /  Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão /  Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão /  Alterar )

Connecting to %s