Visualização de dados nas ciências sociais

Por Luís Junqueira

A visualização de dados é um tema que tem vindo a despertar o meu interesse ao longo da minha (ainda breve) carreira. A necessidade de representar as complexas teias de relações entre indivíduos, instituições, lugares, objetos, textos, etc. que compõem as dinâmicas sociais que estudamos fica frequentemente limitada pela nossa capacidade de as representar de forma clara e eficiente através de palavras e números.

As técnicas de visualização de dados foram um elemento importante ao longo da história da prática científica, não apenas como ilustração/representação de dados, mas como parte integrante do processo da sua interpretação. Ao trabalhar com dados quantitativos, as representações numéricas implicam frequentemente uma perda de informação ou uma visualização pouco intuitiva. A visualização através de gráficos, mapas e diagramas permite criar sínteses de grandes quantidades de informação com imenso valor para guiar, interpretar e validar o trabalho de análise estatística dos dados.

No entanto, durante grande parte do século XX a representação gráfica de dados não teve a atenção merecida por parte das ciências sociais. Após a segunda metade do século XIX, que Michael Friendly chama a Era Dourada dos gráficos estatísticos – deixo alguns exemplos interessantes de infografias do século XIX, segue-se um período marcado pela emergência das técnicas modernas de análise de dados baseadas em amostragens e testes de hipóteses estatísticas.  A introdução destas técnicas transformou as práticas científicas assentes na análise de dados quantitativos, cuja interpretação passa a ser em grande medida mediada por conjunto limitado de parâmetros estatísticos, em particular a significância, descurando a visualização dos dados como parte desta interpretação.

Atualmente, estamos num contexto de ressurgência da visualização nas ciências sociais motivada em grande medida por mudanças tecnológicas. Alguns tipos de dados quantitativos, especialmente aqueles que resultam de técnicas de recolha de informação consideradas de maior qualidade como os inquéritos por questionário presencial, são bastante dispendiosos de produzir, mas a massificação da computação abriu novas possibilidades de disseminação desses inquéritos online ou por email e de acesso a software intuitivo para o tratamento e visualização de dados.

Acresce que vivemos um quotidiano cada vez mais marcado por uma presença digital, que pode ela própria ser objeto de investigação. As redes sociais, os blogues, as plataformas de partilha de conteúdos, tudo isto começa a ser encarado como potencial objeto de investigação – por exemplo, a última conferência em que estive presente tinha um painel dedicado a investigação sobre representação da ciência e ambiente em vídeos online. Trabalhar estes dados pode implicar grandes volumes de informação cuja análise não beneficia muito dos tradicionais métodos estatísticos. São necessários métodos menos focados na comparação de variáveis e que permitam mapear, interpretar e comunicar as dinâmicas, as relações e os espaços sociais que organizam as interações nestas plataformas digitais.

Nova imagem 1
Visualização do arquivo da Popular Science Magazine. Autor: Jer Thorp (Licença Creative Commons)

Também mudaram as relações entre a ciência e a sociedade. Hoje espera-se que os investigadores não comuniquem apenas entre si, mas que contactem também com um público mais alargado – é uma das razões pela qual este blogue existe. Esta comunicação tem muito a beneficiar com a introdução de novas técnicas de visualização, que, mantendo o rigor científico, sejam apelativas e intuitivas para um leitor não especialista. Neste ponto, talvez as ciências sociais tenham algo a aprender com a comunicação social. O uso de infografias, em muitos casos interativas, tornou-se frequente nas edições digitais dos principais periódicos de informação – ver, por exemplo, os acervos de infografias do The Guardian ou do Público.

A visualização de dados tem hoje um corpo de conhecimento desenvolvido noutras disciplinas do qual as ciências sociais têm tirado pouco proveito. Existe conhecimento tecnicamente fundamentado sobre boas práticas para visualização de dados – sobre como melhor usar cor, forma e dimensão para comunicar visualmente -, e software especializado para produzir os mais diversos tipos de gráficos, mas no que toca à visualização os currículos dos cursos de ciências sociais parecem manter-se focados nas representações clássicas de estatística descritiva – com a exceção da geografia, que mantem uma afinidade à representação espacial de dados. Isto talvez se deva à perceção errada de que a adoção de novos métodos de visualização requer certas competências técnicas que só estão ao alcance de quem trabalha diretamente na área das tecnologias de informação e comunicação TIC. Mas, por exemplo, algumas técnicas simples, como heatmapping, podem contribuir para melhorar a leitura de uma tabela, e algumas técnicas de visualização, como o mapeamento de redes ou de dados textuais, têm vindo a tornar-se mais acessíveis devido à oferta de software específico.

Imagem 2
Heatmap para Rácio Dívida / PIB em alguns países europeus. Fonte do dados: Eurostat. Imagem: By Sigbert (Own work) [CC0], via Wikimedia Commons (https://commons.wikimedia.org/wiki/File:Gdp_to_debt_ratio.svg)

Apesar do potencial dos métodos de visualização de dados na interpretação e comunicação de dados em ciências sociais é importante relembrar que as visualizações não são representações neutras dos dados. Tal como as representações numéricas e textuais, as visualizações são uma construção do autor com o objetivo de suportar um argumento que implicam escolhas sobre que informação é incluída e de que forma esta é apresentada – para os interessados o já clássico Como mentir com estatística de Darrel Huff é uma introdução acessível aos riscos do uso de dados estatísticos. Quando a representação é visualmente mais complexa, aumenta também este potencial de introduzir distorções, sejam estas intencionais ou não. Para que sejam uma mais valia para a interpretação e comunicação dos dados das ciências sociais é importante que as visualizações sejam acompanhadas de descrições claras sobre o seu processo de produção – que dados foram ocultados, que escalas são utilizadas na representação através da distância, dimensão, cor ou forma dos seus elementos – que permitam uma leitura informada por parte do público.

Por fim, deixo as ligações para alguns artigos, repositórios de imagens e aplicações que disponibilizam exemplos interessantes de visualização de dados:


Luís Junqueira é aluno do Programa de Doutoramento em Sociologia do ICS-ULisboa

Anúncios

One thought on “Visualização de dados nas ciências sociais

Comentar / Leave a Reply

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s