terça-feira, 17 de maio de 2016

Desafios da análise social ou de perspectivas da sociedade

Trabalhar com a análise social é um processo exigente e desafiador. Vou tentar eleger alguns motivos para justificar esta primeira frase:

Primeiramente, analisar requer certa metodologia. Por mais que não precisa ser algo engessado, precisa por mais simples que seja ter um ponto de partida e um ponto final. O que, apensar de aparentemente simples, não é.

Analise social é exigente em termos de trabalho. Uma boa análise precisa superar mero comentário, recorrendo a fatores que na maioria das vezes não foram contemplados. É o olhar sociológico propriamente dito, amparado conceitualmente para revelar entrelinhas despercebidas.

Por isso, análise social é um exercício crescente. Dificilmente alguém iniciado conseguirá fazer uma análise social profunda, pois a falta de experiência deste exercício sociológico também estará evidente nas limitações conceituais de abordagem. Todavia, se não continuar a fazer este exercício junto a muita leitura e pesquisa, dificilmente conseguirá fazer análises mais profundas.

Assim como pessoas maduras e experientes conseguem fazer análises mais ponderadas sobre a vida, pois a base reflexiva aumentou em si, também os sociólogos, quanto mais experiência, melhor farão suas análises. Por outro lado é perfeitamente possível surpreender-se com a análise social de um jovem pesquisador, tendo em vista, sua dedicação e habilidade.

Muitos pretendentes ao ofício de sociólogo, ainda em formação, sofrem por não conseguirem entender ou mesmo por não conseguir apreender uma ampla e vasta abordagem de diversas teorias de análise social. Mas essa experiência é inevitável, faz parte do amadurecimento o sofrer com as próprias limitações, as quais sugerem necessidade de desenvolvimento. 

Uma sugestão é começar com fragmentos conceituais, análises limitadas de fenômenos com menor evidência ou relação. Essas análises que se conectam com fenômenos maiores, de maior evidência e abrangência, no futuro serão importantes, pois constituem elementos de base para estas análises. O processo envolve a contínua leitura e reflexividade do fenômeno social, tendo em vista perceber suas relações e conexões. 

Renova-se assim a paciência e dedicação para formação de um corpo conceitual e teórico capaz não de servir de base para a análise, mas de base para a reflexividade. Pois o fazer sociologia exige que aquele que o faz, o faça de nova ou mais profunda perspectiva, dando explicações que farão parte das escolhas e novas reflexões/decisões para a vida.

Ederson Malheiros Menezes

terça-feira, 10 de maio de 2016

O que se esconde por trás de uma nuvem de palavras?

Nuvem de palavras, word cloud ou tag cloud são vários termos utilizados para um tipo de visualização, assim como os grafos, bem própria da era digital, que democratizou uma série de ferramentas e capacidades analíticas para a pessoa comum. “Brincar com dados” é hoje uma atividade cultural tão fácil quanto qualquer outra na internet e, no caso das nuvens de palavras, algo que pode ser feito imediatamente através de sites como Wordle.
Apesar desta simplicidade de utilização, as nuvens de palavras e nuvens de tags escondem minúcias e fatos interessantes por trás de seu uso corriqueiro no nosso mercado de análise e apresentação de dados. Então, vamos lá: o que se esconde por trás de uma nuvem de palavras?
aladdin sane word cloudNuvens de palavras: como funcionam?
Em uma visualização do tipo, cada palavra tem seu tamanho regido pela relevância em determinado corpus de texto. Geralmente se trata de contagem simples das ocorrências de determinada palavra no texto. Uma palavra citada 276 vezes vai ter um tamanho proporcionalmente maior do que uma palavra citada 154 vezes. Ao lado, por exemplo, uma nuvem de palavras criada a partir da música “Aladdin Sane” do David Bowie.
O que fazer com nuvens de palavras?O grande motivador da popularidade das nuvens de palavras para o público geral foi sua utilização desenfreada como recurso navegacional em blogs durante os anos 2000. Adicionar uma nuvem de palavras com as principais categorias ou tags do blog no sidebar era praticamente obrigatório durante um período. Eu enfatizaria o seu poder em três pilares:
  • Recurso Navegacional: então, o modo pelo qual podemos clicar em palavras ou tags para irmos direto a textos relativos a estas categorias e/ou com as determinadas palavras possui simplicidade intuitiva. O digital permite criar índices onomásticos de qualquer volume de textos e, considerando a pouca atenção e tempo que temos, a nuvem de palavras com a quantificação visual linkada é eficaz.
  • Método Heurístico de Análise: uma palavra repetida várias vezes o é por algum motivo. Nuvens de palavras são, então, um método heurístico de análise. Por si só não vão resolver um problema ou responder a uma questão de pesquisa, mas apontam caminhos para o quê se observar em um texto ou, mais importante ainda, em um grupo de textos. Os aplicativos que fazem nuvem de palavras via Twitter são reveladores por causa disto. Afinal de contas, um #trendingtopic no Twitter tem a mesma raiz de apontamento de relevância que uma nuvem de palavras.
  • Apresentação e Visualização de Dados: apresentar, de forma hiper resumida, um dado sobre texto(s) ou conversações através de nuvem de palavras tornou-se padrão. Clientes hoje pedem o recurso pois podem vislumbrar imediatamente os termos mais comuns.
Word Cloud, Tag Cloud, Nuvem de Palavras ou Nuvem de Tags?
A rigor, são utilizados de forma intercambiável, mas recomendo usar o termo tag cloud / nuvem de tags para visualizações que tratam de palavras bem definidas enquanto “tags” mesmo. Ou seja, marcações mais gerais, relacionadas a um sistema de classificação ou identificação criado pelos emissores (por exemplo, o uso de #hashtags) ou criado pelo analista (por exemplo, categorias de um monitoramento). Por outro lado, nuvens de palavras ou word clouds são termos para a visualização quantificada do número de ocorrência das palavras (ao invés das “categorias” ou “marcadores” no caso de tags).
Nuvens de palavras representam um novo tipo de visualização
Em seu clássico artigo “What is Visualization”, Lev Manovich explica que visualização de dados, historicamente, sempre envolveu a redução. Ao invés de mostrarmos uma lista com cinco mil respostas a uma survey, transformamos essa lista em um gráfico como um histograma, mostrando a distribuição das respostas. Ou seja, uma redução. Esta redução envolve transformar um dado em outro formato visual: o volume de respostas a cada pergunta, por exemplo, se é traduzido/reduzido em tamanho de colunas.
Mas quando falamos de texto e de nuvens de palavras, estamos falando de uma visualização direta. Utilizamos o mesmo objeto medido (palavras) para representar as relações entre o que estamos medindo (palavras!). Este tipo de visualização direta tem ocorrências muito mais elaboradas como o Cinema Redux, mas as nuvens de palavras são de longe a mais conhecida. Para ilustrar, imagine que as diferenças entre as visualizações das frequências das palavras mais comuns no início deste post:
histograma x word cloud
Nuvens de palavras? Realmente simples?
Quando falamos de nuvens de palavras (e quando vejo alguns relatórios e infográficos por aí…), parece que a montagem de uma nuvem é algo tão simples quanto abrir a ferramenta, apertar ctrl+c e ctrl+v. Fazer uma nuvem de palavras eficaz é algo bem mais complexo do que isto e devemos ter alguns cuidados, como os listados abaixo.
  • Nuvens de palavras baseadas em monitoramento de mídias sociais (ou baseados em queries): recomenda-se retirar ou relativizar o tamanho da palavra envolvida na query em questão. É óbvio que a palavra estará em todas as unidades de texto (menções), então seu tamanho será muito maior do que as outras palavras, prejudicando a clareza da visualização. Abaixo dois exemplos de nuvem brutas de tags, com e sem as palavras da query buscada.
Tagclouds com e sem query.
Tagclouds com e sem query.
  • Cores e Marcas de Clientes: assim como outros tipos de elementos visuais de um relatório, é mais eficiente utilizar as cores próprias da marca e branding da empresa ou produto do cliente ao se apresentar nuvens de palavras em torno da marca.
  • Simbologia Afetiva das Cores: assim como ocorre com os gráficos de sentimento, pode ser útil mostrar nuvens de palavras segmentadas de acordo com o sentimento atribuído na análise. Neste caso, a simbologia das cores mais básica está relacionada à análise de sentimento: vermelho, verde e laranja para denotar negativo, positivo e neutro. Arbitrárias, mas são codificações consensuais (pelo menos na maioria dos países), então não faça uma nuvem de palavras sobre “elogios de consumidores” usando tons de vermelho.
  • Cores enquanto gradação: a intensidade da cor em cada palavra pode direcionar o olhar, mas ser uma dimensão que não traz dados. Cuidado com as configurações básicas das ferramentas de nuvem de palavras. Não deixe que suas limitações façam uma visualização confusa.
  • Realmente dizem algo? Nem todas nuvens de palavras vão lhe dar informações relevantes. Em alguns casos, a nuvem de palavras vai reproduzir o óbvio ou, ainda, motivar interpretações errôneas. Imagine que você extraiu todas as bios dos seguidores de uma conta Twitter e usa uma nuvem de palavras pra medir e visualizar as mais comuns. Encontrará palavras como “apaixonado/a”, “mundo”, “deus” e outras bem comuns. Mas são termos comuns no Twitter brasileiro como um todo. Contexto e comparações são sempre bem vindos para refinar as interpretações.

Onde fazer nuvens de palavras?
  • Wordle é o software online usado por 9 entre 10 analistas de monitoramento de mídias sociais. Basta copiar e colar um texto, editar as opções, ou ainda ir na seção avançada, e voilà!
  • Wordcounter conta as palavras de um texto, recurso muitas vezes necessário para se realizar nuvens de palavas customizadas e mais claras no Wordle, por exemplo.
  • Tagxedo permite criar nuvens de palavras com formas abstratas e silhuetas representacionais, como o raio que caiu como uma luva para a letra de Aladdin Sane lá em cima.
  • O projeto Many Eyes permite criar não só nuvens de palavras, mas também outras visualizações de texto como phrase net e word tree.
  • Já o portal Tapor é mantido pela Universidade de Alberta e se dedica a manter, investigar e produzir conteúdo e ferramentas de estudo de textos.

Nuvem de palavras formam apenas um cubinho de gelo do iceberg de text analytics e análise semântica
Análise semântica, análise de conteúdo e análise de discurso são metodologias amplamente consolidadas nas ciências sociais aplicadas e podem te ajudar a aprofundar bastante as interpretações realizadas. Dois excelentes livros, traduzidos para o português, tratam bastante do tema: Análise de Conteúdo, de Laurence Bardin; e Pesquisa Qualitativa com Imagem, Texto e Som, de Martin Bauer e George Gaskell.
E conheça a história e teoria por trás do popular Wordle no artigo Participatory Visualization with Wordle, Fernanda B. Viégas, Martin Wattenberg e Jonathan Feinberg.
Fonte: <http://tarciziosilva.com.br/blog/o-que-se-esconde-por-tras-de-uma-nuvem-de-palavras/>

segunda-feira, 2 de maio de 2016

Uma biblioteca para a corrupção

A corrupção está no centro da crise política pela qual passa o Brasil, tendo se tornado pauta da mídia tradicional, das mídias sociais e da opinião pública nacionais e internacionais. Nesse contexto, o Grupo de Pesquisa Qualidade da Democracia do Instituto de Estudos Avançados e o Núcleo de Pesquisa de Políticas Públicas da USP (NUPPs) e sua Biblioteca Internacional da Corrupção (Corrupteca)realizam este seminário no qual debatedores tratarão de déficits, desafios e propostas da democracia brasileira frente à corrupção e aprofundarão a análise das implicações da corrupção para a qualidade da democracia brasileira debatendo aspectos da transparência, responsabilização, participação popular, qualidade e relação das instituições democráticas e o papel das leis.
O evento também marcará o lançamento do Edital de Chamada de Trabalhos para a primeira edição do International Journal of Research on Corruption and Democracy - IJRCD, uma nova revista acadêmica especializada em pesquisas sobre a corrupção e suas relações com a democracia no Brasil e outros países do mundo.
Fonte: <http://www.iea.usp.br/eventos/impacto-corrupcao>

Quando a corrupção recebe destaque suficiente para a criação de uma biblioteca (Biblioteca Internacional da Corrupção (Corrupteca)), torna-se inevitável reconhecer o surgimento crescente de um indicador negativo acerca da sociedade planetária. É louvável a iniciativa da USP e outras IES no sentido de contemplar a temática. Nosso desafio é acompanhar e participar dedicadamente, de forma que a iniciativa possa alcançar a esfera local ou regional, destituindo velhos arranjos estruturais da corrupção que sugam a possibilidade da democracia se efetivar, bem como do bem comum. É um debate com antenas ligadas, pois a corrupção tem sua própria dinâmica e estratégia para recriar-se, por incrível que pareça ela é criativa tanto quanto estas novas iniciativas de confronto que está recebendo (Ederson Malheiros Menezes).