Arquivo da categoria: Data-driven journalism

A análise sobre estatísticas de crimes que ainda falta ser feita

A imprensa reportou a quantidade de homicídios dolosos em 2015 no Estado de São Paulo. Foi a menor taxa desde 1996. Algumas indagações:

  • A metodologia é realmente estranha. O poder público contabiliza a quantidade de casos, e não a quantidade de mortos. Como explica o texto, um caso pode conter várias mortes (uma chacina, por exemplo). Isso pode ampliar significativamente o número de pessoas assassinadas intencionalmente.
  • É sempre complicado analisar segurança pública por meio de um único indicador. Um dia ainda espero ler uma reportagem que traga, em bom espaço, todos os indicadores de mortes e de crimes.
  • Isso significa mostrar estatísticas históricas de mortes com ou sem intenção, por qualquer tipo de arma, no trânsito ou em casa, enfim, qualquer causa de morte, exceto doença.
  • Vale o mesmo para os tipos de crime: com ameaça ou não, em casa ou na rua, roubo ou furto, patrimônio – qualquer ocorrência.
  • Essa análise é muitas vezes difícil ou impossível por causa de imperfeiçoes na coleta, organização e divulgação de estatísticas públicas.
  • Isso é importante para evitar manipulações. Por exemplo: um assassinato passa a constar na lista de homicídios dolosos de acordo com a metodologia adotada na contabilidade e na investigação das autoridades públicas. Pode haver uma redução histórica dos casos de mortes intencionais, mas uma explosão nos de mortes cujas causas não foram identificadas.
  • Geralmente, os jornais mostram localidades com maior ou menor ocorrências de algum tipo de crime por meio de um mapa coroplético indicando cores mais escuras ou claras em cada distrito. Essa visualização é a única possível, já que o poder público não divulga o endereço exato da ocorrência, mas somente por bairros.
  • No entanto, isso pode causar distorções. Um exemplo: uma enorme quantidade de crimes praticados na fronteira entre um bairro tranquilo e outro mais problemático pode passar a impressão que um bairro inteiro é problemático. Essa distorção aumenta se o bairro for espacialmente bastante extenso.

    FSP crimes 2015

Analise o histórico de quaisquer estatísticas. Ele pode ajudar a contar outra história

Um curso recém finalizado pelo Knight Center sobre noções básicas de matemática e estatística para jornalistas pinçou uma regra básica na análise de dados: é fundamental olhar a evolução das informações em um prazo mais prolongado, quando tais informações estiverem disponíveis.

O instrutor, Greg Ferenstein, alertou que não é recomendável ignorar a História, sobretudo em mudanças de opinião pública, quando torna-se ainda mais importante consultar os dados do passado longínquo.

O exemplo utilizado para demonstrar o ensinamento foi a opinião pública da sociedade norte-americana sobre pena de morte. Enquanto a evolução das estatísticas no curto prazo mostra uma coisa (falta de apoio à pena de morte no nível mais baixo de todos os tempos), os dados completos indicam outra (apesar das oscilações ao longo das décadas, a sociedade norte-americana mantém a mesma opinião ao longo de quase um século).

Dead penalty 2

Dead penalty 1

Concluiu o instrutor, em tradução livre: “Você ainda pode afirmar que a pena de morte está em declínio em popularidade, mas você teria que levar a História em conta. Ela muda tudo.”

Dias atrás, o Pew Research Center, que investiga há muito tempo a opinião pública dos Estados Unidos e também de outros países com muita eficiência, publicou uma avaliação a respeito das taxas de pobreza entre crianças negras, brancas, asiáticas e hispânicas.

Child poverty rates

Vale a mesma lição e a mesma conclusão: com exceção das crianças asiáticas, as estatísticas mostram uma evolução, para mais ou para menos, interessante no prazo mais curto. Mas, no longo prazo, entre 1975 e 2015, o nível de pobreza entre crianças (menores de 18 anos para o instituto) permanece razoavelmente sem alterações significativas.

Projetos para visualizar mais facilmente estatísticas de orçamento público se espalham pelo mundo

O pesquisador Jonathan Gray lançou um pedido para pesquisadores do mundo todo por mais exemplos de projetos de visualização de informações fiscais – arrecadação e gasto de dinheiro público.

Ele publicou uma lista prévia com inúmeros projetos já existentes ao redor do mundo. Até o momento, há quase 200 projetos digitais que tentam oferecer formas mais fáceis e inteligíveis para as pessoas navegarem pelas informações dos orçamentos públicos, principalmente os mais leigos e sem muito conhecimento sobre os trâmites e terminologias sobre arrecadação e gasto de recursos públicos.

Vale lembrar uma antiga demanda: projetos de visualização de dados apenas são possíveis de serem feitos quando os dados estão disponíveis para a sociedade, em formato amigável para os programadores de dados trabalharem. As informações públicas pertencem à sociedade. Escondidas nas gavetas, não valem nada.

Exemplo brasileiro – No Brasil, um projeto interessante que busca atender a essas expectativas é o Meu Município. Ele oferece algumas informações principais e permite comparação entre cidades. O leitor que tiver um algum conhecimento sobre as rubricas de orçamento e finanças públicas poderá interpretar mais facilmente a importância as estatísticas e explorar as inúmeras possibilidades que o portal oferece.

De positivo, além do mérito de oferecer informações interpretadas e organizadas, está a possibilidade de exportar as estatísticas e a possibilidade de comparar as diversas rubricas entre várias cidades. Apresenta ainda as fórmulas para o cálculo de cada estatística orçamentária, o que serve como aula para alguns perfis de internautas. Quem acessar

Meu Município

O projeto, com algum apoio financeiro e de recursos humanos, poderia ir além rapidamente, buscando oferecer visualizações diferentes. Um exemplo mais comum são os infográficos do tipo “treemap”, uma forma eficiente de organizar e mostrar informações quantitativas de forma hierárquica por meio de retângulos. Isso permite ao leitor conhecer as dimensões de cada tipo de gasto dentro do orçamento.

Exemplos de visualização – Um bom exemplo é o que faz o governo federal dos Estados Unidos, que publica na internet a perspectiva de gastos por área proposto no orçamento federal para o ano seguinte, no caso, 2016.

US federal budget 2016 treemap

Ou como faz um projeto independente para a cidade de Arlington, no estado norte-americano de Massachusetts, que mostra informações sobre arrecadação e gastos públicos em gráficos de área e no estilo “treemap”.

Arlington fiscal data

Para saber mais:

A Federação das Indústrias do Rio de Janeiro publicou a última versão do Índice Firjan de Gestão Fiscal, uma excelente ferramenta que analisa dados fiscais dos municípios brasileiros. Em 2013, entre todas as cidades brasileiras, 84,2% tinham gestão fiscal em situação difícil ou crítica, 15,4% tinham boa gestão e só 0,3% tinham gestão de excelência. Mais de 80% das cidades brasileiras não conseguiram gerar 20% das receitas necessárias para cumprir o orçamento municipal, dependendo de transferências dos governos federal e estaduais. Vale comparar o índice da Firjan e o portal Meu Município.

Dados abertos ajudam governos a combater o crime

mapa-violencia-2014O jornal O Globo divulgou dados da mais nova versão do Mapa da Violência, pesquisa que analisa estatísticas de crimes no Brasil, com apoio de dados públicos. Em 2012,  dois recordes: a taxa mais alta (29 mortos em cada 100 mil habitantes) e o maior número absoluto (56.337 homicídios).

Diversos motivos são listados para a persistente epidemia brasileira de violência. O baixo índice de solução – e consequentemente de punição – para os crimes é apontado como um dos principais.

IndicadoresJulio Jacobo Waiselfisz, coordenador do Mapa da Violência, estimou, em recente reportagem do Valor Econômico, que apenas 8% dos homicídios do país sejam solucionados. A mesma matéria trouxe uma reflexão: os níveis de renda e de escolaridade estão no pico histórico no Brasil, e a violência permanece elevada.

Fatores que interferem – A lista de fatores com correção ou interferência – o que não significa causalidade – nos indicadores de segurança pública são muitos: capacidade de coletar dados em tempo real, organização e transparência de estatísticas de crime, equipamentos (carros e outros itens) e tecnologia, evolução da economia e do nível educacional, capacidade do poder público prender, investigar, punir e educar, entre outros.

A realização da Copa do Mundo no Brasil, a partir de 12 de junho, deixará – em tese – melhorias na área de inteligência. Em tese porque, depois do evento, será necessário alocar recursos para operação e treinamento de recursos humanos.

Monitorar e capturar informação – O projeto, viabilizado graças à pressão do evento esportivo internacional, foi a construção de uma central de monitoramento de locais públicos, capaz de captar imagens de aproximadamente 500 câmeras que já operam em funções de segurança, transporte e trânsito. O governo federal investiu R$ 66 milhões, e o governo estadual paulista gastou R$ 2,25 milhões na reforma predial.

Não é só em São Paulo que projetos de inteligência serão inaugurados. A matriz de responsabilidades da Copa do Mundo, documento acordado entre os governos brasileiros, lista projetos em todas as cidades envolvidas no evento. Mas reportagem da Folha de S. Paulo mostrou que, das 39 ações em segurança pública, 27 foram concluídas (69%) e 12 estão incompletas (31%).

Dados abertos – As políticas públicas de dados abertos também podem ajudar na prevenção ou combate aos crimes. De um lado, as autoridades públicas responsáveis pelos registros de ocorrências são publicidade aos dados, mantendo o sigilo das pessoas envolvidas. O que importa é onde, quando e que tipo de crime ocorreu. De outro lado, o cidadão tem à disposição mais informações para tomar decisões melhores.

Mais que isso: empresas privadas, com acesso legal aos dados, passaram a oferecer serviços de organização, visualização, análise e treinamento. Exemplos: CrimeReport, SpotCrime e CrimeMapping. Nos Estados Unidos, há um conjunto enorme de companhias com esse objetivo, que fecham acordos com as autoridades e, ao mesmo tempo, oferecem consultorias e treinamento a elas, nas cidades ou condados. O cidadão pode acessar aplicativos para visualizar os tipos de crimes em um raio próximo aos locais de moradia ou trabalho.

Chicago himicidesSe os dados são públicos, a imprensa também ajuda. Programadores e jornalistas constroem mapas constantemente atualizados, encontram a melhor forma de visualizar a informação e oferecem reportagens associadas. O Chicago Tribune esclarece ao leitor que está comprometido a escrever uma história sobre cada assassinato e oferece mapas indicando onde pessoas levaram tiros ou foram assassinadas. O Los Angeles Times tem mapas com indicadores de crimes. O Everyblock, projeto de jornalismo local que que voltou a funcionar em janeiro, também oferece mapas de criminalidade baseados em dados públicos.

Para saber mais:

Lembram do filme Minority Report, no qual os investigadores passam a se antecipar aos crimes? Com base em estatísticas e algorítimos, alguma coisa parecida começa a surgir nos departamentos de polícia.

Acesse o banco de dados da ONU com taxas de homicídios (sem contar suicídios) em diversos países e ao longo de vários anos, em números absolutos e em taxa relativa (homicídios por 100.000 habitantes). Esse banco de dados é interessante porque também indica a fonte da estatística. No Brasil, a taxa de homicídios pode variar de 21 a 25 assassinatos a cada grupo de 100.000 habitantes, de acordo com a fonte (Ministério da Justiça ou Mapa da Violência).

Infográfico complexo e interessante mostra o clima em 35 cidades mundiais, inclusive São Paulo

Global Weather SP

Uma visualização de dados bastante interessante e complexa: é assim que se pode caracterizar o infográfico “Global Weather Radials 2013”, feito pelo estúdio alemão Raureif para mostrar as ondas de calor e frio em 35 cidades de vários países em 2013.

O clima de cada cidade é representado em um círculo, formado por várias linhas verticais, cada uma para um dia do ano. Esse círculo lembra um relógio, indicando o clima transcorrendo ao longo dos 12 meses do ano.

Global Weather Radials 2013 - Cópia

Como ler o infográfico – A parte de baixo da linha mostra a temperatura mais baixa do dia – e quanto mais próximo do centro do círculo, mas frio foi a temperatura mínima daquele dia. Ao contrário, o topo da linha mostra a temperatura máxima registrada naquele dia.

As bolhas em tom azul claro indicam as precipitações – quanto maior, mais chuva ou neve. O centro da bolha está posicionado no meio da linha que representa o dia em que choveu ou nevou.

Rapidamente, o leitor pode perceber quais as cidades que tiveram estações mais quentes ou mais frias, qual a duração das ondas de calor e frio, bem como ocorrências específicas, que são informadas em texto atrelado à fina barra que representa a temperatura de determinado dia.

São Paulo – O clima das cidades de São Paulo e de Buenos Aires estão demonstrados no infográfico. Na capital paulista, em 2013, percebe-se as elevadas temperaturas em todas as estações do ano – mais intensamente entre janeiro e março e depois entre outubro e dezembro.

A visualização apenas confirma o que o paulistano ainda deve ter na memória – as elevadas temperaturas do último verão entre o fim de 2013 e início de 2014. Mas o leitor não consegue comparar as precipitações de chuvas entre os dois últimos verões, pois os dados indicam somente as ocorrências em 2013.

Os dados utilizados para elaborar essa visualização foram obtidos no projeto Open Weather Map, no Instituto Meteorológico da Noruega e no Weather Underground. Os eventos climáticos específicos, informados em texto, foram avaliados manualmente, a partir da leitura de jornais nas respectivas cidades.

A guerra feita por drones: uma história poderosa, contada por meio dos dados e da visualização

O projeto “Out of Sight, Out of Mind”, uma infografia interativa criada pela agência Pitch Interactive, permite visualizar a quantidade de mortes ocasionadas pelos ataques de aviões não tripulados no Paquistão, os drones. Lançado em março de 2013, já foi bastante elogiado. O título do projeto pode ser traduzido como “o que os olhos não veem, o coração – ou a mente – não sente”.

A infografia interativa está baseada em dados coletados pela instituição não governamental Bureau of Investigative Journalism (BIJ), segundo a qual 3.207 pessoas foram mortas por bombas enviadas por drones, uma estratégia de guerra que evita custos, perdas e constrangimentos diplomáticos com envio de equipamentos militares e tropas para as áreas em guerra. Apesar do apoio civil que credenciaria o uso de drones, há conflitos éticos e humanitários, já que a maioria das vítimas não eram alvos.

Out-of-Sight-Out-of-Mind-750x354

Orientação e sentido – O que chama a atenção nesse projeto da Pitch é que ele não é somente uma reportagem interativa e digital, que entrega informação de forma atraente. Nem tampouco é apenas uma visualização de estatísticas em um formato inédito que possibilita ao internauta interagir com ela, escolhendo as estatísticas e o ponto de vista que deseja. É tudo isso e mais um pouco.

É uma união bastante eficiente de jornalismo, infografia, design, programação e análise de dados. Ao organizar estatísticas atualizadas e atualizáveis de um assunto que está presente na pauta dos principais órgãos de imprensa, dá orientação e sentido aos números, conta uma história impactante e faz da visualização e da infografia uma potente ferramenta para a compreensão daquilo que está sendo apresentado.

Para mostrar como o projeto suscita debates e reportagens, o que demonstra a importância, a Pitch Interactive lista, abaixo da visualização de dados, as últimas notícias sobre a guerra travada por drones. Em 2013, por exemplo, foram 27 ataques deste tipo, segundo a publicação Business Recorder. Quem quiser saber mais, basta ler as reportagens da imprensa.

Estética e narrativa – É possível perceber o foco na narrativa da história desde o princípio, já que as primeiras informações que surgem são três frases: “Desde 2004, ataques feitos por drones mataram, numa estimativa, 3,105 pessoas no Paquistão”, “Menos de  2% das vítimas eram alvos de primeira categoria” e “o restante eram crianças, civis e alegados combatentes.

O efeito estético – bombas que caem até o solo formando arcos e, neste momento, uma coluna desce mostrando o número de vítimas do ataque – servem como isca poderosa para atrair a atenção das pessoas para um tema importante. O uso de uma tabela ou de um gráfico de barras seria igualmente eficiente em mostrar os números brutos. Mas a visualização de dados, da forma como foi feita, impressiona e faz as pessoas memorizarem e aprenderem sobre o tema.

Almanaque e jornalismo – Boa parte das visualizações de dados – geralmente usa-se a abreviação ‘datavis’, em língua inglesa – são feitas a partir do momento que os autores obtém um banco de dados com estatísticas suficientes para elaborar a infografia, interativa ou não. Apesar de bonitos, muitos cumprem apenas a função de serem almanaques elegantes.

O projeto da Pitch Interactive inverte essa lógica. Escolhe um tema importante e atual e busca a melhor fonte de dados disponível no momento, dando sentido às informações. Isso é jornalismo, dos bons.

Coleta de dados – Já que o governo dos EUA não divulga dados sobre os ataques feitos por drones, nem as circunstâncias ou informações estratégicas, os jornalistas do BIJ coletam informações nos locais dos ataques – com todas as deficiências e desafios que um tipo de coleta de informações deste tipo traz.

Do total de mortos, 175 eram crianças, 535 civis, 2.448 outros e somente 49 considerados “alvos de primeira categoria”. Como a história enfatiza, menos de 2% das vítimas eram alvos prioritários.

Os autores explicam que as vítimas classificadas como “outros” ainda são um desafio, pois podem ser tanto vizinhos da vítima, cidadãos sem qualquer ligação com a ela ou até amigos ou parceiros dos alvos preferenciais. Muitos não foram sequer identificados. O governo norte-americano coloca nessa conta todos os homens adultos que possa ser um combatente, até que isso se prove o contrário.

Visualização mostra rota de baleeiros dos EUA entre 1830 e 1855 – e as mudanças por trás dos números

Whaling ships

Um infográfico elaborado por Ben Schmidt, professor assistente de História na Northeastern University, nos Estados Unidos, mostra o potencial da visualização de dados para o estudo das ciências humanas.

O mapa digital produzido por Schmidt mostra a rota dos navios baleeiros dos Estados Unidos entre 1830 e 1855.

Um dos aspectos mais importantes nesta história é perceber a cultura de registro de estatísticas no setor de comércio marítimo naquela época.

O vídeo é bastante, principalmente porque há inúmeras ferramentas à disposição de desenvolvedores e programadores.

No entanto, sem os dados não seria possível fazer esse mapa digital e perceber padrões e transformações escondidas nas informações.

O autor explica que a exaustão dos oceanos devido a pesca intensiva de baleias leva os navios norte-americanos cada vez mais longe.