Arquivo da categoria: Jornalismo de dados

Riscos e cuidados no uso de estatísticas. Mesmo as oficiais

Reportagem publicada pela Folha de S. Paulo no dia 4 de março de 2016 evidencia o risco – e consequentemente os cuidados -que devem ser levados em consideração no trato com estatísticas, mesmo aquelas que são oferecidas oficialmente por órgãos públicos.

Em resumo, o número de homicídios divulgados pelo poder público está subdimensionado, pois há muitos casos listados em outra categoria de informação que não aparece nos balanços divulgados pela Secretaria de Segurança Pública.

O debate em torno da reportagem e da análise dos dados exigiu explicações do governo paulista e novas regras para a divulgação de estatísticas, como a divulgação das correções feitas periodicamente e de dados dos boletins de ocorrências.

estatisticas-de-seguranca

Veja mais:

O problema atinge outros estados brasileiros, como mostra a tese do pesquisador Daniel Cerqueira, que avaliou dados sobre mortes violentas não esclarecidas no estado do Rio de Janeiro.

A análise sobre estatísticas de crimes que ainda falta ser feita

A imprensa reportou a quantidade de homicídios dolosos em 2015 no Estado de São Paulo. Foi a menor taxa desde 1996. Algumas indagações:

  • A metodologia é realmente estranha. O poder público contabiliza a quantidade de casos, e não a quantidade de mortos. Como explica o texto, um caso pode conter várias mortes (uma chacina, por exemplo). Isso pode ampliar significativamente o número de pessoas assassinadas intencionalmente.
  • É sempre complicado analisar segurança pública por meio de um único indicador. Um dia ainda espero ler uma reportagem que traga, em bom espaço, todos os indicadores de mortes e de crimes.
  • Isso significa mostrar estatísticas históricas de mortes com ou sem intenção, por qualquer tipo de arma, no trânsito ou em casa, enfim, qualquer causa de morte, exceto doença.
  • Vale o mesmo para os tipos de crime: com ameaça ou não, em casa ou na rua, roubo ou furto, patrimônio – qualquer ocorrência.
  • Essa análise é muitas vezes difícil ou impossível por causa de imperfeiçoes na coleta, organização e divulgação de estatísticas públicas.
  • Isso é importante para evitar manipulações. Por exemplo: um assassinato passa a constar na lista de homicídios dolosos de acordo com a metodologia adotada na contabilidade e na investigação das autoridades públicas. Pode haver uma redução histórica dos casos de mortes intencionais, mas uma explosão nos de mortes cujas causas não foram identificadas.
  • Geralmente, os jornais mostram localidades com maior ou menor ocorrências de algum tipo de crime por meio de um mapa coroplético indicando cores mais escuras ou claras em cada distrito. Essa visualização é a única possível, já que o poder público não divulga o endereço exato da ocorrência, mas somente por bairros.
  • No entanto, isso pode causar distorções. Um exemplo: uma enorme quantidade de crimes praticados na fronteira entre um bairro tranquilo e outro mais problemático pode passar a impressão que um bairro inteiro é problemático. Essa distorção aumenta se o bairro for espacialmente bastante extenso.

    FSP crimes 2015

Alguns cuidados quando a série histórica do gráfico não começa na posição zero

O Globo - Escala eixo y em gráficos

O eixo vertical deste gráfico, publicado no jornal O Globo, mostra a quantidade de trabalhadores por conta própria (em azul) e a quantidade de trabalhadores com carteira assinada (em vermelho).

Um leitor desatento pode se confundir. A primeira impressão é que a quantidade de trabalhadores por conta própria está crescendo e a quantidade de trabalhadores com carteira assinada está diminuindo. Ambas conclusões estão corretas.

No entanto, visualmente, o leitor fica com a impressão que a quantidade de trabalhadores por conta própria (em azul) e maior que a quantidade de trabalhadores com carteira assinada (em vermelho). Essa é uma falsa conclusão. No primeiro grupo, azul, há 22 milhões de pessoas. No segundo, vermelho, 35 milhões de pessoas.

Comparar tamanhos – A ilusão de ótica ocorre porque por duas razões: o eixo vertical não começa no número zero e começa em diferentes posições em cada gráfico de área. Por causa disse, mesmo que ele demonstre corretamente a evolução (para mais ou para menos), ele induz o leitor ao erro ao comparar o tamanho de cada grupo.

Um gráfico de linha não precisa, necessariamente, começar no ponto zero do eixo vertical. É apenas recomendável. Muitas vezes, a série estatística começa em um número muito distante do zero e é importante chamar a atenção para a evolução dos números ao longo da série histórica (ainda mais se essas mudanças forem sutis). Assim, é possível iniciar o eixo vertical em uma posição diferente de zero.

Já para um gráfico de área, que além de informar sobre a evolução do número de trabalhadores tem também a incumbência de informar o tamanho deste grupo (a quantidade total), é bastante recomendável começar o eixo vertical no número zero.

Mesma posição – O que é recomendável passa a ser obrigatório quando há o intuito de fazer comparações entre dois diferentes grupos, mostrando a evolução deles, como é o caso do gráfico do jornal. Esse é o segundo – e principal – problema. Se o eixo vertical não começar na posição zero, é essencial que ele comece na mesma posição numérica em ambos os gráficos.

O fato de escrever o número que informa sobre a quantidade de trabalhadores acaba não sendo suficiente para contornar a distorção na transmissão da informação. O melhor, mesmo, é iniciar os gráficos sempre no número zero.

Um terceiro problema, muito comum em gráficos e em comparações, é usar escala diferente. Neste caso, tal equívoco não aparece. Em ambos os gráficos, cada intervalo no eixo vertical corresponde a 500 mil trabalhadores.

Analise o histórico de quaisquer estatísticas. Ele pode ajudar a contar outra história

Um curso recém finalizado pelo Knight Center sobre noções básicas de matemática e estatística para jornalistas pinçou uma regra básica na análise de dados: é fundamental olhar a evolução das informações em um prazo mais prolongado, quando tais informações estiverem disponíveis.

O instrutor, Greg Ferenstein, alertou que não é recomendável ignorar a História, sobretudo em mudanças de opinião pública, quando torna-se ainda mais importante consultar os dados do passado longínquo.

O exemplo utilizado para demonstrar o ensinamento foi a opinião pública da sociedade norte-americana sobre pena de morte. Enquanto a evolução das estatísticas no curto prazo mostra uma coisa (falta de apoio à pena de morte no nível mais baixo de todos os tempos), os dados completos indicam outra (apesar das oscilações ao longo das décadas, a sociedade norte-americana mantém a mesma opinião ao longo de quase um século).

Dead penalty 2

Dead penalty 1

Concluiu o instrutor, em tradução livre: “Você ainda pode afirmar que a pena de morte está em declínio em popularidade, mas você teria que levar a História em conta. Ela muda tudo.”

Dias atrás, o Pew Research Center, que investiga há muito tempo a opinião pública dos Estados Unidos e também de outros países com muita eficiência, publicou uma avaliação a respeito das taxas de pobreza entre crianças negras, brancas, asiáticas e hispânicas.

Child poverty rates

Vale a mesma lição e a mesma conclusão: com exceção das crianças asiáticas, as estatísticas mostram uma evolução, para mais ou para menos, interessante no prazo mais curto. Mas, no longo prazo, entre 1975 e 2015, o nível de pobreza entre crianças (menores de 18 anos para o instituto) permanece razoavelmente sem alterações significativas.