A análise sobre estatísticas de crimes que ainda falta ser feita

A imprensa reportou a quantidade de homicídios dolosos em 2015 no Estado de São Paulo. Foi a menor taxa desde 1996. Algumas indagações:

  • A metodologia é realmente estranha. O poder público contabiliza a quantidade de casos, e não a quantidade de mortos. Como explica o texto, um caso pode conter várias mortes (uma chacina, por exemplo). Isso pode ampliar significativamente o número de pessoas assassinadas intencionalmente.
  • É sempre complicado analisar segurança pública por meio de um único indicador. Um dia ainda espero ler uma reportagem que traga, em bom espaço, todos os indicadores de mortes e de crimes.
  • Isso significa mostrar estatísticas históricas de mortes com ou sem intenção, por qualquer tipo de arma, no trânsito ou em casa, enfim, qualquer causa de morte, exceto doença.
  • Vale o mesmo para os tipos de crime: com ameaça ou não, em casa ou na rua, roubo ou furto, patrimônio – qualquer ocorrência.
  • Essa análise é muitas vezes difícil ou impossível por causa de imperfeiçoes na coleta, organização e divulgação de estatísticas públicas.
  • Isso é importante para evitar manipulações. Por exemplo: um assassinato passa a constar na lista de homicídios dolosos de acordo com a metodologia adotada na contabilidade e na investigação das autoridades públicas. Pode haver uma redução histórica dos casos de mortes intencionais, mas uma explosão nos de mortes cujas causas não foram identificadas.
  • Geralmente, os jornais mostram localidades com maior ou menor ocorrências de algum tipo de crime por meio de um mapa coroplético indicando cores mais escuras ou claras em cada distrito. Essa visualização é a única possível, já que o poder público não divulga o endereço exato da ocorrência, mas somente por bairros.
  • No entanto, isso pode causar distorções. Um exemplo: uma enorme quantidade de crimes praticados na fronteira entre um bairro tranquilo e outro mais problemático pode passar a impressão que um bairro inteiro é problemático. Essa distorção aumenta se o bairro for espacialmente bastante extenso.

    FSP crimes 2015

Nova Iorque registrou primeira alta em homicídios em cinco anos: 350 casos em 2015

A cidade de Nova Iorque, a mais populosa cidade dos Estados Unidos, com cerca de 8,5 milhões de habitantes, registrou 350 assassinatos em 2015, entre homicídios com ou sem dolo. Isso mesmo, menos de 500. Esse tipo de crime aumentou 5,1% em comparação ao ano anterior, quando a cidade registrou 333 homicídios.

Foi a primeira elevação em cinco anos. As estatísticas foram divulgadas pelo Departamento de Polícia de Nova Iorque, publicadas no The Wall Street Journal e servem para comparação com quaisquer cidades brasileiras, independentemente do porte populacional e condições sociais.

NY crime 2015

A decisão que revolucionou o futebol completou 20 anos. E quase ninguém lembrou

No dia 15 de dezembro, um artigo nas redes sociais chamou a atenção: “20 anos da Lei Bosman – o fim da escravidão no futebol“. A notícia foi publicada no Blog do Paulinho.

Os mais jovens talvez não saibam, mas qualquer um que fosse apaixonado por futebol em 1995 sabe quem é Bosman – ou o cara que fez acabar a chamada “lei do passe”.

Em resumo: jogadores podem assinar contratos com outros clubes tão logo o contrato com a equipe atual termine (ou um pré-contrato, seis meses antes do fim do contrato) sem a necessidade de pagar uma indenização à equipe atual, que detinha o “passe” do jogador. No Brasil, foi seguida pela Lei Pelé, em 1998.

Os principais jornais impressos não lembraram da efeméride. O portal IG fez uma reportagem. Lá fora, destaque para matéria do diário inglês The Guardian.

O futuro tal qual descrito no passado: um roteiro para planejar uma infografia

As informações abaixo foram coletadas no Brain Pickings e reproduzidas quase fielmente porque são brilhantes para explicar o processo criativo no momento de traduzir uma série de dados ou estatísticas em um infográfico.

Resumindo: no artigo, a autora informa que distribuiu, via redes sociais, uma lista de informações sobre eventos futuros tal qual foram descritos em livros e outros produtos culturais de ficção científica.

A organização das informações talvez seja a parte mais importante da produção de uma visualização criativa e eficiente, pois precisa dispor, de forma uniforme e categorizada, um conjunto de dados que estão dispersos em várias fontes. Leva tempo, muito tempo (às vezes, uma vida inteira).

Giorgia Lupi, designer da informação e uma das mais criativas editoras de arte atualmente, ao acessar tal lista, organizou os dados em uma visualização no padrão da Accurat, agência da qual ela é fundadora. O resultado é visualmente interessante. As informações, ainda mais.

As lições dela:

  • como na maioria das infografias no formato linhas do tempo, os dados são organizados sobre um eixo horizontal.
  • ela explica que usou uma “linha do tempo distorcida”, pois listou os eventos com distâncias regulares, simétricas, entre um e outro, e não em escala proporcional aos anos. A distância entre entre os eventos será a mesma, não importa se transcorreram dez ou cem anos.
  • o eixo vertical informa o ano em que o livro foi publicado
  • na parte inferior no infográfico, a autora categorizou as histórias para facilitar a leitura. Alguns símbolos foram escolhidos para indicar se o evento é majoritariamente político, tecnológico, científico ou ambiental, entre outros.
  • várias camadas foram planejadas para oferecer o máximo de informação, de forma que seja facilmente perceptível conhecer um aspecto de cada história ou alguma tendência do conjunto das histórias. exemplo: ao identificar com cores diferentes se o livro mostra uma perspectiva positiva ou negativa do futuro, percebe-se rapidamente, somente pela cor predominante, que os autores de ficção científica não têm uma visão muito positiva do futuro.

 

Accurat - The future as foretold in the past

Vale a leitura.

Alguns cuidados quando a série histórica do gráfico não começa na posição zero

O Globo - Escala eixo y em gráficos

O eixo vertical deste gráfico, publicado no jornal O Globo, mostra a quantidade de trabalhadores por conta própria (em azul) e a quantidade de trabalhadores com carteira assinada (em vermelho).

Um leitor desatento pode se confundir. A primeira impressão é que a quantidade de trabalhadores por conta própria está crescendo e a quantidade de trabalhadores com carteira assinada está diminuindo. Ambas conclusões estão corretas.

No entanto, visualmente, o leitor fica com a impressão que a quantidade de trabalhadores por conta própria (em azul) e maior que a quantidade de trabalhadores com carteira assinada (em vermelho). Essa é uma falsa conclusão. No primeiro grupo, azul, há 22 milhões de pessoas. No segundo, vermelho, 35 milhões de pessoas.

Comparar tamanhos – A ilusão de ótica ocorre porque por duas razões: o eixo vertical não começa no número zero e começa em diferentes posições em cada gráfico de área. Por causa disse, mesmo que ele demonstre corretamente a evolução (para mais ou para menos), ele induz o leitor ao erro ao comparar o tamanho de cada grupo.

Um gráfico de linha não precisa, necessariamente, começar no ponto zero do eixo vertical. É apenas recomendável. Muitas vezes, a série estatística começa em um número muito distante do zero e é importante chamar a atenção para a evolução dos números ao longo da série histórica (ainda mais se essas mudanças forem sutis). Assim, é possível iniciar o eixo vertical em uma posição diferente de zero.

Já para um gráfico de área, que além de informar sobre a evolução do número de trabalhadores tem também a incumbência de informar o tamanho deste grupo (a quantidade total), é bastante recomendável começar o eixo vertical no número zero.

Mesma posição – O que é recomendável passa a ser obrigatório quando há o intuito de fazer comparações entre dois diferentes grupos, mostrando a evolução deles, como é o caso do gráfico do jornal. Esse é o segundo – e principal – problema. Se o eixo vertical não começar na posição zero, é essencial que ele comece na mesma posição numérica em ambos os gráficos.

O fato de escrever o número que informa sobre a quantidade de trabalhadores acaba não sendo suficiente para contornar a distorção na transmissão da informação. O melhor, mesmo, é iniciar os gráficos sempre no número zero.

Um terceiro problema, muito comum em gráficos e em comparações, é usar escala diferente. Neste caso, tal equívoco não aparece. Em ambos os gráficos, cada intervalo no eixo vertical corresponde a 500 mil trabalhadores.

Entrevista traz pistas importantes sobre futuro do jornalismo

O jornal O Globo tem o hábito de publicar diariamente uma rápida entrevista com alguém que tenha algo a dizer. Inclusive, a primeira pergunta é sempre “conte algo que eu não sei”.

No dia 9 de outubro, o entrevistado foi Greg Policinski, jornalista, editor fundador do Instituto Newseum, o Museu da Imprensa, sediado em Washington, Estados Unidos. Policinski é diretor de operações da instituição.

Vale a leitura. Há dicas interessantes sobre o presente e o futuro do jornalismo e da imprensa. Destaque:

  • Os micropagamentos podem se constituir em uma fonte de receita alternativa à publicidade e à circulação.
  • Em algum tempo, o imediatismo (“instant now”, na entrevista) que a internet trouxe pode deixar de ser tão relevante assim para o leitor.
  • Jornalismo, mais que notícias, vende credibilidade.
  • Para construir credibilidade, é necessário tempo e pessoas.

Newseum

Na pressa, prefeitura paulistana pode confundir correlação com causalidade

transitoEssa notícia na capa do jornal O Estado de S. Paulo é sintomática para ensinar sobre os conceitos de causalidade e de correlação.

Em geral, governantes e imprensa costumam ser apressados e estabelecer uma relação de causa e efeito entre dois fenômenos.

No caso, a Prefeitura de São Paulo acredita que a redução da velocidade máxima permitida em algumas vias causou um efeito positivo, que foi a redução na extensão de congestionamento – e também na quantidade total de acidentes.

Já especialistas alertam que os efeitos podem ter uma outra causa: a diminuição de carros nas ruas por causa da desaceleração da atividade econômica. As pessoas dirigem menos se não estão indo ao trabalho ou às compras e, assim, a possibilidade de ocorrerem acidentes é menor, bem como a chance de haver congestionamento.

A Prefeitura de São Paulo pode até ter acertado ao estabelecer a causa (redução da velocidade) para o efeito (índice de congestionamento menor). Até porque os acidentes rotineiros de trânsito travam a circulação de automóveis e isso eleva a extensão de congestionamento. Mas, antes de cravar, é preciso fazer os estudos estatísticos adequados. Esse alerta foi feito por um entrevistado na reportagem.

materia

A confusão entre causalidade e correlação é um dos principais erros que são cometidos por entrevistados e repórteres. Há uma diferença enorme entre os conceitos. Um primeiro fenômeno pode exercer influência sobre um segundo sem necessariamente ser a causa deste – ou a causa única.

Outro equívoco comum é estabelecer uma tese como verdadeira a partir de um exemplo ou dois apenas. Ouve-se um entrevistado apenas, e crava-se o título. Mas essa já é outra história.

Saiba mais:

Artigo interessante: Correlação não implica causalidade. Argumenta muito bem sobre a diferença dos dois conceitos.

Outro artigo interessante, desta vez em inglês: Causation vs Correlation.