Arquivo da tag: estatísticas

Riscos e cuidados no uso de estatísticas. Mesmo as oficiais

Reportagem publicada pela Folha de S. Paulo no dia 4 de março de 2016 evidencia o risco – e consequentemente os cuidados -que devem ser levados em consideração no trato com estatísticas, mesmo aquelas que são oferecidas oficialmente por órgãos públicos.

Em resumo, o número de homicídios divulgados pelo poder público está subdimensionado, pois há muitos casos listados em outra categoria de informação que não aparece nos balanços divulgados pela Secretaria de Segurança Pública.

O debate em torno da reportagem e da análise dos dados exigiu explicações do governo paulista e novas regras para a divulgação de estatísticas, como a divulgação das correções feitas periodicamente e de dados dos boletins de ocorrências.

estatisticas-de-seguranca

Veja mais:

O problema atinge outros estados brasileiros, como mostra a tese do pesquisador Daniel Cerqueira, que avaliou dados sobre mortes violentas não esclarecidas no estado do Rio de Janeiro.

Anúncios

Na pressa, prefeitura paulistana pode confundir correlação com causalidade

transitoEssa notícia na capa do jornal O Estado de S. Paulo é sintomática para ensinar sobre os conceitos de causalidade e de correlação.

Em geral, governantes e imprensa costumam ser apressados e estabelecer uma relação de causa e efeito entre dois fenômenos.

No caso, a Prefeitura de São Paulo acredita que a redução da velocidade máxima permitida em algumas vias causou um efeito positivo, que foi a redução na extensão de congestionamento – e também na quantidade total de acidentes.

Já especialistas alertam que os efeitos podem ter uma outra causa: a diminuição de carros nas ruas por causa da desaceleração da atividade econômica. As pessoas dirigem menos se não estão indo ao trabalho ou às compras e, assim, a possibilidade de ocorrerem acidentes é menor, bem como a chance de haver congestionamento.

A Prefeitura de São Paulo pode até ter acertado ao estabelecer a causa (redução da velocidade) para o efeito (índice de congestionamento menor). Até porque os acidentes rotineiros de trânsito travam a circulação de automóveis e isso eleva a extensão de congestionamento. Mas, antes de cravar, é preciso fazer os estudos estatísticos adequados. Esse alerta foi feito por um entrevistado na reportagem.

materia

A confusão entre causalidade e correlação é um dos principais erros que são cometidos por entrevistados e repórteres. Há uma diferença enorme entre os conceitos. Um primeiro fenômeno pode exercer influência sobre um segundo sem necessariamente ser a causa deste – ou a causa única.

Outro equívoco comum é estabelecer uma tese como verdadeira a partir de um exemplo ou dois apenas. Ouve-se um entrevistado apenas, e crava-se o título. Mas essa já é outra história.

Saiba mais:

Artigo interessante: Correlação não implica causalidade. Argumenta muito bem sobre a diferença dos dois conceitos.

Outro artigo interessante, desta vez em inglês: Causation vs Correlation.

 

Analise o histórico de quaisquer estatísticas. Ele pode ajudar a contar outra história

Um curso recém finalizado pelo Knight Center sobre noções básicas de matemática e estatística para jornalistas pinçou uma regra básica na análise de dados: é fundamental olhar a evolução das informações em um prazo mais prolongado, quando tais informações estiverem disponíveis.

O instrutor, Greg Ferenstein, alertou que não é recomendável ignorar a História, sobretudo em mudanças de opinião pública, quando torna-se ainda mais importante consultar os dados do passado longínquo.

O exemplo utilizado para demonstrar o ensinamento foi a opinião pública da sociedade norte-americana sobre pena de morte. Enquanto a evolução das estatísticas no curto prazo mostra uma coisa (falta de apoio à pena de morte no nível mais baixo de todos os tempos), os dados completos indicam outra (apesar das oscilações ao longo das décadas, a sociedade norte-americana mantém a mesma opinião ao longo de quase um século).

Dead penalty 2

Dead penalty 1

Concluiu o instrutor, em tradução livre: “Você ainda pode afirmar que a pena de morte está em declínio em popularidade, mas você teria que levar a História em conta. Ela muda tudo.”

Dias atrás, o Pew Research Center, que investiga há muito tempo a opinião pública dos Estados Unidos e também de outros países com muita eficiência, publicou uma avaliação a respeito das taxas de pobreza entre crianças negras, brancas, asiáticas e hispânicas.

Child poverty rates

Vale a mesma lição e a mesma conclusão: com exceção das crianças asiáticas, as estatísticas mostram uma evolução, para mais ou para menos, interessante no prazo mais curto. Mas, no longo prazo, entre 1975 e 2015, o nível de pobreza entre crianças (menores de 18 anos para o instituto) permanece razoavelmente sem alterações significativas.

Sozinhos, os números informam. Contextualizados, eles esclarecem

Messi x Muller 6

Dois assuntos recentes deram oportunidade para a imprensa mostrar o quanto está interessada em lidar corretamente com estatísticas. Na cidade de São Paulo, a quantidade de assassinatos aumentou significativamente em 2012, mês a mês, e os jornalistas investigam os motivos desta escalada. Na área esportiva, o atacante argentino Lionel Messi marcou, no último jogo, o 90º gol no ano, distanciando-se dos recordistas anteriores. Nunca antes na história do futebol profissional um atleta havia marcado tantos gols em um único ano.

Na capital paulista, a quantidade de assassinatos dobrou em diversos meses do ano. Essa notícia, informada diversas vezes por dia ao longo do ano causou tensão na sociedade. As pessoas, amedrontadas, passaram a mudar hábitos. A violência passou a ser o principal e quase único assunto nas famílias. No entanto, quando contextualizados com estatísticas históricas e de outros estados, surge um outra informação.

Veja - Violência SP 3

São Paulo, tanto estado quanto capital, figuram ainda entre os mais seguros do país e, apesar do recrudescimento da violência, mantêm-se próximos da meta de computarem menos de 10 assassinatos em cada grupo de mil pessoas, indicador que situa uma região fora da condição de violência em estado epidêmico. A média brasileira foi de 23,6 assassinatos em cada grupo de 100 mil pessoas em 2011. Repare: uma informação não anula a outra, mas ambas oferecem ao leitor uma compreensão melhor do fato.

Na área esportiva, o atacante argentino marcou o 90º gol. Já havia ultrapassado o brasileiro Pelé (75 gols em 1958) e o alemão Gerd Muller (85 gols em 1972). O número é surpreendente. Mas não diz tudo. A média, tanto do brasileiro quanto do alemão, é de 1,41 gol/jogo, contra 1,32 do argentino, que ainda tem mais um jogo em 2012 e, se escalado, teria de conseguir fazer oito gols para superar a média dos dois concorrentes. Novamente, uma informação não anula a outra a e só ajuda o leitor.

Veja - MessiOs números, isolados, estão corretos, mas não dizem tudo. Eles surpreendem e intrigam e, por chamarem tanto a atenção, aparecem isolados na maior parte das reportagens. No entanto, quando inseridos historicamente ou contextualizados, o alarde diminui. Menos alarde, menos audiência – e por isso muitas trazem apenas a informação sem o contexto. Essa é uma justificativa.

Outra razão para os números alarmantes ou surpreendentes aparecerem isoladamente na maior parte das matérias é a pressa. leva tempo para buscar estatísticas que permitam ao leitor ou internauta analisar o número ao longo de um período mais longo. Diante da pressa de uma imprensa cada vez mais presente na internet, a regra é primeiro publicar o fato para somente depois melhorar a apuração e oferecer mais dados para ajudar a compreensão.

A revista Veja, na edição de 21 de novembro, produziu reportagens sobre os dois assuntos, dando aos temas o tratamento adequado – apresentou tanto a informação alarmente, isoladamente, sem deixar de inseri-la em um contexto. O leitor saiu ganhando.

Nos EUA, famílias contam cada vez mais com programas sociais para melhorar renda. Porque você nunca saberá nada sobre isso no Brasil?

Em 2009, 18% da renda média do cidadão norte-americano foi resultante do pacote de benefícios (mais de 50 programas, de alimentação a saúde e emprego) pagos pelo governo dos EUA. Em 1969, essa parcela era de 8%. O que isso significa? Há duas possibilidades principais: ou as pessoas empobreceram e passaram a precisar da colaboração do poder público para complementar a renda necessária ao suprimento das necessidades básicas ou o próprio Estado tomou a decisão de elevar as transferências de assistência e recursos para aos cidadãos.

Esses números foram tabulados pelo Departamento de Comércio do governo dos Estados Unidos e publicados detalhadamente na edição do dia 12 de fevereiro do The New York Times. Deram substância e conteúdo para uma reportagem abrangente e longa, acompanhada pela publicação de infográficos interativos no formato de mapas, nos quais as diferenças de tonalidade mostram locais onde os cidadãos foram mais ou menos dependentes das transferências de recursos governamentais.

The New York Times 12Feb2012 O mapa com tonalidades diferentes para mostrar localidades nas quais as famílias receberam mais ou menos recursos de programas sociais é mais um projeto bem-sucedido da equipe de infografia do jornal norte-americano. No entanto, vale lembrar que a tarefa fica mais fácil quando há dados disponíveis.

Faltam estatísticas – No Brasil, é bastante comum não encontrar estatísticas confiáveis com um histórico significativo que permita fazer análises responsáveis, estabelecer tendências, interpretar transformações. Raramente é possível encontrar uma série estatística com dados que mensurem 30 ou 40 anos de qualquer coisa, mesmo na área econômica.

O IBGE, claro, é um clássico exemplo positivo dentro de um país acostumado a não contabilizar quase nada. Mesmo feita essa ressalva, dificilmente emanarão dos arquivos do instituto dados com tanto detalhe, com cinco ou seis décadas de sequência, para cada ente federativo.

Nos últimos anos, a área econômica é o setor do governo central que mais evoluiu na organização e confiabilidade de dados orçamentários (tanto arrecadação quanto gasto), principalmente a partir da década de 1990, quando houve a necessidade de organizar as estatísticas das contas públicas por causa do iminente plano de combate à inflação – o Real.

Tornou-se essencial conhecer rigorosamente o destino dos gastos para evitar descontroles nos preços. Na contabilidade pública, o Real forçou uma revolução positiva sem precedentes.

Problema histórico – Essa falta de cultura do poder público brasileiro em registrar e mensurar estatísticas sobre as iniciativas governamentais causou estragos consideráveis no esforço de entender as transformações econômicas e sociais no Brasil.

Mesmo historiadores, quando conseguem resgatar alguns dados, nunca recuperam dados que representem a fotografia do país – no máximo, de um estado ou município. Simples: se o Estado pouco se preocupou em mensurar e registrar as estatísticas sobre gastos e serviços públicos, é impossível resgatá-los de qualquer arquivo.

Los Angeles Times: boa pauta mescla bancos de dados, infografia e narrativa com eficiência

O jornal Los Angeles Times produziu uma bela reportagem que ajuda a demonstrar uma das mais atraentes vertentes do jornalismo atualmente. A matéria faz uso de três ingredientes: bancos de dados, infografias e excelente reportagem para contar a história.

A matéria em questão aborda a retomada das transferência de dinheiro dos estrangeiros residentes nos Estados Unidos para as famílias que eles deixaram nos países de origem. Índia, China e México, nessa ordem, são os principais países de destino dos dólares mandados pelos imigrantes que trabalham no mercado norte-americano.

Dados e visualização – As estatísticas suportam a pauta: o crescimento das remessas de recursos de imigrantes mexicanos para o México. A análise sobre os dados permitiu identificar uma informação nova sobre o mercado de trabalho norte-americano. A partir desse ponto, especialistas ajudaram a entender as causas e consequências dessa mudança e sugerir conclusões sobre o fenômeno.

Los Angeles Times 12jan2012 A infografia reúne recursos como estatísticas sobre mapa e gráficos em barras, com tonalidades diferentes da mesma cor, de forma que o leitor percebe facilmente medidas como distribuição espacial e quantidade. A informação visual permite entender quais estados mexicanos mais receberam dinheiro despachado por imigrantes mexicanos que trabalham nos Estados Unidos.

Personagem – Um terceiro aspecto é a harmonia com a qual todos esses elementos foram organizados na parte principal da capa do jornal.

A reportagem é inaugurada com um personagem comum que representa a essência do fato que pretende ser contado – uma empregada doméstica que espera numa fila a vez de enviar uma pequena quantia para a mãe, que mora em Chiapas, México.

A matéria ainda supõe, a partir dos especialistas, que o crescimento, depois de três anos em queda, da quantidade total de dinheiro enviado por imigrantes para parentes residentes em outros países pode representar uma evidência do fortalecimento e da recuperação do mercado de trabalho norte-americano.

Método – Esse estilo de jornalismo têm sido chamado de “data-driven journalism”, algo como “jornalismo movido por estatísticas”. Em regra geral, é um método baseado na organização e análise de bancos de dados cada vez mais abrangentes que ajudam os jornalistas a detectarem mudanças que embasam as pautas e as notícias subsequentes.

Muitas vezes, a análise dos dados e a visualização deles conta com a participação de programadores que, com as técnicas das ciências da computação, criam regras para cruzar e orientar as estatísticas de forma eficiente.

Brasil patina há mais de uma década no desafio de reduzir corrupção

No mais recente atlas da Transparency International, organização que monitora o nível de corrupção no mundo todo, o Brasil, invariavelmente, não ocupa uma boa posição.

A organização consegue, a partir de um conjunto de pesquisas (entre 3 e 13 em cada país, dependendo da quantidade de fontes disponíveis em cada ano), avaliar qual é o nível de corrupção percebida.

O indicador oferece muito espaço para o debate. A partir de pesquisas de opinião e outras qualitativas, tenta medir o nível de percepção que a sociedade local tem sobre a corrupção no país onde vive ou negocia.

Não creio ser possível avançar muito mais que isso. É praticamente impossível determinar quais são os países nos quais há mais corrupção a partir da medição da quantidade de dinheiro desviado ou de propinas pagas.

A posição do Brasil – Entre 178 países, o Brasil se situa no pelotão do meio, no 69° lugar, com outras três nações. Toda a imprensa deu destaque para a lista dos mais e menos corruptos. Há menos corrupção por aqui do que em Vanuatu, que vem logo atrás. da mesma forma, há mais corrupção aqui que em Ruanda, na África.

Tão importante quanto a posição que o Brasil ocupa é saber quais posições ele ocupou no passado. Só assim é possível saber se houve retrocesso ou avanço.

Segundo os parâmetros da pesquisa, quanto mais próximo de 10, menor é a corrupção percebida no dia a dia nos países. Mais próximo de zero, o ‘toma-lá-dá-cá’ corre solto.

Desde 1995, quando as pesquisas começaram a ser feitas pela Transparency International, depois de melhorar significativamente entre 1995 e 1999, o país passou a patinar no combate à corrupção, mostram as estatísticas.

Corrupção no Brasil

Coloquei os dados no Tableau Public, ferramenta gratuita que permite inserir planilhas de dados e visualizá-los em gráficos. Achei que o velho e simples gráfico em formato de colunas mostraria bem a estagnação do Brasil no combate à corrupção.

Brinque com o gráfico – Quem quiser, pode verificar lá como os 178 países evoluíram ou regrediram. A ferramenta permite interação. Os interessados podem copiar a tabela de dados, clicando em ‘download’.

Montar a tabela deu um trabalho enorme. Coletei a tabela principal de todas as edições disponíveis da pesquisa anual da Transparency International, de 1995 até 2010 .

Depois, organizei os dados em uma planilha de forma que pudessem ser comparáveis, linha por linha. Muitos países entraram na pesquisa somente nas edições mais recentes. Para outros, faltam dados em pesquisas intermediárias.

Se alguém que for craque na arte de criar infográficos e visualizações, fique à vontade para refazer e melhorar.