Na The Economist, levamos a visualização de dados a sério. Toda semana nós publicamos cerca de 40 gráficos em toda a imprensa, o site e nossos aplicativos. Com cada um deles, tentamos ao máximo visualizar os números com precisão e de uma forma que melhor suporte a história. Mas às vezes nos enganamos. Podemos fazer melhor no futuro se aprendermos com nossos erros - e outras pessoas também aprenderem com eles.Depois de um mergulho profundo em nosso arquivo, encontrei vários exemplos instrutivos. Agrupamos nossos crimes em relação à visualização de dados em três categorias: gráficos que (1) são enganosos, (2) confusos e (3) não fazem sentido. Para cada um, sugiro uma versão melhorada que requer uma quantidade similar de espaço - uma consideração importante ao desenhar gráficos para serem publicados na impressão.(Um breve aviso: A maioria dos gráficos "originais" foram publicados antes do redesenho do gráfico. Os gráficos aprimorados são desenhados para se ajustarem às novas especificações. Os dados são os mesmos.)Gráficos enganososVamos começar com o pior dos crimes na visualização de dados: apresentar dados de maneira enganosa. Nós nunca fazemos isso de propósito! Mas isso acontece de vez em quando. Vamos ver os três exemplos do nosso arquivo.Erro: Truncar a escalaUm pouco de campo à esquerdaEste gráfico mostra o número médio de curtidas no Facebook em posts de páginas da esquerda política. O objetivo desse gráfico era mostrar a disparidade entre as postagens de Corbyn e outros.O gráfico original não apenas minimiza o número de curtidas de Corbyn, mas também exagera em outros posts. Na versão reformulada, mostramos o bar do Sr. Corbyn em sua totalidade. Todas as outras barras permanecem visíveis. (Seguidores ávidos deste blog terão visto outro exemplo dessa prática ruim.)Outra coisa estranha é a escolha da cor. Na tentativa de imitar o esquema de cores do Trabalhismo, usamos três tons de laranja / vermelho para distinguir entre Jeremy Corbyn, outros MPs e partidos / grupos. Nós não explicamos isso. Embora a lógica por trás das cores possa ser óbvia para muitos leitores, talvez faça pouco sentido para aqueles menos familiarizados com a política britânica.Download dos dados do gráficoErro: Forçando um relacionamento por escalas de colheitaUma correlação perfeita rara? Na verdade não.O gráfico acima acompanhava uma história sobre o declínio do peso dos cães. À primeira vista, parece que o peso e o tamanho do pescoço dos cães são perfeitamente correlacionados. Mas isso é verdade? Apenas até certo ponto.No gráfico original, ambas as escalas diminuem em três unidades (de 21 para 18 à esquerda; de 45 para 42 à direita). Em termos percentuais, a escala da esquerda diminui em 14% enquanto a da direita diminui em 7%. No gráfico redesenhado, mantive a escala dupla, mas ajustei suas faixas para refletir uma mudança proporcional comparável.Considerando o alegre tópico deste gráfico, esse erro pode parecer relativamente menor. A mensagem do gráfico, afinal, é a mesma em ambas as versões. Mas o takeaway é importante: se duas séries se seguem muito de perto, é provavelmente uma boa ideia dar uma olhada mais de perto na balança.Download dos dados do gráficoErro: Escolhendo o método errado de visualizaçãoOpiniões sobre o Brexit quase tão erráticas quanto suas negociaçõesPublicamos este quadro de votação no Espresso, nosso aplicativo de notícias diárias. Ele mostra atitudes para o resultado do referendo da UE, plotado como um gráfico de linhas. Olhando para os dados, parece que os entrevistados tinham uma visão bastante errática do resultado do referendo - aumentando e diminuindo em alguns pontos percentuais de uma semana para a próxima.Em vez de plotar as pesquisas individuais com uma curva suavizada para mostrar a tendência, conectamos os valores reais de cada pesquisa individual. Isso aconteceu, principalmente, porque nossa ferramenta de gráficos interna não plota linhas suavizadas. Até bem recentemente, estávamos menos à vontade com softwares estatísticos (como o R) que permitissem visualizações mais sofisticadas. Hoje, todos nós somos capazes de traçar um gráfico de votação como o redesenhado acima.Outra coisa a notar neste gráfico é a maneira em que a escala foi quebrada. O gráfico original distribui os dados mais amplamente do que deveria. Na versão reformulada, deixei mais espaço entre o início da escala e o menor ponto de dados. Francis Gagnon criou uma boa fórmula para isso: tentar deixar pelo menos 33% da área livre em um gráfico de linhas que não comece em zero.Download dos dados do gráficoGráficos confusosNão tão criminoso quanto um gráfico enganoso, gráficos difíceis de ler são um sinal de mau trabalho de visualização.Erro: Levar o "alongamento da mente" um pouco longe demais… que?Na The Economist, somos encorajados a produzir jornalismo de "alongamento mental". Mas, às vezes, levamos isso longe demais. O gráfico acima mostra o déficit comercial dos EUA e o número de pessoas empregadas na indústria.O gráfico é incrivelmente difícil de ler. Tem dois problemas principais. Primeiro, os valores de uma série de dados (déficit comercial) são inteiramente negativos, enquanto os demais (emprego industrial) são todos positivos. É um desafio combinar essas disparidades em um gráfico sem achatar nenhuma das séries de dados. A aparente "solução" para isso leva ao segundo problema: as duas séries de dados não compartilham uma linha de base comum. A linha de base do déficit comercial está no topo do gráfico (destacada por uma linha vermelha traçada em metade do corpo do gráfico). A linha de base da escala correta está na parte inferior.O gráfico reprojetado mostra que não houve necessidade de combinar as duas séries de dados. A relação entre o déficit comercial e o emprego industrial permanece clara e ocupa apenas uma quantidade mínima de espaço extra.Download dos dados do gráficoErro: uso confuso de cor50 tons de azulEste gráfico compara os gastos do governo com benefícios de aposentadoria com a parcela de pessoas de 65 anos ou mais para uma seleção de países, com um foco particular no Brasil. Para manter o gráfico pequeno, o visualizador apenas rotulou uma seleção de países e destacou aqueles em azul elétrico. A média da OCDE é destacada em azul claro.O visualizador (eu!) Ignorou o fato de que uma mudança de cor geralmente implica uma mudança categórica. À primeira vista, este parece ser o caso também neste gráfico - todas as cores azuis elétricas parecem pertencer a um grupo diferente do azul escuro. Este não é o caso. A única coisa que eles têm em comum é que foram escolhidos para serem rotulados.Na versão reformulada, a cor dos círculos permanece a mesma para todos os países. Eu mudei a opacidade daqueles que não são rotulados para fazer os outros se destacarem. A tipografia faz o resto: o Brasil, o país em foco, está escrito em negrito e a média da OCDE em itálico.Download dos dados do gráficoGráficos que escondem seu pontoOs erros nesta categoria final são menos óbvios. Gráficos como esses não são enganosos, nem são muito confusos. Eles simplesmente não conseguem justificar sua existência - muitas vezes porque foram visualizados incorretamente ou porque tentamos empinar demais em pouco espaço.Erro: Incluindo muitos detalhes“Quanto mais cores, melhor!” - Nenhum bom visualizador de dados, nuncaQue arco-íris! Publicamos este gráfico em uma coluna sobre o superávit orçamentário da Alemanha. Mostra os saldos orçamentais e os saldos das contas correntes de dez países da área do euro. Com tantas cores - algumas das quais são muito difíceis de distinguir ou até mesmo de ver porque os valores são muito pequenos - a mensagem do gráfico é impossível de entender. Quase te tenta a espreitar e seguir em frente. E, mais importante, uma vez que não estamos a traçar todos os países da área do euro, não faz qualquer sentido empilhar os dados.Revisei a história para ver se havia uma maneira de simplificar um pouco esse gráfico. A coluna menciona Alemanha, Grécia, Holanda, Espanha e o total da área do euro. Na versão reformulada do gráfico, decidi destacar apenas esses. Para resolver o problema de empilhar apenas uma seleção de países, adicionei outra categoria ("Outros") que inclui todos os outros países da área do euro. (O saldo total da conta corrente no gráfico redesenhado é menor do que no gráfico original. Isto é devido a uma revisão de dados do Eurostat.)Download dos dados do gráficoErro: muitos dados, espaço insuficienteConfinados pelo espaço limitado em uma página, muitas vezes somos tentados a forçar todos os dados que temos em um espaço muito pequeno. Embora isso economize um espaço valioso na página, isso tem consequências - conforme mostrado neste gráfico, de março de 2017. A história é sobre como a publicação científica é dominada pelos homens. Todos os pontos de dados são igualmente interessantes e relevantes para a história. Mas ao apresentar uma quantidade tão grande de dados - quatro categorias de campo de pesquisa, bem como a parcela de inventores - a informação é difícil de aceitar.Depois de refletir bastante, decidi não reprojetar esse gráfico. Se eu fosse manter todos os dados, o gráfico teria se tornado grande demais para ter uma história concisa. Em casos como este, seria melhor cortar alguma coisa. Alternativamente, poderíamos mostrar algum tipo de medida média, por ex. a participação média de publicações de mulheres em todos os campos. (Por favor, deixe-me saber se você tem alguma idéia sobre como visualizar isso em um espaço apertado! Eu adoraria ouvir suas idéias.)Download dos dados do gráficoAs melhores práticas em visualização de dados estão evoluindo rapidamente: o que pode ser aceitável hoje pode ser desaprovado amanhã. Novas e melhores técnicas estão surgindo o tempo todo. Você já cometeu um crime gráfico que poderia ter sido corrigido facilmente? Nos informe!

Erros, nós tiramos alguns

Na The Economist, levamos a visualização de dados a sério. Toda semana nós publicamos cerca de 40 gráficos em toda a imprensa, o site e nossos aplicativos. Com cada um deles, tentamos ao máximo visualizar os números com precisão e de uma forma que melhor suporte a história. Mas às vezes nos enganamos. Podemos fazer melhor no futuro se aprendermos com nossos erros – e outras pessoas também aprenderem com eles.

Depois de um mergulho profundo em nosso arquivo, encontrei vários exemplos instrutivos. Agrupamos nossos crimes em relação à visualização de dados em três categorias: gráficos que (1) são enganosos, (2) confusos e (3) não fazem sentido. Para cada um, sugiro uma versão melhorada que requer uma quantidade similar de espaço – uma consideração importante ao desenhar gráficos para serem publicados na impressão.

(Um breve aviso: A maioria dos gráficos “originais” foram publicados antes do redesenho do gráfico. Os gráficos aprimorados são desenhados para se ajustarem às novas especificações. Os dados são os mesmos.)

Gráficos enganosos
Vamos começar com o pior dos crimes na visualização de dados: apresentar dados de maneira enganosa. Nós nunca fazemos isso de propósito! Mas isso acontece de vez em quando. Vamos ver os três exemplos do nosso arquivo.

Erro: Truncar a escala

Um pouco de campo à esquerda
Este gráfico mostra o número médio de curtidas no Facebook em posts de páginas da esquerda política. O objetivo desse gráfico era mostrar a disparidade entre as postagens de Corbyn e outros.

O gráfico original não apenas minimiza o número de curtidas de Corbyn, mas também exagera em outros posts. Na versão reformulada, mostramos o bar do Sr. Corbyn em sua totalidade. Todas as outras barras permanecem visíveis. (Seguidores ávidos deste blog terão visto outro exemplo dessa prática ruim.)

Outra coisa estranha é a escolha da cor. Na tentativa de imitar o esquema de cores do Trabalhismo, usamos três tons de laranja / vermelho para distinguir entre Jeremy Corbyn, outros MPs e partidos / grupos. Nós não explicamos isso. Embora a lógica por trás das cores possa ser óbvia para muitos leitores, talvez faça pouco sentido para aqueles menos familiarizados com a política britânica.

Download dos dados do gráfico

Erro: Forçando um relacionamento por escalas de colheita

Uma correlação perfeita rara? Na verdade não.
O gráfico acima acompanhava uma história sobre o declínio do peso dos cães. À primeira vista, parece que o peso e o tamanho do pescoço dos cães são perfeitamente correlacionados. Mas isso é verdade? Apenas até certo ponto.

No gráfico original, ambas as escalas diminuem em três unidades (de 21 para 18 à esquerda; de 45 para 42 à direita). Em termos percentuais, a escala da esquerda diminui em 14% enquanto a da direita diminui em 7%. No gráfico redesenhado, mantive a escala dupla, mas ajustei suas faixas para refletir uma mudança proporcional comparável.

Considerando o alegre tópico deste gráfico, esse erro pode parecer relativamente menor. A mensagem do gráfico, afinal, é a mesma em ambas as versões. Mas o takeaway é importante: se duas séries se seguem muito de perto, é provavelmente uma boa ideia dar uma olhada mais de perto na balança.

Download dos dados do gráfico

Erro: Escolhendo o método errado de visualização

Opiniões sobre o Brexit quase tão erráticas quanto suas negociações
Publicamos este quadro de votação no Espresso, nosso aplicativo de notícias diárias. Ele mostra atitudes para o resultado do referendo da UE, plotado como um gráfico de linhas. Olhando para os dados, parece que os entrevistados tinham uma visão bastante errática do resultado do referendo – aumentando e diminuindo em alguns pontos percentuais de uma semana para a próxima.

Em vez de plotar as pesquisas individuais com uma curva suavizada para mostrar a tendência, conectamos os valores reais de cada pesquisa individual. Isso aconteceu, principalmente, porque nossa ferramenta de gráficos interna não plota linhas suavizadas. Até bem recentemente, estávamos menos à vontade com softwares estatísticos (como o R) que permitissem visualizações mais sofisticadas. Hoje, todos nós somos capazes de traçar um gráfico de votação como o redesenhado acima.

Outra coisa a notar neste gráfico é a maneira em que a escala foi quebrada. O gráfico original distribui os dados mais amplamente do que deveria. Na versão reformulada, deixei mais espaço entre o início da escala e o menor ponto de dados. Francis Gagnon criou uma boa fórmula para isso: tentar deixar pelo menos 33% da área livre em um gráfico de linhas que não comece em zero.

Download dos dados do gráfico

Gráficos confusos
Não tão criminoso quanto um gráfico enganoso, gráficos difíceis de ler são um sinal de mau trabalho de visualização.

Erro: Levar o “alongamento da mente” um pouco longe demais

… que?
Na The Economist, somos encorajados a produzir jornalismo de “alongamento mental”. Mas, às vezes, levamos isso longe demais. O gráfico acima mostra o déficit comercial dos EUA e o número de pessoas empregadas na indústria.

O gráfico é incrivelmente difícil de ler. Tem dois problemas principais. Primeiro, os valores de uma série de dados (déficit comercial) são inteiramente negativos, enquanto os demais (emprego industrial) são todos positivos. É um desafio combinar essas disparidades em um gráfico sem achatar nenhuma das séries de dados. A aparente “solução” para isso leva ao segundo problema: as duas séries de dados não compartilham uma linha de base comum. A linha de base do déficit comercial está no topo do gráfico (destacada por uma linha vermelha traçada em metade do corpo do gráfico). A linha de base da escala correta está na parte inferior.

O gráfico reprojetado mostra que não houve necessidade de combinar as duas séries de dados. A relação entre o déficit comercial e o emprego industrial permanece clara e ocupa apenas uma quantidade mínima de espaço extra.

Download dos dados do gráfico

Erro: uso confuso de cor

50 tons de azul
Este gráfico compara os gastos do governo com benefícios de aposentadoria com a parcela de pessoas de 65 anos ou mais para uma seleção de países, com um foco particular no Brasil. Para manter o gráfico pequeno, o visualizador apenas rotulou uma seleção de países e destacou aqueles em azul elétrico. A média da OCDE é destacada em azul claro.

O visualizador (eu!) Ignorou o fato de que uma mudança de cor geralmente implica uma mudança categórica. À primeira vista, este parece ser o caso também neste gráfico – todas as cores azuis elétricas parecem pertencer a um grupo diferente do azul escuro. Este não é o caso. A única coisa que eles têm em comum é que foram escolhidos para serem rotulados.

Na versão reformulada, a cor dos círculos permanece a mesma para todos os países. Eu mudei a opacidade daqueles que não são rotulados para fazer os outros se destacarem. A tipografia faz o resto: o Brasil, o país em foco, está escrito em negrito e a média da OCDE em itálico.

Download dos dados do gráfico

Gráficos que escondem seu ponto
Os erros nesta categoria final são menos óbvios. Gráficos como esses não são enganosos, nem são muito confusos. Eles simplesmente não conseguem justificar sua existência – muitas vezes porque foram visualizados incorretamente ou porque tentamos empinar demais em pouco espaço.

Erro: Incluindo muitos detalhes

“Quanto mais cores, melhor!” – Nenhum bom visualizador de dados, nunca
Que arco-íris! Publicamos este gráfico em uma coluna sobre o superávit orçamentário da Alemanha. Mostra os saldos orçamentais e os saldos das contas correntes de dez países da área do euro. Com tantas cores – algumas das quais são muito difíceis de distinguir ou até mesmo de ver porque os valores são muito pequenos – a mensagem do gráfico é impossível de entender. Quase te tenta a espreitar e seguir em frente. E, mais importante, uma vez que não estamos a traçar todos os países da área do euro, não faz qualquer sentido empilhar os dados.

Revisei a história para ver se havia uma maneira de simplificar um pouco esse gráfico. A coluna menciona Alemanha, Grécia, Holanda, Espanha e o total da área do euro. Na versão reformulada do gráfico, decidi destacar apenas esses. Para resolver o problema de empilhar apenas uma seleção de países, adicionei outra categoria (“Outros”) que inclui todos os outros países da área do euro. (O saldo total da conta corrente no gráfico redesenhado é menor do que no gráfico original. Isto é devido a uma revisão de dados do Eurostat.)

Download dos dados do gráfico

Erro: muitos dados, espaço insuficiente

Confinados pelo espaço limitado em uma página, muitas vezes somos tentados a forçar todos os dados que temos em um espaço muito pequeno. Embora isso economize um espaço valioso na página, isso tem consequências – conforme mostrado neste gráfico, de março de 2017. A história é sobre como a publicação científica é dominada pelos homens. Todos os pontos de dados são igualmente interessantes e relevantes para a história. Mas ao apresentar uma quantidade tão grande de dados – quatro categorias de campo de pesquisa, bem como a parcela de inventores – a informação é difícil de aceitar.

Depois de refletir bastante, decidi não reprojetar esse gráfico. Se eu fosse manter todos os dados, o gráfico teria se tornado grande demais para ter uma história concisa. Em casos como este, seria melhor cortar alguma coisa. Alternativamente, poderíamos mostrar algum tipo de medida média, por ex. a participação média de publicações de mulheres em todos os campos. (Por favor, deixe-me saber se você tem alguma idéia sobre como visualizar isso em um espaço apertado! Eu adoraria ouvir suas idéias.)

Download dos dados do gráfico

As melhores práticas em visualização de dados estão evoluindo rapidamente: o que pode ser aceitável hoje pode ser desaprovado amanhã. Novas e melhores técnicas estão surgindo o tempo todo. Você já cometeu um crime gráfico que poderia ter sido corrigido facilmente? Nos informe!