Atlas identifica potencial viés amostral na última pesquisa Datafolha

O Instituto Datafolha realizou uma pesquisa de opinião sobre o coronavírus e a aprovação do governo entre os dias 1 e 3 de abril de 2020. De acordo com o instituto, foram entrevistados 1511 brasileiros adultos por telefone celular em todo território nacional. A população alvo da pesquisa é a população brasileira adulta.

No dia 06/04/20, o relatório da pesquisa na página oficial do Instituto Datafolha mostrava a seguinte distribuição amostral para a pergunta P40d: “Na sua opinião, o presidente Jair Bolsonaro deveria ou não renunciar à Presidência da República?”:

0408202 Table

De acordo com os resultados reportados pelo Datafolha, a amostra coletada depois da ponderação tinha o seguinte perfil para votos válidos no segundo turno das eleições de 2018:

Jair Bolsonaro: 634 respondentes [63%]

Fernando Haddad: 378 respondentes [37%]

Vantagem: 25p.p.

O resultado da votação no segundo turno das eleições de 2018 foi:

Jair Bolsonaro: [55%]

Fernando Haddad: [45%]

Vantagem: 10p.p.

A diferença de 15 pontos entre a margem verdadeira na votação de 2018 e a margem existente na amostra capturada pelo Datafolha afeta a representatividade da amostra, provavelmente sub-representando fora da margem de erro da pesquisa os eleitores do Fernando Haddad.

Na literatura acadêmica sobre o assunto, vários estudos destacam a existência frequente de uma falha sistemática por parte dos entrevistados na autodeclaração do voto passado, viés geralmente favorecendo o candidato vencedor1. No entanto, a magnitude desse viés num estudo de duas décadas de eleições legislativas nos Estados Unidos raramente costuma ultrapassar 50% da margem de vitória do candidato vencedor2:

0408202 Chart

Aplicando essas estimativas ao caso brasileiro, uma diferença de até 15 pontos (5 pontos maior do que a diferença real) entre os percentuais autodeclarados de voto passado no segundo turno da eleição presidencial de 2018 não seria necessariamente indicativa da existência de um viés amostral, podendo ser plausivelmente atribuída a uma falha sistemática dos respondentes na autodeclaração do voto passado. No entanto, a diferença observada na amostra da pesquisa telefônica Datafolha foi de 25 pontos, 15 pontos maior do que a diferença real e três vezes maior que o teto normalmente observado, indicando dessa forma um provável viés amostral.

Contribuem para essa conclusão as últimas pesquisas presenciais do próprio Datafolha. Em dezembro, a distribuição amostral para o segundo turno de 2018 era: Jair Bolsonaro 57.9% vs. Fernando Haddad 42.1%, uma diferença de 16 pontos percentuais. Na pesquisa de agosto, a distribuição amostral era: Jair Bolsonaro 55.5% vs. Fernando Haddad 44.5%, uma diferença de 11 pontos percentuais, quase igual ao resultado oficial da eleição.

A discrepância entre a distribuição amostral das mais recentes pesquisas presenciais e as pesquisas telefônicas do Datafolha em relação a autodeclaração do voto passado em 2018 é provavelmente decorrente do perfil sistematicamente diferente dos respondentes que acabam respondendo a pesquisa por telefone em comparação com o perfil dos respondentes que desistem de responder, um fenômeno amplamente analisado na literatura sobre pesquisas de opinião sob o nome “differential non-response bias”.

No caso das pesquisas sobre preferências políticas, esse viés sistemático costuma ser correlacionado com a intensidade do engajamento político: pessoas menos engajadas politicamente desistem de responder a pesquisa com uma frequência maior do que pessoas muito engajadas. Como esse fenômeno pode se refletir dentro de qualquer cota demográfica, uma distribuição amostral aparentemente correta por conta da calibragem por cotas demográficas não garante a seleção randômica da amostra; de fato, um foco exclusivo nas cotas pode exacerbar o problema do viés de seleção não aleatória. A literatura identifica várias soluções e estratégias para corrigir esse viés amostral (veja por exemplo Gelman et al 2016)3.

Como o voto na eleição de 2018 é claramente um fator fortemente correlacionado com qualquer pergunta sobre a avaliação de governo, apoio a uma eventual renúncia do presidente, etc., os 15 pontos adicionais de voto autodeclarado para Jair Bolsonaro em relação a um patamar considerado razoável dentro da série histórica do próprio Datafolha faz com que os resultados alcançados para esse tipo de indicador na pesquisa de abril sejam inverossímeis.

AtlasIntel disponibilizou para Datafolha a distribuição amostral da última pesquisa Atlas em relação ao segundo turno da eleição de 2018 e está colaborando com o instituto de forma construtiva para trocar experiências na otimização do desenho amostral das nossas pesquisas.

1 Wright, Gerald C. 1990. “Misreports of Vote Choice in the 1988 NES Senate Election Study.” Legislative Studies Quarterly 15:543-564; Wright, Gerald C. 1992. “Reported versus Actual Vote: There Is a Difference and It Matters.” Legislative Studies Quarterly 17:131-142; Wright, Gerald C. 1993. “Errors in Measuring Vote Choice in the National Election Studies, 1952-88.” American Journal of Political Science 37:291-316; Mattei, Franco. 1998. “Winning at the Polls and in the Polls: The Incumbency Advantage in Surveys of U.S. House Voters.” Electoral Studies 17:443-461.

2 Rainey, Carlisle & Robert Jackson. “Modeling Misreports of Vote Choice: A Comparison of Alternative Approaches.” American Political Science Association Annual Conference, New Orleans, LA, August 2012

3 http://www.stat.columbia.edu/~gelman/research/unpublished/swing_voters.pdf

Tracking Pro

Proprietary high-frequency polling that enables you to be the first to know when public opinion shifts and the likelihood of political outcomes changes.

view

Atlas Monitor

Atlas Monitor is a customizable social media intelligence tool that provides granular monitoring of businesses, organizations, topics, political campaigns, etc.

view

Public Polls

Nationally representative polls conducted by AtlasIntel using its proprietary data collection technology and post-stratification algorithms.

view

Atlas Político

Atlas Político is a political transparency platform that empowers citizens to keep their politicians accountable.

view