Nos últimos meses, as pesquisas de intenção de voto para o segundo turno presidencial de 2026 começaram a ganhar forma, oferecendo sinais sobre a disputa entre Lula e Tarcísio de Freitas. No entanto, cada instituto apresenta seus próprios números, metodologias e margens de erro, o que deixa o público diante de um mosaico complexo e por vezes contraditório. Para transformar essa multiplicidade de levantamentos em uma visão mais clara, é possível recorrer a um modelo estatístico conhecido como agregador bayesiano, uma ferramenta que tem como objetivo combinar diferentes pesquisas e atualizar continuamente as estimativas de acordo com a recência e a precisão de cada estudo. Em vez de escolher uma pesquisa favorita ou tentar interpretar dezenas de números isolados, o método cria um retrato mais estável e confiável da disputa ao longo do tempo.
A lógica central do modelo parte de um princípio simples: nem todas as pesquisas têm o mesmo peso. Alguns levantamentos são mais recentes, outros entrevistam um número muito grande de eleitores, outros ainda utilizam margens de erro menores, o que indica maior precisão estatística. O agregador bayesiano leva em conta esses fatores por meio de uma equação que soma duas dimensões importantes: a precisão e a recência. A precisão está ligada diretamente à margem de erro declarada. Pesquisas com margem menor carregam mais informação e, por isso, recebem maior peso. Em termos práticos, a fórmula usada atribui um peso inversamente proporcional ao quadrado da margem de erro; ou seja, se uma pesquisa tem margem de erro de 1 ponto, ela pesa muito mais do que outra com margem de 3 pontos. Já a recência funciona de maneira semelhante ao que ocorre com alimentos frescos: quanto mais antiga a pesquisa, menor sua contribuição para o retrato atual. Esse fenômeno é representado por uma taxa de decaimento temporal, chamada τ, que no modelo adotado vale quinze dias. Pesquisas realizadas há mais de um mês ainda contam, mas muito menos que levantamentos feitos na última semana.
Combinando essas duas dimensões, o modelo calcula um peso final para cada pesquisa e, a partir daí, gera uma estimativa atualizada da intenção média de voto de cada candidato. O método utilizado é bayesiano porque, a cada nova pesquisa, a estimativa anterior funciona como um ponto de partida, e os novos dados servem para ajustar esse ponto de maneira gradual e coerente. Essa atualização contínua diminui o impacto de pesquisas atípicas e evita saltos artificiais na curva de intenção de voto, produzindo uma tendência mais suave e mais compatível com a realidade eleitoral. Para tornar o processo ainda mais robusto, o modelo realiza milhares de simulações usando os números divulgados pelos institutos. Em cada simulação, os percentuais de Lula e Tarcísio são sorteados dentro de uma distribuição que incorpora a margem de erro. Ao repetir esse processo milhares de vezes, o modelo consegue estimar não apenas a média esperada de cada candidato, mas também o grau de incerteza dessas estimativas e a probabilidade de um candidato estar liderando naquele momento.
Aplicando esse método ao conjunto de 46 pesquisas realizadas ao longo de 2025, o agregador encontrou um quadro consistente. Embora as pesquisas isoladas variem bastante — algumas mostram Lula com vantagem folgada, outras sugerem equilíbrio maior —, quando somadas de maneira ponderada elas produzem um retrato mais estável da disputa. Segundo o modelo, Lula aparece na média atual com cerca de 47,3% das intenções de voto, enquanto Tarcísio registra em torno de 44,9%. A diferença, de pouco mais de dois pontos, é modesta, mas estatisticamente significativa, porque se mantém mesmo após a incorporação das margens de erro e das diversas metodologias envolvidas. A faixa de incerteza, representada pelo intervalo de credibilidade de 95%, indica que os percentuais mais prováveis para Lula oscilam entre 46,6% e 48,1%, enquanto Tarcísio apresenta uma faixa entre 44,2% e 45,6%. Assim, apesar de a disputa ser relativamente apertada, o modelo aponta uma liderança consistente do presidente, que se mantém mesmo sob simulações mais adversas.
Outro aspecto revelador é a probabilidade de liderança, calculada a partir das milhares de simulações conduzidas pelo modelo. Como cada simulação sorteia novos percentuais com base nos erros amostrais das pesquisas, é possível verificar em quantas delas Lula aparece à frente. O resultado é categórico: em praticamente 100% das simulações, Lula lidera o segundo turno. Isso não significa, evidentemente, que a eleição esteja decidida, mas indica que, dadas as informações disponíveis até aqui, seria estatisticamente improvável que o candidato adversário estivesse silenciosamente à frente sem que isso aparecesse nos dados. Em uma disputa real, qualquer mudança desse cenário dependeria de alterações significativas na opinião pública, de eventos políticos futuros ou do surgimento de novas pesquisas que apontem tendências inesperadas.
Uma parte importante do estudo é a reconstrução da evolução das intenções de voto ao longo de 2025. Ao aplicar o modelo em um conjunto de datas ao longo do ano, o agregador permite visualizar como cada candidato oscilou no tempo. A tendência encontrada mostra Lula começando o ano em torno de 45%, com pequenas variações ao longo do primeiro semestre, e iniciando um processo gradual de alta a partir da metade do ano, até alcançar os valores próximos de 47% no fim de novembro. Já Tarcísio aparece em um patamar entre 41% e 46%, dependendo da época, com movimentos suaves que sugerem leve alta no segundo semestre, mas sem ultrapassar Lula em nenhuma fase do período analisado. Esse comportamento indica que, embora exista algum dinamismo, o quadro geral permanece relativamente estável, com vantagem sustentada do presidente.
Os institutos que mais influenciam o resultado também chamam atenção. Pesquisas do AtlasIntel, por exemplo, que apresentam amostras muito grandes e margem de erro de apenas 1 ponto, acabam recebendo grande peso no modelo e, em muitos momentos, puxam as estimativas para cima no caso de Lula. Do outro lado, levantamentos do Futura/Apex e de alguns ciclos da Gerp tendem a mostrar números ligeiramente mais favoráveis a Tarcísio, equilibrando parcialmente o efeito das pesquisas mais positivas para o presidente. Institutos como Datafolha, CNT/MDA, Paraná Pesquisas e Quaest aparecem de maneira mais próxima da média e ajudam a ancorar o modelo, fornecendo leituras menos extremas ao longo do ano.
O resultado final não é uma previsão da eleição, mas um retrato estatisticamente coerente do que as pesquisas de 2025 dizem sobre um eventual segundo turno em 2026. Hoje, esse retrato mostra Lula com uma vantagem pequena, porém robusta; mostra também um eleitorado em lenta consolidação, com o grupo de indecisos encolhendo ao longo do ano e chegando a cerca de 7% no momento mais recente. O modelo sugere um cenário competitivo, mas com um favorito claro nas condições atuais. Como toda fotografia, o retrato continuará a mudar conforme novas pesquisas forem divulgadas. O papel do agregador bayesiano é justamente organizar essas informações de forma transparente e consistente, permitindo ao público compreender a evolução real da disputa, em vez de se perder em números isolados e muitas vezes contraditórios.
Nenhum comentário:
Postar um comentário