Atualizado em 4 de janeiro, com ranking da FIFA atualizado e regulamento dos terceiros colocados da fase de grupo.
Começou o aquecimento para a Copa do Mundo 2026! Agora com 48 times e três países-sede, o torneio começa em 11 de junho do próximo ano. Ainda faltam seis times a definir, quatro europeus e dois do resto do mundo, mas a tabela foi sorteada na última sexta-feira e (praticamente) todos já conhecem o caminho até a grande final no dia 19 de julho.
A Copa do Mundo é o grande evento que eu acompanho desde 1994, embora tenha vagas lembranças de um ou outro jogo da Copa na Itália em 90. Para o ano que vem, estaremos imersos em um mundo de dados do futebol, cercados de casas de apostas e probabilidades, estatísticas e muitos outros números. Se elas podem, eu também posso calcular a probabilidade de cada país ser campeão!
A ideia aqui é fazer um modelo simples para estimar a chance de uma seleção ganhar a Copa. O que a gente vai precisar:
- Lista dos países que vão jogar a Copa
- Ranking que apresente a "força" de cada país
- Tabela dos jogos
- Modelo de predição de vitória, empate ou derrota
A lista de países já está disponível, mas ainda temos algumas vagas sendo disputadas. Por isso, precisamos incluir uma fase preliminar para mapear quem vai ocupar as posições que ainda estão em aberto. Vamos usar o mesmo modelo que será usado depois.
Para representar a força de cada país, a FIFA disponibiliza o Ranking de Seleções, com a posição e uma pontuação. Vamos usar esses valores para comparar os times.
A tabela de jogos foi sorteada no dia 05 de dezembro de 2025, separando os times em doze grupos com quatro seleções, indicando onde as vagas de repescagem estão. Aqui há uma complicação, pois temos dois classificados diretos em cada grupo e mais os oito melhores terceiros colocados. Isso introduz um fator extra a ser considerado, pois o sorteio da próxima fase inclui condições especiais. Para evitar que um time enfrente novamente alguém do seu grupo, os confrontos envolvendo os terceiros colocados precisam ser feitos com cuidado.
Para modelar os confrontos, vamos usar um modelo semelhante ao usado no sistema Elo do xadrez, mas com uma adaptação para incluir a possibilidade de empate (modelo Bradley–Terry–Davidson). A partir da pontuação de cada time, se calcula um fator de força (sA = força, rA = pontuação).

Se usa um parâmetro para definir a "força" do empate.

Com a força de cada time e do empate, podemos calcular a probabilidade de cada resultado na partida, usando a fórmula abaixo:

Só usaremos a possibilidade do empate durante a fase de grupos e deixaremos esse parâmetro como zero na outras etapas do torneio, inclusive na repescagem, uma vez que precisamos que alguém ganhe.
Para cada partida, é sorteado um número aleatório para determinar o vencedor (ou empate), baseado nas probabilidades calculadas acima. Fazendo isso para cada jogo, conseguimos os classificados pela repescagem, as posições na fase de grupo e os times que vão passando até chegar na final, onde encontraremos nosso campeão. No primeiro teste, o jogo do título foi entre Brasil e Holanda, com o título ficando com eles...
Como precisamos gerar esses números aleatórios para encontrar o vencedor, o processo retrata UMA possível Copa do Mundo. Se fizermos isso várias vezes, vamos ter uma amostra de Copas e podemos ver os times que ganham mais. Se fizermos isso UM MILHÃO de vezes, vamos ter um grande número de simulações e podemos imaginar que a estatística vai ser próxima da realidade.
O objetivo do programa é encontrar a probabilidade de cada país de ser campeão e quais são as três finais mais prováveis.
Os cinco times com a maior probabilidade de festejar mais um título da Copa são:
- Espanha - 17,33%
- França - 17,04%
- Argentina - 15,72%
- Inglaterra - 11,94%
- Brasil - 4,76%
Tivemos um conjunto de países literalmente com uma chance em um milhão! Albânia e Macedônia do Norte ganharam a Copa em UMA das simulações. Não dá para dizer a mesma coisa de Gana, Curaçao, Nova Zelândia, Jamaica, Haiti, Bolívia, Bósnia e Herzegovina, Irlanda do Norte e Kosovo (que conseguiu chegar em UMA final).
Também encontramos as cinco finais mais prováveis para a Copa de 2026:
- Argentina x Espanha - 5,60%
- Argentina x França - 4,52%
- Espanha x Inglaterra - 3,86%
- França x Inglaterra - 3,68%
- Espanha x França - 3,40%
Os times mais prováveis a eliminar o Brasil na Copa são:
- Holanda - 15,15%
- França - 10,44%
- Japão - 8,62%
O Brasil tem a probabilidade de ser eliminado nas seguintes fases:
- Fase de Grupos: 8,08%
- Fase 16 avos: 33,60%
- Fase de Oitavas: 22,09%
- Fase de Quartas: 18,30%
- Fase de Semifinal: 10,70%
- Vice Campeonato: 2,46%
- Campeão: 4,76%
Temos quase a mesma probabilidade de ser chegar até a semifinal do que ser eliminado na primeira fase. Chegando nas finais, temos mais chance de ser campeão do que ficar com o vice.
Foi um exercício bacana, mas teremos evoluções até o começo da Copa em junho do ano que vem. Teremos a definição das últimas vagas de repescagem e teremos vários encontros preparatórios entre as equipes, o que vai gerar mudanças na pontuação. Refaremos a análise no início de junho!