Estamos atualmente no segundo ano da pandemia do coronavírus. É óbvio que as instituições não estão preparadas para enfrentar condições extremas por um período prolongado, e as pessoas também não. Embora haja uma grande comunidade de paranoicos nos EUA prontos para sobreviver à extinção da civilização, no Brasil esse cenário não é algo que consideramos quando pensamos no futuro.
O Brasil é um país de dimensões continentais, com mais de 220 milhões de habitantes espalhados por 8,5 milhões de quilômetros quadrados. Deve haver alguns lugares sombrios e esquecidos onde seria possível sobreviver a um evento de extinção. São mais de cinco mil cidades, e analisaremos diferentes tipos de dados para determinar os melhores lugares para aproveitar o fim do mundo.
Depois de classificar as cidades da melhor para a pior, tentaremos otimizar nossa rota de fuga, escolhendo nossa cidade inicial e definindo a sequência de cidades para chegar ao nosso destino final.
Definição do problema
Existem diversas causas para um apocalipse, e as pessoas estão cada vez mais criativas. Zumbis, guerra nuclear, grandes asteroides, vírus mortais, aquecimento global, vulcões em erupção, terremotos massivos, invasão alienígena! Embora existam enormes variações em cada um desses cenários, podemos buscar algumas informações que nos ajudarão, não importa o que aconteça.
Locais lotados devem ser evitados, a comida deve ser abundante e a água fresca deve estar disponível. Também precisamos de medicamentos para curar e prevenir doenças, e armas de fogo para proteção. Seria inteligente ficar longe de usinas nucleares, mas a energia solar pode ser útil. Temperaturas médias em torno de 22 graus Celsius são uma boa opção. Estar perto de um aeroporto deve ser interessante, mesmo que pequeno, para uma escapada rápida, se você conseguir encontrar e pilotar um avião.
Também deveríamos nos preocupar em aprender novas habilidades para sobreviver e talvez reconstruir a civilização, por isso também estamos analisando bibliotecas e universidades.
Carregaremos dados que ajudam a determinar o potencial de cada cidade para atender a um desses requisitos, descrevendo sua origem e como criamos uma métrica para classificar as cidades. Após processar todas essas informações, nosso conjunto de dados final será uma tabela onde cada linha representa uma cidade e cada coluna mostrará uma pontuação entre 0 e 1 para uma determinada característica. Nossa última característica será a soma de todas as pontuações, e classificaremos as cidades de acordo com essa métrica. Esperamos ter um vencedor claro para todo o país.
Também temos uma lista de cidades vizinhas para cada local. Assim, podemos mapear uma rota de qualquer lugar até o nosso santuário ou tentar encontrar o melhor local a uma certa distância de um ponto de partida.
A característica comum a todos os dados será um ID fornecido pelo Instituto Brasileiro de Geografia e Estatística (IBGE) . Esse ID único tem seis dígitos, mas às vezes os bancos de dados adicionam um número extra no final.
Extração, Transformação e Carregamento dos Dados
Estamos reunindo aqui diversas informações diferentes para cada cidade brasileira. Todas foram reunidas após uma longa e árdua busca em diversos sites governamentais e outras fontes. Listaremos aqui as fontes utilizadas e as informações relevantes que nos interessam. Alguns dados foram processados antes de serem carregados aqui, devido a erros de digitação ou informações claramente incorretas (Porto Alegre foi colocado no RN em um dos arquivos).
Atlas do Desenvolvimento Humano Brasileiro 2013 , disponível no Atlas Brasil . Aqui, obtemos o ID da cidade, a população da cidade e o componente Saúde para o IDH de 2010.
Dados territoriais do IBGE – Instituto Brasileiro de Geografia e Estatística , disponíveis em Áreas Territoriais . Isso nos dá a área de cada cidade.
Tabnet – DataSUS , no Tabnet . Temos o número de leitos hospitalares disponíveis em cada cidade.
Agência Nacional de Energia , aqui . Aqui temos os dados com a localização e a produção de energia de todas as usinas do país. Aqui, manteremos apenas quatro tipos de produção de energia: solar, eólica, biomassa e nuclear. A energia solar é fácil de manter, a biomassa é uma boa alternativa, as turbinas eólicas devem funcionar por muito tempo sem manutenção e a energia nuclear deve ser o mais distante possível, pois pode falhar sem os devidos cuidados. As usinas hidrelétricas são muito complexas para manter e as termelétricas dependem de combustível.
O INPE – Instituto Nacional de Pesquisas Espaciais divulgou o Atlas Brasileiro de Energia Solar de 2017. Nele, obtemos a incidência solar que será usada para o Índice Climático e também as coordenadas geográficas de cada cidade.
Forest-GIS , aqui . Temos as informações climáticas de cada cidade: a temperatura média e o desvio padrão ao longo do ano, a precipitação e a altitude.
SIDRA, Sistema de Recuperação Automática do IBGE , com duas entradas, uma para a produção em fazendas permanentes e outra para as produções temporárias. A informação que buscamos aqui é a área que está sendo usada para plantações, e usaremos isso como um proxy para determinar o quão fértil é a região ao redor da cidade.
Pesquisa de Informações Básicas Municipais (MUNIC) – IBGE , disponível aqui . Não encontramos informações sobre posse de armas, portanto, usaremos o número de delegacias de polícia como proxy.
A Wikipédia tem muita informação para processar. Aqui, estamos interessados na lista de Bases Militares e Aeroportos.
Censo do Ensino Superior – IBGE , disponível aqui , com as informações de todas as entidades cadastradas como Ensino Superior no Ministério da Educação.
O Sistema Nacional de Bibliotecas Públicas possui um site que reúne os dados das Secretarias Estaduais e de todas as bibliotecas públicas.
Basedosdados.org é uma ótima fonte de conjuntos de dados limpos, incluindo um com a lista de cidades vizinhas .
GeoDataBR é um projeto do GitHub que oferece arquivos geojson com o formato das cidades brasileiras.
Das 5.565 cidades, temos todas as informações para 5.532. Isso representa 99,6% da área do país, então podemos presumir que nossos resultados não serão prejudicados por isso.
Criação do Índice de Sobrevivência Humana – HSI
Seguindo o exemplo do Índice de Desenvolvimento Humano, vamos criar vários subíndices relacionados a aspectos importantes necessários para nossa sobrevivência.
Índice de População – Este é bem simples: precisamos encontrar lugares com pouca população. A partir da população e da área, calculamos a densidade populacional de cada cidade.
Índice de Produção de Alimentos – Para sobreviver, precisamos cultivar nossas próprias plantações. Nosso índice será a porcentagem da área da cidade destinada à agricultura.
Índice Climático – 1) Nossa temperatura ideal é de 23 graus Celsius; 2) pequenas variações de temperatura; 3) precipitação; 4) incidência solar.
Índice de isolamento – quão difícil é alcançá-lo, com base em suas altitudes e nas de seus vizinhos.
Índice de Conhecimento – quão próximas estão as bibliotecas e as universidades
Índice de Escape – quão perto está o aeroporto mais próximo
Índice de armas de fogo – quantas delegacias de polícia e bases militares estão próximas
Índice de Energia – disponibilidade de fontes de energia sustentáveis
Estamos prontos para criar nosso Índice de Sobrevivência Humana final! Temos oito componentes, divididos em dois grupos: os " indispensáveis " (Pessoas, Alimentação, Clima e Isolamento) e os " desejáveis " (Conhecimento, Fuga, Armas de Fogo e Poder). Nosso HSI será a média ponderada de todos os índices, com o primeiro grupo valendo o dobro.
Estamos prontos para criar nosso Índice de Sobrevivência Humana final! Temos oito componentes, divididos em dois grupos: os " indispensáveis " (Pessoas, Alimentação, Clima e Isolamento) e os " desejáveis " (Conhecimento, Fuga, Armas de Fogo e Poder). Nosso HSI será a média ponderada de todos os índices, com o primeiro grupo valendo o dobro.
Nosso Índice de Sobrevivência Humana final
Atualmente moro no Rio de Janeiro, que é a 2.736ª cidade no ranking do HSI.
Pontuações do Rio de Janeiro
Nem ótimo, nem terrível. O Rio de Janeiro está na primeira metade da nossa lista, mas vemos que três dos nossos " indispensáveis " estão com índices zero ou muito baixos. Parece que, quando os índices individuais não estão zero, eles estão muito altos.
Distribuição do HSI para todas as cidades do Brasil
Planejando uma rota de fuga
Finalmente chegamos à parte divertida! Temos a pontuação HSI para todas as cidades e a lista de vizinhos. Uma cidade será selecionada como ponto de partida e, em seguida, simularemos um grande número de agentes tentando escapar de lá. Usaremos um método conhecido como recozimento simulado para otimizar nossa fuga. O algoritmo funciona da seguinte maneira:
Definimos uma série de etapas que a otimização tomará; A partir da cidade escolhida, criaremos uma lista de seus vizinhos; Selecionaremos aleatoriamente um dos vizinhos como alvo para um movimento, usando suas pontuações como pesos; Se a pontuação do alvo for maior que a nossa cidade atual, a movimentação é feita; Se a pontuação do alvo for menor que a cidade atual, há uma probabilidade de fazer a mudança de qualquer maneira, e isso depende da diferença entre as pontuações e de quantos passos foram dados pela otimização; Esse processo é repetido para cada etapa.
Este algoritmo é muito interessante porque permite que o sistema vá para cidades piores para explorar uma parte maior do domínio. Mas também reduz a probabilidade dessa movimentação à medida que o algoritmo é executado, o que faz com que o agente assuma mais riscos no início.
Teremos três resultados:
Um mapa de calor mostrando quantos agentes visitaram cada cidade;
A rota de fuga que termina com a maior pontuação de todas as simulações;
A evolução da pontuação para esta rota.
Esta pode não ser a melhor solução possível, pois é provável que haja alguns degraus sem movimento e que haja circuitos fechados antes de prosseguir. Também é possível chegar às cidades melhores e sair delas.
Todas as cidades visitadas pelos nossos agentes
Fugindo do Rio de Janeiro e indo para a cidade com maior pontuação visitada
Nossa simulação nos levou à décima cidade no ranking! Não é a solução ideal, mas chega perto.
Pontuações para Adolfo, nosso melhor resultado de simulação
Nosso caminho de otimização para a melhor rota encontrada
Conclusão
A maior parte da população vive em uma faixa estreita perto do litoral e nas áreas metropolitanas ao redor das capitais. Isso significa que devemos nos deslocar para o interior em busca de lugares com menos pessoas.
Há pouca ou nenhuma produção de alimentos nas capitais, que têm um ambiente mais urbano. Somado à maior densidade populacional, isso significa que haverá muita competição para obter os alimentos já disponíveis, portanto, não é uma boa ideia ficar em qualquer uma das capitais. A produção de alimentos do país concentra-se principalmente nas regiões sul e centro.
Não queremos enfrentar frio nem calor extremo, então devemos procurar um clima temperado. Parece que as regiões Centro-Oeste e Nordeste têm o clima mais estável e confortável.
O melhor lugar para se esconder será um lugar de difícil acesso e onde possamos ver o que está ao nosso redor. Isso significa o topo de uma montanha ou o fundo de um vale.
A maioria das cidades tem bibliotecas, mas as instituições de ensino superior estão localizadas principalmente nas cidades maiores, nas capitais e nos centros locais de cada estado.
Para uma escapada rápida, podemos contar com a grande quantidade de pequenos aeroportos espalhados pelo país, próximos aos polos de produção de alimentos, e também grandes aeroportos nas capitais.
Como esperado, quanto maior a cidade, mais armas estão disponíveis.
Quando consideramos fontes de energia renováveis, principalmente biomassa, energia solar e eólica, a região Nordeste é uma ótima opção. Também vemos a região central do país obtendo bastante eletricidade dessas fontes.
Para o nosso Índice de Sobrevivência Humana, reunimos todos esses dados e vemos que as melhores opções estão espalhadas pelo país, com muitas das melhores cidades na região central, mas com algumas boas opções no Nordeste e no Oeste. Embora as capitais tenham alguns dos índices mais altos, elas não são produtoras de alimentos e têm as maiores densidades populacionais, portanto, não são boas opções.
Conclusão final: Iniciamos nosso projeto reunindo diferentes conjuntos de dados que poderiam nos ajudar a descobrir a melhor cidade para onde correr caso haja algum tipo de Apocalipse no Brasil. Classificamos as cidades de acordo com um conjunto de parâmetros que consideramos necessários para garantir nossa sobrevivência em uma série de cenários possíveis de "fim da civilização como a conhecemos". Depois de calcularmos nossas pontuações para cada cidade, simulamos várias tentativas de fuga de uma cidade escolhida e mapeamos como elas se movem entre as cidades. Também salvamos a sequência de cidades que levam à maior pontuação após um número predefinido de etapas.