O modelo SIR e o achatamento da curva

Há anos que eu penso em começar um blog para falar sobre biologia teórica, estatística, matrizes e outras coisas divertidas. Mas sempre fiquei adiando. Eis que chega uma epidemia e, subitamente, eu tenho tempo, dificuldade de me concentrar nas minhas obrigações e coisas relevantes sobre matemática e biologia teórica para compartilhar com o mundo.

Então, hoje é dia de falar sobre o modelo SIR, sigla para suscetíveis, infectados e recuperados (ou, em inglês, susceptible, infected, recovered). E vamos usar esse modelo simples para aprender um pouco sobre o famoso “achatamento da curva”. Note que o objetivo desse texto não é fazer previsões sobre o que vai acontecer em nossa população nas próximas semanas ou meses. Eu só quero ensinar algo sobre modelos epidemiológicos e sobre o fenômeno do achatamento da curva para vocês. Antes disso, vou explicar de onde eu vim, o que é um modelo e porque modelos são úteis. Se você não estiver interessado, só pule até o item “O Modelo SIR”.

Para que você possa acreditar no que eu estou dizendo, vou dar uma leve carteirada: eu sou biólogo, mestre e doutor e ecologia e pesquisador na área de comportamento animal. Fiz a graduação em biologia e o mestrado na UNICAMP, e cursei o doutorado na USP. No momento, sou pesquisador de pós-doutorado na USP. O que quer dizer que eu tenho um contrato temporário de pesquisador. Não sou especializado em epidemiologia nem na área da saúde. Sou um “comportamentólogo”, afinal de contas. Mas já estudei um pouco sobre modelos epidemiológicos e trabalho muito mais com bioestatística e modelagem do que no campo, efetivamente. Em resumo, eu sou um biólogo que gosta de números e programas de computador e que leu um pouco sobre epidemiologia ao longo dos últimos anos. Sei o suficiente para ensinar algumas coisas, e é isso que eu quero fazer com esse texto.

Mas o que eu quero dizer com palavras como “modelo” ou “modelagem”?

As palavras “modelo” e “modelagem” podem ter muitos significados em nossa linguagem corrente, do dia a dia. Nesse texto, vamos falar sobre algo que é um modelo teórico ou modelo científico. Nesse contexto, um modelo é uma versão idealizada e simplificada de um sistema real mais complexo. Ficou confuso? Deixa que eu explico. Para a gente aqui, nesse texto, um modelo é como uma pequena máquina. Uma máquina feita de ideias, equações e, às vezes, até um programa de computador. Nessa máquina, entram ideias, que nós chamamos de premissas. Essas premissas são proposições sobre como nosso sistema real funciona. Dessa máquina saem previsões sobre como o sistema real deve se comportar. Modelagem, então, é o exercício de construir essas máquinas e analisar suas previsões.

Mas como saberemos se essas previsões são, realmente, totalmente corretas?

Essa é a pegadinha dos modelos, nenhuma previsão é totalmente correta. Cada previsão é a consequência algorítmica e matematicamente fria das premissas que incluímos no modelo. Logo, só podemos fazer previsões totalmente precisas e acuradas em situações extremamente controladas, o que normalmente só existe dentro do laboratório ou em cenários muito especiais. Se quisermos fazer previsões sobre um sistema complexo como um país inteiro, precisaremos ou de um modelo absurdamente complexo, ou teremos de nos contentar com previsões mais vagas.

Nesse caso, para que serve a modelagem então?

Existe uma frase famosa, atribuída ao químico e estatístico George E.P. Box que diz:

_ Todos os modelos estão errados, mas alguns são úteis.

O que isso quer dizer? Que mesmo que as previsões do nosso modelo não sejam totalmente corretas, com acurácia e precisão super altas, essas previsões podem nos ajudar a entender o mundo à nossa volta. E com essa compreensão, podemos tomar decisões mais acertadas. Por exemplo, os modelos aerodinâmicos que nos permitiram inventar o avião, no início do século XX, não explicavam o voo de insetos parrudos como as abelhas mamangavas. Por décadas, o voo desses insetos lindamente rechonchudos foi um mistério. Até a comunidade científica desenvolver modelos aerodinâmicos melhores. A compreensão do início do século XX, que permitiu a invenção do avião, não era totalmente correta, mas também não era errada. Foi apenas incrivelmente útil.

(Mais informações sobre a história do voo das mamangavas https://www.livescience.com/33075-how-bees-fly.html)

Uma linda, peludinha e rechonchuda mamangava que eu encontrei em 2017 no orquidário do Museu da Amazônia, em Manaus.

Agora então, estamos prontos para o modelo SIR.

O Modelo SIR

O modelo SIR, como todo modelo (conforme aprendemos acima), é uma representação simplificada de um sistema complicado, nesse caso, uma população por onde uma doença infecciosa está se espalhando. Este é um dos modelos mais clássicos de toda a epidemiologia, e pertence a um grupo de modelos conhecidos como modelos de compartimentos, em que a população é dividida em dois ou mais compartimentos (ahá!) ou grupos de pessoas.

Nesse caso, os compartimentos são: (S) suscetíveis, as pessoas saudáveis que podem pegar a doença; (I) os infectados, que estão doentes e podem espalhar a doença; e (R) os recuperados que se tornaram imunes à doença. Este modelo não é o ideal para modelar uma epidemia do coronavírus (SARS-CoV-2 ou Covid-19, aqui, vou chamar só de corona mesmo), mas, conforme aprendemos com o George Box, um modelo simplificado ainda pode nos ensinar alguma coisa. Além de poder servir de base para modelos mais complexos e aplicáveis ao caso do corona.

Continuemos com o SIR então. Lembra que eu disse que um modelo tem premissas? Pois bem, essas são as principais premissas no nosso modelo:

  • a população é composta de um número N de pessoas
  • a infecção passa de pessoas Infectadas para pessoas Suscetíveis quando elas se encontram
  • os encontros são totalmente ao acaso (é como se a população se misturasse aleatoriamente o tempo todo).
  • os Infectados passam para o grupo dos Recuperados a uma taxa constante
  • Recuperados não podem ser mais infectados (ganham imunidade).
  • Nessa versão simplificada do modelo, ninguém morre da doença

Como eu tinha dito, são premissas simplificadas e que não levam em consideração que os doentes podem ter comportamentos que aumentem ou diminuam sua taxa de transmissão. Mas, é um bom começo para quem quer brincar de epidemiologia.

Continuemos com o SIR então. O modelo é composto por três equações, mas não precisa ter medo delas, eu vou explicar com calma e vai dar para entender a conclusão mesmo se você não entender as equações. Cada equação, descreve uma taxa de variação ao longo do tempo, ou de mudança ao longo do tempo se você preferir. Elas são as chamadas equações diferenciais, porque representam o quanto algo muda (fica diferente) ao longo do tempo. dS/dt, por exemplo, representa o quanto o S fica diferente ao longo do tempo t. As equações tem a seguinte carinha:

Equações diferenciais do modelo SIR – Suscetíveis (S), Infectados (I) e Recuperados (R). Cada equação representa uma taxa de variação ao longo do tempo. O beta mede a taxa de transmissão, e o gama a de recuperação. A figura foi feita com a ajuda desse estrogonóficamente maravilhoso site: https://www.codecogs.com/latex/eqneditor.php?lang=pt-br

Nessas equações: S é o número de suscetíveis, I são os infectados (doentes), R são os Recuperados (imunes), e N é o tamanho populacional total (N = S + I + R). O beta (o B esquisito) é uma medida de taxa de transmissão, pode ser interpretado como o número de pessoas que um infectado encontra, em média, por unidade de tempo. O gama (a outra letra esquisitinha) é a taxa de recuperação, ele é igual a 1 dividido pelo tempo médio que alguém demora pra se recuperar. Aqui, nesse exercício, vamos considerar dias como nossa unidade de tempo. (O tempo é contínuo nesse tipo de modelo, mas ainda assim, podemos estabelecer nossa unidade de tempo, e vamos estabelecer a unidade como dias). O que essas equações dizem, simplificando, é:

  • pessoas Suscetíveis se tornam Infectadas a uma taxa que aumenta com o número de Suscetíveis, o número de Infectados e a taxa de encontro entre eles.
  • Infectados se tornam Recuperados a uma taxa constante.
  • Recuperados só continuam de boa vivendo suas vidas.

OK! Depois de tanta explicação, o que vamos fazer com isso!?

Com essas lindas equações, e da posse do programa de computador adequado, podemos fazer o que se chama de solução numérica do modelo. Isso quer dizer que vamos escolher um valor de beta (a taxa de infecção), e um gama (a de recuperação), escolher números iniciais de S, I e R, e então ver o que acontece com a população, ou seja, ver como os números de S, I e R mudam ao longo do tempo. Logo, a solução numérica é uma pequena simulação de um mundo simplificado.

Esse é o link para o meu github onde tem o script em linguagem R que eu usei para rodar a solução numérica e gerar os gráficos: https://github.com/danilogmuniz/epidemiology. O R é uma linguagem de programação voltada para cientistas e estatísticos que permite fazer milhões de coisas legais, incluindo soluções numéricas de equações diferenciais e gráficos bonitinhos. O R é totalmente livre e gratuito e você pode obter mais informações sobre ele aqui: https://www.r-project.org, e por toda a internet (sério, a comunidade do R é muito ativa e tem milhões de materiais disponíveis por aí).

Então, gráficos! Finalmente! Nosso primeiro gráfico mostra o número de Suscetíveis, Infectados (doentes) e Recuperados ao longo de 200 dias no seguinte cenário: 1 milhão de suscetíveis iniciais, 3 infectados, nenhum recuperado, taxa de transmissão igual a 1 (cada infectado infecta uma pessoa por dia, em média) e recuperação igual a 1/15 (15 dias de recuperação, em média). Eu escolhi esses números inspirado pelo que aparentemente acontece com o corona, mas são números muito aproximados e o modelo é super simples. Nosso objetivo aqui é aprender, não prever o futuro. Pois bem, ao gráfico:

Solução numérica do modelo epidemiológico SIR com beta = 1, gama = 1/15 e os seguintes valores iniciais: S = 1 milhão, I = 3, R = 0.

Note como o número de doentes cresce super rápido! O pico da epidemia ocorre na tarde do dia 17. O número de doentes cai rapidamente depois mas, por algum tempo, a população é composta majoritariamente de doentes. No pico da epidemia simulada, temos 7% de suscetíveis, 18% de recuperados e 75% da população está doente. Ao final dos 200 dias, temos ainda 4 infectados e todo o resto da população é de recuperados. TODO MUNDO ficou doente em algum momento. Como esse modelo é simplificado, e não inclui mortes por doença nem consequências de uma sociedade sem pessoas saudáveis, no final, dá tudo certo e todo mundo fica imune. Então entenda esse gráfico não como uma previsão, mas como uma parábola, uma história que nos ensina uma lição. E a lição é:

(LIÇÃO NÚMERO 1) Se a taxa de encontro entre as pessoas é alta, uma infecção vai atingir muita gente, muito rápido, e muita gente vai ficar doente ao mesmo tempo.

O modelo não nos diz as consequências disso, são só três equações afinal de contas. Deixo as consequências para a sua imaginação.

Agora, vamos criar um cenário diferente, com todos os mesmos parâmetros, mas com uma taxa de infecção cinco vezes menor ou 1/5. Nesse cenário, cada infectado só infecta uma pessoa, em média, a cada cinco dias.

Solução numérica do modelo epidemiológico SIR com beta = 1/5, gama = 1/15 e os seguintes valores iniciais: S = 1 milhão, I = 3, R = 0.

Note como a curva vermelha, dos infectados, se “achatou”. Agora, o número de doentes está muito mais “espalhado” no tempo. O pico da epidemia agora ocorre na manhã do dia 102, e a população tem cerca de 30% de doentes nesse momento. 30% de pessoas doentes ainda é muito, é muito mais do que o sistema hospitalar de qualquer país consegue suportar, mas é melhor que 75%. Note também que essa população teria mais tempo para se preparar, com o pico da doença ocorrendo mais de 3 meses depois do início da epidemia. Mas note que, mesmo dividindo o contato (contágio) por cinco, quase todo mundo ainda fica doente, e o número máximo de doentes cai mais ou menos pela metade. Ou seja, mesmo medidas que parecem grandes, podem não ter um efeito tão forte. Finalmente, note que a linha azul, dos saudáveis que nunca entram em contato com o vírus, agora é claramente diferente de zero no dia 200. Mas eles ainda são só 6% da população, 93,7% das pessoas chegam no dia 200 imunes após terem ficado doentes, 0,3% de nossa população simulada ainda está doente no dia 200. Mesmo dividindo o contágio por cinco, quase todo mundo, cedo ou tarde, fica doente. Mas lembre-se que, nesse modelo, ninguém consegue se isolar totalmente, e todos os suscetíveis acabam encontrando um infectado em algum momento.

Novamente, esse é o modelo epidemiológico mais simples do mundo. O que eu mostro aqui são lições, e não previsões. E as lições são:

(LIÇÃO NÚMERO 2) reduzir o contato entre as pessoas “achata” a curva, tornando a situação menos apocalíptica, mas ainda longe de ser tranquila.

(LIÇÃO NÚMERO 3) mesmo com contato reduzido, o total de pessoas que fica doente ainda é alto.

Ou seja, se quisermos mesmo parar uma infecção que se espalha rapidamente de pessoa para pessoa, precisamos manter as pessoas REALMENTE isoladas umas das outras. Eu não vou, aqui, mostrar cenários com contágio bem menor, porque eles podem nos enganar. No mundo real, alguns doentes vão espalhar a doença para dezenas de pessoas, enquanto outros não vão espalhar pra ninguém. E essa variação pode ter consequências drásticas, que estão muito além do modelo simples que aprendemos hoje. Ainda assim, acho que podemos aprender algo com o modelo SIR. Mesmo nesse cenário simples, podemos ver o fenômeno do achatamento da curva que todo mundo tem falado na mídia. E podemos ver que, realmente, diminuir o contato entre as pessoas (e o contágio) achata a curva. Mas precisamos de muita redução de contato para realmente ter um efeito na curva de número de doentes. Por fim, vamos dar uma última olhada nas curvas de número de doentes nos dois cenários (note o achatamento):

Comparação entre dois cenários diferentes do modelo SIR. Em ambos, gama = 1/15, no alto contato: beta = 1, no contato reduzido: beta = 1/15.

Então, isole-se. Cuide de você e daqueles à sua volta. O isolamento vai proteger você, seus vizinhos, seus familiares e seu país. Você torce pelo Brasil? Isole-se. É o melhor que você pode fazer para proteger seus compatriotas e o futuro de sua nação.

3 comentários em “O modelo SIR e o achatamento da curva

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Crie um novo site no WordPress.com
Comece agora
%d blogueiros gostam disto: