Ciência de dados e a previsão para o fim da pandemia da Covid 19
Assim como as ciências básicas (matemática, biologia, química, física, dentre outras), que nos permitem descrever detalhadamente a natureza, a análise de dados desempenha um papel fundamental na produção de novos conhecimentos e na descrição de alguns fenômenos. E com o avanço da tecnologia e do conhecimento, é possível aplicar as ciências básicas na análise de dados e começar a explicar, modelar e prever o curso da disseminação de doenças.
O Covid Lake, criado e executado por especialistas voluntários e sem fins lucrativos, nasceu da necessidade de se criar um projeto com componentes open-source e apoiado por empresas de base tecnológica, para proporcionar à sociedade um Lago de Dados com informações públicas e privadas da saúde, começando pela pandemia do novo Coronavírus.
O projeto iniciou-se durante a pandemia do COVID-19, mas não se limita a ela. A ideia central do projeto é que outras doenças sejam integradas e que o acesso aos dados seja patrocinado por entidades públicas e privadas de forma vitalícia.
Todos os dados são armazenados em nuvem. A arquitetura do projeto prevê em um segundo momento uma redundância através da disponibilização dos dados em três nuvens principais de mercado. Com a correta utilização dos créditos, o projeto permitirá o acesso a todos os pesquisadores ou profissionais de dados que queiram investigar os dados de saúde armazenados no COVID Lake.
A proposta é analisar e modelar o comportamento e evolução da Covid-19 ao longo do tempo no Brasil, mas, cabe ressaltar que o grande desafio desses modelos estatísticos se encontra na estimação dos parâmetros.
No caso do modelo SIR, a capacidade de infecção e a letalidade da doença, que podem variar com as condições gerais de saúde da população, permanecem constantes. Se as condições mudarem, é preciso recalcular os parâmetros.
Assim, esse modelo é confiável apenas considerando um pequeno número de casos. O modelo estatístico utilizado pelo HealthLake, o de Ondas de Contágio (OC), traz uma nova abordagem, com insights para próximos estudos desse tipo. Com apenas três parâmetros, pode-se ajustar o modelo para quantas ondas de infecção forem observadas.
No artigo Comparação dos modelos SIR e de ondas de contágio é possível acompanhar, com detalhes, o desenvolvimento do novo modelo que pode ser utilizado para prever as características do Covid-19 e o nível de contágio da população nas diferentes fases da epidemia, além da comparação com modelos de análise tradicionais.
Um dos resultados mais importantes do modelo Ondas de Contágio é a previsão do fim da pandemia em um cenário em que as taxas de contágio e mortes se mantenham as mesmas, descartando a possibilidade de uma vacina e de novas medidas para tratamento e contenção da doença. O gráfico a seguir mostra este resultado (atente para as datas!).
De acordo com o modelo, até dia 26 de fevereiro de 2021, haverá uma redução significativa nos óbitos que nos aproximaria de um “marco zero”, sem expectativa de crescimento. Importante ressaltar que o modelo tem sido ajustado diariamente e é possível checar as novas previsões com o Covidômetro.
Para conhecer o trabalho da equipe de voluntários, acesse https://www.covidlake.com.br/voluntarios.
Para ser apoiador, acesse https://www.covidlake.com.br/sejaapoiador.