O Governo do Estado de Santa Catarina, em parceria com o Centro de Informática e Automação do Estado de Santa Catarina (CIASC) tem trabalhado para criar tecnologias que gerem inteligência através de dados e possam ser utilizadas pelos profissionais da Secretaria de Estado da Saúde (SES) no enfrentamento à pandemia da COVID-19.
Uma ferramenta central para isso se chama BoaVista. A Plataforma BoaVista, do CIASC, é uma tecnologia de Big Data utilizada para tratar de dados fornecidos por múltiplos bancos de dados e gerar informações úteis para os gestores da administração pública. O trabalho com a plataforma voltado para o enfrentamento da pandemia é realizado pelo Núcleo Intersetorial de Inteligência de Dados (NIID), que inclui diversos órgãos públicos, além de algumas entidades privadas que têm trabalhado junto ao governo de forma voluntária neste momento de necessidade. Embora esse fornecimento de dados por múltiplas fontes diferentes seja uma parte muito importante das tecnologias de Big Data, por conta da variabilidade dos dados, é uma questão que também gera um desafio: é comum que duplicidades nos dados aconteçam.
A equipe da Diretoria de Vigilância Epidemiológica (DIVE) da SES trabalha em uma das frentes da ferramenta, a qual consolida as bases de dados de vigilância que permitem as análises do perfil epidemiológico da doença no estado de Santa Catarina.
A integração dos sistemas RED CAP, e-SUS VE, SIVEP-Gripe, GAL (Lacen) e da plataforma SC Digital (Laboratórios privados) na plataforma BoaVista aprimorou a capacidade de análise do estado sobre a pandemia da Covid-19. Essa integração que passou a existir na plataforma é resultado do trabalho conjunto entre CIASC e SES. Para Fernanda Melo, coordenadora do Centro de Informações Estratégicas em Vigilância em Saúde (CIEVS) da DIVE, o Boa Vista é um grande aliado. “Temos um fluxo enorme de dados que são gerados todos os dias, com a plataforma podemos trabalhar nas investigações dos casos e óbitos com mais agilidade e precisão. Os dados são a principal informação para a tomada de decisões para frear a disseminação viral e diminuir o número de pessoas com a doença”, afirma.
O médico infectologista Fábio Gaudenzi relata que o BoaVista facilitou o trabalho da pesquisa e análise de dados para um controle mais efetivo da pandemia. “As informações são de grande importância neste momento da pandemia. A plataforma é um conjunto de informações que são usadas para as avaliações de risco e analises das equipes da saúde, e consequentemente se faz presente do trabalho diário. Buscamos colaborar para que a plataforma melhore cada vez mais”, finaliza.
Estes dados são publicados também numa estrutura de dados abertos, permitindo que pesquisadores e a comunidade possam fazer uso desta ferramenta.
Automatizando a busca por registros duplicados
Esse algoritmo usa o conceito Distância de Jaro-Winkler para comparar dois elementos, nesse caso os nomes das pessoas. Isso permite que a ferramenta identifique, por exemplo, que a diferença entre o nome João da Silva e o nome José de Souza é muito grande, enquanto a diferença entre o nome João da Silva e o nome Joao Silva é muito pequena. O algoritmo registra esses casos em que a diferença entre os nomes é muito pequena e gera um relatório com esses prováveis casos de duplicidade. Esse relatório é enviado pelo CIASC para a Diretoria de Vigilância Epidemiológica (DIVE), permitindo que eles precisem apenas confirmar os casos de provável duplicidade do relatório, ao invés de ficar buscando duplicidade em todas as listagens de todos os bancos de dados, manualmente.
Segundo Raphael Tucunduva, gerente de serviços corporativos do CIASC, “esse é um trabalho de melhoria constante, conforme a equipe da Vigilância Epidemiológica vai utilizando o BoaVista, eles vão nos dando feedback das necessidades que vão sentindo, e a partir disso nós buscamos como aperfeiçoar a plataforma”. Esse trabalho de qualificação dos dados feito pela DIVE é essencial para que as equipes que vão tratar esses dados depois, e os próprios gestores do poder público que vão usá-los para definir as políticas públicas de enfrentamento à pandemia, façam uma boa governança de dados. Isso porque a governança de dados exige que esses dados sejam o mais claros e corretos possível.