Metodologias de extração, modelagem e análise de informações e dados foram alguns dos tópicos abordados no seminário do Centro de Estudos sobre Ciência de Dados Aplicada à Saúde, realizado na terça-feira, 18 de outubro, no Salão de Leitura da Biblioteca de Manguinhos. Além do lançamento da Plataforma de Computação Científica de Dados em Saúde (leia mais ao lado), o evento trouxe experiências práticas sobre as principais ferramentas e técnicas em uso atualmente nesse campo.
Os palestrantes apresentaram temas inerentes a ciência de dados, como big data, mineração de dados e aprendizagem de máquina. O assunto foi apresentado pelo cientista de dados Mário Filho, consultor em machine learning. “Não é nenhuma mágica, trata-se apenas novas de novas ferramentas”, apontou. Elas buscam desenvolver algoritmos e técnicas que permitam o computador aprender tendências, aperfeiçoando seu desempenho em determinadas tarefas.
O convidado explicou que para um projeto de ciência de dados ter sucesso é fundamental atender alguns critérios, como utilizar dados corretos e variáveis relevantes ao problema a que se busca solucionar, além de uma validação correta e modelos de dados confiáveis. No campo da saúde, Filho descreveu projetos que já aplicam ciência de dados em suas análises, como no Egito, onde se buscou a predição de locais com presença de mosquitos na bacia do Rio Nilo, para ações de prevenção.
Mário Filho é cientista de dados e competidor frequente da plataforma Keggle. Foto: Raquel Portugal - Multimeios/Fiocruz.
O responsável pela Tecnologia da Informação da plataforma científica SciElo, Fábio Batalha, apresentou como foi utilizada a metodologia Elasticsearch para a construção de indicadores de uso, publicação e impacto do repositório. Essas ferramentas possibilitaram a remodelagem da infraestrutura de indicadores, possibilitando o rastreamento de citações, a entrega de contextualizações desses dados e marcadores e compartilhamento. “Usamos diferentes módulos de metadados por diferentes algoritmos que podem ser disponibilizados ao público por meio de APIs (interfaces de programação)”, explicou. A ferramenta é pública e o código está disponível pelo GitHub.
Sobre as possibilidades do uso de machine learning em pesquisas de saúde no Brasil, a pesquisadora Hellen Geremias dos Santos, do Laboratório de Big Data e Análise Preditiva em Saúde da Universidade de São Paulo, enxerga bastante potencial. “Predição ainda é um assunto muito novo no campo da saúde”, avaliou. Uma das técnicas citadas foi a superlearner, descrita por Sheri Rose, que correlaciona sete variáveis preditoras e doze algoritmos de predição, aplicando diferentes métodos simultaneamente para uma mesma estimativa.
Outro uso de ciência de dados abordado foi o conjunto de ferramentas da IBM para análise de sentimento. Com ele, é possível avaliar tendências em redes sociais, por exemplo, como o estudo em andamento em parceria com a Fiocruz, que investigou a percepção da população sobre o vírus zika.
“Fizemos filtragens para separar conteúdos irrelevantes, como spam. Apesar disso 85% dos dados mostraram-se relevantes”, revelou Paulo Cavalin, pesquisador da IBM Research Brasil. De junho de 2015 a outubro de 2016, o estudo encontrou 190 mil impressões sobre o assunto. Márcia Ito, também do IBM Research, demonstrou o uso de dados na investigação do cuidado a pacientes com doenças crônicas.
Por fim, o representante da Dell EMC, Fred Arruda, apresentou algumas iniciativas da companhia realizadas em parceria com a Prefeitura do Rio de Janeiro, que utilizam big data. “No centro de operações da cidade trafega um volume de dados absurdo. Agora eles são tratados em tempo real”, explicou. A parceria inclui ações nas áreas de mobilidade urbana e de planejamento de megaeventos, como os últimos Jogos Olímpicos. As palestras foram seguidas de debate, sob mediação de Fábio Porto, do LNCC.
Links
[1] https://www.icict.fiocruz.br/../..
[2] https://www.icict.fiocruz.br/arquivo-de-noticias
[3] https://www.facebook.com/sharer.php?u=https%3A%2F%2Fwww.icict.fiocruz.br%2Fprint%2F3258
[4] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_02_0.jpg
[5] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_03_0.jpg
[6] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_04_0.jpg
[7] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_05_0.jpg
[8] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_07_0.jpg
[9] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_08_0.jpg
[10] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_09_0.jpg
[11] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_10_0.jpg
[12] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_14_0.jpg
[13] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_17_0.jpg
[14] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_18_0.jpg
[15] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20Ci%C3%AAncia%20de%20dados%20aplicada%20%C3%A0%20sa%C3%BAde_20_0.jpg
[16] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20DSC_0895_1.jpg
[17] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20DSC_0896_1.jpg
[18] https://www.icict.fiocruz.br/sites/www.icict.fiocruz.br/files/%5Bp%5D%20DSC_0903_2.jpg
[19] https://www.icict.fiocruz.br/javascript%3Avoid%280%29%3B
[20] https://www.icict.fiocruz.br/node/3256
[21] https://www.icict.fiocruz.br/node/2101
[22] https://www.icict.fiocruz.br/node/2316
[23] https://www.icict.fiocruz.br/node/2854
[24] https://www.icict.fiocruz.br/www.bigdata.icict.fiocruz.br