Especialistas em Ciência de Dados e Saúde discutem ferramentas e técnicas em Seminário do Centro de Estudos

por
André Bezerra
,
25/10/2016

Metodologias de extração, modelagem e análise de informações e dados foram alguns dos tópicos abordados no seminário do Centro de Estudos sobre Ciência de Dados Aplicada à Saúde, realizado na terça-feira, 18 de outubro, no Salão de Leitura da Biblioteca de Manguinhos. Além do lançamento da Plataforma de Computação Científica de Dados em Saúde (leia mais ao lado), o evento trouxe experiências práticas sobre as principais ferramentas e técnicas em uso atualmente nesse campo.

Os palestrantes apresentaram temas inerentes a ciência de dados, como big data, mineração de dados e aprendizagem de máquina. O assunto foi apresentado pelo cientista de dados Mário Filho, consultor em machine learning. “Não é nenhuma mágica, trata-se apenas novas de novas ferramentas”, apontou. Elas buscam desenvolver algoritmos e técnicas que permitam o computador aprender tendências, aperfeiçoando seu desempenho em determinadas tarefas.

O convidado explicou que para um projeto de ciência de dados ter sucesso é fundamental atender alguns critérios, como utilizar dados corretos e variáveis relevantes ao problema a que se busca solucionar, além de uma validação correta e modelos de dados confiáveis. No campo da saúde, Filho descreveu projetos que já aplicam ciência de dados em suas análises, como no Egito, onde se buscou a predição de locais com presença de mosquitos na bacia do Rio Nilo, para ações de prevenção.

Mário Filho é cientista de dados e competidor frequente da plataforma Keggle. Foto: Raquel Portugal - Multimeios/Fiocruz.

O responsável pela Tecnologia da Informação da plataforma científica SciElo, Fábio Batalha, apresentou como foi utilizada a metodologia Elasticsearch para a construção de indicadores de uso, publicação e impacto do repositório. Essas ferramentas possibilitaram a remodelagem da infraestrutura de indicadores, possibilitando o rastreamento de citações, a entrega de contextualizações desses dados e marcadores e compartilhamento. “Usamos diferentes módulos de metadados por diferentes algoritmos que podem ser disponibilizados ao público por meio de APIs (interfaces de programação)”, explicou. A ferramenta é pública e o código está disponível pelo GitHub.

Sobre as possibilidades do uso de machine learning em pesquisas de saúde no Brasil, a pesquisadora Hellen Geremias dos Santos, do Laboratório de Big Data e Análise Preditiva em Saúde da Universidade de São Paulo, enxerga bastante potencial. “Predição ainda é um assunto muito novo no campo da saúde”, avaliou. Uma das técnicas citadas foi a superlearner, descrita por Sheri Rose, que correlaciona sete variáveis preditoras e doze algoritmos de predição, aplicando diferentes métodos simultaneamente para uma mesma estimativa.

Outro uso de ciência de dados abordado foi o conjunto de ferramentas da IBM para análise de sentimento. Com ele, é possível avaliar tendências em redes sociais, por exemplo, como o estudo em andamento em parceria com a Fiocruz, que investigou a percepção da população sobre o vírus zika.

“Fizemos filtragens para separar conteúdos irrelevantes, como spam. Apesar disso 85% dos dados mostraram-se relevantes”, revelou Paulo Cavalin, pesquisador da IBM Research Brasil. De junho de 2015 a outubro de 2016, o estudo encontrou 190 mil impressões sobre o assunto. Márcia Ito, também do IBM Research, demonstrou o uso de dados na investigação do cuidado a pacientes com doenças crônicas.

Por fim, o representante da Dell EMC, Fred Arruda, apresentou algumas iniciativas da companhia realizadas em parceria com a Prefeitura do Rio de Janeiro, que utilizam big data. “No centro de operações da cidade trafega um volume de dados absurdo. Agora eles são tratados em tempo real”, explicou. A parceria inclui ações nas áreas de mobilidade urbana e de planejamento de megaeventos, como os últimos Jogos Olímpicos. As palestras foram seguidas de debate, sob mediação de Fábio Porto, do LNCC.

Comentar

Preencha caso queira receber a resposta por e-mail.

Galeria de fotos

Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz
Seminário de Ciência de Dados Aplicada à Saúde e lançamento de Plataforma de Computação Científica, no Icict/Fiocruz

Assuntos relacionados

Fiocruz disponibiliza Plataforma de Ciência de Dados Aplicada à Saúde

Serviço permite análise visual, mineração de dados e capacitação sobre o tema. Seu lançamento ocorreu em seminário

Grupo de Pesquisa da Fiocruz adota estratégia Big Data em Saúde

Com a iniciativa, pesquisa e gestão terão ferramentas para analisar grandes volumes de dados

Por dentro do GBD: Seminários do Icict discutem Carga Global de Doença

Eventos do Centro de Estudos realizaram debates aprofundados entre especialistas e pesquisadores da área estatística e de epidemiologia

Computação científica como estratégia de saúde pública

Plataforma de Big Data em Saúde tem como objetivo utilizar dados para identificar padrões de comportamento no surgimento de doenças

Para saber mais

Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
Av. Brasil, 4.365 - Pavilhão Haity Moussatché - Manguinhos, Rio de Janeiro
CEP: 21040-900 | Tel.: (+55 21) 3865-3131 | Fax.: (+55 21) 2270-2668

Este site é regido pela Política de Acesso Aberto ao Conhecimento, que busca garantir à sociedade o acesso gratuito, público e aberto ao conteúdo integral de toda obra intelectual produzida pela Fiocruz.

O conteúdo deste portal pode ser utilizado para todos os fins não comerciais, respeitados e reservados os direitos morais dos autores.

logo todo somos SUS