Pesquisadores e profissionais de saúde ganharam uma nova ferramenta para analisar grandes volumes de dados e conjuntos de informações sobre a área. A Plataforma de Ciência de Dados aplicada à Saúde é uma iniciativa do Icict/Fiocruz que disponibiliza para a comunidade científica e gestores um serviço online de armazenamento, gestão e análise de dados em saúde, possibilitando o uso de estratégicas como análise visual, mineração de dados, big data, aprendizagem de máquina, dentre outras.
“É um serviço de computação científica voltado para o setor de saúde”, explica o coordenador da plataforma, Marcel Pedroso, do Laboratório de Informação em Saúde (Lis/Icict). A partir de parcerias com o Laboratório Nacional de Computação Científica (LNCC) e a Dell EMC, o projeto utiliza conceitos de processamento distribuído, tornando a plataforma uma área de trabalho de alta capacidade para análise de dados.
A interface é dividida em três eixos: Análise visual, voltada para indexação, extração e análise visual de dados, por meio de ferramentas livres como Elasticsearch e Kibana; Mineração de Dados e Análise Preditiva, que permitirá ao pesquisador a conexão aos dados via R Studio Server; e Data Science Lab, que será uma área colaborativa para troca de experiências para inovação e aprendizagem na área de ciência de dados.
“Na prática, a plataforma permitirá aos pesquisadores uma capacidade avançada para processamento de algoritmos para análise desses grandes volumes de dados, não só da área de saúde, mas também de outras fontes como o IBGE, INPE, dentre outras, que sejam públicas e estejam disponíveis”, explica Pedroso. Além disso, os dados que já se encontram disponíveis passaram por tratamento de modelagem e indexação. No nível individual, os dados disponibilizados são anonimizados.
Marcel Pedroso, coordenador da Plataforma de Ciência de Dados em Saúde. Fotos: Raquel Portugal (Multimeios/Icict)
“A plataforma permitirá mais agilidade para a pesquisa, pois conta com um hardware bastante robusto e suporte constante”, aponta Jefferson Lima, tecnologista do Centro de Tecnologia da Informação e Comunicação (Ctic/Icict) e responsável pela governança de dados na plataforma. Sua instalação foi viabilizada por meio de parcerias e fomento do Programa de Indução à Pesquisa e Desenvolvimento Tecnológico (PIPDT/Icict) e FAPERJ.
Além da infraestrutura, a plataforma também tem o objetivo de ser um espaço para capacitação e especialização para a área de ciência de dados aplicada à saúde. Haverá uma equipe de referência composta por profissionais de diversas áreas, conforme a própria característica desse campo. “A Ciência de Dados é um campo de interseção entre a Estatística, a Computação e a área de interesse, no nosso caso, a saúde”, descreve o coordenador. Os membros receberão curso de capacitação com reconhecimento internacional e há previsão de abertura de um curso de especialização dessa área a ser oferecido pela Gestão Acadêmica do Icict.
A interface para a plataforma está disponível no site do projeto em bigdata.icict.fiocruz.br. Para acessar a plataforma, os interessados deverão realizar um cadastro no sistema, informando e-mail e criando uma senha de acesso. Saiba como foi o Seminário do Centro de Estudos sobre Ciência de Dados aplicada à Saúde no link [3] e no menu lateral.
Links
[1] https://www.icict.fiocruz.br/../..
[2] https://www.icict.fiocruz.br/arquivo-de-noticias
[3] http://www.icict.fiocruz.br/content/especialistas-em-ci%C3%AAncia-de-dados-e-sa%C3%BAde-discutem-ferramentas-e-t%C3%A9cnicas-em-semin%C3%A1rio-do
[4] https://www.facebook.com/sharer.php?u=https%3A%2F%2Fwww.icict.fiocruz.br%2Fprint%2F3256
[5] https://www.icict.fiocruz.br/node/3258
[6] https://www.icict.fiocruz.br/node/2854
[7] https://www.icict.fiocruz.br/node/2316
[8] https://www.icict.fiocruz.br/node/2101
[9] https://www.icict.fiocruz.br/bigdata.icict.fiocruz.br