Computação científica e infraestrutura de big data na pauta do segundo dia de seminários

por
André Bezerra
,
28/08/2015

No segundo dia, as discussões foram mais voltadas à questão da computação científica, passando por pontos como programação e infraestruturas necessárias para o estudo GBD. Após a abertura da sessão, com o Vice-Diretor de Informação e Comunicação do Icict, Rodrigo Murtinho, o professor convidado do IHME apresentou como funcionam a modelagem e fluxo de dados do GBD, além das plataformas CODEm e DisMod, desenvolvidas especificamente para a carga global de doenças.

Naghavi apresentou alguns dos processos de modelagem de dados utilizados pelo IHME “Nós temos quatro modelos e diferentes covariáveis. Isso é um problema que tentamos resolver por meio da aplicação de algoritmos”, explicou, utilizando como exemplo algoritmos utilizados comercialmente como o serviço de filmes Netflix, que indica sugestões de filmes baseando-se em padrões de escolhas feitos pelos usuários. “Também usamos uma taxa de diversidade, devido a particularidades encontradas nos diferentes conjuntos de dados dos países, mas em geral, usamos modelos para entender os padrões”, completou.

Além disso, a tarefa é complementada com o uso de três métricas de validade para as predições, onde são avaliadas entre os grupos o melhor modelo a ser aplicado individualmente. O principal software utilizado na etapa posterior é o DisMod, que possibilita a verificação da consistência das estimativas de incidência e prevalência dos casos de invalidez, fatalidade ou doenças. Para seu funcionamento, é necessário ter estimativas da estrutura populacional e também outros dados de taxa de mortalidade.

Ainda na parte da manhã, o evento recebeu outro convidado internacional, o pesquisador da Organização Pan-americana de Saúde Ramón Martinez, que abordou o tema da visualização de dados. “É muito importante que as informações também possam ser apresentadas de forma visual para facilitar o entendimento dos profissionais e das pessoas que vão usar esses dados”, apontou. Para ele, a percepção visual é uma característica humana muito importante para a linguagem e o conhecimento. E na estatística, as visualizações contribuem para que outros profissionais possam se apoderar das informações e fazerem melhores escolhas no processo decisório.

Dentre as ferramentas que apresentou, incluiu desde as mais simples, baseadas na internet até ferramentas desenvolvidas para o uso na epidemiologia e estatística descritiva. Também ressaltou que esse campo tem diversas modalidades de visualização. “Precisamos destacar que os gráficos não são as únicas ferramentas para visualizar informações e dados. Temos para isso também como criar mapas, diagramas de volume e proporção, bem como ferramentas interativas, onde o usuário pode adequar a visualização de acordo com suas necessidades e interesse por certos dados”, completou.

Infraestrutura necessária é sofisticada

Fábio Porto, do Laboratório Nacional de Computação Científica. (Foto: Raquel Portugal - Multimeios/Icict)

Na sessão da tarde, Naghavi descreveu brevemente a estrutura de TI por trás do GBD. “São 17 mil processadores, 3000 terabytes para armazenamento de dados e 1 petabyte para rodar os bancos de dados, todos organizados em clusters”, enumerou. Além disso, há um grande time de recursos humanos, incluindo pesquisadores, desenvolvedores, analistas de bancos de dados, analistas de métodos e modelos, indexadores, dentre outras especialidades. Alguns dos profissionais colaboram à distância com o instituto, interligados em redes acadêmicas.

Em seguida, o Laboratório Nacional de Computação Científica, parceiro do Icict na iniciativa Big Data em Saúde, apresentou um pouco de sua estrutura, projetos em que atua e como a computação científica se insere em diferentes contextos. O pesquisador Fábio Porto informou que o Extreme Data Lab, unidade do LNCC, trabalha atualmente em áreas diversas como a astronomia, o esporte, a genômica e também na saúde. “Nosso papel é ajudar a limpar, organizar e tratar dados para que façam sentido para pesquisadores, cientistas e usuários”, resumiu.

“No Big Data, um dos grandes problemas é que não se sabe como formular uma pergunta que tenha um bom retorno de informações, porque essa questão tem que ser modelada para que os dados ofereçam respostas, isso dentro de uma compreensão científica dos dados”, acrescentou ao apontar uma das abordagens do LNCC. Porto também ressaltou a importância do trabalho de integração dos dados, tanto na questão da terminologia quanto na estrutura de sistemas.

Por fim, Marcel Pedroso, do Icict, apresentou as características do projeto de Big Data iniciado pela Fiocruz, cujo marco de lançamento foram os próprios seminários do Centro de Estudos. A sessão foi finalizada com debate em torno dos modos de gestão para viabilizar uma operação desse porte que seja de utilidade para a saúde pública brasileira. Para Fátima Marinho, da Secretaria de Vigilância do Ministério da Saúde e responsável pelo Projeto GBD Brasil 2015, será uma estrutura inédita para a saúde pública brasileira.

“O projeto de carga de doenças tem dois braços, um vai estimar a carga no Brasil, usando principalmente o indicador da perda da saúde, ou seja, queremos saber o quanto que se perde de saúde e o que se pode fazer do ponto de vista da política pública. O outro braço do projeto é construir uma infraestrutura para análise de dados. Essas medidas exigem uma sofisticação, passando pela integração de dados, além de validar, corrigir e fazer uma análise científica. É uma estrutura inédita e, na saúde, ainda não temos o uso da computação científica. Espero conseguirmos dar uma melhor resposta para o que a população quer, que é melhorar sua saúde, e, especialmente, deixar de perder tanta saúde”, explicou Fátima Marinho.

(Foto: Raquel Portugal)

Comentar

Preencha caso queira receber a resposta por e-mail.

Galeria de fotos

Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde
Seminários GBD e Big Data em Saúde

Assuntos relacionados

Por dentro do GBD: Seminários do Icict discutem Carga Global de Doença

Eventos do Centro de Estudos realizaram debates aprofundados entre especialistas e pesquisadores da área estatística e de epidemiologia

Grupo de Pesquisa da Fiocruz adota estratégia Big Data em Saúde

Com a iniciativa, pesquisa e gestão terão ferramentas para analisar grandes volumes de dados

Para saber mais

Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
Av. Brasil, 4.365 - Pavilhão Haity Moussatché - Manguinhos, Rio de Janeiro
CEP: 21040-900 | Tel.: (+55 21) 3865-3131 | Fax.: (+55 21) 2270-2668

Este site é regido pela Política de Acesso Aberto ao Conhecimento, que busca garantir à sociedade o acesso gratuito, público e aberto ao conteúdo integral de toda obra intelectual produzida pela Fiocruz.

O conteúdo deste portal pode ser utilizado para todos os fins não comerciais, respeitados e reservados os direitos morais dos autores.

logo todo somos SUS