">
Cientistas de dados, pesquisadores e colaboradores da PCDaS e de projetos parceiros se reuniram virtualmente nos dias 12 e 13 de abril para fazer um balanço do andamento dos projetos vinculados à segunda Chamada “Grand Challenges Explorations” no Brasil, que teve como objetivo o fomento de pesquisas que buscam melhorar a saúde materno-infantil, saúde da mulher e da criança no país.
Ao longo de 2021, sete projetos contaram com o apoio da equipe e da infraestrutura da PCDaS (Plataforma de Ciência de Dados aplicada à Saúde) no processo de tratamento de grandes e complexas bases de dados.
Com duração prevista até o final de 2022, a parceria observa resultados em diversos projetos, já apresentando produtos e análises, mas ainda com importantes etapas a serem completadas. Por isso, o “Seminário Avaliação Parcial da Chamada ‘Grand Challenges Explorations’” foi organizado em dois dias para reunir os pesquisadores em torno dos projetos em andamento e compartilhar impressões, além de assistirem a mesas redondas abordando a importância do uso de dados em pesquisas de saúde pública.
Apoio e infraestrutura
A parceria entre a Plataforma e os projetos foi dividida em três níveis: Básico, Intermediário e Avançado. Os pesquisadores do pacote Básico contam com acesso remoto e seguro à PCDaS via JupyterHub; capacitação básica em Python e R e para utilização dos bancos de dados da Plataforma; além de 32 vCPUs e 208 GB de RAM, GPU Tesla P100, 10 Terabytes de HD e conexão 10 Gigabit.
O pacote Intermediário tem todas as vantagens acima e inclui o processo de ETL (Extração, Transformação e Carregamento) de dados de interesse para a equipe de pesquisa. O Avançado, além dos recursos anteriores, ainda conta com a equipe da PCDaS para apoio na análise de dados e uma capacitação em ciência de dados com foco em machine learning.
GCE em números
Durante o seminário, o coordenador da PCDaS, Marcel Pedroso, apresentou um breve relatório com as principais iniciativas realizadas por sua equipe para apoiar os projetos.
Marcel ressaltou que, para realizar a parceria, 17 profissionais da PCDaS — 80% de toda a equipe — estiveram envolvidos na iniciativa. Nas equipes parceiras, foram mais de 50 integrantes participando das pesquisas.
No Slack, plataforma utilizada para comunicação das equipes e gestão do trabalho, foram criados 14 canais de comunicação e trocadas mais de 3 mil mensagens. No Workstreams, foram feitos 10 quadros Kanban, com mais de 200 tarefas movimentadas. No total, cerca de 130 reuniões virtuais foram realizadas até agora.
No desenvolvimento até aqui, o API da Plataforma recebeu mais de 1,5 milhão de acessos — cerca de 900 mil dos parceiros e aproximadamente 500 mil da equipe da PCDaS. Os parceiros utilizaram 8 Kibana Workspaces com 10 Dashboards, mais de 240 notebooks Jupyter e geraram mais de 60 mil linhas de código.
Marcel também lembrou que as equipes parceiras participaram de três capacitações — para acessar as bases de dados da PCDaS e para se familiarizar com as linguagens Python e R. Foram realizadas 18 aulas síncronas ao longo de oito semanas, que foram gravadas e continuam à disposição dos interessados. No total, 46 pesquisadores divididos em 4 turmas participaram das capacitações.
Além das capacitações, os envolvidos ainda receberam um ano de acesso à plataforma Datacamp, que oferece 368 cursos em ciências de dados.
Publicação original: Plataforma de Ciência de Dados aplicada à Saúde (14/4/2022).
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
Av. Brasil, 4.365 - Pavilhão Haity Moussatché - Manguinhos, Rio de Janeiro
CEP: 21040-900 | Tel.: (+55 21) 3865-3131 | Fax.: (+55 21) 2270-2668
Este site é regido pela Política de Acesso Aberto ao Conhecimento, que busca garantir à sociedade o acesso gratuito, público e aberto ao conteúdo integral de toda obra intelectual produzida pela Fiocruz.
O conteúdo deste portal pode ser utilizado para todos os fins não comerciais, respeitados e reservados os direitos morais dos autores.
Comentar