Área do cabeçalho
gov.br
Portal da UFC Acesso a informação da UFC Ouvidoria Conteúdo disponível em:PortuguêsEnglishEspañol

Universidade Federal do Ceará
Mestrado e Doutorado em Ciências da Computação

Área do conteúdo

Defesa de Qualificação de Mestrado: João Araújo Castelo Branco

Data da publicação: 9 de outubro de 2024 Categoria: Notícias, Qualificação de Mestrado

Título: Research Flow: Padronização em Pesquisas de Aprendizagem de Máquina

Data: 17/10/2024
Horário: 07h00
Local: Google Meet (https://meet.google.com/gey-tbeu-jyj)

 

Resumo:

O campo de Machine Learning (ML) tem crescido exponencialmente nos últimos anos, trazendo inovações em áreas como a saúde. No entanto, um dos grandes desafios enfrentados pela pesquisa em ML é a reprodutibilidade, conforme apontado por autores como Desai et al. (2024) e Semmelrock et al. (2023). A qualidade do código desempenha um papel crucial nesse contexto, especialmente quando a lógica por trás dos algoritmos desenvolvidos não é clara o suficiente para facilitar sua reprodução por outros pesquisadores. O uso de arquiteturas baseadas em pipelines é apontado como uma abordagem que pode ajudar a tornar o código mais legível e acessível. A modularidade e a organização dessas arquiteturas permitem que a lógica das funções seja compreendida mais facilmente, mesmo sem a presença de documentação extensa. Isso facilita a análise e a reprodução de experimentos por outros pesquisadores, independentemente do nível de especialização em tecnologia. Estudos mostram que, apesar de sua importância, muitos artigos em ML, especialmente no domínio médico, não compartilham seus códigos, e a falta de padronização torna difícil para revisores analisarem os modelos apresentados. Para enfrentar esses desafios, diversos frameworks de pipelines foram desenvolvidos, como o Scikit-Learn e o Prefect, mas suas limitações e complexidades muitas vezes restringem seu uso. Visando melhorar a legibilidade e reprodutibilidade dos códigos em ML, este trabalho propõe o Research Flow, uma biblioteca que utiliza apenas recursos nativos da linguagem Python e auto documentável, aplicado na reconstrução de Eletrocardiogramas (ECG) a partir de sinais de Fotopletismografia (PPG), comparando o código original proveniente do trabalho de Tang et al. (2022) com o re-implementado utilizando o Research Flow, obtendo uma redução de aproximadamente metade de sua Cyclomatic Complexity e Cognitive Complexity.

Banca examinadora:

  • Prof. Dr. José Antonio Fernandes de Macêdo (MDCC/UFC – Orientador)
  • Prof.ª Dr.ª Rossana Maria de Castro Andrade (MDCC/UFC)
  • Prof. Dr. Regis Pires Magalhães (UFC)

 

Acessar Ir para o topo