O artigo científico “GenoDedup: Similarity-Based Deduplication and Delta-Encoding for Genome Sequencing Data”, da co-autoria de João Paulo, investigador do Laboratório de Software Confiável (HASLab) do INESC TEC, apresenta uma nova solução de deduplicação de dados, que permite guardar e aceder a informação do genoma humano de forma mais rápida e com menor custos de armazenamento associados.
Escrito em colaboração com Vinicius Cogo e Alysson Bessani, da Faculdade de Ciências de Lisboa, este artigo foi aceite para publicação na revista científica IEEE Transactions on Computers, uma das revistas mais relevantes na área da Informática.
Esta nova solução de desduplicação visa reduzir os custos associados ao armazenamento da informação genómica, garantindo ao mesmo tempo o acesso eficiente a essa informação. Desta forma, esta solução ajudará a racionalizar e acelerar os actuais estudos científicos centrados no genoma humano, facilitando assim novas descobertas.