Repositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data Point

  • João Luiz Rebelo Moreira Universidade Federal de Minas Gerais (UFMG)
  • Luiz Bonino Universidade de Twente (Holanda)
  • Luís Ferreira Pires Universidade de Twente (Holanda) https://orcid.org/0000-0001-7432-7653
  • Marten van Sinderen Universidade de Twente (Holanda)
  • Patricia Henning Universidade Federal do Estado do Rio de Janeiro (UNIRIO)

Resumo

É necessário um esforço significativo para encontrar, entender e reutilizar dados da pesquisa. Para endereçar esse problema, os princípios de dados Localizáveis, Acessíveis, Reutilizáveis e Interoperáveis (FAIR em inglês) foram criados, e descrevem um conjunto mínimo de requisitos para gerenciamento e administração de dados, considerados a base tecnológica para a Nuvem Europeia de Ciência Aberta. O FAIR Data Point (FDP) utiliza dados ligados (LD) para expor dados e metadados aderentes aos princípios de dados FAIR, especificando um conjunto de metadados padronizados que um repositório de dados deve implementar. Os proprietários de dados podem expor conjuntos de dados e os usuários de dados podem reutilizar conjuntos de dados por meio de serviços RESTful, permitindo a interoperabilidade em escala na web. Os repositórios de dados e o software subjacente apenas recentemente começaram a oferecer suporte à LD, e seus metadados estão disponíveis apenas como pares de valores-chave. Uma questão em aberto neste contexto é como permitir que um software de repositório de dados existente seja compatível com a especificação do FDP, ou seja, como adicionar descrições semânticas aos repositórios de dados para garantir a interoperabilidade semântica entre dados de diferentes repositórios. Este artigo descreve uma solução não invasiva e não intrusiva de proxy semântico que permite que um software de repositório de dados, o serviço EUDAT B2share, se comporte como um FDP, permitindo a interoperabilidade semântica por meio de traduções semânticas. A solução inclui uma metodologia para o mapeamento de metadados com base em transformações endógenas de modelos léxicos para modelos semânticos. Mostramos como os metadados nos pares de valores-chave de um repositório de uso geral podem ser compatíveis com a tecnologia LD sem alterar o software do repositório. A validação da solução inclui testes funcionais das camadas de metadados do FDP e uma análise de desempenho do impacto do proxy semântico na troca de dados. Os resultados mostram que o B2share pode ser compatível com as especificações do FDP, tendo impacto reduzido no desempenho da troca de dados. Portanto, a validação mostra que a solução é viável e adequada para transformar um software de repositório de dados de uso geral em um FDP.

Palavras-chave: Dados FAIR.Reusabilidade de Dados.Software de Repositório de Dados.FAIR Data Point.

Link: http://revista.ibict.br/liinc/article/view/4817

Biografia do Autor

João Luiz Rebelo Moreira, Universidade Federal de Minas Gerais (UFMG)
Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Pesquisador de pós-doutorado em ciência da computação pelas universidades VU Amsterdam e Twente.
Luiz Bonino, Universidade de Twente (Holanda)
Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Diretor de tecnologia do escritório GO FAIR.
Luís Ferreira Pires , Universidade de Twente (Holanda)
Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Professor associado da Universidade de Twente.
Marten van Sinderen, Universidade de Twente (Holanda)
Doutor em Ciência da Computação pela Universidade de Twente (Holanda). Professor associado da Universidade de Twente e chefe do grupo SCS.
Patricia Henning, Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
Doutora em Informação e Comunicação em Saúde pelo Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT / FIOCRUZ). Professora Associada da Universidade Federal do Estado do Rio de Janeiro (UNIRIO).
Publicado
2020-09-11
Seção
Resumos de artigos científicos