Web Semântica e preservação digital: o padrão de metadados PREMIS na proposta do Linked Data

  • Felipe Augusto Arakaki Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP), Câmpus Presidente Epitácio/ Universidade Estadual Paulista (Unesp), Faculdade de Filosofia e Ciências, Marília
  • Paula Regina Ventura Amorim Gonçalez Universidade Estadual de Londrina (UEL)
  • Caio Saraiva Coneglian Universidade Estadual Paulista (UNESP)
  • Placida Leopoldina Ventura Amorim da Costa Santos Universidade Estadual Paulista (UNESP)
  • José Eduardo Santarém Segundo Universidade de São Paulo (USP)/Universidade Estadual Paulista (UNESP

Resumo

A partir do significante aumento da produção de conteúdos digitais, ações visando a recuperação e a preservação de objetos digitais a longo prazo tornam-se de importância capital em nossos dias, caso contrário, haverá um rompimento no conhecimento devido a perda ou insuficiência na representação das informações disponíveis no ambiente Web. Nesse contexto, a Curadoria Digital se configura como uma área interdisciplinar que gerencia informações com a proposta e o desafio de preservação e transmissão de objetos informacionais, atuando sobre os fatores de risco como: tecnologia obsoleta, fragilidade tecnológica, falta de entendimento sobre o que é uma boa prática digital e recursos inadequados. Nesse cenário, foi feito um recorte sobre conceitos e funções dos metadados para preservação digital. Assim objetiva-se verificar como o padrão de metadados  Preservation Metadata: Implementation Strategies (PREMIS) pode ser utilizado para atender as demandas de preservação dos objetos informacionais digitais. Optou-se como procedimento metodológico a revisão da literatura visto que, é uma reflexão sobre a representação da informação tendo como pano de fundo a Web semânticaComo resultado abordou-se a estrutura e as características do padrão metadados PREMIS e sua relação com a Web Semântica.

Biografia do Autor

Felipe Augusto Arakaki, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP), Câmpus Presidente Epitácio/ Universidade Estadual Paulista (Unesp), Faculdade de Filosofia e Ciências, Marília
Doutorando em Ciência da Informação pela Universidade Estadual Paulista "Júlio Mesquita Filho" - UNESP/Marília, Mestrado em Ciência da Informação pela Universidade Estadual paulista "Júlio Mesquita Filho" - UNESP/Marília e graduado em Biblioteconomia pela Universidade Estadual Paulista "Júlio de Mesquita Filho" - Campus de Marília. É integrante do Grupo de Pesquisa "Novas Tecnologias em Informação" e do Grupo de Pesquisa "Dados e Metadados". Trabalha como bibliotecário no IFSP - Presidente Epitácio. Áreas de interesse incluem a Ciência da Informação, principalmente nos temas: Biblioteca escolar, Representação e organização da informação, Catalogação, Catalogação Automatizada, Metadados, Interoperabilidade, Padrões de Metadados, Dublin Core, BIBFRAME, Schema.org, Web Semântica e Linked Data.
Paula Regina Ventura Amorim Gonçalez, Universidade Estadual de Londrina (UEL)
Bacharel em Biblioteconomia pela UNESP - Universidade Estadual Paulista Júlio de Mesquita Filho, mestre em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho e doutora em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho. Atualmente é professora colaboradora da Universidade Estadual de Londrina- UEL. Áreas de atuação: Biblioteconomia e Arquivologia nos seguintes temas: Catalogação, arquivos permanentes, repositórios digitais confiáveis, técnicas de arquivo, acesso e disseminação da informação.
Caio Saraiva Coneglian, Universidade Estadual Paulista (UNESP)

Doutorando e Mestre em Ciência da Informação na UNESP. Possui graduação em Ciência da Computação. Tem experiência na área de Ciência da Computação e Ciência da Informação, com ênfase em Web Semântica, Banco de Dados e Repositórios Digitais, atuando principalmente nos seguintes temas: Recuperação de Informação, modelagem de dados, NOSQL, XML, Ontologias.
Placida Leopoldina Ventura Amorim da Costa Santos, Universidade Estadual Paulista (UNESP)
Livre-docente em Catalogação pela UNESP (2010), doutora em Letras - Semiótica e Lingüística Geral pela FFLCH/USP (1994), mestre em Ciência da Informação pela PUC de Campinas (1983) e bacharel em Biblioteconomia pela UNESP (1980). Docente permanente do Programa de Pós-Graduação em Ciência da Informação da FFC/UNESP, na linha de pesquisa Informação e Tecnologia. Vice-Lider do Grupo de Pesquisa ? Novas Tecnologias em Informação (GP-NTI). Desenvolve suas pesquisas nas temáticas: Metadados, Catalogação e Tecnologias, Intersemiose Digital, Redes de Informação, Mapa do Conhecimento Humano. Pesquisadora CNPq, coordenadora do GT8 - Informação e Tecnologia, da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação - Ancib (2013-2016). Editora da revista Informação & Tecnologia (Itec), membro do corpo editorial das revistas Brazilian Journal of Information Science: research trends e Revista Eletrônica Informação e Cognição. Parecerista ad hoc de agências de fomento e de periódicos científicos, participa como revisora e como membro de Comitês Científicos de periódicos científicos em Ciência da Informação no Brasil e no exterior. Membro da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação ? ANCIB e membro da Diretoria da Sociedade Brasileira de Ciência Cognitiva ? SBCC.
José Eduardo Santarém Segundo, Universidade de São Paulo (USP)/Universidade Estadual Paulista (UNESP
Doutor e Mestre em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho-UNESP-Marília/SP; Professor Doutor no Departamento de Educação, Informação e Comunicação, da Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, da Universidade de São Paulo (USP); Docente do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília na linha de Informação e Tecnologia. Coordenador do GT8 - Informação e Tecnologia, da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Atua na linha de pesquisa - Ambientes Digitais e Tecnologias Aplicadas a Informação e Comunicação - , com ênfase em Web Semântica, Linked Data, Dados Abertos e Acervos Digitais. Lider do NEWSDA - Núcleo de Estudos em Web Semantica e Dados Abertos. Recebeu o Prêmio de Melhor Tese pela Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB) - Ano 2011. Recebeu também Menção Honrosa no Prêmio Capes de Teses - 2011 (Ciências Sociais Aplicadas)

Referências

ALVES, R. C. V. Web semântica: uma análise focada no uso de metadados. 2005. 180 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, 2005. Disponível em: <http://repositorio.unesp.br/handle/11449/93690>. Acesso em: 12 nov. 2017.

ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010. 132 f. Tese (Doutorado em Ciência da Informação)–Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, Marília, 2010. Disponível em: <http://hdl.handle.net/11449/103361>. Acesso em: 12 nov. 2017.

ALVES, R. C. V.; SANTOS, P. L. V. A. da C. Metadados no domínio bibliográfico. Intertexto: Niterói, 2013.

ARAKAKI, F. A. Linked data: ligação de dados bibliográficos. 2016. 144 f. Dissertação (Mestrado em Ciência da Informação) – Universidade Estadual Paulista (Unesp), Faculdade de Filosofia e Ciências, 2016. Disponível em: <https://repositorio.unesp.br/handle/11449/147979>. Acesso em: 12 nov. 2017.

BACA, M. (ed.). Introduction to Metadata: pathways to digital information. Los Angeles, CA: Getty Information Institute, 1998.

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web. Scientific american, v. 284, n. 5, p. 28-37, 2001.

BREITMAN, K. Web semântica: a Internet do Futuro. LTC, 2005.

CAPLAN, P. Understanding PREMIS. Washington, DC: Library of Congress Network Development and MARC Standards Office, 2009. Disponível em: <http://www.loc.gov/standards/premis/understanding-premis.pdf>. Acesso em: 12 nov. 2017.

COPPENS, S. et al. PREMIS OWL: A semantic long-term preservation model. Int J Digit Libr, v. 15, n. 87, 2015. Disponível em: <https://link.springer.com/article/10.1007/s00799-014-0136-9#citeas>. Acesso em: 12 nov. 2017.

CONEGLIAN, C. S.; LUZ, L. P. SANTAREM SEGUNDO, J. E. Boas práticas para publicação de dados na web: aplicação nos dados referentes aos resultados de pesquisa científica. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO (UNESP), 18., 2017. Marília. Anais... Marília: UNESP, 2017. p. 1-21. Disponível em: < http://enancib.marilia.unesp.br/index.php/xviiienancib/ENANCIB/paper/viewFile/382/835> Acesso em: 10 nov. 2017.

CONSELHO NACIONAL DE ARQUIVOS. Diretrizes para a implementação de repositórios digitais confiáveis de documentos arquivísticos. Rio de Janeiro: Câmara Técnica de Documentos Eletrônicos, 2014. Disponível em: <http://www.conarq.arquivonacional.gov.br/media/publicacoes/conarq_repositorios_2014.pdf>. Acesso em: 12 nov. 2017.

DI IORIO, A.; CARON, B. PREMIS 3.0 Ontology: Improving Semantic Interoperability of Preservation Metadata. EUA: Library of Congress, 2016. Disponível em: <https://www.loc.gov/standards/premis/pif/2016/iPresDiIoria_Caron_iPRES_2016_paper_150.pdf>. Acesso em: 12 nov. 2017.

DUFF, W.; MCKEMMISH, S. Metadata ans ISO 9000 Compliance. Information Management Journal, v. 34, n. 1, 2000. Disponível em: <http://www.infotech.monash.edu.au/research/groups/rcrg/publications/smckduff.ht>. Acesso em: 12 nov. 2017.

DUVAL, E. et al. Metadata principles and practicalities. D-Lib Magazine, v. 8, n. 4, 2002. Disponível em: <http://www.dlib.org/dlib/april02/weibel/04weibel.html>. Acesso em: 12 nov. 2017.

FERREIRA, J. A. Wikis semânticos: da Web para a Web Semântica. 2014. 131 f. Dissertação (Mestrado em Ciência da Informação). Faculdade de Filosofia e Ciências – Universidade Estadual Paulista, Marília, 2014. Disponível em: <http://repositorio.unesp.br/handle/11449/108380>. Acesso em: 12 nov. 2017.

GILLILAND-SWETLAND, A. Defining Metadata. In: BACA, M. (ed.), Introduction to Metadata: pathways to digital information. Los Angeles, CA: Getty Information Institute, 1998.

GONÇALEZ, P. R. V. A. Repositórios arquivísticos digitais confiáveis: identificação de requisitos com ênfase no acesso à informação. 2017. 166 f. Tese (Doutorado em Ciência da Informação)-Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2017.

HEDSTROM, M. Digital preservation: a time bomb for digital libraries. Computer and the Humanities, n. 31, p. 189-202, 1998. Disponível em: <https://doi.org/10.1023/A:1000676723815>. Acesso em: 12 nov. 2017.

HIGGINS, S. The DCC Curation Lifecycle Model. International Journal of Digital Curation, v. 3, n. 1, p. 134-140, 2008. Disponível em: <https://doi.org/10.2218/ijdc.v3i1.48>. Acesso em: 12 nov. 2017.

LYMAN, P. Archiving the world wide web. Council on Library and Information Resources, 2002. Disponível em: <https://www.clir.org/pubs/ reports/pub106/web.html>. Acesso em: 12 nov. 2017.

MÉNDEZ RODRÍGUEZ, E. Metadatos y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Trea: Espanha, 2002.

MENDEZ, E. GREENBERG, J. Linked data for open vocabularies and HIVE’s global framework. El profesional de la información, mayo-junio, v. 21, n. 3, 2012. Disponível em: <http://recyt.fecyt.es/index.php/EPI/article/view/epi.2012.may.03/17916>. Acesso em: 12 nov. 2017.

MILES, A.; BECHHOFER, S. SKOS: Simple Knowledge Organization System Reference. W3C Recommendation, 2009. Disponível em: <http://www.w3.org/TR/skos-reference/>. Acesso em: 12 nov. 2017.

NATIONAL INFORMATION STANDARD ORGANIZATION. Understanding Metadata. Bethesda, MD: NISO Press, 2004. Disponível em: <http://www.niso.org/publications/press/UnderstandingMetadata.pdf>. Acesso em: 12 nov. 2017.

NOWACK, B. The Semantic Web Technology Stack (not a piece of cake...). Linked Data Developer. [Online] 2009. Disponível em: <http://linkeddatadeveloper.com/Projects/LinkedData/media/fig11.2.png>. Acesso em: 12 nov. 2017.

POMERANTZ, J. Metadata. USA: The MIT press essential knowledge series, 2015.

PREMIS DATA DICTIONARY FOR PRESERVATION METADATA. Data Dictionary for Preservation Metadata: PREMIS version 3.0. [S.l.: s.n.], 2015. Disponível em: <http://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf>. Acesso em: 12 nov. 2017.

RAMALHO, R. A. S. Web semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da ciência da informação. 2006. 120 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, 2006. Disponível em: <http://repositorio.unesp.br/handle/11449/93709>. Acesso em: 12 nov. 2017.

RAMALHO, R. A. S. Análise dos modelos de dados SKOS e BIBFRAME: novas perspectivas de representação na era dos dados interligados. ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 17., Anais... Bahia, ANCIB; UFBA, nov. 2016. Disponível em: <http://www.ufpb.br/evento/lti/ocs/index.php/enancib2016/enancib2016/paper/view/4111>. Acesso em: 12 nov. 2017.

RAMALHO, Rogério Aparecido Sá; OUCHI, Marcos Teruo. Tecnologias Semânticas: Novas Perspectivas para a Representação de Recursos Informacionais. Informação & Informação, Londrina, v. 16, n. 3, p. 60-75, dez. 2011. ISSN 1981-8920. Disponível em: <http://www.uel.br/revistas/uel/index.php/informacao/article/view/9829/10643>. Acesso em: 12 nov. 2017. doi:http://dx.doi.org/10.5433/1981-8920.2011v16n3p60.

RILEY, J. Understanding metadata: what is metadata, and what is it for? Baltimore: NISO, 2017. Disponível em: <http://www.niso.org/apps/group_public/download.php/17446/Understanding%20Metadata.pdf>. Acesso em: 12 nov. 2017.

SANTAREM SEGUNDO, J. E. Recursos tecno-metodológicos para descrição e recuperação de informações na Web. 2004. 157 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília. 2004. Disponível em: <http://repositorio.unesp.br/handle/11449/93618>. Acesso em: 12 nov. 2017.

SANTAREM SEGUNDO, J. E. Web semântica: introdução a recuperação de dados usando SPARQL. ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 15., Minas Gerais. Anais... Minas Gerais, ANCIB; UFMG, 2014. Disponível em: <http://enancib2014.eci.ufmg.br/documentos/anais/anais-gt8>. Acesso em: 12 nov. 2017.

SAYÃO, L. F.; SALES, L. F. Curadoria digital: um novo patamar para preservação de dados digitais de pesquisa. Informação & Sociedade: Estudos, João Pessoa, v. 22, n. 3, p. 179-191, set./dez. 2012.

SIEBRA, S. A. et al. Curadoria digital: além da questão da preservação digital. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO (ENANCIB), 14., 2013. Florianópolis. Anais… Rio de Janeiro. UFSC, 2013, p. 1-20. Disponível em:< http://basessibi.c3sl.ufpr.br/brapci/index.php/article/view/0000013754/cfbd64a34a690 3340c12b82d9319d014>. Acesso em: 12 nov. 2017.

SIKOS, L. F. Mastering structured data on the Semantic Web: from HTML5 microdata to Linked Open Data. EUA: Apress, 2015.

SILVA, R. E. da. As tecnologias da web semântica no domínio bibliográfico. 134 f. 2013. Dissertação (Mestrado em Ciência da Informação)–Universidade Estadual Paulista “Júlio de Mesquita Filho”, Faculdade de Filosofia e Ciências, Marília, 2013. Disponível em: <http://repositorio.unesp.br/handle/11449/93653>. Acesso em: 12 nov. 2017.

ZENG, M. L. QUIN, J. Metadata. New York: Neal-Schuman Publishers, 2008.

Publicado
2019-02-10