FONTES DE INFORMAÇÃO SOBRE
GESTÃO DE DADOS DE PESQUISA
INFORMATION SOURCES ON RESEARCH DATA MANAGEMENT
Murilo Bastos da Cunha1
Maira Murrieta Costa2
RESUMO
O artigo apresenta uma bibliografia seletiva e anotada sobre as principais fontes de informação necessárias ao estudo da gestão de dados de pesquisa. Ela está dividida em duas partes; a primeira arrola os livros e manuais e os documentos gerais. Na segunda parte foram listados os documentos relacionados ao fluxo dos dados de pesquisa: políticas de gestão, planos para a gestão de dados, requisitos das agências de fomento, normas e padrões, metadados, fluxos de trabalho, aspectos legais, aspectos econômicos, compartilhamento e reuso de dados, preservação de dados, identificadores dos dados, citação de dados, visualização de dados, usuários de dados e avaliação dos sistemas.
Palavras-chave: Bibliografia. Gestão de dados de pesquisa. Preservação digital.
ABSTRACT
The article presents a selective and annotated bibliography on the major sources of information necessary to the study of research data management. It is divided into two parts; the first enrolls books and manuals and general documents. In the second part are included the documents related to the flow of research data: management policies, plans for data management, requirements of funding agencies, norms and standards, metadata, workflows, legal aspects, economic aspects, sharing and reuse of data, data
Keywords: Bibliography. Digital preservation. Research data management.
Artigo submetido em 21/09/2020 e aceito para publicação em 11/10/2020
1 INTRODUÇÃO
Os dados são um componente importante da pesquisa econômica e social – eles são a base para a pesquisa e o produto final da pesquisa. A qualidade dos dados de pesquisa e a sua proveniência tornam-se fundamentais no compartilhamento e o subsequente utilização como documento secundário. A gestão eficaz dos dados é uma condição essencial para a geração de dados reutilizáveis de alta qualidade. Os investigadores precisam ter o conhecimento e as habilidades para garantir que os dados que criam e gerenciam possam ser explorados ao máximo, sendo, portanto, um promissor potencial para futuras pesquisas.
Como um objeto acadêmico os dados continuam a crescer em importância na comunidade de pesquisa e, paulatinamente, os bibliotecários e demais profissionais da informação estão tendo, de forma crescente, maiores responsabilidades na de gestão e curadoria de dados. As novas iniciativas de bibliotecas e arquivos incluem as tarefas de ajudar os pesquisadores a encontrar conjuntos de dados para reutilização; localizar e hospedar em repositórios os dados, consultar sobre o fluxo de trabalho, elaborar os planos de gestão de dados, bem como desenvolver metodologias para as práticas para a preservação.
Na atualidade existe uma ênfase em abertura de dados, requisitos de planejamento e gerenciamento de dados, assim como potenciais oportunidades de pesquisa com o denominado “Big Data”. É preciso contextualizar que o processo de gestão de dados é decorrente da necessidade de compartilhamento dos mesmos. O compartilhamento, por sua vez, é derivado do movimento de governo aberto (open goverment partnership) e ciência aberta (open Science), pautados respectivamente pelo monitoramento e avaliação da política pública pela sociedade e, pelo avanço célere em pesquisas que se encontram na fronteira do conhecimento.
Em decorrência desse contexto, as instituições de pesquisa estão reconhecendo uma demanda emergente para fornecer uma gama de serviços de dados para atender às necessidades em diferentes pontos no processo de pesquisa, dentre elas, a colaboração online de pesquisadores que exige, necessariamente, a gestão de dados e a infraestrutura para viabilizar o compartilhamento. Esse novo contexto amplifica a importância dos dados, refletido no crescimento exponencial da literatura internacional e nacional relacionada à temática. As instituições de pesquisa brasileiras já sentem o impacto desses influxos, a exemplo dos editais de pesquisa da FAPESP em e-Science que solicitaram um plano de gestão de dados de pesquisa, ou mesmo da Plataforma Zika, desenvolvida pela FIOCRUZ para prospecção de pesquisa, desenvolvimento de redes de colaboração, curadoria e compartilhamento de dados .
Os profissionais de informação ao olharem sobre as opções de fornecer serviços e produtos para essa nova e vibrante área, irão precisar saber como tratar e difundir esse tipo de documento até então negligenciado pela área de Ciência da Informação. Assim, esta bibliografia se destina a esses profissionais que podem ampliar e melhorar os seus conhecimentos e ajudar seus colegas no aprimoramento da gestão de dados de pesquisa (GDP).
Uma das áreas que nós reconhecemos como importantes na construção desta bibliografia foi o refinamento da terminologia ao longo do tempo. Exemplos de tais termos incluem ciência eletrônica (eScience), ciberinfraestrutura (cyberinfrastructure), dilúvio de dados (data deluge), arquivamento de dados e gestão de dados de pesquisa (research data management), distinto dos serviços de dados de forma mais ampla, o último, por vezes, incluindo gerenciamento de registros institucionais. Entre outros objetivos, esperamos que esta bibliografia possa lançar alguma luz sobre as variações de sentido, e fornecer alguma oportunidade para posterior maturação e convergência terminológica.
Neste documento se utilizará o termo “gestão de dados de pesquisa” (GDP) para se referir às atividades da biblioteca que permeiam o gerenciamento e o arquivamento de dados. O assunto GDP teve, a partir de meados dos anos 2000, um enorme crescimento. Isto foi consubstanciado, entre outros, pelo surgimento de livros e eventos profissionais específicos, bem como pela publicação de centenas de artigos. Tais fatos demonstram, por conseguinte, a necessidade de uma bibliografia onde constassem as principais fontes de informação que pudessem delinear os contornos dessa dinâmica área. Este é, portanto, o objetivo deste trabalho: incluir, de forma anotada, os principais documentos sobre a GDP, disponibilizados nas línguas mais acessíveis aos leitores da língua portuguesa.
Esta bibliografia seletiva e anotada se destina aos estudantes e profissionais da biblioteconomia, arquivologia e demais áreas da ciência da informação. Eles podem encontrar, num único documento, referências básicas relacionadas com os principais problemas e soluções envolvidas na complexa construção de uma biblioteca digital e/ou repositório de dados de pesquisa.
2 AS PRINCIPAIS FONTES DE INFORMAÇÃO
Esta bibliografia abordou as principais fontes de informação, lançadas a partir de 2000, necessárias ao estudo da GDP. Ela está dividida em duas partes; a primeira arrola as bibliografias mais recentes, os livros e manuais e os documentos gerais sobre GDP. Na segunda parte foram listados os principais documentos relacionados ao fluxo dos dados de pesquisa em um repositório digital. Dentro de cada tópico as entradas dos itens seguem o arranjo alfabético.
Em cada um desses tipos de fontes de informação foram comentados os documentos básicos, em ordem alfabética dos autores e/ou instituições. Tanto quanto possível, foram incluídos os endereços eletrônicos na internet.
As bibliografias sobre GDP têm crescido bastante; abaixo estão citadas as mais recentes. Aqui deve ser ressaltado que, geralmente, as fontes de informação sobre biblioteca digital são também úteis para o entendimento da GDP.
BAILEY JUNIOR, C. W. Research data curation bibliography. 10th ed. Houston: Digital Scholarship, 2019. digital-scholarship.org/rdcb/rdcb.htm
Inclui 750 documentos, arranjados pela ordem alfabética dos autores, publicados na língua inglesa, cobrindo o período de 2009 a 2018.
CUNHA, M. B. da. Bibliografia sobre o fluxo do documento na biblioteca digital. DataGramaZero Revista de Ciência da Informação, 2009. www.brapci.inf.br/index.php/article/view/0000008251/e2451180a6a5facc3eaf7585847260c1/
Bibliografia internacional sobre as principais fontes de informação relacionadas com o fluxo do documento na biblioteca digital. Os tópicos cobertos são: definições da biblioteca digital, projeto e arquitetura da biblioteca digital, normas e padrões, digitalização, desenvolvimento de coleções, controle bibliográfico, preservação digital, acesso à informação, referência digital, aspectos jurídicos, aspectos econômicos, usuários e avaliação. Muitos dos tópicos cobertos se aplicam à área da GDP.
DIGITAL CURATION CENTRE. Resources for digital curators. www.dcc.ac.uk/ ]
Importante fonte de informação para a curadoria digital e de GDP. Provê acesso, entre outros, a normas técnicas, manuais, guias, políticas e fluxos de trabalho.
GASPAR, A. C. Documento técnico contendo revisão da literatura e análise de publicações sobre Ciência Aberta (Open Science) e temas correlatos para elaboração de bibliografia especializada com resumos traduzidos e comentados. Brasília: IBICT, UNESCO, 2014. 111 p. cariniana.ibict.br/index.php/fontes-de-informacao
O documento objetivou “identificar na literatura os principais vetores que estão na base de construção da ciência aberta e tendências que configuram o uso compartilhado dos seus resultados, provocando mudanças que equivale a uma atualização maciça, global na capacidade da Internet para compartilhar dados científicos” (Apresentação).
GOBEN, A.; RASZEWSKI, R. Research Data Management Self-Education for Librarians: A Webliography. Issues in Science and Technology Librarianship, n. 82, Fall 2015. istl.org/15-fall/internet2.html
Bibliografia de fontes de informação sobre GDP hospedadas na internet, com ênfase nas fontes americanas.
OREGON STATE UNIVERSITY. State University Libraries. Research Data Services: Tools & Resources. guides.library.oregonstate.edu/research-data-services
Bibliografia dividida em três partes: gestão dos dados; plano de gestão de dados; serviços para compartilhamento e preservação de dados.
WESTRA, B. et al. Science and Technology Resources on the Internet: Selected Internet Resources on Digital Research Data Curation. Issues in Science and Technology Librarianship, n. 63, Fall 2010. www.istl.org/10-fall/internet2.html
Bibliografia de fontes de informação sobre curadoria de dados na área de ciências naturais hospedadas na internet.
Uma simples busca na livraria eletrônica Amazon, utilizando a expressão “digital data”, recupera mais de uma centena de livros sobre o assunto. Este é um tópico que tem atraído crescente atenção por parte dos pesquisadores em variadas áreas – especialmente nas comunidades da ciência da informação e da ciência da computação.
A gestão desse tipo de informação é uma temática que muda muito rapidamente. Assim, nenhum livro pode refletir por muito tempo o estado-da-arte desse assunto. As obras abaixo mencionadas servem, portanto, como um marco inicial para compreender os problemas relacionados com as diversas facetas da GDP. É óbvio que, para conteúdos mais atualizados, devem ser buscadas informações nos trabalhos apresentados em eventos e nos artigos de periódicos.
ATKINS, D. E. et al. Revolutionizing science and engineering through cyberinfrastructure: report of the National Science Foundation Blue-Ribbon Advisory Panel on Cyberinfrastructure. Washington, DC, Jan. 2003. 84 p. Disponível em: repository.arizona.edu/handle/10150/106224
Importante documento que sugere à National Science Foundation (US) o desenvolvimento de uma infraestrutura para apoiar a pesquisa científica. Para os autores, “a pesquisa científica nos próximos anos dependerá da qualidade da infraestrutura cibernética - os sistemas integrados de informação, computação e comunicação que nos unem. (...) O relatório enfatiza a importância de agir rapidamente e os riscos de não fazê-lo. Esses riscos incluem falta de coordenação, o que pode deixar os principais dados em formatos irreconciliáveis; falhas a longo prazo em arquivar e selecionar dados coletados com grandes custos; e barreiras artificiais entre disciplinas construídas a partir de ferramentas e estruturas incompatíveis” (Introdução).
BAYKOUCHEVA, S. Managing Scientific Information and Research Data. Waltham, MA: Elsevier, 2015. 208 p. ISBN 9780081001950
Com 16 capítulos, a obra analisa as abordagens e instrumentos desenvolvidos para gerenciar informações e dados científicos, a saber: as mudanças na comunicação científica; os novos modelos de publicação e revisão por pares; ética na pesquisa; preservação de dados; ferramentas de descoberta; práticas de disciplinas específicas de pesquisadores para a coleta e utilização de informação científica; redes sociais; ferramentas de gerenciamento bibliográficas; letramento em informação e as necessidades de informação; o envolvimento de bibliotecas universitárias e as novas oportunidades que apresenta para bibliotecários.
BORGMAN, C. L. Big data, little data, no data: scholarship in the networked world. Cambridge: MIT Press, 2015. 416 p. ISBN: 9780262028561
Obra clássica que examina os usos dos dados em uma infraestrutura de conhecimento em mudança, oferecendo análises e estudos de caso das ciências, ciências sociais e humanas. A autora argumenta que os dados não têm valor ou significado isoladamente; eles existem dentro de uma infraestrutura de conhecimento - uma ecologia de pessoas, práticas, tecnologias, instituições, objetos materiais e relacionamentos.
BRINEY, K. Data Management for Researchers: Organize, Maintain and Share Your Data for Research Success. Exeter, UK: Pelagic, 2015. 204 p. ISBN: 9781784270117
Guia sobre o que se precisa saber sobre a GDP. Dividido em 11 capítulos a obra aborda: o problema dos dados, o ciclo de vida dos dados, planejando para a gestão de dados, documentação, organização, aprimorando a análise de dados, dados sensíveis, armazenamento e backups, armazenamento e preservação a longo prazo, compartilhamento de dados, reuso de dados, recomeçando o ciclo de vida dos dados.
CORTI, L.; EYNDEN, V. Van den; BISHOP, L.; WOOLLARD, M. Managing and Sharing Research Data: A Guide to Good Practice. 2nd ed. Los Angeles: Sage, 2019. 368 p. ISBN: 1526460264
Editada desde 2014, é uma obra prática sobre como preservar e compartilhar os dados científicos. Os exercícios no final de cada capítulo são pontos de aprendizagem úteis
COUNCIL ON LIBRARY AND INFORMATION RESOURCES. Research Data Management: Principles, Practices, and Prospects. Washington, DC: Council on Library and Information Resources, 2013. 99 p. ISBN 978193232647-5 www.clir.org/pubs/reports/pub160
Em seis capítulos, o documento examina como as instituições de pesquisa estão respondendo aos requisitos das agências de fomento americanas. Aborda também os papéis que as bibliotecas universitárias e os profissionais de informação devem ter no apoio das necessidades dos cientistas em relação à gestão de dados.
DIAS, G. A.; OLIVEIRA, B. M. J. F. de (org.). Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 2019. 216 p. ISBN: 9788523714116
Com nove capítulos, apresenta os principais tópicos relacionados com os dados científicos no contexto acadêmico. “Nos quatro capítulos iniciais da obra são abordadas questões de vertente mais teóricas, [...] Os capítulos seguintes abordam questões relacionadas com a curadoria dos dados científicos, repositórios eletrônicos de dados e o Ciclo de Vida dos Dados)” (Apresentação).
ERWAY,R.; HORTON, L.; NURNBERGER, A.; OTSUJI, R.; RUSHING, A. Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, OH: OCLC, 2016. 23 p. www.oclc.org/research/publications/2016/oclcresearch-data-management-building-blocks-2016.html
Documento que “provê orientação detalhada em dois níveis: a Parte 1, estabelecendo a Fundação, é dirigida a instituições que ainda precisam iniciar sua implementação, com o objetivo de orientá-las nas etapas necessárias para estabelecer uma base firme e solidária sobre a qual construir. A Parte 2, Construção e saída, é para aqueles que estão um pouco mais adiantados e prontos para criar a estrutura de um programa completo de GDP” (Introdução).
GONZÁLEZ MORENO, L. M.; PESET MANCEBO, F. Ciencia abierta y gestión de datos de investigación (RDM). Gijón, Espanha: Trea, 2017. 192 p. ISBN 9788497049078
Apresenta uma introdução à ciência dos dados e sua gestão por parte da biblioteca.
GREEN, A.; MACDONALD S.; RICE, R. Policy-making for research data in Repositories: a guide. London: Data Information Specialists Committee UK, 2009. www.disc-uk.org/docs/guide.pdf
Em sete capítulos, apresenta uma panorâmica dos principais aspectos sobre os dados de pesquisa.
HARVEY, R. Digital Curation: A How-To-Do-It Manual. 2. ed. New York: Neal-Schuman, 2016. 240 p. ISBN: 9780838913857
Editada desde 2010, a obra apresenta de forma prática e didática, os conceitos e técnicas essenciais que são cruciais para preservar a longevidade dos recursos digitais. Nesta edição foram incluídos capítulos sobre o compartilhamento e reuso de dados, e sobre os processos para garantir a preservação desses dados.
INTER-UNIVERSITY CONSORTIUM FOR POLITICAL AND SOCIAL RESEARCH (ICPSR). Guide to social science data preparation and archiving. 6th ed. Ann Arbor, MI: ICPSR, 2020. 62 p. www.icpsr.umich.edu/web/pages/deposit/guide/
Editado desde 1997, é um guia prático que apresenta o fluxo de preparação e arquivamentos de dados, com ênfase nas ciências sociais.
JOHNSTON, L. R., ed. Curating Research Data. Chicago: American Library Association, 2017. 294 p.
Em 12 capítulos, a obra aborda vários aspectos da GDP.
KELLAM, L.; THOMPSON, K., ed. Databrarianship: The Academic Data Librarian in Theory and Practice. Chicago: ALA, 2016. 386 p. ISBN: 9780838987995
Contendo 22 capítulos, a obra está dividida em quatro partes: serviços de apoio de dados para pesquisadores e estudantes; dados nas disciplinas; preservação e acesso aos dados; passado, presente e futuro. Cada capítulo foi escrito por especialistas onde apresentam estudos de casos, apontando os desafios de se trabalhar com diferentes tipos de formas de dados, explorando os modelos de serviços mais adequados aos tipos de bibliotecas.
KRIER, L.; STRASSER, C. A. Data management for libraries: a LITA guide. Chicago: American Library Association, 2014. 112 p. ISBN: 9781555709693
De forma prática, a obra em oito capítulos aborda: o que é gestão de dados; iniciando um novo serviço; planos para a gestão de dados; a entrevista sobre gestão de dados; metadados; preservação de dados; acesso; problemas dos dados governamentais. Anexos: recursos sobre repositórios institucionais; descrição das tarefas do bibliotecário de dados; planos para a gestão de dados.
LAKE, S; SALLANS, A.; PRALLE, B.; FEARON, D.; GUNIA, B. Research data management services. Washington, DC: Association of Research Libraries, 2013. (SPEC kit, 334)
A obra apresenta os resultados de um levantamento realizado com 73 bibliotecas universitárias sobre as atividades de GDP. Aborda o planejamento, indexação, armazenamento, preservação e compartilhamento de dados de instituições de pesquisa. É útil por apresentar documentos, fluxos, formulários e demais documentos usados por essas bibliotecas.
OPEN KNOWLEDGE FOUNDATION (OKF). Guia de dados abertos. opendatahandbook.org/pt_BR/index.html
O guia “apresenta os aspectos legais, sociais e técnicos dos dados abertos. Pode ser usado por qualquer um, porém foi especialmente desenvolvido para aqueles que querem trabalhar com dados abertos de pesquisa. Discute o porquê, o que e como dos dados abertos” (Apresentação).
RAY, J. M., ed. Research data management: practical strategies for information professionals. West Lafayette, IN: Purdue University Press, 2014. 300 p. ISBN: 9781557536648
A obra está dividida em seis partes: entendendo o contexto político; planejando para a gestão de dados; administrando o projeto de dados; arquivando e administrando dados de pesquisa em repositórios; medindo o sucesso; estudo de casos.
PRYOR, G.; JONES, S.; WHYTE, A. Delivering research data management services: fundamentals of good practice. London: Facet, 2014. 256 p. ISBN: 9781856049337
Guia que ensina como implementar um serviço de GDP dentro de uma organização, com exemplos dos Estados Unidos, Reino Unido e Austrália.
PRYOR, G., ed. Managing Research Data. London: Facet, 2013. 224 p. ISBN 9781856049337
Com 10 capítulos, escritos por especialistas, a obra aborda os principais aspectos da GDP. Com ênfase no contexto anglofônico.
RICE, R. C.; SOUTHALL, J. The Data Librarian’s Handbook. London: Facet, 2016. 224 p. ISBN 9781783300471
Obra prática, com nove capítulos, aborda: introdução à biblioteconomia de dados, as diferenças entre os dados, letramento em dados, desenvolvendo um acervo de dados, a GDP, os planos para a GDP, repositórios de dados, dados sensíveis, a ciência aberta e a pesquisa aberta.
SALES, L. F.; SAYÃO L. F. Dados de pesquisa: quem ama cuida. Brasília, DF: Comissão Nacional de Energia Nuclear (Brasil): IBICT, 2019. 23 p.
Sob a forma de uma cartilha ilustrada apresenta, de forma simples como “os dados são tão importantes como meus artigos. Então eu preciso aprender a fazer sua gestão durante todo o transcorrer da minha pesquisa” (Introdução).
SAYÃO, L. F.; SALES, L. F. Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. Rio de Janeiro: CNEN/IEN, 2015. 90 p.
A obra tem como objetivo “apresentar aos pesquisadores e bibliotecários os elementos básicos, conceitos, ferramentas, referências e melhores práticas para o planejamento da gestão de dados de pesquisa e para a efetiva ação ao longo de todo o ciclo de vida dos dados” (Introdução).
SILVA, F. C. C. da. Gestão de dados científicos. Rio de Janeiro: Interciência, 2019. 128 p. ISBN 9788571934351
Obra introdutória, em oito capítulos, aborda o interesse pelos dados, os dados de pesquisa, tipologia dos dados, ciclo de vida, plano de gestão de dados, repositórios de dados e o papel do bibliotecário.
STRASSER, C. Research Data Management. Baltimore, MD: NISO, 2015. 27 p. ISBN: 9781937622650 www.niso.org/apps/group_public/download.php/15375/PrimerRDM-2015-0727.pdf
Pequeno manual que aborda os principais aspectos relacionados à GDP.
TENOPIR, C.; BIRCH, B.; ALLARD, S. Academic Libraries and Research Data Services: Current Practices and Plans for the Future. Chicago: Association of College & Research Libraries, 2012. 55 p. www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/whitepapers/Tenopir_Birch_Allard.pdf
O documento analisa a situação da GDP em bibliotecas universitárias dos Estados Unidos e Canadá.
VAN DEN EYNDE, V.; CORTI, L.; WOOLLARD, M.; BISHOP, L.; HORTON, L. Managing and Sharing Data: Best Practice for Researchers. Colchester, UK: UK Data Archive, 2011. 40 p. www.data-archive.ac.uk/media/2894/managingsharing.pdf
Pequeno guia que aborda o fluxo da GDP.
2.3 Documentos gerais sobre GDP
AKERS, K. G.; SFERDEAN, F. C.; NICHOLLS, N. H.; GREEN, J. A. Building Support for Research Data Management: Biographies of Eight Research Universities. International Journal of Digital Curation v. 9, n. 2 p. 171-191, 2014. www.ijdc.net/index.php/ijdc/article/view/9.2.171/376
Comenta oito casos de bibliotecas universitárias que desenvolveram suporte para a GDP, incluindo os novos serviços e infraestrutura. O artigo sugere prazos para cada universidade na construção de apoio para a GDP, apontando as semelhanças e diferenças entre as motivações para implantar a GDP, as colaborações entre as unidades do campus, a avaliação das necessidades e serviços, além das mudanças nos recursos humanos.
ALBAGLI, S.; APPEL, A. L.; MACIEL, M. L. E-Science, ciência aberta e o regime de informação em ciência e tecnologia. Tendências da Pesquisa Brasileira em Ciência da Informação, v. 7, n. 1, jan./jun. 2014. inseer.ibict.br/ancib/index.php/tpbci/article/viewFile/124/166
Comenta as práticas de e-Science e as questões que influenciam sua promoção como ciência aberta.
ASSOCIATION OF RESEARCH LIBRARIES. Joint Task Force on Library Support for E-Science. Agenda for Developing E-Science in Research Libraries. Final Report and Recommendations to the Scholarly Communication Steering Committee, the Public Policies Affecting Research Libraries Steering Committee, and the Research, Teaching, and Learning Steering Committee. Nov. 2007. www.arl.org/storage/documents/publications/escience-report-final-2007.pdf
Apresenta uma agenda para o uso da GDP em bibliotecas universitárias.
ASSOCIATION OF RESEARCH LIBRARIES. To Stand the Test of Time: Long-term Stewardship of Digital Data Sets in Science and Engineering; A Report to the National Science Foundation from the ARL Workshop on New Collaborative Relationships: The Role of Academic Libraries in the Digital Data Universe. Arlington, VA: Sept. 2006. 160 p. www.arl.org/storage/documents/publications/digital-data-report-2006.pdf
Examina o papel das bibliotecas universitárias no desenvolvimento dos dados digitais científicos e da engenharia. São analisadas: a necessidade de novas parcerias para gerir os bancos de dados, desenvolvimento de infraestrutura necessária para apoiar esses dados e a necessidade de modelos econômicos sustentáveis para ajudar a GDP a longo prazo.
BRASE, J.; FARQUHAR, A., ed. Introduction. Access to Research Data. D-Lib Magazine, v.17, n. 1-2, Jan./Feb. 2011. www.dlib.org/dlib/january11/brase/01brase.html
Esta edição especial do D-Lib Magazine inclui oito artigos derivados das palestras e um artigo adicional sobre a qualidade dos dados de pesquisa.
COATES, H. L. Building data services from the ground up: strategies and resources. Journal of eScience Librarianship, v. 3, n. 1, e1063, 2014. escholarship.umassmed.edu/jeslib/vol3/iss1/5/
O artigo mostra os recursos e as estratégias para o desenvolvimento de serviços locais relevantes e apontando para as comunidades de bibliotecários e pesquisadores enfrentar os desafios associados com os dados de pesquisa digital.
COUNCIL ON LIBRARY AND INFORMATION RESOURCES. No Brief Candle: Reconceiving Research Libraries for the 21st Century. Washington, DC: Council on Library and Information Resources (CLIR), 2008. 81 p. (CLIR Report 142) www.clir.org/pubs/reports/pub142/
Documento inclui as oito conferências, feitas por especialistas, em fevereiro de 2008, sobre os desafios e as oportunidades que as bibliotecas enfrentarão nos próximos anos e como a comunicação científica irá afetar o futuro das bibliotecas.
COX, A. M.; PINFIELD, S.; SMITH, J. Moving a Brick Building: UK Libraries Coping with Research Data Management as a ‘Wicked’ Problem. Journal of Librarianship and Information Science v. 48, n. 1, p. 3-17, 2016. journals.sagepub.com/doi/full/10.1177/0961000614533717
O artigo analisa como os bibliotecários devem ver a GDP como um problema único e complexo. Este problema geralmente é gerado pelo fato de que as diferentes partes interessadas analisam de forma particular, tornando dificil o seu gerenciamento.
DOÑATE-CIFUENTES, A.; PESET, F.; FERRER-SAPENA, A. G. Research data services in academic libraries: the essential list. In: LIBER ANNUAL CONFERENCE, 2016 Libraries opening paths to knowledge, Helsinki, June 2016. liber2016.org/wp-content/uploads/2016/06/20-Research-data-services_Donate-Cifuentes.pdf
Estudo sobre os serviços de dados de pesquisa em bibliotecas da América e da Europa. Apresenta uma lista com os serviços de dados essenciais para as pequenas bibliotecas com um orçamento pequeno, focando na realidade europeia.
ERWAY, R.; HORTON L.; NURNBERGER, A.; OTSUJI, R.; RUSHING, A. Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, OH: OCLC Research, 2016. www.oclc.org/content/dam/research/publications/2016/oclcresearch-data-management-building-blocks-2016.pdf
Dividido em duas partes, o documento é útil para quem pensa em oferecer serviços de dados para os pesquisadores de uma universidade. Na primeira parte apresenta os fundamentos básicos sobre GDP; na segunda, identifica os caminhos necessários para a criação desses serviços de dados.
ESTADOS UNIDOS. Executive Office of the President. National Science and Technology Council. Interagency Working Group on Digital Data to the Committee on Science. Harnessing the Power of Digital Data for Science & Society. Washington, DC: January 2009. 60 p. www.nitrd.gov/About/Harnessing_Power_Web.pdf
Relatório, preparado pelo governo americano, que contém as estratégias para assegurar que os dados científicos sejam preservados de forma confiável, visando a máxima utilização no processo de catalisação do progresso da ciência e tecnologia.
GASPAR, A. C.; ALVARES, L.; PEREIRA, M. de N. F. Gestão dos dados de pesquisa: oportunidades e desafios. In: SEMINARIO HISPANO BRASILERO DE INVESTIGACIÓN EN INFORMACIÓN, DOCUMENTACIÓN Y SOCIEDAD, 3., Brasilia, 2014. issuu.com/necfci-unb/docs/pol__ticas_de_informa____o
Analisa casos de sucesso e lições aprendidas disponíveis na literatura sobre compartilhamento, reuso e preservação de dados abertos da ciência.
GOLD, A.. Cyberinfrastructure, Data, and Libraries, Part 1. A Cyberinfrastructure Primer for Librarians. D-Lib Magazine v. 13, n. 9/10, 2007. www.dlib.org/dlib/september07/gold/09gold-pt1.html
GOLD, A. Cyberinfrastructure, Data, and Libraries, Part 2. Libraries and the Data Challenge: Roles and Actions for Libraries. D-Lib Magazine v. 13, n. 9/10, 2007. www.dlib.org/dlib/september07/gold/09gold-pt2.html
Em duas partes, o artigo inicialmente faz uma introdução sobre os maiores problemas relacionados com os dados científicos e, em seguida, analisa os papeis que as bibliotecas e os bibliotecários podem exercer nessa nova temática.
GOODMAN, A. et al. Ten Simple Rules for the Care and Feeding of Scientific Data. PLoS Computational Biology v. 10. n. 4, e1003542, 2014. journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003542
O artigo provê um um breve guia para os pesquisadores que querem saber por que é importante “cuidar e alimentar” os seus dados de pesquisa, com alguns conselhos práticos sobre como fazer isso.
JAHNKE, L.; ASHER, A.; KERALIS, S. D. C. The Problem of Data. Washington, DC: Council on Library and Information Resources, 2012. 48 p. (CLIR Report 154). www.clir.org/pubs/reports/pub154
Documento que inclui dois relatórios: a GDP e a prática da curadoria entre os pesquisadores universitários; a educação em curadoria digital.
JONES, S.; PRYOR, G.; WHYTE, A. How to Develop Research Data Management Services—A Guide for HEIs. Edinburgh: Digital Curation Centre, 2013 www.dcc.ac.uk/resources/how-guides/how-develop-rdm-services
O objetivo deste guia é ajudar as instituições a entenderem os pontos-chave e as questões relacionadas com os serviços de GDP. Apresenta os componentes e os processos de serviços, descreve os papéis e as responsabilidades daqueles que vão entregar e usá-los.
PARSON, T. Creating a research data management service. International Journal of Digital Curation, v. 8, n. 2, p. 146-156, 2013. www.ijdc.net/index.php/ijdc/article/view/8.2.146/324
O artigo apresenta uma visão geral dos elementos necessários para se criar um serviço sustentável de GDP. Analisa a experiência da Universidade de Nottingham (UK) na montagem do seu serviço, abordando a GDP, o levantamento e a validação dos requisitos e a disponibilização na internet.
PINFIELD, S.; COX, A. M.; SMITH, J. Research data management and libraries: Relationships, activities, drivers and influences. PLoS ONE v. 9, n. 12, e114734, 2014. DOI: 10.1371/journal.pone.0114734
Este artigo analisa a contribuição de 26 bibliotecas universitárias do Reino Unido para a GDP. Examina as funções e os relacionamentos envolvidos na GDP, identifica os principais componentes de um programa GDP, analisa os principais fatores que influenciam a forma dos desenvolvimentos da GDP.
RABOIN, R.; REZNIK-ZELLEN, R. C.; SALO, D. Forging New Service Paths: Institutional Approaches to Providing Research Data Management Services. Journal of eScience Librarianship, v. 1, n. 3, e1021, 2012. escholarship.umassmed.edu/jeslib/vol1/iss3/2/
Descreve três diferentes experiências institucionais no desenvolvimento de programas de GDP, analisando os desafios, as oportunidades e as lições aprendidas.
RAMBO, N. Research Data Management Roles for Libraries. New York: Ithaka S+R, October 2015. 19 p. www.sr.ithaka.org/wp-content/uploads/2015/10/SR-Issue_Brief_Research_Data_Management_1022151.pdf
Folheto que descreve os passos que uma biblioteca deve executar para implantar serviços de GDP.
RESEARCH DATA ALLIANCE. The Data Harvest, how sharing research data can yield knowledge, jobs and growth. 40 p. Dec. 2014. rd-alliance.org/sites/default/files/attachment/The%20Data%20Harvest%20Final.pdf
Documento de cunho estratégico que mostra como “a Europa deve agir agora para garantir sua posição nos mercados de dados futuros. Nestas páginas, que descrevem os benefícios e desafios e recomendações de oferta. Falamos como líderes da Aliança Dados Research, uma organização financiada pela UE que, com os seus homólogos em os EUA e a Austrália, está trabalhando para acelerar e facilitar o caminho para dados científicos que compartilham todo o mundo.” (p. 3).
SALES, L. F. SAYÃO, L. F. O impacto da curadoria digital dos dados de pesquisa na comunicação científica. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, v. 17, n. esp. 2, p. 118-135, 2012. Disponível em: periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2012v17nesp2p118
Apresenta o conceito de curadoria digital enquanto uma nova atividade de tratamento e representação da informação que, desenvolvida de forma correta, poderá alterar o ciclo da comunicação científica.
SI, L. et al. Investigation and analysis of research support services in academic libraries. Electronic Library, v. 37, n. 2, p. 281-301, 2019. doi.org/10.1108/EL-06-2018-0125
O artigo teve como objetivo entender a situação dos serviços de suporte à pesquisa oferecidos por 76 bibliotecas universitárias nas principais universidades do mundo e fornecer implicações e sugestões úteis a GDP em outras bibliotecas.
SILVA, F. C. C. da. Infraestructuras y políticas internacionales de desarrollo para gestión de los datos de investigación. Biblios, Lima, n. 63, 2016. biblios.pitt.edu/ojs/index.php/biblios/article/view/286/261
O artigo faz uma análise das infraestruturas e políticas de desenvolvimento para a GDP, focando nos mecanismos adotados para a área a nível internacional.
UNIÃO EUROPEIA. Guidelines on open access to scientific publications and research data in horizon 2020. 10 p. Version 2.1, 15 February 2016. (The EC Framework Programme for Research and Innovation- Horizon 2020). ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
“Estas orientações destinam-se a contextualizar e clarificar as regras de acesso aberto que cobrem os beneficiários em projectos financiados ou co-financiados pelo Programa Horizon 2020” (p. 2).
WITT, M. Co-designing, Co-developing, and Co-implementing an Institutional Data Repository Service. Journal of Library Administration, v. 52, n. 2, p. 172-188, 2012.
Em janeiro de 2011, a National Science Foundation começou a exigir que todas as propostas de financiamento da investigação incluissem a GDP. Nessa época biblioteca e a Universidade de Purdue tinham iniciado a montagem do HUBzero, um repositório institucional de dados digitais. No processo, as práticas de biblioteconomia foram estendidas para facilitar a curadoria de dados de pesquisa no campus. A partir daí os bibliotecários passaram a montar a GDP, letramento sobre dados, consultoria sobre organização e descrição dos dados, dentro de um quadro de novos serviços bibliotecários.
3 FLUXO DOS DADOS CIENTÍFICOS
Esta parte da bibliografia está arranjada segundo as fases do fluxo tradicional do documento numa biblioteca ou repositório digital que realiza a GDP. Assim, neste fluxo estão incluídas as fases básicas sobre a GDP, documentando os dados de pesquisa, administrando os dados, preservação de dados e uso de dados.
Dentro de cada assunto segue-se a ordem alfabética dos autores e/ou instituições. Tanto quanto possível, foram incluídos os endereços eletrônicos na internet, que foram conferidos antes da publicação deste artigo. Entretanto, tendo em vista a volatilidade desses endereços, é provável que alguns não estejam ativados e/ou tenham sido transferidos para outros sítios.
3.1 Planejando a gestão de dados
3.1.1 Políticas de GDP
Inúmeros governos e agências de fomento começam a elaborar políticas públicas relacionadas com a GDP. Geralmente essas políticas visam, entre outras coisas, ampliar a eficiência da pesquisa, motivar a reutilização dos dados, acelerar as ações cooperativas entre pesquisadores e suas entidades.
Existe uma diversidade de como as políticas de GDP são implantadas e monitoradas. O certo é que esta é uma área nova para todos. Também coexiste nesse contexto a criação de ações de GDP mesmo sem a existência de políticas públicas. Certamente, tal cenário tende a mudar rapidamente nos próximos anos, com uma participação mais efetiva dos agentes públicos.
BERTIN, P. R. B. et al. A Política de Governança de Dados, Informação e Conhecimento da Embrapa como mecanismo para a gestão de dados de pesquisa agropecuários. Liinc em revista, v. 15, n. 2, p. 194-204, 2019. revista.ibict.br/liinc/article/view/4798
O artigo analisa a política de governança de dados, informação e conhecimento da Embrapa, com foco nas questões relacionadas à GDP. Espera-se que essa política possa ser instrumental para outras organizações no desenvolvimento de seus próprios atos normativos.
BRINEY, K.; GOBEN, A.; ZILINSKI, L. Do You Have an Institutional Data Policy? A Review of the Current Landscape of Library Data Services and Institutional Data Policies. Journal of Librarianship and Scholarly Communication v. 3, n. 2, p. 12-32, 2015.
Análise das políticas de GDP adotadas por 206 universidades americanas, onde foram examinados 24 aspectos relacionados às bibliotecas universitárias, os serviços de dados dessas bibliotecas e suas políticas de conteúdo informativo.
CALLAGHAN, S. et al. Guidelines on Recommending Data Repositories as Partners in Publishing Research Data. International Journal of Digital Curation v. 9, n. 1, p. 152-163, 2014. www.ijdc.net/index.php/ijdc/article/view/9.1.152/349
O documento sintetiza as orientações elaboradas pela UK JISC relativas à acreditação governamental de repositórios de dados.
CORRÊA, P. L. P. Modelo organizacional para gestão integrada de dados da biodiversidade brasileira. In: DIAS, G. A.; OLIVEIRA, B. M. J. F. de (org.). Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 2019. Cap. 7, p. 153-175
O “capítulo apresenta o modelo organizacional e as diretrizes de política de dados institucional (...) para a gestão de dados científicos de biodiversidade, estabelecendo os papéis, os processos e os relacionamentos intra e inter organizacionais” (p. 154).
DIGITAL CURATION CENTRE. UK Institutional Data Policies. 2016. www.dcc.ac.uk/resources/policy-and-legal/institutional-data-policies
Mostra as políticas de GDP praticadas pelas instituições britânicas.
DILLO, I.; DOORN, P. The Front Office-Back Office Model: Supporting Research Data Management in the Netherlands. International Journal of Digital Curation v. 9, n. 2, p. 39-46, 2014. www.ijdc.net/index.php/ijdc/article/view/9.2.39/368
O artigo apresenta uma visão dos dados federados na Holanda com um modelo de uma infraestrutura nacional de suporte para os pesquisadores.
ERWAY, R. Starting the Conversation: University-wide Research Data Management Policy. Dublin, Ohio: OCLC Research, 2013. 24 p. oclc.org/research/publications/library/2013/2013-08r.html
Aborda os benefícios da adoção de uma política de GDP no âmbito das universidades. Identifica os vários intervenientes nessa política e sugere que a biblioteca deva iniciar uma negociações entre eles, a fim de obter uma ação proativa, facilitando assim o planejamento e gerenciamento dos dados num contexto sustentável.
HALL, N.; COREY, B.; MANN, W.; WILSON, T. Model Language for Research Data Management Polices. ASERL/SURA Research Data Coordinating Committee, 2013. 5 p. www.aserl.org/wp-content/uploads/2012/11/Model_Language_RDM_Policies-FINAL_FOR_ASERL_REVIEW.pdf
Sugere um modelo de documento para as universidades que estão considerando implantar uma política de GDP.
JONES, S. Developments in Research Funder Data Policy. International Journal of Digital Curation v. 7, n. 1, p. 114-125, 2012. www.ijdc.net/index.php/ijdc/article/view/209/278
O artigo faz uma revisão do desenvolvimento das políticas públicas de GDP no Reino Unido após 2008. Também aponta as perguntas que ainda permanecem sobre se as mudanças estão afetando a prática no contexto de dados.
KROES, N. Open Science for the 21st century: A declaration of all European Academies. Rome: Accademia Nazionale dei Lincei, 11-12 April 2012. 5 p. www.unesco.org/new/fileadmin/MULTIMEDIA/HQ/CI/CI/pdf/news/ALLEA%20Declaration%20on%20Open%20Science.pdf
A União Europeia tem liderado o movimento do Acesso Livre que continuará no programa Horizonte 2020, começando em 2014 com a e-infraestrutura, incluindo o desenvolvimento de sistemas de helpdesk regulares e interfaces web para tornar as redes de repositórios mais amigáveis e transparentes, como também incluir serviços avançados para buscar informações, vincular publicações e dados experimentais, processar e visualizar dados em ambientes virtuais, e para manter e atualizar aplicativos de armazenamento e softwares de preservação em longo prazo.
RODRIGUES, E.; SARAIVA, R. Os Repositórios de dados científicos: estado da arte. Universidade do Minho. Projeto RCAAP. 4 de julho de 2010. 54 p. projeto.rcaap.pt/index.php?option=com_remository&Itemid=2&func=startdown&id=271&lang=pt
Estudo elaborado para orientar o desenvolvimento do Repositório Científico de Acesso Aberto de Portugal, provendo informação sobre o tema e iniciativas relacionadas com a GDP, apresentado um quadro dos repositórios de dados científicos, enquadramento, origem e evolução. Descreve as tecnologias, plataformas e normas de metadados bem como aspectos políticos, legais e éticos associados ao acesso e reutilização dos dados científicos.
SHEARER, K. Comprehensive Brief on Research Data Management Policies. 2015. docplayer.net/17594465-Comprehensive-brief-on-research-data-management-policies.html
Analisa as políticas existentes no Canadá, Austrália, Reino Unido, Estados Unidos, Alemanha e na União Europeia. Comenta também a administração, implantação, custos e desafios da GDP.
WILSON, J. A. J.; MARTINEZ-URIBE, L.; FRASER, M. A.; JEFFREYS, P. An Institutional Approach to Developing Research Data Management Infrastructure. International Journal of Digital Curation, v. 6, n. 2, p. 274-287, 2011. www.ijdc.net/article/view/198
Descreve dois projetos da Universidade de Oxford (UK) para implementar uma infraestrutura de GDP. Esses projetos envolvem o trabalho com pesquisadores para o desenvolvimento de aspectos particulares da infraestrutura, incluindo: políticas da universidade, sistemas para a preservação e documentação de dados de pesquisa, treinamento e suporte, ferramentas de software para a visualização de imagens grandes, e criação e compartilhamento de bancos de dados via Web.
3.1.2 Planos para a gestão de dados
Os planos para a gestão de dados é um dos elementos chave no processo da GDP. Eles descrevem como os dados são coletados, formatados, preservados e compartilhados, bem como como dados já existentes podem ser usados e como novos dados serão criados. Também ajudam os pesquisadores na identificação dos custos, dos benefícios e dos desafios na gestão dos dados. É importante que na sua implantação os planos utilizem ferramentas padronizadas.
A flexibilidade na organização da informação é um dos principais pontos no projeto de GDP. Nessa organização é que entra a arquitetura da informação para representar a riqueza e variedade dos conteúdos informacionais, geralmente feita sob a forma de blocos que comporão o sistema. Do ponto de vista computacional, essa biblioteca é construída com componentes simples, denominados objetos digitais – uma das maneiras para estruturar a informação sob a forma digital. Essa estruturação não é trivial, pois um simples documento pode ser composto de várias partes que possuem uma complexa estrutura interna e relacionamentos com outros documentos.
Portanto, os PGD são elementos essenciais para o futuro sucesso dessa empreitada, permitindo uma interação descomplicada e ágil entre o usuário e os dados. Os documentos abaixo podem ser úteis para a compreensão dos caminhos tomados na implantação dos projetos de bibliotecas ou repositórios de dados.
BALL, J. Research Data Management for Libraries: Getting Started. Insights: The UKSG Journal v. 26, n. 3, p. 256-260, 2013. insights.uksg.org/articles/10.1629/2048-7754.70/
O artigo mostra o enfoque utilizado pela Universidade de Sussex (UK) para envolver os departamentos nas práticas de GDP, apontando, inclusive os problemas e as soluções encontradas para obter êxito no projeto.
BRASIL. MINISTÉRIO DO PLANEJAMENTO, ORÇAMENTO E GESTÃO COMISSÃO NACIONAL DE CARTOGRAFIA. Plano de Ação para a implantação da infraestrutura de dados espaciais. Janeiro 2010. 205 p. www.concar.gov.br/pdf/PlanoDeAcaoINDE.pdf
“Os capítulos deste documento foram planejados para abordarem as dimensões de implementação de uma Infraestrutura de Dados Espaciais (IDE), a saber: a dimensão Organizacional, a dimensão Técnica e a dimensão Humana. O primeiro capítulo trata de conceitos gerais e diretrizes para a implantação da INDE; os Capítulos 2 a 7 endereçam questões organizacionais, técnicas e humanas essenciais. A consolidação dá-se no Capítulo 8, que corresponde ao PLANO DE AÇÃO DA INDE propriamente dito, ao qual também se refere como Plano de Ação” (Prefácio).
CLAIBOURN, M. P. Bigger on the Inside: building Research Data Services at the University of Virginia. Insights: The UKSG Journal v. 28, n. 2, p. 100-106, 2015. insights.uksg.org/articles/10.1629/uksg.239/
Descreve a trajetória das ações realizadas visando a implantação do Research Data Services da biblioteca da Universidade de Virginia (US).
CLEMENTS, A. Research Information Meets Research Data Management in the Library? Insights: The UKSG Journal v. 26, n. 3, p. 298-304, 2013. insights.uksg.org/articles/10.1629/2048-7754.99/
Mostra as ações usadas na biblioteca da University of St Andrew (UK) para a criação de uma estrutura de GDP.
DIGITAL CURATION CENTRE. Checklist for a Data Management Plan. v.4.0. Digital Curation Centre, 2014. www.dcc.ac.uk/resources/data-management-plans
Excelente ajuda na conferência dos itens de um plano de gestão.
DIGITAL CURATION CENTRE. DMPonline. dmponline.dcc.ac.uk/
Modelo de plano de GDP; focado no contexto da comunidade europeia.
ERWIN, T.; SWEETKIND-SINGER, J.; LARSGAARD, M. L. The National Geospatial Digital Archives—Collection Development: Lessons Learned. Library Trends v. 57, n. 3, p. 490-515, 2009. www.ideals.illinois.edu/bitstream/handle/2142/13592/librarytrends573_erwin.pdf?sequence=2
Analisa a política de desenvolvimento de coleções dos dados do National Geospatial Digital Archives, projeto conjunto entre as universidades da California Santa Barbara e de Stanford. Aponta as dificuldades para a implantação desse tipo de política tendo em vista as características dos objetos digitais a serem arquivados.
FARY, M.; OWEN, K. Developing an Institutional Research Data Management Plan Service. EDUCAUSE, Louisville, Jan. 8, 2013. 27 p. library.educause.edu/resources/2013/1/developing-an-institutional-research-data-management-plan-service
Provê instruções para o desenvolvimento de GDP numa instituição de ensino superior. O documento está dividido em três partes: o que deve ser incluído no plano, desenvolvendo o serviço e habilidades necessárias para o serviço de consultoria na área.
HENDERSON, M. E.; KNOTT, T. L. Starting a Research Data Management Program Based in a University Library. Medical Reference Services Quarterly v. 34, n. 1, p. 387-403, 2015. pubmed.ncbi.nlm.nih.gov/25611440/
O artigo analisa a criação, em setembro de 2013, de um serviço de GDP na Virginia Commonwealth University (US).
JOHNSON, A. M.; KNUTH, S. Data Management Plan Requirements for Campus Grant Competitions: Opportunities for Research Data Services Assessment and Outreach. Journal of eScience Librarianship v. 5, n. 1, e1089, 2016. escholarship.umassmed.edu/jeslib/vol5/iss1/1/
Analisa os efeitos de serviços de GDP sobre a qualidade dos planos de gestão de dados necessários para uma competição junto às agências de fomento. As exigências dos planos de GDP em competições podem proporcionar importantes oportunidades de avaliação e divulgação desses serviços no contexto de uma organização de pesquisa.
JONES, S.; PRYOR G.; WHYTE, A. How to Develop Research Data Management Services - a guide for HEIs. Edinburgh: Digital Curation Centre, 2015. www.dcc.ac.uk/resources/how-guides/how-develop-rdm-services
Baseado nas experiencias de 40 universidades do Reino Unido, é um excelente guia sobre como planejar um serviço de GDP.
MAYERNIK, M. S., et al. The Data Conservancy Instance: Infrastructure and Organizational Services for Research Data Curation. D-Lib Magazine v. 18, n. 9/10, 2012. www.dlib.org/dlib/september12/mayernik/09mayernik.html
O artigo descreve a GDP implantada na Johns Hopkins University (US). São comentados os serviços organizacionais e a infraestrutura para a coleção de dados, armazenamento, preservação, arquivamento, curadoria e compartilhamento dos dados.
PARSONS, T. Creating a Research Data Management Service. International Journal of Digital Curation v. 8, n. 2, p. 146-156, 2013. www.ijdc.net/index.php/ijdc/article/view/8.2.146/324
Baseada na experiência da Universidade de Nottingham (UK), o artigo mostra uma visão geral dos elementos necessários para a criação de um serviço sustentável de GDP.
PEER, L.; GREEN, A. Building an Open Data Repository for a Specialized Research Community: Process, Challenges and Lessons. International Journal of Digital Curation, v. 7, n. 1, p. 151-162, 2012. www.ijdc.net/index.php/ijdc/article/view/212/281
Comenta o processo de criação, em 2009, no Institution for Social and Policy Studies, da Universidade de Yale (US), de um repositório de dados.
SILVA JÚNIOR, L. P. da; SANTOS, T. H. do N.. repositórios de dados científicos: um panorama teórico-prático. In: DIAS, G. A.; OLIVEIRA, B. M. J. F. de (org.). Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 2019. Cap. 5, p. 89-111.
Analisa os principais softwares para a criação de repositórios e serviços de dados científicos.
UNIÃO EUROPEIA. Guidelines on data management in Horizon 2020. Version 3.2, 21 March 2017. 11 p. (EC Framework Programme for Research and Innovation- Horizon 2020). ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
No Programa Horizon 2020 os projetos de acesso aberto aos dados de pesquisa exigem apresentação da GDP, nos quais deverão ser especificados quais dados estarão abertos.
UNIVERSITY OF CALIFORNIA. California Digital Library. Curation Center. Data Management Planning Tool (DMPT). dmptool.org/ ¶
Metodologia criada pela Universidade da California para o processo do planejamento da GDP.
VEIGA V. S. de O. et al. Plano de gestão de dados FAIR: uma proposta para a Fiocruz. Liinc em revista, Rio de Janeiro, v. 15, n. 2, p. 275-286, Nov. 2019. revista.ibict.br/liinc/article/view/5030/4349
Apresenta uma proposta de template de Plano de Gestão de Dados, alinhado aos princípios FAIR, para a Fundação Oswaldo Cruz e em diversos planos de gestão de dados europeus.
WITT, M. Co-designing, Co-developing, and Co-implementing an Institutional Data Repository Service. Journal of Library Administration v. 52, n. 2, p. 172-188, 2012.
Descreve as ações feitas no desenvolvimento do HUBzero pela biblioteca da Universidade de Purdue (US), visando a criação de um repositório de dados.
3.1.3 Requisitos das agências de fomento
Em janeiro de 2011, a National Science Foundation (NSF), importante agência americana de fomento à pesquisa, começou a exigir que todos os projetos de pedido de auxílio deveriam incluir a GDP. A partir daí forçadas por essa decisão legal, praticamente todas as instituições de pesquisa passaram a planejar e implantar a GDP em suas organizações. Essa decisão da NSF teve reflexos em outros países. Assim, desde então, começaram a surgir o desenvolvimento de repositórios de dados e serviços para apoiar esse tipo de atividade.
No desenvolvimento da GDP as bibliotecas passaram a incorporar esse tipo de conteúdo informativo aos seus acervos. Os bibliotecários começaram a executar atividades de consultoria nos PGD, conduzindo entrevistas e treinamento sobre as melhores maneiras de organizar e descrever os dados, iniciando ações para a futura preservação e divulgação desses acervos.
CANADA. Tri-Agency Statement of Principles on Digital Data Management. www.science.gc.ca/default.asp?lang=En&n=83F7624E-1
Requisitos exigidos pelas agências canadenses em projetos de GDP.
DIGITAL CURATION CENTRE. Overview of Funders’ Data Policies. www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies
Apresenta quadro comparativo das políticas de publicação e de dados das agências financiadoras do Reino Unido.
ESTADOS UNIDOS. OFFICE OF SCIENCE AND TECHNOLOGY POLICY. Memorandum for the heads of Executive departments and agencies. Subject: Increasing access to the results of federally funded scientific research. Washington, DC: Executive Office of the President, Office of Science and Technology Policy. Feb. 22, 2013. 6 p. www.whitehouse.gov/sites/default/files/microsites/ostp/ostp_public_access_memo_2013.pdf
Recomendações sobre os requisitos das agências de fomento do poder executivo americano para a GDP.
FUNDAÇÃO DE AMPARO À PESQUISA DO ESTADO DE SÃO PAULO (FAPESP). Programa FAPESP de Pesquisa em eScience e Data Science. www.fapesp.br/8436
Lançado em 27 de março de 2014, o programa visa “apoiar projetos de pesquisa (...) que envolvam, dentre outros, modelos matemáticos, repositórios digitais e gerenciamento de dados, novos hardwares, softwares, protocolos, ferramentas e serviços, voltados para atender demandas de pesquisas nas áreas de ciências agrárias; bioinformática, biológicas e saúde; artes, humanidades e ciências sociais; engenharia e física, clima e ciências da terra, e à prática e educação em eScience” (Sítio).
HSWE, P.; HOLT, A. NSF Data Sharing Policy. Association of Research Libraries, Guide for Research Libraries, 2011. www.researchgate.net/publication/220889273_The_DataRes_research_project_on_data_management
Guia prático, direcionado que mostra como atender os requisitos da NSF relativo à GDP; com links para os planos elaborados por inúmeras bibliotecas universitárias.
KOZLOWSKI, W. Funding Agency Responses to Federal Requirements for Public Access to Research Results. Bulletin of the American Society for Information Science and Technology v. 40, n. 6, p. 26-30, 2014. www.asis.org/Bulletin/Aug-14/AugSep14_Kozlowski.pdf
Analisa os requisitos exigidos pelas agências de fomento americanas.
NATIONAL SCIENCE FOUNDATION. Proposal Preparation Instructions. In: Grant Proposal Guide, cap. 2, Jan. 2011. www.nsf.gov/pubs/policydocs/pappguide/nsf11001/gpg_2.jsp#dmp
Inclui informações que irão ajudar na preparação de documentos que a National Science Foundation requer para a realização de revisões administrativas e financeiras da organização. Também mostra os requisitos de prestação de contas associados com recursos federais americanos.
TANANBAUM, G. Implementing an Open Data Policy: A Primer for Research Funders. Washington, DC: Scholarly Publishing and Academic Resources Coalition, 2013. 7 p. sparcopen.org/wp-content/uploads/2016/01/sparc-open-data-primer-final.pdf
Diretrizes gerais sobre a política de implantação de dados abertos.
THOEGERSEN, J. L. Examination of Federal Data Management Plan Guidelines. Journal of eScience Librarianship v. 4, n. 1, e1072, 2015. escholarship.umassmed.edu/jeslib/vol4/iss1/1/
O artigo analisa as diretrizes do plano de GDP de agências federais americanas de financiamento.
UNIVERSITY OF MINNESOTA. Libraries. Funding Agency Guidelines. www.lib.umn.edu/datamanagement/funding
Apresenta os requisitos de financiadores federais dos Estados Unidos para gerenciar e compartilhar dados de pesquisa.
3.2 Documentando os dados de pesquisa
3.2.1 Normas e padrões
A maturidade da biblioteca ou repositório digital de dados de pesquisa está demandando o estabelecimento de normas, padrões, formatos e protocolos que possam facilitar o crescimento futuro das redes. Eles exercem um papel vital para o sucesso, pois embasam as regras pelas quais os dados serão descritos e preservados, como e onde os seus conteúdos serão armazenados e recuperados, como também mostram como os seus sistemas se intercomunicam.
É crucial o papel das normas, isto é refletido no incremento da compreensão e reutilização dos dados. As atividades de normalização caracterizam as diferentes fases do ciclo de vida dos dados científicos. As várias atividades destinam-se a definir e desenvolver normas para: representar dados científicos, isto é, os modelos de padrões de dados; a consulta às coleções ou bancos de dados, isto é, as linguagens padrões de consulta; os modelo de domínio específico das informações de metadados, ou seja, os padrões de metadados; identificar os dados, isto é, os padrões de identificação de dados; criar um entendimento comum de um domínio específico, ou seja, os padrões de ontologias/taxonomias e léxicos; transferir dados entre domínios, ou seja, os protocolos de transporte, etc.
Portanto, é salutar verificar que nos projetos de implantação de novas bibliotecas a adoção das normas já existentes e/ou usadas em outros projetos em vez de se utilizar inovações locais, totalmente fora dos padrões. Essas ações certamente facilitarão a interoperabilidade entre esses projetos de GDP, redundando na otimização dos recursos.
Os metadados são a espinha dorsal da GDP. Sem ele um recurso digital pode ser irrecuperável, não identificáveis ou inutilizável. Metadados são informações descritivas ou contextual que se refere a ou está associado a outro objeto ou recurso. Isso normalmente assume a forma de um conjunto estruturado de elementos que descrevem o recurso de informação e auxilia na identificação, localização e recuperação do mesmo por usuários, facilitando ao mesmo tempo conteúdo e gerenciamento de acesso.
Com o crescimento da biblioteca digital a catalogação e classificação passaram a receber enormes investimentos em novos instrumentos de trabalho para ampliar e melhorar os dados sobre os objetos digitais. Assim, cada vez mais crescem a importância dos metadados e, nos últimos tempos, também as ontologias.
Existem muitas barreiras que precisam ser superadas para que o completo beneficio de compartilhamento de dados possa ser realizado. Para que isto seja uma realidade é necessário a padronização. Esses padrões podem ser de três tipos: os descritivos, que descrevem o conteúdo intelectual do objeto; os estruturais, que ligam cada objeto a outros criando unidades lógicas e os administrativos, que gerenciam e controlam o acesso aos conteúdos e objetos digitais.
O uso comum de normas alivia muitas as dificuldades que se podem encontrar no compartilhamento de dados. Os padrões de protocolos permitem que os diferentes sistemas possam se comunicar, enquanto o padrão de formatos permite que softwares distintos possam processar os mesmos arquivos. Ja os padrões de metadados permitem que os dados sejam processados, procurados, preservados, recombinados e reutilizados em contextos diferentes. Esta área, portanto, ainda está em fase de transição devendo, nos próximos anos, contar com maior grau de padronização advinda do trabalho cooperativo.
BROWNLEE, R. Corral: Policy and Technical Issues at the University of Sydney Library. Cataloging & Classification Quarterly v. 47, n. 3-4, p. 370-379, 2009. hdl.handle.net/2123/4996
Discute a gestão de metadados em repositórios de dados sob o ponto de vista da biblioteca em definir os requisitos relacionados com as diversas opções dessa gestão.
CORNELL UNIVERSITY. Cornell Research Data Management Service Group. Guide to Writing ‘readme’ Style Metadata. data.research.cornell.edu/content/readme
Normas indicativas para a preparação, por parte do pesquisador, de um arquivo “leia-me” que provê informações sobre os dados. Ele se destina a garantir que os dados possam ser interpretados corretamente, por si mesmo, ou por outras pessoas ao compartilhar ou publicar dados. Os metadados baseados em padrões são geralmente preferíveis, mas onde não existe padrão apropriado, o arquivo “readme” é uma estratégia adequada.
DIGITAL CURATION CENTRE. Metadata standards; Disciplinary metadata. 2016. www.dcc.ac.uk/resources/metadata-standards/list
Provê informações sobre padrões de metadados existentes em diversas áreas científicas, ferramentas para implantar esses padrões e usos em repositórios de dados.
SALES, L. F. Integração semântica de publicações científicas e dados de pesquisa: proposta de modelo de publicação ampliada para a área de ciências nucleares. 2014. Tese (Doutorado em Ciência da Informação) – Escola de Comunicação da Universidade Federal do Rio de Janeiro (UFRJ); Instituto Brasileiro de Informação em Ciência e Tecnologia, Rio de Janeiro. 2014. carpedien.ien.gov.br/bitstream/ien/853/1/LUANA%20SALES%20D.pdf
Apresenta uma proposta de diretrizes para uma política nacional de curadoria digital e um modelo de publicação científica para a área de Ciências Nucleares, em que os dados são ligados às publicações acadêmicas por meio de relações semânticas sistematizadas em taxonomia construída para esta finalidade.
Os padrões de representação do fluxo de trabalho (workflow, em inglês) tiveram origem na modelagem de processos de negócios. Muitas dessas soluções foram desenvolvidas por inúmeras empresas como a IBM e a Microsoft. Paralelamente, padrões abertos estão sendo desenvolvidos por consórcios independentes, dentre eles o W3C (World Wide Web Consortium), OASIS (Organization for the Advancement of Structured Information Standards), o Management Coalition for Workflow (WfMC) e o OMG (Object Management Group).
Algumas entidades estão concentrando esforços no desenvolvimento de normas complementares, enquanto outras estão focando as normas polivalentes. Infelizmente, não há, por enquanto, consenso a respeito de quais padrões são os mais pertinentes para aplicações de dados de pesquisa. De todo o modo, é um contexto que tenderá a ter uma maior normalização no futuro, em busca da interoperabilidade entre os sistemas.
CUEVAS-VICENTTÍN, V. et al. The PBase Scientific Workflow Provenance Repository. International Journal of Digital Curation v. 9, n. 2, p. 28-38, 2014. www.ijdc.net/index.php/ijdc/article/view/9.2.28/367
Descreve o PBASE, um fluxo de trabalho de dados fruto da implantação da proposta de norma ProvONE, que segue padrão W3C PROV para os dados de pesquisa.
JOHNSTON, L. R. A Workflow Model for Curating Research Data in the University of Minnesota Libraries. Minneapolis, MN: University Digital of Minnesota Conservancy, 2014. 87 p. hdl.handle.net/11299/162338
Resume as medidas tomadas pela University of Minnesota (US) para a curadoria de dados da GDP, abordando as necessidades e reações dos pesquisadores, criando um fluxo de curadoria de dados. Apresenta também as lições aprendidas ao longo do projeto que visou a criação de um serviço sustentável de dados de pesquisa.
3.3.1 Aspectos legais
Na parte relacionada aos aspectos legais dos dados de pesquisa é importante saber se esses dados estão protegidos pela legislação dos direitos autorais (copyright). Atualmente, essa legislação não contempla fatos e, geralmente, grande parte dos dados de pesquisa são considerados factuais. Este contexto tende a mudar tendo em vista o enorme interesse por parte das grandes corporações em coletar e organizar a chamada “big data”, retirando dessa massa de dados inferências que podem ser vitais para os negócios. Quanto, aos dados de pesquisa, a área também poderá receber influência dessas ações empresariais e, como consequência, é possível que no futuro os dados também sejam passíveis do amparo dos direitos autorais.
Como é possível compartilhar os dados de pesquisa? Considerando que eles raramente tem direitos autorais, a melhor maneira de compartilhar dados de pesquisa é com a utilização do Creative Commons Zero (CC0) (CC0 use for data). Essa modalidade do Creative Commons faz o status de direito autoral de forma clara, permitindo a reutilização dos dados.
Muitos dados podem servir para o patenteamento de novos produtos ou insumos. As patentes dão o controle exclusivo sobre invenções enquanto que os direitos autorais dão controle somente como os dados podem ser reutilizados. Portanto, caso a pesquisa possa gerar um patenteamento, área da propriedade intelectual, é vital que os dados sejam controlados e não divulgados antes da aprovação da patente.
De qualquer modo, é importante ter ciência de que boas práticas de pesquisa exigem a citação de dados com a reutilização, não importando a situação dos direitos autorais dos dados. Portanto, os aspectos legais ainda necessitam ser conhecidos pelos profissionais que desenvolvem a biblioteca digital de dados com intuito de se evitar litígios judiciais desnecessários. Não é um assunto fácil, pois se exige conhecimento da linguagem jurídica e do cipoal legislativo, sendo, por conseguinte, uma área que também precisa ser considerada importante na GDP.
BRASIL. Decreto nº 6.666 de 27 de novembro de 2008. Institui, no âmbito do Poder Executivo federal, a Infraestrutura Nacional de Dados Espaciais INDE e dá outras providências. Diário Oficial da União 28/11/2008. www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Decreto/D6666.htm
Legislação federal sobre dados espaciais.
BRASIL. MINISTÉRIO DA CIÊNCIA, TECNOLOGIA. Portaria nº 693, de 20 de agosto de 2009. Institui, no âmbito do Programa de Pesquisa em Biodiversidade, a Política de Dados. Diário Oficial da União, nº 160, Seção 1, p. 8-9, 21 agosto de 2009. www.mctic.gov.br/mctic/opencms/legislacao/portarias/migracao/Portaria_MCT_n_693_de_20082009.html
Norma legal que institui “no âmbito do Programa de Pesquisa em Biodiversidade - PPBio, a Política de Dados, com o objetivo de promover o gerenciamento das informações para os dados coletados sobre a biodiversidade brasileira e gerados no âmbito do Programa, seus acessos, usos e disseminação, na forma do anexo a esta portaria” (Art. 1º).
BRASIL. MINISTÉRIO DO MEIO AMBIENTE. ICMBio. Instrução Normativa nº 03 de 01 de setembro de 2014. Fixa normas para a utilização do Sistema de Autorização e Informação em Biodiversidade. www.icmbio.gov.br/sisbio/images/stories/instrucoes_normativas/INSTRU%C3%87%C3%83O_NORMATIVA_ICMBio_N%C2%BA_3_DE_2014__com_retifica%C3%A7%C3%A3o_do_DOU18062015.pdf
Regulamenta a disponibilização, o acesso e o uso de dados e informações recebidos pelo Instituto Chico Mendes de Conservação da Biodiversidade por meio do SISBio.
BRASIL. MINISTÉRIO DO PLANEJAMENTO, ORÇAMENTO E GESTÃO. Manual para a elaboração de plano de dados abertos. 38 p. wiki.dados.gov.br/Politica-de-Dados-Abertos.ashx
Documento que orienta as ações de implantação e promoção de abertura de dados, inclusive os geoespacializados, que deverão obedecer aos padrões mínimos de qualidade, de forma a facilitar o entendimento e a reutilização das informações. É ele quem organiza o planejamento referente à implantação e racionalização dos processos de publicação de dados abertos nas agências públicas brasileiras.
CARROLL, M. W. Sharing Research Data and Intellectual Property Law: A Primer. PLOS Biology v. 13, n. 8, e1002235, 2015. journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.1002235
O artigo, de forma didática, faz um apanhado geral sobre quais são os direitos legais de dados, quem têm esses direitos, como os detentores desses direitos podem usá-los para compartilhar os dados.
COSTA, M. M.; CUNHA, M. B. da. A necessidade de uma política nacional para a gestão de dados de pesquisa no Brasil. Liinc em revista, v. 5, n. 2, p. 287-309, 2019. revista.ibict.br/liinc/article/view/4763
Discute o marco legal sobre dados abertos governamentais e científicos, e gestão de dados. Apresenta um conjunto de diretrizes que pode servir de subsídio para a elaboração de uma política nacional para a GDP.
CREATIVE COMMONS CORPORATION. CC0 use for data. wiki.creativecommons.org/wiki/CC0_use_for_data
Explica como utilizar a licença CC0 (CC zero) “sem reserva de direitos autorais”.
DIAS, G. A.; SOUSA, R. P. M.; PAIVA, M. J. R. Direito autoral e preservação digital: considerações pertinentes a periódicos científicos eletrônicos mantidos no sistema Lockss. Ciência da Informação v. 41 n. 1, 2012. revista.ibict.br/ciinf/index.php/ciinf/article/view/2117
O trabalho discute a questão da preservação de periódicos científicos eletrônicos no sistema Lots of Copies Keep Stuff Safe (LOCKSS) à luz da legislação brasileira dos direitos autorais. Propõe analisar se as cessões de direito patrimonial do autor, em periódicos científicos, contemplam a replicação de conteúdos no referido sistema, para que suas obras sejam preservadas digitalmente.
EMBRAPA. Resolução Consad nº 184, de 4 de abril de 2019: Política de Governança de Dados, Informação e Conhecimento da Embrapa. Boletim de Comunicações Administrativas, ano 45, n. 16, p. 1-19, 5 abr. 2019. Disponível em: www.embrapa.br/documents/10180/1600893/Pol%C3%ADtica+de+Governan%C3%A7a+de+Dados%2C+Informa%C3%A7%C3%A3o+e+Conhecimento+da+Embrapa/96873780-8e04-b67d-be7c-a0b6a4318556
Documento que normatiza a Política de Governança de Dados, Informação e Conhecimento da Embrapa, estabelecendo princípios, diretrizes, atribuições e responsabilidades para a gestão de dados, informação e conhecimento, bem como quanto à divulgação de informações relevantes na Empresa.
INSTITUTO CHICO MENDES DE CONSERVAÇÃO DA BIODIVERSIDADE (ICMBio). Portaria nº 222, de 23 de agosto de 2013. Institui a Política de Segurança da Informação e Comunicações (POSIC) no âmbito do ICMBio. 14 p. www.icmbio.gov.br/portal/images/stories/comunicacao/icmbio-posic-2013.pdf.pdf
Norma legal que instituir “a Política de Segurança da Informação e Comunicações - POSIC que tem por escopo a instituição de diretrizes estratégicas visando assegurar a integridade de dados, informações e documentos do ICMBio, contra ameaças e vulnerabilidades, de modo a preservar os seus ativos, inclusive sua imagem institucional” (Art. 1º).
INSTITUTO DE PESQUISAS JARDIM BOTÂNICO DO RIO DE JANEIRO. Portaria JBRJ nº 77/2012, de 19 de julho de 2012. Instituir a Política de Acesso a Dados e Informações Científicas do Instituto de Pesquisas Jardim Botânico do Rio de Janeiro. dados.jbrj.gov.br/download/politica_de_acesso_a_dados_e_informacoes_cientificas_do_instituto_de_pesquisas_jardim_botanico_do_rio_de_janeiro.pdf
Norma legal que “diz respeito aos dados das coleções do JBRJ, sob a responsabilidade da Diretoria de Pesquisa Científica – DIPEQ” (Art. 2º).
MUSEU PARAENSE EMÍLIO GOELDI. Normas Gerais de uso e gerenciamento das coleções científicas. 1999. 34 p. www.museu-goeldi.br/assuntos/o-museu/norma_uso_colecoes_politicas.pdf
Documento que estabelece normas gerais para a “a organização e a utilização das Coleções Científicas do MPEG, e são complementadas por outras Normas Específicas de cada Coleção” (Preâmbulo).
MUSEU PARAENSE EMÍLIO GOELDI. Política de dados de coleções e acervos científicos biológicos do Museu Paraense Emílio Goeldi. 18 de maio de 2007. 5 p. www.museu-goeldi.br/assuntos/o-museu/PolticadedadosMPEG.pdf
Trata da política dos dados e metadados das coleções biológicas do Museu Paraense Emílio Goeldi, sob a responsabilidade da Coordenação de Pesquisa e Pós-graduação, que mantém, gerencia e desenvolve as diversas coleções científicas biológicas da Instituição, sendo assessorada pelo Conselho de Curadoria.
OLIVEIRA, A. C. S. de. Ciência Aberta, direitos de propriedade intelectual e autoria colaborativa: a multidimensionalidade da ciência contemporânea. Rio de Janeiro: Lumen Juris, 2019.
A obra discute os direitos de propriedade intelectual vigentes para a nova acepção de autoria colaborativa na ciência aberta. Aborda ainda as questões como a pesquisa baseada no uso intensivo de dados, e o data lifecycle model como metodologia de apoio a gestão de dados.
OPEN KNOWLEDGE. Definição de Conhecimento Aberto, Versão 2.0 opendefinition.org/od/2.0/pt-br/
Definições dos termos mais importantes utilizados nas licenças de direitos autorais.
UNIVERSITY OF VIRGINIA. Research Data Services. Data Rights & Responsibilities Guidance 1.0 data.library.virginia.edu/files/Data_Rights_and_Responsibilities_Guidance.pdf
Documento que trata dos direitos e responsabilidades dos dados de pesquisa no âmbito da Universidade de Virginia (US).
O projeto de uma biblioteca digital geralmente implica num considerável investimento de recursos financeiros. Assim, ela deve comprovar que pode fazer muito mais do que uma biblioteca tradicional realiza, tendo, obrigatoriamente, de agregar valor como resultado da digitalização dos acervos e/ou do uso de acervos digitais de terceiros – muitas vezes objeto de contratos onerosos. Nesse contexto, é útil para os gerentes de repositório de dados – um dos tipos de biblioteca digital -- investigarem não apenas como gerenciar custos, mas também novas fontes de receita.
As bibliotecas que pretendem coletar, selecionar e disseminar dados produzidos por suas respectivas comunidades de pesquisa devem apoiar uma variedade de custos ao longo da vida útil dos dados selecionados. Os custos incluem, entre outros, os recursos humanos, software, hardware, rede, gerenciamento e custos de administração.
Entretanto, os aspectos econômicos não podem ser negligenciados no projeto do repositório de dados, sob pena de afetar a sua sustentabilidade futura. Como ainda não se tem com clareza o modelo econômico a ser adotado, é importante acompanhar os exemplos positivos usados em projetos congêneres a fim de que sejam adaptados e utilizados localmente.
O financiamento para projetos de GDP é um ponto chave. Muitas bibliotecas, especialmente as universitárias, que iniciaram esses projetos cobriram os custos envolvidos por meio dos seus orçamentos regulares. Poucas bibliotecas receberam subsídios externos por meio de agências de fomento. No contexto brasileiro essas agências precisam oferecer apoio financeiro para esse tipo de ação; no exterior, isto já está se tornando algo rotineiro – daí o sucesso dos repositórios de dados notadamente no Reino Unido, Estados Unidos, Canadá e Austrália.
4C PROJECT. Final roadmap. Feb. 2015. www.4cproject.eu/documents/Roadmap%20-%20V1.02%20-%2020Feb2015.pdf
O consórcio formado por diversas instituições europeias para promover a curadoria e preservação digital disponibiliza o documento que aborda os aspectos econômicos envolvidos num projeto.
BEAGRIE, N., CHRUSZCZ, J.; LAVOIE, B. Keeping Research Data Safe: A Cost Model and Guidance for UK Universities. London: JISC, 2008. 169 p. www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf
Documento sobre os custos da preservação dos dados de pesquisa para as instituições de ensino superior. Analisa os benefícios potenciais dessa preservação, as variáveis envolvidas para determinar os custos, o modelo das atividades envolvidas e planilha para acompanhamento dos custos.
ERWAY, R.; RINEHART, A. If You Build It, Will They Fund? Making Research Data Management Sustainable. Dublin, Ohio: OCLC Research, 2016. 13 p. www.oclc.org/content/dam/research/publications/2016/oclcresearch-making-research-data-management-sustainable-2016.pdf
Apresenta as diversas estratégias para obtenção de financiamento de recursos para a GDP. Comenta as vantagens e desvantagens de cada estratégia; compara a situação da obtenção de recursos em vários países.
KESKITALO, E. Costs and benefits of a shared digital long-term preservation system. LIBER Quarterly the Journal of European Research Libraries, v. 21, n. 1, p. 69-85, 2011. www.liberquarterly.eu/articles/10.18352/lq.8008/
Descreve a análise de custo-benefício da preservação digital a longo prazo, que foi realizada, em 2010, no contexto do projeto da National Digital Library Project (Finlândia).
NILSEN, K. Beyond Cost Recovery. In: Curating Research Data. Chicago: American Library Association, 2017. Cap. 5, p. 193-212.
O capítulo analisa cinco modelos de receita para os repositórios de dados, bem como discute os modelos de negócios aplicáveis à GDP.
PALAIOLOGK, A. S., et al. An Activity-Based Costing Model for Long-Term Preservation and Dissemination of Digital Research Data: The Case of DANS. International Journal on Digital Libraries v. 12, n. 4, p. 195-214, 2012.
Comenta um modelo para os custos das atividades de preservação de dados digitais.
3.3.3 Compartilhamento e reuso de dados
A investigação científica praticada no século XXI utiliza mais dados e colaborações do que no passado. Assim, é importante estudar as práticas de de uso de dados pelos pesquisado, entre elas a acessibilidade, a descoberta, o reuso, a preservação e o compartilhamento de dados. Além disso, existe o aspecto, por exemplo, que uma grande parcela dos dados geológicos contém observações que não são repetíveis, e, como resultado, as principais áreas de investigação científica tornam-se dependentes da exploração significativa e reutilização desses dados.
O compartilhamento de dados é uma importante parte do moderno método científico, permitindo a verificação dos resultados obtidos e a ampliação da pesquisa a partir de resultados anteriores. Entretanto, o compartilhamento de dados é complexo e difícil. Os dados podem assumir inúmeras formas, ser recolhidos com muitos propósitos, por meio de várias abordagens metodológicas, e muitas vezes, uma vez retirados do seu contexto inicial, podem ser difíceis de interpretação.
O compartilhamento pode ter várias motivações: por preocupações de pesquisa ou para alavancar os investimentos públicos, ser destinada a servir os interesses dos pesquisadores que produzem dados ou pelos interesses dos potenciais reutilizadores de dados. De qualquer modo, políticas públicas devem estimular o compartilhamento de dados para aprimorar a qualidade dos resultados da pesquisa e do progresso científico.
ALLARD, S. DataONE: Facilitating eScience through Collaboration. Journal of eScience Librarianship v. 1, n. 1, Feb. 2012. escholarship.umassmed.edu/jeslib/vol1/iss1/3/
Analisa o compartilhamento de dados provido pelo Sistema DataONE.
ALTMAN, M. et al. Digital Preservation through Archival Collaboration: The Data Preservation Alliance for the Social Sciences. American Archivist, v. 72, n. 1, p. 170-184, Spring-Summer 2009. americanarchivist.org/doi/abs/10.17723/aarc.72.1.eu7252lhnrp7h188
Discute os acordos, processos e infraestrutura que provê base para colaboração e compartilhamento de dados entre cinco instituições americanas componentes da Data Preservation Alliance for the Social Sciences.
BEAGRIE, N.; Houghton, J. The Value and Impact of Data Sharing and Curation: A Synthesis of Three Recent Studies of UK Research Data Centres. London: JISC, 2014. 26 p. repository.jisc.ac.uk/5568/1/iDF308_-_Digital_Infrastructure_Directions_Report%2C_Jan14_v1-04.pdf
O estudo analisa três instituições do Reino Unido: Economic and Social Data Service, Archaeology Data Service e o British Atmospheric Data Centre. Os resultados mostram o valor do compartilhamento de dados provocou aumento na eficiência na pesquisa e no ensino.
BORGMAN, C. L. The Conundrum of Sharing Research Data. Journal of the American Society for Information Science and Technology v, 63, n. 6, p. 1059-1078, 2012.
O artigo analisa as complexidades dos dados, as práticas de pesquisa, inovação, incentivos, economia, propriedade intelectual e política pública associada com o dilema do compartilhamento de dados. Mostra as dificuldades enfrentadas pelos pesquisadores no compartilhamento e reuso dos dados.
COMISSÃO ECONÔMICA PARA A AMÉRICA LATINA E O CARIBE (CEPAL). Barreras e incentivos para compartir datos de investigación [Video]. Santiago, Chile; CEPAL, 2017. www.youtube.com/watch?v=Hkt6dGK95i8&index=2&list=PLnMIbRrfMTMWiPKEH4oOM_tDXGsCM57sX
Analisa as dificuldades para o compartilhamento dos dados.
CÓRDULA, F. R.; ARAÚJO, W. J. De. O compartilhamento de dados científicos na era do E-Science. In: DIAS, G. A.; OLIVEIRA, B. M. J. F. de (org.). Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 2019. Cap. 9, p. 189-207.
Aborda o compartilhamento de dados e, “como norte, foi empregado o ciclo de vida dos dados da Data Observation Network for Earth (DataONE)” (p. 191).
CURTY, R. Abordagens de reuso e a questão da reusabilidade dos dados científicos. Liinc em revista, v. 15, n. 2, p. 177-193, 2019. revista.ibict.br/liinc/article/view/4777/4315
Analisa o reuso de dados de pesquisa e propõe uma classificação de cinco abordagens distintas para o reuso: reaproveitamento, agregação, integração, metanálise e reanálise. Aborda as questões determinantes para a condição de reuso, relacionando a reusabilidade à qualidade da documentação que acompanha os dados.
DALLMEIER-TIESSEN, S. et al. Enabling Sharing and Reuse of Scientific Data. New Review of Information Networking v. 19, n. 1, p. 16-43, 2014.
Analisa o estado do compartilhamento de dados científicos e o que as partes interessadas poderiam usar para desenvolver e implementar estratégias e políticas eficazes para a área. Foi desenvolvido um modelo conceitual para descrever o processo de compartilhamento de dados, as barreiras e os facilitadores que determinam a participação dos interessados.
DEHNHARD, I.; WEICHSELGARTNER E.; KRAMPEN, G. Researcher’s Willingness to Submit Data for Data Sharing: A Case Study on a Data Archive for Psychology. Data Science Journal v. 12, p. 172-180, 2013. www.jstage.jst.go.jp/article/dsj/advpub/0/advpub_12-037/_article/-char/ja/
Analisa os diferentes tipos de dados utilizados na Psicologia e as possíveis razões da relutância dos pesquisadores alemães em submeter os seus dados para os repositórios.
DIAS, G. A.; ANJOS, R. L. dos; RODRIGUES, A. A. Os princípios FAIR: viabilizando o reuso de dados científicos. In: DIAS, G. A.; OLIVEIRA, B. M. J. F. de (org.). Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 2019. Cap. 8, p. 177-187.
Analisa cada um dos princípios FAIR sobre o uso e o reuso de dados científicos.
DOUGLASS, K.; ALLARD, S.; TENOPIR, C.; WU, L.; FRAME, M. Managing Scientific Data as Public Assets: Data Sharing Practices and Policies among Full-Time Government Employees. Journal of the Association for Information Science and Technology v. 65, n. 2, p. 251-262, 2014.
Examina como os cientistas que trabalham para a agências governamentais americanas estão reagindo em relação à legislação de compartilhamento dos dados gerados por suas pesquisas.
FANIEL, I. M.; KRIESBERG, A.; YAKEL, E. Social scientists’ satisfaction with data reuse. Journal of the Association of Information Science and Technology, v. 6, n. 6, p. 1404-1416, June 2016.
A partir de um levantamento baseado em 1.480 artigos que citaram o Inter-University Consortium for Political and Social Research os autores mostraram que os atributos de completeza, acessibilidade, facilidade de uso e credibilidade tiveram significativas associações com a satisfação de reuso de dados. Finalizam apontando que existe uma relação positiva entre a qualidade da documentação e o nível de satisfação dos reutilizadores de dados.
FEAR, K. M. Measuring and anticipating the impact of data reuse. Ph. D. Dissertation. Ann Arbor, MI: University of Michigan, Horace H. Rackham School of Graduate Studies, 2013. hdl.handle.net/2027.42/102481
Tese de doutorado que examinou as citações de dados nas ciências sociais, mediu o impacto acadêmico da reutilização de dados, bem como explorou os fatores que estão associados à reutilização de um conjunto de dados.
FECHER, B.; FRIESIKE, S.; HEBING, M. What Drives Academic Data Sharing? PLoS ONE v. 10, n. 2, 2015. journals.plos.org/plosone/article?id=10.1371/journal.pone.0118053
Baseada numa revisão de literatura de 98 trabalhos acadêmicos e uma pesquisa empírica com 603 usuários de dados secundários, os autores desenvolveram um quadro conceitual que explica o processo de compartilhamento de dados sob o ponto de vista do pesquisador.
HIGMAN, R.; PINFIELD, S. Research Data Management and Openness: The Role of Data Sharing in Developing Institutional Policies and Practices. Program v. 49, n. 4, p. 364-381, 2015. eprints.whiterose.ac.uk/89888/
Examina o relacionamento entre a GDP e o compartilhamento de dados em 37 universidades do Reino Unido.
KIM, Y.; STANTON, J. M. Institutional and individual factors affecting scientists’ data-sharing behaviors: A multilevel analysis. Journal of the Association for Information Science and Technology, v. 67, n. 4, p. 776-799, 2016. www.asis.org/asist2013/proceedings/submissions/papers/123paper.pdf
Investiga os fatores institucionais e pessoais que influenciam os cientistas a compartilharem os seus dados de pesquisa.
KOWALCZYK, S.; SHANKAR, K. Data Sharing in the Sciences. Annual Review of Information Science and Technology v. 45, n. 1, p. 247-294, 2011. asistdl.onlinelibrary.wiley.com/doi/abs/10.1002/aris.2011.1440450113
Revisão de literatura sobre compartilhamento de dados; com ênfase na literatura da língua inglesa.
MACMILLAN, D. Data Sharing and Discovery: What Librarians Need to Know. Journal of Academic Librarianship v. 40, n. 5, p. 541-549, 2014.
Artigo de revisão de literatura que aborda o que os bibliotecários precisam saber sobre como os cientistas gerenciam e compartilham os seus dados. Sugere que os bibliotecários precisam desenvolver habilidades que preencham o trabalho de ligação tradicional com as demandas de pesquisas científicas cada vez mais baseadas em dados, para que possam apoiar os investigadores com as suas necessidades de GDP e ajudar os usuários a descobrirem dados através de uma miríade de coleções e recursos.
MEDEIROS, J. da S.; CAREGNATO, S. E. Compartilhamento de dados e e-Science: explorando um novo conceito para a comunicação científica. Liinc em Revista, v. 8, n. 2, jul./dez. 2012. doi.org/10.18617/liinc.v8i2.488
Analisa o compartilhamento de dados científicos primários. Finaliza observando que a perspectiva de compartilhar dados entre cientistas pode fazer com que as possibilidades de colaboração se tornem cada vez mais reais, criando ambientes onde as viabilidades de compartilhamento de resultados de pesquisas promovam o desenvolvimento da ciência e tecnologia e permitindo que recursos sejam utilizados de forma a avançar a ciência.
NINA-ALCOCER, V.; BLASCO-GIL, Y.; PESET, F. Datasharing: guía práctica para compartir datos de investigación. El profesional de la información, noviembre-diciembre, v. 22, n. 6, p. 562-568, 2013. eprints.rclis.org/20907/1/datasharing.pdf
O artigo descreve os aspectos positivos e negativos de programas de compartilhamento de dados: Dryad, Figshare, Zenodo e Dataverse.
PASQUETTO, I. V.; RANDLES, B. M.; BORGMAN, C. L. On the reuse of scientific data. Data Science Journal, v. 16, n. 8, p. 1-9, 2017. escholarship.org/uc/item/4xf018wx
O artigo analisa os conceitos de dados, compartilhamento e dados abertos como um meio de examinar a reutilização de dados. Explora as distinções entre uso e reutilização de dados. Por fim, propõe seis perguntas de pesquisa sobre reutilização de dados: Como distinguir o uso de dados dos reutilizadores? Quando a reprodutibilidade é uma meta essencial? Quando a integração de dados é um objetivo essencial? Quais são as vantagens e desvantagens entre coletar novos dados e reutilizar dados existentes? Como as motivações para a coleta de dados influenciam a capacidade de reutilizar dados? Como os padrões e formatos de liberação de dados influenciam as oportunidades de reutilização? Conclui mostrando as implicações dessas questões para a política científica e para investimentos em reutilização de dados.
PIWOWAR, H. A; DAY, R. S; FRIDSMA, D. B. Sharing detailed research data is associated with increased citation rate. PLoS ONE, v. 2, n. 3, e308, 2007. journals.plos.org/plosone/article/file%3Fid%3D10.1371/journal.pone.0000308%26type%3Dprintable
Os autores encontraram, na área de pesquisa de câncer, uma correlação entre dados publicamente disponíveis e maior impacto na literatura, isto pode motivar ainda mais os pesquisadores a compartilhar seus dados detalhados de pesquisa.
SHEN, Yi. Research Data Sharing and Reuse Practices of Academic Faculty Researchers: A Study of the Virginia Tech Data Landscape. International Journal of Digital Curation v. 10, n. 2, 2015. www.ijdc.net/index.php/ijdc/article/view/10.2.157/413
O artigo analisa os resultados da avaliação de dados de pesquisa na Virginia Tech University (US) para determinar as práticas de compartilhamento e reuso de dados na instituição.
TENOPIR, C. et al. Data Sharing by Scientists: Practices and Perceptions. PLoS ONE v. 6, n. 6, 2011. journals.plos.org/plosone/article?id=10.1371/journal.pone.0021101
Analisa as práticas de compartilhamento de dados e as barreiras percebidas e os facilitadores para esse compartilhamento. Mostra que as barreiras ao compartilhamento e preservação estão profundamente enraizadas nas práticas e processo cultural do processo de pesquisa, bem como nos próprios pesquisadores. Conclui mostrando a necessidade das agências governamentais atentarem para a importância do compartilhamento e preservação dos dados de pesquisa.
VAN DE SANDT, T. et al. The definition of reuse. Data Science Journal, v. 18, n. 1, 2019. pdfs.semanticscholar.org/2d3a/c4b66155bc9ce7632ba476afbc6e11bc787d.pdf
O artigo apresenta uma definição de reutilização de dados de pesquisa, as características de reutilização são identificadas, levando a uma variedade de cenários de reutilização que mostram a complexidade do cenário de pesquisa atual. Aponta que não há motivos para distinguir o uso e a reutilização, e discute o que isso significa para possíveis novas métricas que tentam cobrir as práticas de Ciência Aberta de maneira mais abrangente.
WALLIS, J.; ROLANDO, E.; TENOPIR, C. L. If We Share Data, Will Anyone Use Them? Data Sharing and Reuse in the Long Tail of Science and Technology. PLoS ONE v. 8, n. 7, e67332, 2013. journals.plos.org/plosone/article/file?type=printable&id=10.1371/journal.pone.0067332
Os autores relatam um estudo de dez anos do Center for Embedded Network Sensing, mostrando que os pesquisadores estão dispostos a compartilhar seus dados, mas poucos são solicitados a fazê-lo, e em apenas algumas áreas de domínio seus financiadores ou periódicos exigem que eles depositem dados.
WALPORT, M.; BREST, P. Sharing research data to improve public health. Lancet, v. 377, n. 9765, p. 537-539, Feb. 2011. doi.org/10.1016/S0140-6736(10)62234-9
Na área biomédica os autores propoem que é preciso garantir que os resultados da pesquisa sejam usados para maximizar o conhecimento e os possíveis benefícios à saúde. “Por sua vez, as populações que participam da pesquisa e os contribuintes que pagam a conta têm o direito de esperar que cada grama de conhecimento seja extraída da pesquisa”.
WILKINSON, M. D., et al. The FAIR guiding principles for scientific data management and stewardship”. Scientific data, v. 3, p. 160018, 2016. www.nature.com/articles/sdata201618
Há uma necessidade urgente de melhorar a infraestrutura de apoio à reutilização de dados de pesquisa. Um grupo diversificado de interessados se reúnem para projetar e aprovar um conjunto de tópicos que são referidos como Princípios de Dados FAIR. A intenção é que estes possam agir como um guia para aqueles que desejam melhorar a reutilização de dados.
3.4 Produtos e serviços
O conhecimento dos cenários dos serviços de GDP nas bibliotecas é oportuno e significativo. Embora ele ofereça uma compreensão geral de onde o programa de GDP está e para onde está indo, também pode prover um entendimento das práticas atuais e recomendações de gerenciamento de dados e/ou adoção de ferramentas, além de revelar áreas de melhoria e suporte.
Os serviços de dados, como muitas áreas de pesquisa, requer conhecimentos e recursos de equipes abrangendo muitas disciplinas. O caminho para fornecer serviços de GDP pode ser difícil para muitas bibliotecas. Uma das principais preocupações são as novas habilidades que os bibliotecários devem ter para fornecer serviços de gerenciamento de dados.
COATES, H. L. Building Data Services From the Ground Up: Strategies and Resources. Journal of eScience Librarianship, v. 3, n. 1, e1063, 2014. escholarship.umassmed.edu/jeslib/vol3/iss1/5
O objetivo deste artigo é orientar especialistas em dados, fornecendo recursos e estratégias importantes para o desenvolvimento de serviços relevantes localmente e apontando para comunidades ativas de bibliotecários e pesquisadores que enfrentam os desafios associados à GDP.
COX, A.; KNIGHT, G. Building a Research Data Management Service for the London School of Hygiene & Tropical Medicine. Program: Electronic Library and Information Systems, v. 49, n. 4, p. 424–39, 2015. doi.org/10.1108/PROG-01-2015-0011
Estudo de caso da implantação de serviços de GDP na área de saúde.
COX, A.; KENNAN, M. A.; LYON, E. J.; PINFEED, S.; SBAFF, L. Progress in Research Data Services: An International Survey of University Libraries. International Journal of Digital Curation, v. 14, n. 1, p. 126-135, 2019. www.ijdc.net/article/view/595/549
Este artigo apresenta uma análise comparativa de duas pesquisas internacionais de bibliotecas sobre serviços de GDP, realizadas em 2014 e 2018, mostrando como esses serviços haviam se desenvolvido nesse período e expor os fatores motivadores e as barreiras à mudança.
FEARON, D.; GUNIA, B.; PRALLE, B.; LAKE, S.; SALLANS, A. L. Research data management services. Washington, D.C.: Association of Research Libraries, 2013. SPEC Kits, 334. repository.arizona.edu/handle/10150/622168
Levantamento dos serviços providos por 73 bibliotecas americanas. Os mais comuns foram: ajudar pesquisadores a localizar e usar fontes de dados (93% dos respondentes); suporte para análise geoespacial (84%), aquisição de conjunto de dados (79%) e aconselhamento sobre direitos autorais e patentes (74%).
SI, L.; XING, W.; ZHUANG, X.; HUA, X.; XHOU, L. Investigation and Analysis of Research Data Services in University Libraries. Electronic Library, v. 33, n. 3, p. 417–49, 2015. doi.org/10.1108/EL-07-2013-0130
Analisa os serviços de GDP providos por 50 bibliotecas universitárias de vários países. Os serviços mais ofertados são: a introdução de dados de pesquisa (47,13%), curadoria e armazenamento de dados (43,68%), diretrizes de gerenciamento de dados (42,53%), referência de gerenciamento de dados (41,38%), recurso recomendação (41,38%) e treinamento em gerenciamento de dados (24,14%).
YOON, A.; SCHULTZ, T. Research data management services in academic libraries in the US: A content analysis of libraries’ websites. College & Research Libraries, v. 78, n. 7, p. 920-933, 2017. hdl.handle.net/1805/14535
Este estudo examinou os serviços de GDP em 185 bibliotecas universitárias americanas por meio de uma análise de conteúdo dos sitios dessas bibliotecas, a saber: serviço, informação, educação e rede. Os resultados revelam que as bibliotecas precisam avançar e se envolver mais ativamente para fornecer serviços, fornecer informações em linha e desenvolver serviços educacionais.
Enquanto as tecnologias digitais permitem que a informação seja criada, manipulada, disseminada, recuperada e armazenada com facilidade cada vez maior, a preservação dessa informação apresenta desafios significativos. A menos que estratégias de preservação sejam empregadas, essa informação se tornará inacessível muito rapidamente. A escolha da estratégia dependerá da natureza do material e quais aspectos precisam ser conservados.
No presente, muitas das ações ligadas à biblioteca digital envolvem a digitalização do material existente, por exemplo, livros e fotografias. Infelizmente, poucos projetos de bibliotecas digitais consideram a preservação além dessa digitalização inicial. A ação de copiar a informação sem alterá-la oferece uma solução a curto prazo para a preservação do acesso aos objetos digitais. Isto faz com que a informação seja armazenada numa nova mídia antes que a mídia antiga se deteriore. Porém, a longo prazo, essa simples migração nem sempre funciona. Aqui entra, portanto, a necessidade de implantar uma política de preservação que leve em conta todos os outros aspectos relacionados com a informação digital.
Em decorrência do contexto acima descrito é que aqui foram incluídas fontes de informação que ajudam o leitor a conhecer o fluxo desde a escolha dos critérios para uma boa digitalização até a discussão sobre as melhores políticas de preservação.
AKMON, D.; ZIMMERMAN, A.; DANIELS, M.; HEDSTROM, M. The Application of Archival Concepts to a Data-Intensive Environment: Working with Scientists to Understand Data Management and Preservation Needs. Archival Science v. 11, n. 3-4, p. 329-348, 2011.
A comunidade de arquivo tem negligenciado os dados científicos, assumindo que eles estavam fora dos limites das suas preocupações profissionais. Os cientistas, por outro lado, cada vez mais reconhecem que eles não têm as habilidades e os conhecimentos necessários para atender às demandas em relação à curadoria de dados e estão buscando a ajuda de “arquivistas de dados” e “curadores de dados.” Isso representa uma oportunidade significativa para os arquivistas, mas que só pode ser concretizada se entenderem melhor o contexto científico.
BARATEIRO, J.; ANTUNES, G.; CABRAL, M.; BORBINHA, J.; RODRIGUES, R. Digital Preservation of Scientific Data. Lecture Notes in Computer Science n. 5173, p. 388-391, 2008.
O artigo aborda o problema da preservação digital em dois cenários: uma biblioteca digital nacional e um repositório de informação científica sobre segurança de barragens. Apresenta o quadro dos dados sobre segurança de barragens e uma análise de uma solução de grid dos dados existentes que pode ser utilizado para este fim.
BEAGRIE, N.; BEAGRIE, R.; ROWLANDS, I. Research Data Preservation and Access: The Views of Researchers. Ariadne, n. 60, 2009. www.ariadne.ac.uk/issue60/beagrie-et-al
Apresenta os resultados do levantamento sobre o ponto de vista e as práticas utilizadas por quatro universidades do Reino Unido sobre preservação e disseminação dos dados de pesquisa.
BEAGRIE, N.; LAVOIE, B.; WOOLLARD, M. Keeping Research Data Safe 2. London: JISC, 2010. 89 p. www.webarchive.org.uk/wayback/archive/20140615221405/http://www.jisc.ac.uk/media/documents/publications/reports/2010/keepingresearchdatasafe2.pdf
Descreve o projeto que teve quatro objetivos: realizar um levantamento sobre o custo da preservação digital; revisar o modelo do Keeping Research Data Safe 2, analisar as informações sobre os custos de quatro instituições do Reino Unido (Archaeology Data Service; National Digital Archive of Datasets; UK Data Archive e da University of Oxford); apresentar um quadro com os benefícios advindos do uso do modelo.
BERMAN, F. Got Data? A Guide to data preservation in the information age. Communications of the ACM, v. 51, n. 12, p. 50-56, 2008. dl.acm.org/doi/fullHtml/10.1145/1409360.1409376
O artigo explora as tendências e questões relacionadas com a preservação dos dados digitais e o que é necessário para mantê-lo gerenciável, acessível, disponível e seguro. Apresenta as ferramentas permitem sobreviver a um dilúvio de dados para garantir que esses dados estarão lá, quando forem necessários.
COMISSÃO ECONÔMICA PARA A AMÉRICA LATINA E O CARIBE (CEPAL). Buenas prácticas sobre el almacenamiento y seguridad de los datos de investigación [Video]. Santiago, 2017. www.youtube.com/watch?v=5EdpGekXE60&index=5&list=PLnMIbRrfMTMWiPKEH4oOM_tDXGsCM57sX
Ações prática sobre o armazenamento e segurança dos dados de pesquisa.
CONWAY, E.; GIARETTA, D.; LAMBERT, S.; MATTHEWS, B. Curating Scientific Research Data for the Long Term: A Preservation Analysis Method in Context. International Journal of Digital Curation v. 6, n. 2 p. 38-52, 2011. www.ijdc.net/index.php/ijdc/article/view/182/264
Apresenta uma metodologia de análise de preservação que foi desenvolvido em resposta a essa necessidade nos projetos Scarp CASPAR e Digital Curation Centre. Analisa o relacionamento com outras práticas de preservação digital, discutindo como elas podem interagir para prover arquivos protegidos de dados científicos, com ferramentas e técnicas necessárias para enfrentar este desafio.
CONWAY, E. et al. Managing Risks in the Preservation of Research Data with Preservation Networks. International Journal of Digital Curation v. 7, n. 1, p. 3-15, 2012. www.ijdc.net/index.php/ijdc/article/view/200/269
Descreve os componentes do modelo de uma rede de preservação, mostrando como as ações de preservação podem ser realizadas na área de dados científicos.
DALLMEIER-TIESSEN, S. et al. Exemplar Good Governance Structures and Data Policies. Dorset, UK: Alliance for Permanent Access, 17 January 2014. 43 p. www.alliancepermanentaccess.org/wp-content/uploads/sites/7/downloads/2014/06/APARSEN-REP-D35_1-01-1_0_incURN.pdf
Analisa o nível de preparação para as políticas de governança e de dados interoperáveis. O documento conclui com recomendações selecionados que devem ser levadas em conta na elaboração de políticas de dados relativos à preservação digital.
DURANTI, L. The Long-Term Preservation of Accurate and Authentic Digital Data: The INTERPARES Project. Data Science Journalv. 4, p. 106-118, 2006. datascience.codata.org/articles/abstract/10.2481/dsj.4.106/
Apresenta o Projeto InterPARES que visa desenvolver o conhecimento necessário para a preservação a longo prazo das entidades digitais produzidas no decorrer da pesquisa para que sua autenticidade possa ser verificada. A metodologia, as atividades de pesquisa, os resultados e os produtos projetados são discutidos no documento.
MARDERO ARELLANO, M. Cariniana: uma rede nacional de preservação digital. Ciência da Informação v. 41 n. 1, 2012. revista.ibict.br/ciinf/article/view/1354/1533
Apresenta o projeto da Rede Cariniana como um sistema de preservação digital baseado no modelo de rede distribuída, que acompanha e provê subsídios a outros projetos brasileiros que precisam preservar materiais autênticos e certificados por instituições reconhecidas.
ONLINE COMPUTER LIBRARY CENTER. Trustworthy Repositories Audit & Certification (TRAC): Criteria and checklist. Dublin, OH: OCLC, 2007. 94 p. www.crl.edu/PDF/trac.pdf
Documento que provê critérios para identificar os repositórios digitais capazes de armazenar de forma confiável, a migração, e dar acesso a coleções digitais. No processo de certificação a instituição deve cumprir os critérios para a preservação digital; ele está dividido em três seções: infraestrutura organizacional; gestão do objeto digital; tecnologia, estrutura técnica e segurança.
PINTO, F. de M. A. G.; AMARAL, J. C.: SANTOS, M. de B. dos. Curadoria de dados de pesquisa em repositórios de ensaios clínicos: uma revisão de escopo. Liinc em Revista, Rio de Janeiro, v. 15, n. 2, p. 84-100, Nov. 2019. revista.ibict.br/liinc/article/view/4766/4326
O artigo investiga a prática da GDP em repositórios de ensaios clínicos. Apresenta o conceito de curadoria de dados de pesquisa e fomenta novos estudos que priorizam a discussão sobre a GDP no domínio da saúde, apontando para a necessidade de implantação de políticas que assegurem critérios de descrição, sistematização, compartilhamento, recuperação, interoperabilidade, preservação e reuso de dados.
SAYÃO, L. F.; SALES, L. F. Curadoria digital: um novo patamar para preservação de dados digitais de pesquisa. Informação & Sociedade: Estudos, v. 22, n. 3, p. 179-191, set./dez. 2012. periodicos.ufpb.br/ojs2/index.php/ies/article/view/12224
O artigo analisa a importância dos dados de pesquisa e a ideia de curadoria digital e seus impactos na formulação de novos documentos e na comunicação científica.
SCHUMACHER, J.; VANDECREEK, D. Intellectual Capital at Risk: Data Management Practices and Data Loss by Faculty Members at Five American Universities. International Journal of Digital Curation v. 10, n. 2, p. 96-109, 2015. www.ijdc.net/index.php/ijdc/article/view/10.2.96/410
Pesquisa, que contou com a participação de 56 professores de cinco universidades americanas e descobriu que a maioria dos docentes tinha pouca compreensão dos princípios da curadoria de dados e que a muitos deles tinham experimentado a perda de pelo menos um objeto digital relacionado com o trabalho de pesquisa. Os dados sugerem que o corpo docente não está ciente de que seus dados estão em risco, e que eles podem se beneficiar do conhecimento e uso de práticas de gestão de dados pessoais, bem como a participação nos esforços de curadoria digital e acesso à infraestrutura para o armazenamento e preservação de dados digitais.
3.6.1 Identificadores dos dados
A identificação precisa e unívoca dos dados é muito importante. O Digital Object Identifier (DOI) foi desenvolvido em 1998, tendo as suas primeiras aplicações lançadas em 2000. O sistema DOI é operado pela International DOI Foundation (IDF) e por agencias de registro – membros da IDF que oferecem o sistema para clientes que desejam utilizar o sistema em seus objetos digitais. Em 23 de abril de 2012, a International Standard Organization (ISO) aprovou a norma ISO 26324, relativa ao Sistema DOI.
DATACITE. www.datacite.org/
Consórcio internacional, fundado em 2009, composto por organizações de vinte países, para estabelecer um formato de citação para os dados utilizados na pesquisa. Ele provê identificadores persistentes (DOI) para dados de pesquisa. No site existem importantes informações sobre como obter o DOI e esquemas de metadados.
HELBIG, K.; HAUSSTEIN, B.; TOEPFER, R. Supporting Data Citation: Experiences and Best Practices of a DOI Allocation Agency for Social Sciences. Journal of Librarianship and Scholarly Communication v. 3, n. 2, eP1220, 2015. jlsc-pub.org/articles/abstract/10.7710/2162-3309.1220/
Comenta as ações da DataCite para o registro DOI para dados de pesquisa em ciências sociais e economia. O artigo comenta os principais problemas relacionados a esse registro.
INTERNATIONAL DOI FOUNDATION. www.doi.org/
Organização que provê o registro do Digital Object Identifier (DOI). O sistema DOI fornece uma infraestrutura técnica para o registro e uso de identificadores persistentes interoperáveis, usados em redes digitais.
INTERNATIONAL STANDARD NAME IDENTIFIER (ISNI). www.isni.org/
Operada pela ISNI International Authority, é uma norma da ISO (ISO 27729) que provê um número padrão para identificar os milhões de contribuintes para trabalhos criativos e os que operam na sua distribuição, incluindo pesquisadores, inventores, escritores, artistas, criadores visuais, intérpretes, produtores, editores, agregadores e muito mais. É parte de uma família de identificadores padrão internacional que inclui identificadores de obras, gravações, produtos e titulares de direitos em todos os repertórios, p. ex.: DOI, ISAN, ISBN, ISRC, ISSN, ISTC e ISWC.
INTERNATIONAL STANDARD ORGANIZATION. ISO 26324:2012 Information and documentation, Digital object identifier system. 17 p. www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=43506
Norma que especifica a sintaxe, descrição e resolução de componentes funcionais do sistema de identificador de objeto digital e os princípios gerais para a criação, registro e administração de nomes de DOI.
À medida que mais e mais dados de pesquisa tornam-se melhor e mais facilmente acessíveis, a citação dados ganha maior importância. Similar às regras de citação de um documento, a citação de dados também é vital para o sucesso para o acesso, o compartilhamento e reutilização de um conjunto de dados de pesquisa. Os princípios da citação de dados representam um grande avanço para a disseminação dos dados de pesquisa.
A história da citação dados de pesquisa com identificadores persistentes ainda é muito recente. A atribuição de nomes de DOI para dados de investigação científica começou em 2004, com o DataCite, um dos órgãos de registro para nomes com DOI. Consequentemente, a literatura de citação dados da pesquisa ainda é modesta.
Em meados de 2013, o Joint Declaration of Data Citation Principles foi formado para unificar várias recomendações existentes. E em novembro de 2013, foi proposta uma Declaração Conjunta de Princípios de Citação de Dados [FORCE 11], tendo sido completada em fevereiro de 2014. Na prática, esses principios se transformaram em norma orientadora para as diversas áreas.
ALTMAN, M.; BORGMAN, C.; CROSAS, M.; MATONE, M. An Introduction to the Joint Principles for Data Citation. Bulletin of the Association for Information Science and Technology v. 41, n. 3, p. 43-45, 2015. www.asis.org/Bulletin/Feb-15/FebMar15_RDAP_Altman_EtAl.html
O artigo sumariza o relatório publicado pelo grupo sobre os princípios da citação de dados (ver FORCE 11).
BALL, A.; DUKE, M. How to Cite Datasets and Link to Publications. DCC How-to Guides. Edinburgh: Digital Curation Centre, 2015. www.dcc.ac.uk/sites/default/files/documents/publications/reports/guides/How_to_Cite_Link.pdf
Regras para a citação de dados de pesquisa.
BRASE, J.; SENS, I.; LAUTENSCHLAGER, M. The tenth anniversary of assigning DOI names to scientific data and a five-year history of DataCite. D-Lib Magazine v. 21, n. 1-2, January 2015. www.dlib.org/dlib/january15/brase/01brase.html
A Biblioteca Nacional Alemã de Ciência e Tecnologia atribuiu os primeiros nomes DOI para dados científicos no verão de 2004. O objetivo era usar identificadores persistentes como parte de uma mais ampla esforço para tornar citáveis esses conjuntos de dados científicos. O esforço iniciado pela biblioteca levou à criação do DataCite em 1 de Dezembro de 2009. Durante os últimos anos o DataCite tem crescido, formando um consórcio global que atribuiu nomes de DOI para conjuntos de dados científicos e outros artefatos de pesquisa. Este artigo destaca o seu desenvolvimento e dá uma visão geral do trabalho do DataCite.
CROSAS, M. . IASSIST Quarterly, v. 37, n. 1-4, 2014.
O artigo revisa a evolução dos padrões de citação de dados e os princípios básicos da citação de dados que surgiram por meio de uma síntese colaborativa. Em seguida, discute um exemplo do estado atual da prática e identifica os desafios de implementação restantes.
FORCE 11. Data Citation Synthesis Working Group.. Joint Declaration of Data Citation Principles Final. February 2014 www.force11.org/datacitationprinciples ¶ Descreve os principios de citação de dados, incluindo o seu propósito, função e os atributos de citações. Estes princípios reconhecem a dupla necessidade de criar práticas de citação que sejam compreensíveis por recursos eletrônicos e humanos.
HERTERICH, P.; DALLMEIER-TIESSEN, S. Data Citation Services in the High-Energy Physics Community. D-Lib Magazine v. 22, n. 1-2, January 2016. www.dlib.org/dlib/january16/herterich/01herterich.html
Estudo de caso dos serviços de citação de dados na comunidade de Física de Altas Energias. Mostra como o conceito de citação de dados é implementado no fluxo de trabalho da pesquisa, abrangendo a produção, publicação, citação e acompanhamento da reutilização de dados. Descreve também os desafios enfrentados e as lições aprendidas para os provedores de infraestrutura e as partes interessadas na comunicação científica.
OPEN RESEARCHER AND CONTRIBUTOR ID (ORCID). orcid.org
Instituição que fornece um identificador para os indivíduos para usar com o seu nome quando estiverem envolvidos em atividades de pesquisa, bolsas de estudo e de inovação. Na prática funciona como um nome padronizado, conceito já conhecido na Biblioteconomia como “catálogo de autoridades”.
REINO UNIDO. Economic & Social Research Council (ESRC). Data Citation: What You Need to Know. Swindon, UK: ESRC, 2016. 8 p. ukdataservice.ac.uk/media/104397/data_citation_online.pdf
Folheto que explica a importância da citação dos dados de pesquisa.
A visualização dos dados é parte essencial de qualquer análise de dados. Os modernos desenvolvimentos na computação trouxeram grandes melhorias na capacidade gráfica e surgiram inúmeras possibilidades para exibições de dados.
Existem muitos programas – proprietários e de acesso livre – que podem ser usados para apresentar os dados numa forma mais fácil e entendível para o usuário. A maioria desses programas proveem manuais de utilização e na literatura técnica existem inúmeros artigos avaliando esses programas.
BALL, A. et al. Visualizing Research Data Records for Their Better Management. Journal of Digital Information v. 13, n. 1, 2012. journals.tdl.org/jodi/index.php/jodi/article/view/5917 ¶ Comenta o projeto sobre um método visual de mapear os registros de dados produzidos no decurso da investigação, juntamente com as associações entre esses dados. O projeto Research Activity Information Development (RAID), está servindo tanto para manter o controle de seus próprios dados, como também para comunicar esta compreensão para os outros que podem desejar validar os resultados ou reutilizar os dados.
CHEN, C. Information Visualization: Beyond the Horizon. 2nd ed. Berlin; London: Springer: 2010. 316 p. ISBN 9781846283406
A obra busca “definir a visualização da informação e os ambientes virtuais em uma estrutura unificadora. Ela presta especial atenção para os avanços feitos ao longo dos últimos cinco anos e, potencialmente, as direções frutíferas para prosseguir” (Contracapa).
KIRK, A. Data visualization: a handbook for data driven design. 2nd ed. London: Sage, 2019. 312 p. ISBN 9781526468925
Obra clássica que aborda didaticamente os mais variados aspectos da visualização de dados. É dividida em três partes: fundamentos (cap. 1-2), o pensamento escondido (cap. 3-5) e desenvolvendo a solução para os seus dados (cap. 6-10).
SILVA, F. C. C. da. Visualização de dados: passado, presente e futuro. Liinc em revista, Rio de Janeiro, v. 15, n. 2, p. 205-223, nov. 2019. revista.ibict.br/liinc/article/view/4812/4325 ¶ O artigo aborda como os dados multivariados têm sido representados por meio de imagens e gráficos ilustrados que relacionam os elementos de sintaxe e semântica que podem contemplar o pensamento analítico nas margens visuais.
TELEA, A. C. Data visualization: principles and practice. 2nd ed. Boca Raton, FL: A.K. Press/CRC Press, 2014. 617 p. ISBN 9781466585263
Livro didático que oferece uma introdução básica ao campo e às várias técnicas de visualização. Com exemplos de dados de várias disciplinas, mostra como entender os conjuntos de dados e como a imagem e a computação gráfica trabalham.
UNWIN, A.; CHEN, C.; HARDLE, W. Handbook of data visualization. Berlin; London: Springer, 2008. 936 p. ISBN 9783540330363
A obra apresenta uma visão geral dos métodos de visualização de dados, tanto em teoria e prática. Comenta os principais programas gráficos existentes no mercado.
YAU, N. Data points: visualization that means something. Indianapolis: Wiley, 2013. 320 p. ISBN 9781118462195
Manual para aqueles que trabalham em visualização de dados científicos, guiando o leitor através de exemplos com dados, gráficos, contexto, apresentação e análise. O autor lembra que o verdadeiro propósito da maior parte do trabalho é comunicar os dados para fins pragmáticos.
3.6.4 Usuários de dados e avaliação dos sistemas
A biblioteca ou o repositório digital sempre deve ter o seu foco centrado no usuário. Entretanto, poucos são os projetos que, em sua fase inicial ou experimental, incluem esse importante aspecto nos seus objetivos! Uma das razões desse “esquecimento” é que é possível que esses projetos pensem mais na experimentação de novas tecnologias. Felizmente, nos últimos anos, esse quadro parece começar a mudar: o usuário está sendo redescoberto e os seus anseios e experiências finalmente passam a ser considerados no desenho da biblioteca digital.
Assim, é vital ter informações sobre como os pesquisador4es usamos dados de pesquisa. Portanto, para que a GDP tenha sucesso, garantindo a sua sustentabilidade, é condição primordial que os usuários possam ser conhecidos, estudados e que tenham a oportunidade de informar o que desejam e como desejam acessar essas novas bibliotecas.
AVERKAMP S.; GU, X.; ROGERS, B. Data Management at the University of Iowa: A University Libraries Report on Campus Research Data Needs. Ames, Iowa: University of Iowa Libraries, 2014. 36 p. ir.uiowa.edu/cgi/viewcontent.cgi?article=1246&context=lib_pubs
O documento identifica as lacunas nos serviços de GDP na University of Iowa (US). Os resultados são apresentados como desafios e oportunidades dentro de cinco grandes áreas de GDP: dados de planejamento de gestão, armazenamento de dados, organização de dados e análise, publicação e divulgação de dados e os dados sensíveis.
AKERS, K. G. Disciplinary Differences in Faculty Research Data Management Practices and Perspectives. International Journal of Digital Curation v. 8, n. 2, p. 5-26, 2013. www.ijdc.net/index.php/ijdc/article/view/8.2.5/332
Analisa as práticas de GDP numa universidade, onde os docentes foram categorizados em quatro domínios: artes e humanidades, ciências sociais, ciências médicas e ciências básicas. Foram encontradas diferenças significativas entre esses domínios, revelando distinções entre as disciplinas em ações de GDP, atitudes e interesse. Essas semelhanças e diferenças entre as disciplinas vão ajudar a orientar os profissionais de curadoria de dados no desenvolvimento de uma gama de serviços de GDP que podem ser adaptados às necessidades específicas de diferentes pesquisadores acadêmicos.
BARDYN, T. P.; RESNICK, T.; CAMINA, S. K. Translational Researchers’ Perceptions of Data Management Practices and Data Curation Needs: Findings from a Focus Group in an Academic Health Sciences Library. Journal of Web Librarianship v. 6, n. 4, p. 274-287, 2012.
O artigo analisa como médicos e pesquisadores num centro médico (UCLA School of Medicine), utilizam dados e as práticas de GDP. Os resultados mostram variações entre os departamentos, disciplinas e centros de pesquisa; mas, apontam áreas comuns entre os respondentes, que incluem a privacidade, o acesso e administração dos dados.
BORGMAN, C. L; WALLIS, J. C.; ENYEDY, N. Building digital libraries for scientific data: An exploratory study of data practices in habitat ecology. Lecture Notes in Computer Science: Research and Advanced Technology for Digital Libraries v. 4172, p. 170–183, 2006.
Estudo sobre ecologistas, mostrando que esses cientistas estão mais dispostos a compartilhar os dados já publicados do que os dados que planejam publicar. Além disso, também identificou: que os respondentes estão mais dispostos a compartilhar dados coletados por instrumentos do que aqueles recolhidos manualmente; apontam a responsabilidade de fornecer dados limpos e confiáveis; as preocupações em matéria de responsabilidade e apropriação indevida de dados; os cuidados em lidar com dados sensíveis relacionados a assuntos humanos; o controle dos dados e os direitos autorais.
BUYS, C. M.; SHAW, P. L. Data Management Practices Across an Institution: Survey and Report. Journal of Librarianship and Scholarly Communication v. 3, n. 2, eP1225, 2015. jlsc-pub.org/articles/abstract/10.7710/2162-3309.1225/
Pesquisa que teve por objetivos saber como 788 pesquisadores da Northwestern University (US) administram os seus dados e identificar as suas necessidades futuras relacionadas com a GDP. Os resultados mostraram: que os pesquisadores necessitam de armazenamento a curto e longo prazos; 31% dos respondentes não sabiam o tamanho exato necessário para o armazenamento dos dados; que estavam usando os discos rígidos de seus computadores para o armazenamento, o que, certamente limita a preservação digital; o compartilhamento de dados tende a ocorrer quando a pesquisa é feita de forma colaborativa.
CAREGNATO, S. E. et al. Práticas e percepções dos pesquisadores brasileiros sobre serviços de acesso aberto a dados de pesquisa. Liinc em Revista, Rio de Janeiro, v.15, n.2, p. 121-141, nov. 2019. revista.ibict.br/liinc/article/view/4771/4329
O artigo tem por objetivo apresentar os resultados do estudo que buscou identificar as percepções dos pesquisadores brasileiros sobre o acesso aberto a dados de pesquisa e as práticas já em curso nas instituições nacionais.
DIGITAL CURATION CENTRE. Data dimensions: disciplinary differences in research data sharing, reuse and long term viability. 36 p. 2010. www.dcc.ac.uk/sites/default/files/documents/publications/SCARP-Synthesis.pdf
O estudo investigou as atitudes em relação às abordagens para depósito de dados, compartilhamento e reutilização, curadoria e preservação, através de uma variedade de campos de pesquisa em diferentes disciplinas.
FEIJEN, M. What Researchers Want. Utrecht: SURFfoundation, 2011. 32 p. www.surf.nl/binaries/content/assets/surf/en/knowledgebase/2011/What_researchers_want.pdf
Apresenta uma revisão de literatura sobre 15 estudos de usuários de dados de pesquisa, realizadas no período de 2008-2010. Em seguida foram coletados dados sobre as necessidades de armazenamento e acesso aos dados de pesquisa no contexto das universidades holandesas.
GRIFFITHS, A. The Publication of Research Data: Researcher Attitudes and Behaviour. International Journal of Digital Curation v. 4, n. 1, p. 46-56, 2009. www.ijdc.net/index.php/ijdc/article/view/101/76
Investiga se os pesquisadores disponibilizam os seus dados outros colegas e quais problemas eles se deparam ao fazê-lo. Discute algumas distinções entre os tipos de dados que devem ser compartilhadas e preservados e os que precisa ser feito para fazê-lo de forma eficaz. Em segundo lugar, ele reflete sobre as motivações e os entraves sentidos pelos pesquisadores que publicam seus dados, e como financiadores e os editores podem resolvê-los. Em terceiro lugar, analisa questões em torno da forma como os dados são descobertos, acessados e reutilizados. Finalmente, discute a qualidade acadêmica e técnica dos dados publicados.
MARTÍNEZ-URIBE, L.; MACDONALD; S. User engagement in research data curation. Lecture Notes in Computer Science, n. 5714, p. 309-314, 2009. www.era.lib.ed.ac.uk/handle/1842/3206
O artigo argumenta que o envolvimento dos usuários em curadoria de dados de pesquisa através de uma compreensão de seus processos, restrições e cultura é uma componente chave no desenvolvimento de repositórios de dados. A fim de maximizar a eficácia dessas tecnologias as atividades de curadoria precisam começar cedo no ciclo de vida da pesquisa e, portanto, manter fortes ligações com os pesquisadores.
MCLURE, M. et al. Data Curation: A Study of Researcher Practices and Needs portal: Libraries and the Academy v. 14, n. 2, 2014. muse.jhu.edu/article/541840
O artigo mostra o estudo feito na Colorado State University (US) com 31 professores e cientistas. A pesquisa procurou entender: a natureza dos conjuntos de dados que esses pesquisadores criam ou mantem; como os participantes gerenciam os seus dados;as necessidades que os participantes têm para identificar em relação ao compartilhamento, curadoria e preservação dos dados; e a viabilidade de adaptação do protocolo de entrevista Purdue University para uso em grupos focais com pesquisadores.
NORTON, H. F. et al. Assessment of and Response to Data Needs of Clinical and Translational Science Researchers and Beyond. Journal of eScience Librarianship v. 5, n. 1, e1090, 2016. escholarship.umassmed.edu/jeslib/vol5/iss1/2/
O artigo teve por objetivo fazer uma avaliação das necessidades de GDP de 59 pesquisadores da área de ciências da saúde da University of Florida (US). Os resultados indicaram que os pesquisadores têm diversas necessidades de GDP que muitas vezes são específicos para a sua disciplina ou projeto de pesquisa e abrangem todo o ciclo de vida dos dados. Um tema comum nas respostas foi a necessidade de letramento em GDP, especialmente para os estudantes de pós-graduação.
RIBEIRO, C.; FERNANDES, M. E. M. Data Curation at U. Porto: Identifying Current Practices across Disciplinary Domains. IASSIST Quarterly v. 35, n. 4, p. 14-17, 2011. repositorio-aberto.up.pt/handle/10216/62536
Comenta os conjuntos de dados que estão sendo organizados na Universidade do Porto, bem como a sensibilidade dos pesquisadores em relação ao acesso aberto dos seus dados.
RIBEIRO, C. J. S. Modelo de Maturidade para Repositórios Digitais: um caminho para sua adoção na gestão de dados de pesquisa. Liinc em Revista, Rio de Janeiro, v. 15, n. 2, p. 224-243, nov. 2019. revista.ibict.br/liinc/article/view/4816/4317
Apresenta o estudo sobre modelos de maturidade como forma de avaliação da qualidade para repositórios. Adota o modelo CMMI como referência, relacionado os respectivos níveis. Apresenta um estudo sobre repositórios confiáveis e critérios de avaliação, finalizando a proposta com a inclusão dos princípios FAIR no processo de avaliação.
SCARAMOZZINO, J. M.; RAMIREZ, M. L.; MCGAUGHY, K. J. A study of faculty data curation behaviors and attitudes at a teaching-centered university. College & Research Libraries, v. 73, p. 349-365, 2012. crl.acrl.org/content/73/4/349.full.pdf+html
Analisa as informações coletadas junto aos professores de Ciências e de Matemática da California Polytechnic State University, San Luis Obispo (US). Os resultados mostram as opiniões sobre curadoria de dados, comportamentos e atitudes dos pesquisadores de ciências, bem como o que precisa ser feitos em relação aos serviços e letramento em GDP.
SCHOPF, J. M.; NEWHOUSE, S. User Priorities for Data: Results from SUPER. International Journal of Digital Curation v. 2, n. 1, 2007. www.ijdc.net/index.php/ijdc/article/view/34
Analisa o SUPER (Study of User Priorities for e-infrastructure for Research), uma investigação realizada no Reino Unido, com 30 projetos diferentes, sobre as prioridades do usuário em relação a uma infraestrutura de pesquisa. O seu objetivo era informar sobre o investimento a ser feito, para prover infraestrutura e um conjunto de serviços úteis e acessíveis para todos os pesquisadores. Ao final, o documento apresenta uma lista de prioridades de atividades futuras para pesquisa, desenvolvimento e adoção na GDP.
WELLER, T. Understanding Methodological and Disciplinary Differences in the Data Practices of Academic Researchers. Library Hi Tech v. 32., n. 3, p. 467-482, 2014. kuscholarworks.ku.edu/handle/1808/15171
O objetivo do artigo é entender melhor os dados, as práticas, as influências e as necessidades dos investigadores em uma instituição pública. Ele baseia-se numa pesquisa realizada na Universidade de Kansas (US), onde foram constatadas influências sobre práticas e necessidades de dados que variam de acordo com a metodologia de pesquisa e disciplina acadêmica do pesquisador. Assim, as bibliotecas universitárias precisam ajustar os serviços que oferecem para satisfazer as diferentes necessidades dos pesquisadores em distintas disciplinas que utilizam diferentes metodologias.
WHITMIRE, A. L.; BOOCK, M.; SUTTON, S. C. Variability in Academic Research Data Management Practices: Implications for Data Services Development from a Faculty Survey. Program v. 49, n. 4, p. 382-407, 2015. ir.library.oregonstate.edu/xmlui/handle/1957/57240
Analisa o desenvolvimento progressivo dos serviços de GDP após suas implantações. Os autores descobriram que os pesquisadores da Universidade do Estado de Oregon (US) estão gerando uma grande variedade de tipos de dados, e que as práticas variam entre faculdades. Comentam que os professores não estão utilizando a infraestrutura de armazenamento para todo o campus, mantendo dados em seus próprios servidores de armazenamento. O documento apresenta um exemplo de como mover os serviços básicos de GDP, para a prestação de serviços mais focados que atendam às necessidades locais específicas.
4 CONSIDERAÇÕES FINAIS
As boas práticas de GDP dependem de múltiplos fatores incluindo, entre outros, incentivos, habilidades e conhecimentos, serviços, infraestrutura, financiamento e políticas. Além disso, a adoção abrangente dessas práticas envolve uma significativa mudança cultural nos componentes das diversas áreas envolvidas com dados de pesquisa. Isto, certamente vai levar algum tempo, e provavelmente, vai progredir por meio de passos incrementais, estáveis em vários fatores e domínios. Esforços paralelos também devem ser feitos para aumentar a conscientização e aceitação dos objetivos da política dentro da comunidade de pesquisa.
O assunto GDP, conforme se pode depreender pela bibliografia apresentada, tem tido um crescimento acentuado desde meados dos anos 2010. Essa evolução também teve reflexos no Brasil, onde se pode notar o aumento no número das referências bibliográficas incluídas na presente bibliografia.
Esta é uma área que tem grande futuro na ciência da informação. Espera-se que parte do seu conteúdo seja incorporada aos currículos das escolas brasileiras de arquivologia, biblioteconomia, museologia, como também na ciência da computação. Assim, esta bibliografia pretende colaborar na divulgação do assunto e motivar estudos e pesquisas nas diversas fases da GDP.
1 Docente permanente no Programa de Pós-Graduação em Ciência da Informação. Universidade de Brasília, Brasil. ORCID https://orcid.org/0000-0002-5258-0217. E-mail: murilobc@unb.br
2 Tecnologista Senior do do Ministério de Ciência, Tecnologia, Inovações, Brasil. ORCID: https://orcid.org/0000-0002-8324-2114. E-mail: mairamurrieta@gmail.com
artigo de revisão