Um Método para a Utilização de Ontologias na Indexação Automática

  • Maria Elisa Valentim Pickler Nicolino Universidade Estadual Paulista - UNESP-Marília
  • Edberto Ferneda Universidade Estadual Paulista - UNESP-Marília

Resumo

O processo de indexação tem como objetivo representar sinteticamente o conteúdo informacional de documentos por meio de um conjunto de termos cujos significados remetem aos temas ou assuntos tratados por eles. Com o surgimento da Web as pesquisas em indexação automática receberam grande impulso tendo o vista a necessidade recuperação desse imenso acervo documental. As linguagens de indexação tradicionais, utilizadas para traduzir o conteúdo temático de documentos em termos padronizados, sempre se mostraram eficientes na indexação manual. As ontologias abrem novas perspectivas para as pesquisas em indexação automática, pois oferecem uma estrutura conceitual e terminológica restrita a um determinado domínio e originalmente representada em linguagens processáveis por computador. O uso de ontologias no processo de indexação automática permite agregar a esse processo uma linguagem de um domínio específico e uma estrutura lógica e conceitual que pode ser utilizada para realizar inferências, e cujas relações permitam uma expansão dos termos diretamente extraídos do texto do documento. Este trabalho apresenta diretrizes técnicas para a construção e utilização de ontologias no processo de indexação automática por meio de exemplos. Conclui-se que a utilização de ontologias no processo de indexação permite não só agregar novos recursos ao processo de indexação, mas também permite pensar em novas e avançadas funcionalidades em um sistema de recuperação de informação.

Biografia do Autor

Maria Elisa Valentim Pickler Nicolino, Universidade Estadual Paulista - UNESP-Marília
Supervisora Técnica da Seção de Referência e Atendimento ao Usuário e Documentação na Biblioteca da Unesp, campus de Marília. Mestre em Ciência da Informação pela UNESP - Faculdade de Filosofia e Ciências de Marília. Graduada em Biblioteconomia pela Universidade Estadual de Londrina, 2003-2006. Atua principalmente nos seguintes temas: Ontologias, Indexação, Indexação Automática, Internet, Web, Memória e esquecimento no Ciberespaço, Mecanismos de busca, Tecnologias da Informação e Comunicação.
Edberto Ferneda, Universidade Estadual Paulista - UNESP-Marília
Graduação em Processamento de Dados pela antiga Fundação Educacional de Bauru (1985). Mestre em Informática pela Universidade Federal da Paraíba (1997) . Doutor em Ciências da Comunicação (Ciência da Informação) pela Universidade de São Paulo (2003). Pós-doutorado pela Universidade Federal da Paraíba (2013). Atualmente é professor do Departamento de Ciência da Informação da Universidade Estadual Paulista Julio Mesquita Filho (UNESP) - Campus de Marília. Atua na Ciência da Informação, principalmente nas áreas de Indexação Automática e Recuperação de Informação.

Referências

ANDERSON, J.D.; PEREZ-CARBALLO, J. The nature of indexing: how humans and machines analyze messages and texts for retrieval. Part I: Research, and the nature of human indexing. Information Processing and Management, v.37, p.231-254. 2001.

ABNT - ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 12676: métodos para análise de documentos: determinação de seus assuntos e seleção de termos de indexação: procedimento. Rio de Janeiro, 1992.

BREITMAN, Karin. Web Semântica: a internet do futuro. Rio de Janeiro: LTC, 2005.

CAVALCANTI, Cordélia R. Indexação e tesauro: metodologia e técnicas. Brasília: Associação de Bibliotecários do Distrito Federal, 1978.

DACONTA, M.C.; OBRST, L.J.; SMITH, K.T.The Semantic Web: a guide to the Future of XML, Web Services, and Knowledge Management. Indianápolis: Wiley Publishing, 2003.

DAHLBERG, Ingetraut. A referent-oriented, analytical concept theory for Interconcept. International Classification, Frankfurt, v.5, n.3, 1978.

ESTEBAN NAVARRO, M.A. El marco disciplinar de los lenguajes documentales: la Organización del Conocimiento y las ciencias sociales. Scire, Zaragoza, v.2, n.1, 1996.

EUZENAT, J.; SHVAIKO, P. Ontology Matching. 2.ed. Springer-Verlag, 2007.

FEITOSA, A. Organização da informação na web: das tags à web semântica. Brasília: Thesaurus, 2006.

FUJITA, M.S.L., Avaliação da eficácia de recuperação do sistema de indexação PRECIS. Ciência da Informação, v. 18, n.2, 1989.

FUJITA, M.S.L. Organização e representação do conhecimento no Brasil: análise de aspectos conceituais e da produção científica do ENANCIB no período de 2005 a 2007. Tendências da Pesquisa Brasileira em Ciência da Informação, v.1, n.1, 2008.

GÓMEZ-PÉREZ, A. Evaluation of taxonomic knowledge in ontologies and knowledge bases. In: Twelfth Workshop on Knowledge Acquisition, Modeling and Management, 12. Alberta, Canadá, 1999.

GRISHMAN, Ralph. Information extraction; techniques and challenges. In: International Summer School SCIE-97, 1997, New York. Proceedings… New York : Springer-Verlag, 1997.

GRUBER, T. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, v.43, n.5-6, 1995.

GUIMARÃES, F. J. Z. Ontologies use in B2C domain, 2002. 195p. Dissertação (Mestrado em Informática) - Departamento de Informática da Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro.

LANCASTER, F.W. Indexação e Resumos: teoria e prática. 2.ed. Brasília, DF: Briquet de Lemos, 2004.

LOPES, I.L. Uso das linguagens controlada e natural em bases de dados: revisão da literatura. Ciência da Informação: Brasília, 2002, v. 31, n. 1, p. 41-52.

MANAF, Nor Azlinayati Abdul; BECHHOFER, Sean; STEVENS, Robert. A Survey of Identiers and Labels in OWL Ontologies. Proceedings of the 6th International Workshop on OWL Experiences and Directions (OWLED), 2010.

NOVELLINO, Maria Salet Ferreira. Instrumentos e metodologias de representação da informação. Informação & Informação, Londrina, v.1, n.2, p.37-45, jul./dez. 1996.

PICKLER, Maria Elisa Valentim. Web Semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Informação, v.12, n.1, p.65-83, abr. 2007

PINTO, Lourival Pereira. A recepção da informação: apresentação ou representação? DataGramaZero - Revista de Ciência da Informação, v.11, n.5, 2010.

RAMALHO, R.A.S. Desenvolvimento e utilização de ontologias em Bibliotecas Digitais: uma proposta de aplicação. Tese (Doutorado em Ciências da Informação) – Universidade Estadual Paulista, 2003.

SALES, R.; CAFÉ, L. Semelhanças e Diferenças entre Tesauros e Ontologias. DataGramaZero, Rio de Janeiro, v.9, n.4, ago. 2008.

SANTAREM SEGUNDO, J E. Representação Iterativa: um modelo para repositórios digitais. 2010. 224f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010.

SARAWAGI, S. Information Extraction. Foundations and Trends in Databases v.1, n.3, 2008.

SCHULTZ, C. K. (ed.) H.P. Luhn: Pioneer of information science: selected works. New

SOERGEL, D. The rise of ontologies or the reinvention of classification. Journal of the American Society for Information Science. v. 50, n. 12, 1999.

SOWA, J.F. Knowledge Representation: logical, philosophical, and Computational foundations. Pacific Grove: Brooks/Cole, 2000.

VICKERY, B. C. Ontologies. Journal of Information Science. v.23, n.4, 1997.

Publicado
2014-12-31
Seção
ARTIGOS DE PESQUISA