Um Método para a Utilização de Ontologias na Indexação Automática
Abstract
O processo de indexação tem como objetivo representar sinteticamente o conteúdo informacional de documentos por meio de um conjunto de termos cujos significados remetem aos temas ou assuntos tratados por eles. Com o surgimento da Web as pesquisas em indexação automática receberam grande impulso tendo o vista a necessidade recuperação desse imenso acervo documental. As linguagens de indexação tradicionais, utilizadas para traduzir o conteúdo temático de documentos em termos padronizados, sempre se mostraram eficientes na indexação manual. As ontologias abrem novas perspectivas para as pesquisas em indexação automática, pois oferecem uma estrutura conceitual e terminológica restrita a um determinado domínio e originalmente representada em linguagens processáveis por computador. O uso de ontologias no processo de indexação automática permite agregar a esse processo uma linguagem de um domínio específico e uma estrutura lógica e conceitual que pode ser utilizada para realizar inferências, e cujas relações permitam uma expansão dos termos diretamente extraídos do texto do documento. Este trabalho apresenta diretrizes técnicas para a construção e utilização de ontologias no processo de indexação automática por meio de exemplos. Conclui-se que a utilização de ontologias no processo de indexação permite não só agregar novos recursos ao processo de indexação, mas também permite pensar em novas e avançadas funcionalidades em um sistema de recuperação de informação.
Downloads
References
ANDERSON, J.D.; PEREZ-CARBALLO, J. The nature of indexing: how humans and machines analyze messages and texts for retrieval. Part I: Research, and the nature of human indexing. Information Processing and Management, v.37, p.231-254. 2001.
ABNT - ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 12676: métodos para análise de documentos: determinação de seus assuntos e seleção de termos de indexação: procedimento. Rio de Janeiro, 1992.
BREITMAN, Karin. Web Semântica: a internet do futuro. Rio de Janeiro: LTC, 2005.
CAVALCANTI, Cordélia R. Indexação e tesauro: metodologia e técnicas. Brasília: Associação de Bibliotecários do Distrito Federal, 1978.
DACONTA, M.C.; OBRST, L.J.; SMITH, K.T.The Semantic Web: a guide to the Future of XML, Web Services, and Knowledge Management. Indianápolis: Wiley Publishing, 2003.
DAHLBERG, Ingetraut. A referent-oriented, analytical concept theory for Interconcept. International Classification, Frankfurt, v.5, n.3, 1978.
ESTEBAN NAVARRO, M.A. El marco disciplinar de los lenguajes documentales: la Organización del Conocimiento y las ciencias sociales. Scire, Zaragoza, v.2, n.1, 1996.
EUZENAT, J.; SHVAIKO, P. Ontology Matching. 2.ed. Springer-Verlag, 2007.
FEITOSA, A. Organização da informação na web: das tags à web semântica. Brasília: Thesaurus, 2006.
FUJITA, M.S.L., Avaliação da eficácia de recuperação do sistema de indexação PRECIS. Ciência da Informação, v. 18, n.2, 1989.
FUJITA, M.S.L. Organização e representação do conhecimento no Brasil: análise de aspectos conceituais e da produção científica do ENANCIB no período de 2005 a 2007. Tendências da Pesquisa Brasileira em Ciência da Informação, v.1, n.1, 2008.
GÓMEZ-PÉREZ, A. Evaluation of taxonomic knowledge in ontologies and knowledge bases. In: Twelfth Workshop on Knowledge Acquisition, Modeling and Management, 12. Alberta, Canadá, 1999.
GRISHMAN, Ralph. Information extraction; techniques and challenges. In: International Summer School SCIE-97, 1997, New York. Proceedings… New York : Springer-Verlag, 1997.
GRUBER, T. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, v.43, n.5-6, 1995.
GUIMARÃES, F. J. Z. Ontologies use in B2C domain, 2002. 195p. Dissertação (Mestrado em Informática) - Departamento de Informática da Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro.
LANCASTER, F.W. Indexação e Resumos: teoria e prática. 2.ed. Brasília, DF: Briquet de Lemos, 2004.
LOPES, I.L. Uso das linguagens controlada e natural em bases de dados: revisão da literatura. Ciência da Informação: Brasília, 2002, v. 31, n. 1, p. 41-52.
MANAF, Nor Azlinayati Abdul; BECHHOFER, Sean; STEVENS, Robert. A Survey of Identiers and Labels in OWL Ontologies. Proceedings of the 6th International Workshop on OWL Experiences and Directions (OWLED), 2010.
NOVELLINO, Maria Salet Ferreira. Instrumentos e metodologias de representação da informação. Informação & Informação, Londrina, v.1, n.2, p.37-45, jul./dez. 1996.
PICKLER, Maria Elisa Valentim. Web Semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Informação, v.12, n.1, p.65-83, abr. 2007
PINTO, Lourival Pereira. A recepção da informação: apresentação ou representação? DataGramaZero - Revista de Ciência da Informação, v.11, n.5, 2010.
RAMALHO, R.A.S. Desenvolvimento e utilização de ontologias em Bibliotecas Digitais: uma proposta de aplicação. Tese (Doutorado em Ciências da Informação) – Universidade Estadual Paulista, 2003.
SALES, R.; CAFÉ, L. Semelhanças e Diferenças entre Tesauros e Ontologias. DataGramaZero, Rio de Janeiro, v.9, n.4, ago. 2008.
SANTAREM SEGUNDO, J E. Representação Iterativa: um modelo para repositórios digitais. 2010. 224f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010.
SARAWAGI, S. Information Extraction. Foundations and Trends in Databases v.1, n.3, 2008.
SCHULTZ, C. K. (ed.) H.P. Luhn: Pioneer of information science: selected works. New
SOERGEL, D. The rise of ontologies or the reinvention of classification. Journal of the American Society for Information Science. v. 50, n. 12, 1999.
SOWA, J.F. Knowledge Representation: logical, philosophical, and Computational foundations. Pacific Grove: Brooks/Cole, 2000.
VICKERY, B. C. Ontologies. Journal of Information Science. v.23, n.4, 1997.