A terminologia em Sistemas de Recuperação da Informação baseada na WORDNET.PT

Resumo

O objetivo deste trabalho é propor um sistema de recuperação da informação baseado no processamento da linguagem para extrair lexicalizações da WordNet.Pt e relacioná-las aos termos do vocabulário controlado e das expressões de busca dos usuários. O enfoque é qualitativo, exploratório e aplicado à solução de problemas sobre a ambiguidade na recuperação da informação. Quanto aos procedimentos utilizados, trata-se de uma pesquisa bibliográfica. A discussão é motivada pelo problema da alta revocação, determinada pelo grau de similaridade entre as expressões de busca dos usuários e os documentos do corpus, sem a determinação precisa da semântica envolvida. O núcleo de pesquisa justifica-se pela vantagem de desenvolvimento de sistemas que combinam a linguagem natural e a linguagem controlada orientada, para uma busca interativa. Embora de forma parcial, a pesquisa aponta para resultados importantes na solução da ambiguidade lexical, por meio de relacionamentos semânticos entre termos da linguagem natural e artificial. Por um lado, este sucesso garante a restrição do espaço da busca e, consequentemente, a precisão. Por outro, a expansão de consultas por meio de sugestão de termos equivalentes de vocabulários controlados e da língua natural e suas variantes.

Downloads

Não há dados estatísticos.

Biografia do Autor

Januário Albino Nhacuongue, Universidade Federal de São Carlos
Professor do Departamento da Ciência da Informação - UFSCar
Moisés Lima Dutra, Universidade Federal de Santa Catarina - UFSC

Departamento de Ciência da Informação

Publicado
2020-05-26
Como Citar
Nhacuongue, J. A., & Dutra, M. L. (2020). A terminologia em Sistemas de Recuperação da Informação baseada na WORDNET.PT. Informação & Sociedade: Estudos, 30(2). https://doi.org/10.22478/ufpb.1809-4783.2020v30n2.50756
Seção
Comunicações de Trabalhos/Pesquisas em Andamento