Avaliação de critérios para seleção de sintagmas nominais com valor para a recuperação da informação

  • Gustavo Diniz do Nascimento Universidade Federal de Pernambuco
  • Renato Fernandes Correa Universidade Federal de Pernambuco

Resumo

O presente estudo avalia critérios para seleção de sintagmas nominais mais representativos do conteúdo de documentos jurídicos em língua portuguesa. A metodologia da pesquisa consistiu em revisão de literatura brasileira e experimento. No experimento foram aplicados dez critérios de seleção aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações. Os critérios foram avaliados quanto à eficácia na seleção de sintagmas nominais relevantes para a recuperação da informação. Por meio do experimento, foram identificados como mais eficazes os critérios de eliminação de sintagmas nominais considerados stopwords ou contendo pronomes no núcleo, e os critérios de seleção por posição de ocorrência, nível do sintagma nominal, inverso da frequência nos documentos e frequência de ocorrência em um documento.

 

Biografia do Autor

Gustavo Diniz do Nascimento, Universidade Federal de Pernambuco
Graduação em Biblioteconomia. Graduação em Letras-Língua Portuguesa. Especialização em Biblioteconomia. Mestrado em Ciência da Informação
Renato Fernandes Correa, Universidade Federal de Pernambuco
Possui graduação em Ciência da Computação pela Universidade Federal de Viçosa (2000), mestrado em Ciências da Computação pela Universidade Federal de Pernambuco (2002) e doutorado em Ciências da Computação pela Universidade Federal de Pernambuco (2008). Atualmente é professor adjunto da Universidade Federal de Pernambuco. Tem experiência nas áreas de Ciência da Informação e Ciência da Computação, com ênfase em Sistemas de Recuperação de Informação, atuando principalmente nos seguintes temas: indexação automática, categorização de texto, mineração de texto e sistemas de recuperação de informação.
Publicado
2019-06-05
Seção
Resumos de artigos científicos