Extraction of Keywords from Texts: An Exploratory study using Noun Phrases


  • Renato Rocha Souza FGV/RJ
  • Koti Raghavan PES Institute of Technology


The increasing use of Web for both scholarly publishing and information retrieval emphasizes the need for mechanisms to support efficient indexing and effective information retrieval. Manual indexing and knowledge representation techniques are not suitable for handling huge volumes of digital information. This paper presents an approach to extracting key phrases from texts based on the intrinsic semantics of the text. The methodology has been tested with a series of small-scale experiments involving texts in Portuguese language. The results suggest that the approach yields satisfactory results. Some suggestions for future work have been made.


Download data is not yet available.

Author Biography

Renato Rocha Souza, FGV/RJ

Possui graduação em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (1993), mestrado em Engenharia de Produção pela Universidade Federal de Santa Catarina (2000), doutorado em Ciência da Informação pela Universidade Federal de Minas Gerais (2005) e pós-doutorado (01/2009-01/2010) em Tecnologias Semânticas para Recuperação de Informação - University of Glamorgan, UK, sob supervisão de Douglas Tudhope e com bolsa do CNPQ. É atualmente professor e pesquisador da Escola de Matemática Aplicada (EMAp) da Fundação Getúlio Vargas e professor colaborador da Escola de Ciência da Informação da Universidade Federal de Minas Gerais. É Visiting Fellow da University of Glamorgan (2009-2014) e Editor Adjunto do periódico New Review of Hypermedia and Multimedia. Tem experiência na área de Ciência da Informação, com ênfase em Representação do Conhecimento e Recuperação de Informação, atuando principalmente nos seguintes temas: Sistemas de Recuperação de Informações, Processamento de Linguagem Natural, Indexação Automática, Representação do Conhecimento, Ontologias, Gestão do Conhecimento. Tem também experiência em Tecnologia na Educação, Software Educativo e Ensino a Distância



How to Cite

Souza, R. R., & Raghavan, K. (2014). Extraction of Keywords from Texts: An Exploratory study using Noun Phrases. Information &Amp; Technology, 1(1), 5–16. Retrieved from https://periodicos.ufpb.br/ojs/index.php/itec/article/view/18894

