Descoberta de conhecimentos sobre a esquistossomose e partir de documentos científicos utilizando técnicas de mineração de texto

Douglas Andrey de Oliveira Araújo, Ludmilla Regina de Souza David, Rosângela Silqueira Hickson Rios, Renê Rodrigues Veloso

Resumo


O presente estudo objetivou aplicar técnicas de mineração de texto para a descoberta de conhecimentos sobre a esquistossomose a partir de documentos científicos disponíveis no acervo Memórias do Instituto Oswaldo Cruz. Trata-se de um estudo retrospectivo e exploratório da base de dados memorias.ioc.fiocruz.br , a partir da qual foram obtidos 179 resumos de artigos científicos publicados no período de 2005 a 2015, selecionados pelo descritor “schisto”. Foram utilizadas técnicas de mineração de textos (text mining) com o auxílio do software Weka 3.6.12 (Universidade de Waikato – Nova Zelândia). A extração de termos mais freqüentes foi realizada pelo método de indexação Frequência do Termo – Frequência Inversa de Documentos (TF-IDF). A categorização de documentos, por sua vez, aconteceu por dois métodos: classificação por aprendizado de máquina, utilizando árvores de decisão, e classificação por agrupamento. Posteriormente, o conhecimento revelado foi avaliado por especialistas da área e foram fornecidos indicadores sobre o desempenho do método desenvolvido.

Texto completo:

PDF


Pesquisa Brasileira em Ciência da Informação e Biblioteconomia ISSN: 1981-0695

 Indexadores

Resultado de imagem para INFOBILA