Descoberta de conhecimentos sobre a esquistossomose e partir de documentos científicos utilizando técnicas de mineração de texto

  • Douglas Andrey de Oliveira Araújo Faculdade Promove de Tecnologia
  • Ludmilla Regina de Souza David Faculdade Promove de Tecnologia
  • Rosângela Silqueira Hickson Rios Faculdade Promove de Tecnologia
  • Renê Rodrigues Veloso Universidade Estadual de Montes Claros

Resumo

O presente estudo objetivou aplicar técnicas de mineração de texto para a descoberta de conhecimentos sobre a esquistossomose a partir de documentos científicos disponíveis no acervo Memórias do Instituto Oswaldo Cruz. Trata-se de um estudo retrospectivo e exploratório da base de dados memorias.ioc.fiocruz.br , a partir da qual foram obtidos 179 resumos de artigos científicos publicados no período de 2005 a 2015, selecionados pelo descritor “schisto”. Foram utilizadas técnicas de mineração de textos (text mining) com o auxílio do software Weka 3.6.12 (Universidade de Waikato – Nova Zelândia). A extração de termos mais freqüentes foi realizada pelo método de indexação Frequência do Termo – Frequência Inversa de Documentos (TF-IDF). A categorização de documentos, por sua vez, aconteceu por dois métodos: classificação por aprendizado de máquina, utilizando árvores de decisão, e classificação por agrupamento. Posteriormente, o conhecimento revelado foi avaliado por especialistas da área e foram fornecidos indicadores sobre o desempenho do método desenvolvido.
Publicado
2016-12-07
Seção
Pesquisas em andamento