CADWeb – Categorização automática de documentos digitais

  • Georgia Regina Rodrigues Gomes
  • Rubens de Oliveira Moraes Filho

Resumo

Com a evolução da tecnologia da informação e a disseminação de documentos digitais na Web, faz-se necessário criar meios que forneçam um mecanismo de organização de tais documentos, facilitando sua busca e recuperação. Em bibliotecas digitais ou repositórios de obras eletrônicas, por exemplo, existe a necessidade de uma ferramenta que possa classificar automaticamente os documentos, visto que o processo de classificação (categorização) é feito de forma manual. Esta ferramenta será de grande importância no apoio à catalogação. Este artigo apresenta o desenvolvimento de uma ferramenta que tem como objetivo principal classificar automaticamente documentos digitais em categorias preestabelecidas, nas quais cada documento pertencerá a uma ou mais categorias de acordo com seu conteúdo, tornando assim mais eficaz e rápida a classificação. Na elaboração da ferramenta foram utilizadas técnicas e algoritmos de mineração de textos, sendo definidas no estudo de caso algumas categorias e termos relacionados, tais como informática, direito e física, para validar a ferramenta. Palavras-chave: Tecnologia da informação. Categorização. Biblioteca digital. Mineração de texto. Documentos digitais. Link para o texto completo (PDF) http://revista.ibict.br/ciinf/index.php/ciinf/article/view/1851/1394
Publicado
2012-08-08
Seção
Resumos de artigos científicos