A mineração de dados e a qualidade de conhecimentos extraídos dos boletins de ocorrência das rodovias federais brasileiras

  • Jefferson de Jesus Costa Universidade Federal Fluminense.
  • Flávia Cristina Bernardini Universidade Federal Fluminense.
  • José Viterbo Filho Universidade Federal Fluminense - UFF.

Resumo

Introdução: Apresenta e analisa os resultados encontrados com a aplicação do processo de Mineração de Dados nos boletins de ocorrências de rodovias federais brasileiras gerados pela Polícia Rodoviária Federal (PRF) em 2012. O objetivo desse trabalho é analisar a viabilidade da aplicação do processo de Mineração de Dados sobre os dados fornecidos pela PRF, a fim de identificar associações entre variáveis relacionadas aos acidentes de trânsito em todas as rodovias federais. Método: Empregaram-se algoritmos de aprendizado supervisionado e simbólico e um algoritmo de regras de associação, ambos implementados na ferramenta Weka. Quanto à base de dados o estudo compreende os registros referentes ao ano de 2012. Sobre essa parcela da base de dados aplicou-se a etapa de pré-processamento dos dados, os quais foram utilizados para extração dos modelos e padrões na ferramenta Weka e, por último, avaliaram-se os modelos e os padrões extraídos. Resultados: No aprendizado supervisionado, os resultados obtidos com os algoritmos J48 e PART foram considerados promissores, pois para todas as classes de causas de acidente, os valores obtidos de área sob a curva ROC (AUC) estiveram acima de 0,5. Além disso, utilizando-se o algoritmo Apriori, foram geradas 38 regras de associação com confiança maior que 0,8. Conclusão: Conclui-se que é importante uma proposta de modelo para distribuição dos dados dessa base de dados, com o objetivo de utilizá-la para o processo de mineração de dados, bem como para outras tarefas de extração de conhecimento e tomada de decisão. Observa-se, ainda, a necessidade de melhoria da qualidade dos dados a serem disponibilizados desde a fase de coleta, ou seja, nos sistemas para cadastro dos dados.

 

Palavras-chave: Dados Governamentais Abertos. Mineração de Dados. Regras de Associação. Descoberta de Conhecimento em Bases de Dados.

 

Link para o texto completo (PDF)

http://www.atoz.ufpr.br/index.php/atoz/article/view/89

 

Biografia do Autor

Jefferson de Jesus Costa, Universidade Federal Fluminense.
Mestrando em Engenharia de Produção e Sistemas Computacionais - UFF/PURO.
Flávia Cristina Bernardini, Universidade Federal Fluminense.
mestrado e doutorado em Ciência da Computação e Matemática Computacional pela Universidade de São Paulo.
José Viterbo Filho, Universidade Federal Fluminense - UFF.
Doutor em Informática - PUC - Rio.
Publicado
2015-03-12
Seção
Resumos de artigos científicos