Big Data no contexto de dados acadêmicos: o uso de machine learning na construção de sistema de organização do conhecimento

Fabio Piola Navarro, Caio Saraiva Coneglian, José Eduardo Santarem Segundo

Resumo


A quantidade de dados no âmbito acadêmico tem aumentado significativamente, sendo causado principalmente pelo aumento da quantidade de documentos científicos. Neste sentido, há uma poderosa fonte de informação, enquadrada no contexto do Big Scholarly Data, que pode ser utilizada para análise e o aprimoramento das tradicionais técnicas da Ciência da Informação, ao fornecer um conhecimento relevante para a construção de Sistemas de Organização do Conhecimento que reflitam com mais veracidade dados contidos nestes ambientes. Adicionalmente, uma forma de realizar o tratamento e a análise desse conglomerado de dados é relativo ao machine learning. No entanto, é necessário refletir como as técnicas de aprendizado de máquina quando aplicado a grandes volumes de dados podem favorecer a construção de sistemas de organização de conhecimento. Assim, o objetivo deste trabalho é discutir a aprendizagem de máquinas, em especial o método topic modeling, no processo de construção de sistemas de organização do conhecimento, visando discutir como dados pertencentes ao domínio do BSD podem fornecer informações necessárias para aprimorar os instrumentos de organização do conhecimento. Para isso, utilizou-se de uma metodologia com característica tanto bibliográfica, quanto aplicada. Enquanto resultados, primeiramente, foi proposto um modelo teórico, que vincula os dados de repositórios digitais, com as técnicas de machine learning, para a construção de sistemas de organização do conhecimento. Para validar esse modelo, realizou-se uma prova de conceito que utilizou o método topic modeling e o LDA para identificar tópicos de interesse dentro de um corpus científico de um repositório digital no intuito de organizar, sumarizar e entender seu conteúdo, visando fornecer uma base para a construção de sistemas de organização do conhecimento. Por fim, concluiu-se que a aplicação das técnicas de machine learning contribui para fornecer um panorama amplo sobre os dados contidos em repositórios digitais, sendo uma base bastante rica para apoiar e aprimorar a construção de sistemas de organização do conhecimento.

Texto completo:

PDF

Referências


ARAÚJO, C. A. Á. O sujeito informacional no cruzamento da Ciência da Informação com as ciências humanas e sociais. XIV ENANCIB - Encontro Nacional de Pesquisa em Ciência da Informação, n. Enancib, 2013.

ASSUNÇÃO, M. D. et al. Big Data computing and clouds: Trends and future directions. Journal of Parallel and Distributed Computing, v. 79–80, p. 3–15, 1 maio 2015.

BLEI, D. M. Introduction to Probabilistic Topic Modeling. Communications of the ACM, 2012.

BOYD-GRABER, J.; HU, Y.; MIMNO, D. Applications of Topic Models. Foundations and Trends® in Information Retrieval, v. 11, n. 2–3, p. 143–296, 2017.

BRÄSCHER, M. Semantic Relations in Knowledge Organization Systems. Knowledge Organization, v. 41, n. 412, 2014.

CARLAN, E.; CARLAN, E.; MEDEIROS, M. B. B. Sistemas de Organização do Conhecimento na visão da Ciência da Informação. Revista Ibero-Americana de Ciência da Informação, v. 4, n. 2, 15 fev. 2012.

DE, T. et al. UNIVERSIDADE DE SÃO PAULO MODELOS PROBABILÍSTICOS DE TÓPICOS: DESVENDANDO O LATENT DIRICHLET ALLOCATION RELATÓRIOS TÉCNICOS. 2016.

FERNEDA, E. Recuperação de Informação: estudo sobre a contribuição da Ciência da Computação para a Ciência da Informação. 2003, 147 f. 2003. Tese (Doutorado em Ciências da Comunicação) - Escola de Comunicação e Artes, Universidade de São Paulo, São Paulo, 2003.

INTERNATIONAL SOCIETY FOR KNOWLEDGE ORGANIZATION., I.; CHAPTER, I. S. FOR K. O. R. Knowledge organization : KO. [s.l.] INDEKS Verlag, 1993.

KHAN, S. et al. A survey on scholarly data: From big data perspective. Information Processing & Management, v. 53, n. 4, p. 923–944, 1 jul. 2017.

MITCHELL, T. M. Machine Learning. [s.l: s.n.]. Disponível em: . Acesso em: 27 jul. 2018.

SARACEVIC, T. Interdisciplinary nature of information science. Ciência da informação, v. 24, n. 1, p. 36-41, 1995. Disponível em: . Acesso em: 05 ago. 2018.

XIA, F. et al. Big Scholarly Data: A Survey. IEEE Transactions on Big Data, v. 3, n. 1, p. 18–35, 1 mar. 2017.




DOI: https://doi.org/10.22478/ufpb.2358-3908.2018v5n2.45807

Apontamentos

  • Não há apontamentos.


Licença Creative Commons
Os documentos disponibilizados por Informação & tecnologia foram licenciados por uma Licença Creative Commons - Atribuição-Não Comercial-Compartilha Igual 3.0 Brasil

ISSN 2358-3908

Informação & Tecnologia está registrada e/ou indexada através dos seguintes serviços: