UTILIZAÇÃO DE ONTOLOGIAS NA
RECUPERAÇÃO DE INFORMAÇÃO:
principais abordagens, problemas e propostas de melhorias

USE OF ONTOLOGIES ON INFORMATION RETRIEVAL:
main approaches, problems and proposals for improvements

Marcia Cristina dos Reis1

Edberto Ferneda2

RESUMO

As ontologias estão sendo utilizadas para a implementação de novos recursos e melhorias em sistemas de busca e recuperação de informações, principalmente no contexto da Web. O presente artigo tem como objetivo apresentar um panorama sobre a utilização de ontologias em sistemas de recuperação de informação, discutindo tipos adotados, áreas de aplicação, principais abordagens, propostas de melhorias, estudos validados por usuários e lacunas de pesquisa ainda existentes. A metodologia adotada para este fim contou com pesquisa bibliográfica, de caráter exploratório, baseada nas áreas de Ciência da Informação e Ciência da Computação, realizada por meio de publicações presentes na ACM Digital Library e Google Scholar. Entre os principais resultados, percebemos que as ontologias têm sido amplamente discutidas na literatura e utilizadas em diversas propostas e experimentos, proporcionando melhorias significativas no processo de recuperação de informação. Tal recurso possibilita o desenvolvimento de funcionalidades e recursos interativos, busca semântica, expansão e refinamento de consultas, além de contribuir para projetos de acesso à Web Semântica, visualização de informações, recuperação multimídia, dispositivos móveis e desenvolvimento de interfaces e sistemas. No entanto, apesar das inúmeras contribuições, sugerimos que as ontologias sejam utilizadas para potencializar a busca, através da exploração do significado existente entre os conceitos relacionados.

Palavras-chave: Recuperação de Informação. Ontologia. Interfaces de Busca. Busca Semântica. Visualização de Informação.

ABSTRACT

The ontologies are being used to implement new features and improvements in information search and retrieval systems, especially in web context. This article aims to present an overview of ontologies in information retrieval systems use, discussing types of applications, application areas, main approaches, proposals for improvements, validated studies by users and still researching gaps. The methodology adopted for this purpose included bibliographic research, exploratory, based on Information Science and Computer Science areas, carried out through publications present in the ACM Digital Library and Google Scholar. Among the main results, we noticed the ontologies have been widely discussed in the literature and used in several proposals and experiments, providing significant improvements in the information retrieval process. Such resource enables the development of interactive features and functionality, semantic search, query expansion and refinement, as well as contributing to Semantic Web access projects, information visualization, multimedia retrieval, mobile devices and interface and system development. However, in spite of the numerous contributions, we suggest that ontologies should be used to enhance search by exploring the existing meaning between related concepts.

Keywords: Information Retrieval. Ontology. Search Interfaces. Semantic Search. Information Visualization.

Artigo submetido em 15/01/2020 e aceito para submissão em 15/03/2020

1 INTRODUÇÃO

O desenvolvimento da Web no início dos anos 90 possibilitou um progresso significativo na área de Recuperação de Informação (RI) e atraiu a atenção de pesquisadores de áreas diversas. De um lado, houve um crescimento significativo de informações e o surgimento do maior repositório de conhecimento da história (BAEZA-YATES; RIBEIRO-NETO, 2013). Em contrapartida, como consequência imediata, os problemas de RI se multiplicaram e a dificuldade de encontrar uma informação relevante e de interesse do usuário, tornou-se um dos grandes problemas observados e discutidos no âmbito da Ciência da Informação (LIN; DEMNER-FUSHMAN, 2006; SARACEVIC, 1996).

Bovo (2011) afirma que possuir informações em demasia pode trazer às pessoas e organizações inúmeros benefícios, principalmente se houver oportunidade de uso e de recuperação adequados. Isso gera diretamente desafios relacionados com o armazenamento, a recuperação e a transformação dessa informação em conhecimento. Neste sentido, os sistemas de recuperação de informação tornam-se cada vez mais importantes, principalmente em ambientes que contenham grandes quantidades de informações.

As pesquisas desenvolvidas na área de Recuperação de Informação apresentam inúmeras ideias, teorias e técnicas que procuram minimizar os problemas observados na área e proporcionar aos sistemas maior capacidade de consulta, maior relevância às respostas obtidas e mais facilidades no processo de comunicação e interação com o usuário. Entre os trabalhos com esta finalidade, encontramos inúmeras abordagens que empregam ontologias no processo de RI, com contribuições significativas em diversas áreas: a) indexação e representação de documentos; b) formulação de queries; c) expansão de consultas, d) interfaces do usuário; e) visualização de informações e resultados.

Neste contexto, o nosso principal objetivo ao iniciarmos este estudo foi identificar publicações pertencentes a este grupo e apresentar um panorama sobre como as ontologias estão sendo utilizadas para o aprimoramento do processo de busca e recuperação de informações, destacando os tipos de ontologias adotadas, áreas de aplicação que possuem trabalhos desenvolvidos, principais abordagens, propostas de melhorias para cada problemática avaliada, propostas validadas por estudos de usuários e problemas que ainda requerem aprofundamento de pesquisa.

Para atingir os objetivos propostos, adotamos pesquisa bibliográfica, de caráter exploratório, fundamentada em autores da literatura da Ciência da Computação e Ciência da Informação. Para a seleção dos materiais necessários para o desenvolvimento da nossa análise, selecionamos as bases de dados ACM Digital Library e Google Scholar, por serem relevantes para a área e por trazerem discussões significativas sobre o assunto.

O artigo está organizado da seguinte forma: a seção 2 apresenta brevemente a área de Recuperação de Informação (RI), destacando as características dos sistemas de busca atuais e os problemas relacionados principalmente com as dificuldades de interação dos usuários; a seção 3 discute as principais definições e características presentes na literatura sobre ontologias; a seção 4 apresenta o percurso metodológico para o levantamento dos dados, bem como os critérios e as categorias definidas para a análise; a seção 5 apresenta um panorama sobre a utilização de ontologias na área de recuperação de informação, discutindo abordagens, problemáticas e propostas de melhorias baseadas no uso de ontologias e, por último, as conclusões sobre a pesquisa desenvolvida.

2 SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO E OS DESAFIOS DO PROCESSO DE BUSCA NA WEB

O termo Information Retrieval (Recuperação de Informação) foi apresentado em 1951, pelo cientista da computação Calvin Mooers, que o definiu como um processo no qual um usuário pode converter sua necessidade de informação em uma lista real de citações de documentos armazenados, que contenham informações relevantes (MOOERS, 1951). A evolução da Recuperação de Informação está diretamente relacionada com o advento dos computadores, que passaram a ser utilizados para armazenar e recuperar grandes quantidades de informações (SALTON, 1980).

“[A recuperação da informação] engloba tanto os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregadas para o desempenho da operação” (MOOERS, 1951, p.25).

Por ser um termo originário da área da Ciência da Computação e estar diretamente relacionado com os avanços de hardware e software (principalmente os algoritmos referentes à pesquisa de texto), a Recuperação de Informação pode ser considerada a vertente tecnológica da Ciência da Informação (SALTON, 1980; SARACEVIC, 1999), apresentando grande interdisciplinaridade entre as duas áreas. Enquanto a Ciência da Informação dedica-se à busca de “conhecimentos relacionados à origem, coleção, organização, armazenamento, recuperação, interpretação, transmissão, transformação, e utilização da informação” (BORKO, 1968, p.3), a Ciência da Computação atua no desenvolvimento de técnicas computacionais e algoritmos que possam viabilizar a implementação e aplicação desses conhecimentos.

Desta forma, podemos afirmar que a área de RI se apoia na interdisciplinaridade entre a Ciência da Informação e a Ciência da Computação e tem como principal objetivo pesquisar e desenvolver tecnologias que possibilitem o aprimoramento dos sistemas de recuperação de informação, de modo que os usuários possam obter acesso facilitado às informações, com resultados de buscas mais precisos e relevantes. É uma área de pesquisa direcionada para a representação, armazenamento, organização, busca e recuperação de informação, que pode estar contida em documentos, páginas Web, objetos multimídia, catálogos online, entre outros (BAEZA-YATES; RIBEIRO-NETO, 2013; SALTON, 1968).

Os sistemas de RI são de grande importância para a sociedade contemporânea e organizações em geral, que dependem de documentos e informações para a tomada de decisão e resolução de problemas (BEPPLER, 2008). Esta relevância se torna ainda mais evidente no contexto da Web, em função da quantidade excessiva de informações disponibilizadas diariamente na rede, exigindo formas eficazes de acesso e recuperação. Desta forma, possuem o objetivo de “minimizar as dificuldades do usuário em localizar a informação requisitada, ou seja, diminuir o tempo gasto em um processo de busca até que a informação desejada possa ser acessada” (CRISTOVÃO; DUQUE; SERQUEIRA, 2012, p.5-6).

A recuperação de informação é um processo de comunicação complexo, que ocorre entre o usuário e um acervo documental, realizado por meio de uma interface, com o objetivo principal de satisfazer as necessidades informacionais do usuário (SARACEVIC, 1997; ARAUJO JUNIOR, 2007). No entanto, encontrar uma informação parcialmente ou totalmente relevante ao contexto pesquisado, depende do uso eficiente das ferramentas de busca. Para isso, o usuário precisa estabelecer um diálogo com o sistema, na tentativa de expressar suas necessidades, que geralmente são traduzidas no formato de palavras-chave ou expressões de busca. O sucesso do resultado encontrado depende da combinação entre os termos fornecidos pelo usuário e os termos utilizados na indexação dos documentos.

Por ser um ambiente fortemente influenciado pelos problemas linguísticos semânticos e sintáticos, os usuários, muitas vezes, apresentam dificuldades para traduzir suas necessidades de informação em um conjunto de termos de busca. Entre os problemas observados, destacam-se a falta de interatividade que as ferramentas atuais oferecem, o uso de poucas palavras para formular consultas (aproximadamente 2,2 termos), a rara utilização de expressões booleanas, a dificuldade de expressar uma necessidade de informação por meio de termos ou expressões e a obrigatoriedade de conhecimento do usuário sobre o domínio pesquisado, uma vez que, para realizar uma busca utilizando palavras-chave (ou expressões) significativas, é necessário que ele tenha conhecimento sobre o contexto de interesse. Assim, quanto mais ele souber, mais opções de vocabulário e terminologia terá à sua disposição para enriquecer as buscas, ao mesmo tempo que, quanto menos conhecimento possuir, mais genéricas e inadequadas serão as expressões utilizadas (ANTONIOU; HARMELEN, 2004; BEPPLER, 2008).

Outro obstáculo de grande influência nos sistemas de RI refere-se às variações linguísticas e ambiguidade de ordem semântica e sintática da linguagem, que possibilitam interpretações diferentes para palavras ou termos (a palavra “manga”, por exemplo, está relacionada à vários contextos diferenciados: a fruta manga, a manga de uma camisa, ao desenho animado, etc.).

[A língua pode ser considerada um sistema] de uma complexidade extrema: compreende regras (de pronúncia, de formação de palavras, de formação de frases, de relacionamento das formas com os significados), itens léxicos (palavras e morfemas, com suas propriedades gramaticais e seus significados), expressões idiomáticas (como pisar na bola ou mãe de santo) e clichês (como ficar sem fala e tomar café) (PERINI, 2010, p.1).

Para tentar minimizar os problemas observados, técnicas importantes estão sendo estudadas, trazendo contribuições valiosas para as pesquisas e aplicações propostas em RI. Um recurso que vem sendo amplamente discutido é a utilização de ontologias, que possibilita a implementação de abordagens diferenciadas e inúmeras melhorias para o processo de recuperação de informações, conforme discutiremos na próxima seção.

3 ONTOLOGIAS: DEFINIÇÕES E CARACTERÍSTICAS

O conceito de ontologias vem sendo amplamente discutido e utilizado em áreas distintas que englobam principalmente a filosofia, a ciência da computação e a ciência da informação, “tendo em vista a possibilidade de melhorar significativamente a representação de um domínio de conhecimento” (FERNEDA, 2003, p.26). Para Branco Neto (2006, p.74), “as ontologias representam o ponto mais elevado já atingido em termos de representação, compartilhamento e reutilização do conhecimento”.

As ontologias se colocam como um novo instrumento a ser incorporado ao arsenal teórico e prático da Ciência da Informação. A aprendizagem de novos conceitos e novos recursos oferecidos pelas ontologias é um desafio para os profissionais da informação, mas que pode ser facilmente enfrentado utilizando toda bagagem teórica acumulada durante a história da Ciência da Informação (FERNEDA, 2013, p.41).

Gruber (1993, p.199) define ontologia como sendo “uma especificação formal e explícita de uma conceitualização compartilhada”. Segundo ele, essa conceitualização refere-se ao conjunto de conceitos, relações, objetos e restrições que são definidos para um modelo semântico de um domínio de interesse. As ontologias expressam o formalismo dos conceitos e das relações acerca de um domínio, de modo que possa viabilizar a inferência, pela máquina, da semântica aos significados das informações. Assim, “uma ontologia define os termos usados para descrever e representar uma área de conhecimento” (OWL, 2003), ou seja, ela codifica o conhecimento do domínio e também o conhecimento que se entende do domínio, tornando-o reutilizável. Segundo Gruber (1996), Noy e Mcguinness (2001), a ontologia formaliza o conhecimento através da utilização de classes (organizadas em uma taxonomia), relações (representam o tipo de interação entre os conceitos de um domínio), axiomas (usados para modelar sentenças sempre verdadeiras) e instâncias (utilizadas para representar elementos específicos, ou seja, os próprios dados).

Deste modo, pode-se dizer que uma ontologia visa (em alguns aspectos) desenvolver um conjunto de regras que possibilitem a abstração do significado semântico das informações de um determinado domínio disponibilizadas na Web. Segundo Fensel (2003), isso oferece vantagens, tais como: possibilitar o compartilhamento e a interoperabilidade do conhecimento entre os domínios, estruturá-los de forma que permita sua compreensão com maior clareza e objetividade e permitir a reutilização dos conceitos abordados.

Guarino (1998) afirma que as ontologias podem ser classificadas de acordo com o seu nível de generalidade ou função para a qual foi desenvolvida, podendo ser genéricas, de domínio, de tarefa e de aplicação. As ontologias de domínio e de tarefa são possíveis especializações de uma ontologia genérica, bem como uma ontologia de aplicação são especializações das duas anteriores. Resumidamente, são apresentadas como:

a. Ontologia Genérica (Alto Nível): descrevem conceitos mais amplos, que são independentes de um determinado problema ou domínio, tais como: elementos da natureza, espaço, tempo, etc. De forma geral, são destinadas à grandes comunidades de usuários e possuem o objetivo construir teorias básicas do mundo, de caráter abstrato, aplicáveis a qualquer domínio (conhecimento de senso comum);

b. Ontologia de Domínio: são os tipos mais comuns e descrevem o vocabulário relacionado à um determinado domínio de conhecimento (medicina, genética, computação) ou à uma atividade genérica (compra, venda), especializando os termos apresentados na Ontologia Genérica;

c. Ontologia de Tarefas: Descrevem conceitos que são usados por processos (tarefas e atividades genéricas), sem dependência de um domínio específico, como um processo de compra e venda, por exemplo. Podem contribuir na resolução de problemas, independente do domínio que ocorrem e possuem como principal motivação facilitar a integração dos conhecimentos de tarefa e de domínio em uma abordagem mais uniforme e consistente;

d. Ontologia de Aplicação: descrevem conceitos que dependem tanto de um domínio particular, quanto de uma tarefa específica. São as ontologias mais especialistas e descrevem os papéis que as entidades do domínio assumem quando realizam determinada tarefa.

Além da classificação apresentada por Guarino (1998), outras propostas são comumente encontradas na literatura. Alguns autores definem tipos de ontologias relacionando-as ao grau de formalismo de seu vocabulário: informal, semiinformal, semiformal e formal (USCHOLD; GRUNINGER, 1996), à sua estrutura: alto nível, domínio e tarefa (HAAV; LUBI, 2001) e ao seu conteúdo: terminológicas, de informação, de modelagem do conhecimento, de aplicação, de domínio, genéricas e de representação (VAN HEIJIST; SCHREIBER; WIELINGA, 1997). Apesar de todas essas tipologias, Ruiz e Hilera (2006) alertam que a adoção de apenas um critério de classificação não permite refletir adequadamente sobre a complexidade das ontologias.

Em relação à aplicabilidade das ontologias, relacionadas principalmente com a área de Recuperação de Informação, McGuinness (2003) e Ferneda (2013) destacam a possibilidade de desenvolvimento de sistemas contendo os seguintes recursos:

a. checagem de consistência: as informações obtidas em uma busca podem ser associadas às definições de uma ontologia para verificar se os valores retornados são válidos ou não;

b. complemento de informações: após obter um pequeno conjunto de informações sobre determinada entidade, as ontologias podem ser utilizadas para gerar novas informações com base nas previamente encontradas;

c. resolução de problemas de linguagem (ambiguidade, polissemia e sinônimos): se o mesmo termo aparece em mais de um lugar, ele está relacionado à uma classe e subclasse correspondente que pode ajudar a distinguir entre os vários contextos do termo;

d. indexação automática: a representação de um documento é realizada automaticamente por termos derivados de uma ontologia;

e. expansão de consulta: adição de novos termos à busca do usuário provenientes de uma ontologia;

f. sistemas de recuperação de informação semânticos: os documentos são previamente anotados (marcados) de acordo com uma ontologia de domínio; e

g. interfaces de busca: os conceitos de uma ontologia são apresentados ao usuário que seleciona aqueles que serão utilizados como termos de busca.

Apesar das diversas possibilidades de aplicação de ontologias na recuperação de informação, o tema ainda é considerado incipiente e apresenta grande potencial para o desenvolvimento de estudos e aplicações na área. As pesquisas apontam que a principal utilização das ontologias está relacionada à representação dos documentos, mais especificamente o processo de indexação automática, extração de informação e expansão de consultas. Poucos trabalhos utilizam este recurso para as outras finalidades especificadas (FERNEDA, 2013).

4 Materiais e Métodos

Para atender os propósitos do estudo e identificar como as ontologias estão sendo utilizadas no processo de busca e recuperação de informação, realizamos uma pesquisa bibliográfica, de caráter exploratório, por meio das publicações da ACM Digital Library3 e do Google Scholar4. A ACM Digital Library foi escolhida por possuir uma coleção significativa de artigos publicados em revistas científicas e em eventos relacionados às áreas de Ciência da Computação e Tecnologia da Informação. Além disso, conta com a colaboração de diversos grupos, envolvendo áreas que trazem contribuições significativas e intercâmbio de ideias para a nossa temática, tais como: Special Interest Group on Artificial Intelligence (SIGAI), Special Interest Group on Computer-Human Interaction (SIGCHI), Special Interest Group on Design of Communication (SIGDOC), Special Interest Group on Information Retrieval (SIGIR), Special Interest Group on Software Engineering (SIGSOFT) e Special Interest Group on Hypertext, Hypermedia and Web (SIGWEB). O Google Scholar, por sua vez, foi escolhido por realizar buscas em materiais científicos selecionados, contendo publicações atualizadas, confiáveis e revisadas, garantindo a qualidade da informação disponibilizada. Desta forma, entendemos que as fontes de pesquisa selecionadas possuem materiais relevantes, interdisciplinares e com abrangência suficiente para fundamentar o estudo proposto e oferecer uma visão holística da literatura já publicada.

As palavras-chave utilizadas para realizar a busca dos artigos de estudo são apresentadas na figura 1. Elas envolvem basicamente três áreas: Ontologias, Interfaces de Busca (Search Interface, User Interface, Query Formulation) e Visualização da Informação. Inicialmente, adotamos como termo de busca cada palavra isolada e, posteriormente, a combinação entre elas (duas, três e quatro palavras no mesmo termo), que foi realizada por meio da utilização do operador lógico (+). Também foi possível utilizar o recurso de navegação oferecido pelo ACM Computing Classification System para realizar buscas e avaliar se os termos adotados haviam recuperado todos os materiais de interesse. Neste ponto, analisamos duas categorias: 1) Human-centered computing, que apresenta estudos relacionados com a área de Human computer interaction (HCI), Interaction design e Visualization, e 2) Information systems, que traz materiais sobre World Wide Web e Information Retrievel.

Figura 1 - Palavras-chave utilizadas na busca

Fonte: Elaborada pelos autores

A pesquisa realizada retornou um total de 90 (noventa) artigos, que foram publicados entre os anos de 2000 a 2017. Optamos por não limitar a busca à materiais recentes, visto que tínhamos a intenção de identificar tudo o que havia sido publicado na área. Posteriormente, analisamos cada material selecionado e descartamos 28 (vinte e oito) artigos que, embora relacionados ao tema, não adotavam ontologias em sua estrutura, que é o recurso base do nosso estudo. Estes artigos foram recuperados quando utilizamos os termos isolados “Search Interface”, “User Interface” e “Query Formulation”, combinados entre si ou com o termo “Information Retrieval”. Também retiramos da análise outros 03 (três) artigos por estarem diretamente relacionados ao processo de desenvolvimento de ontologias e, portanto, fora do escopo do trabalho.

Os 59 (cinquenta e nove) artigos restantes, todos referentes à utilização de ontologias na área de recuperação de informação, foram analisados de acordo com os seguintes critérios: 1) tipo de ontologia adotada (genérica, domínio, tarefa, aplicação); 2) área de desenvolvimento da pesquisa e principais abordagens; 3) problemáticas e propostas de melhorias; 4) validação por meio de estudos de usuários. A partir do levantamento destas informações, foi possível traçar um panorama sobre como as ontologias estão sendo utilizadas para a melhoria da busca e recuperação de informação, bem como analisar quais são suas principais contribuições para a área e quais lacunas ainda requerem estudos e aprofundamento de pesquisa.

5 resultados e discussões

A análise de dados foi realizada de acordo com os objetivos do estudo. Inicialmente, classificamos os trabalhos de acordo com o tipo de ontologia adotado na sua estrutura (genérica, domínio, aplicação, tarefa). Posteriormente, analisamos cada um dos 59 artigos válidos e os organizamos de acordo com a área da pesquisa a qual se referiam: Recuperação de Informação na Web, Web Semântica, Visualização de Informações, Recuperação Multimídia, Avaliação, Dispositivos Móveis e Desenvolvimento de Interfaces e Sistemas.

A partir da organização dos materiais e suas respectivas áreas, foi possível analisar as abordagens e as propostas de melhorias de acordo com os seguintes paradigmas de pesquisa: a) busca baseada em ontologia; b) navegação baseada em ontologia e c) busca híbrida (busca e navegação baseadas em ontologias). Encontramos ainda pesquisas que não tinham como objetivo discutir nenhuma destas perspectivas e sim problemáticas relacionadas à visualização de informações e desenvolvimento de software. Além disso, foi possível identificar quais trabalhos foram validados por estudos de usuários, as principais variáveis analisadas e as contribuições deste tipo de estudo para as pesquisas realizadas.

5.1 Tipos de Ontologia Adotada

Em função da grande quantidade de informações disponíveis, principalmente no contexto da Web, inúmeras pesquisas estão sendo direcionadas para o uso de ontologias, com a principal finalidade de representar todo esse conhecimento de forma estruturada e possibilitar uma recuperação mais eficiente. Os trabalhos com este propósito destacam as inúmeras áreas que estão adotando este recurso, bem como a variedade de propostas e aplicações relacionadas.

A maioria dos trabalhos que avaliamos adota ontologias de domínio, indicando que se trata de abordagens realizadas a uma área de conhecimento específica. As ontologias genéricas, de aplicação e de tarefa aparecem em menor quantidade. Em relação a este quesito, foi possível perceber que existem conflitos conceituais entre os autores sobre as tipologias de ontologias. Os conceitos e as características que definem e distinguem cada tipo, principalmente em relação às ontologias de aplicação e de tarefa, não são bem compreendidos, dificultando a adoção dessas duas terminologias. As ontologias de tarefa e de aplicação, de acordo com Guarino (1998), são especializações das ontologias de domínio, o que faz com que a distinção entre elas seja ainda mais complicada.

Tabela 1 - Tipo de Ontologia Adotada

Tipo

Quantidade de Trabalhos

Ontologia Genérica (top-level)

08

Ontologia de Domínio

40

Ontologia de Aplicação

05

Ontologia de Tarefa

03

Tipo de Ontologia não Identificado

03

Fonte: Elaborada pelos autores

Os trabalhos que envolvem ontologias genéricas são direcionados principalmente para o desenvolvimento de técnicas de visualização ontológica e exploração de dados na Web Semântica. As principais ontologias genéricas utilizadas são: Yago (BAST et al., 2007; FREITAS; CURRY, 2014; STYPEREK; CIESIELCZYK; SZWABE, 2014), Sumo (BUNTAIN, 2008), Freebase (DELIGIANNIDIS; KOCHUT; SHETH, 2007; DEMIDOVA; ZHOU; NEJDL, 2013) e Dbpedia (FREITAS; CURRY, 2014; STYPEREK; CIESIELCZYK; SZWABE, 2014). A ontologia Yago (Yet Another Great Ontology), desenvolvida em parceria pelo Instituto Max Planck de Ciência da Computação da Alemanha e pela Universidade Telecom ParisTech da França, é uma base de conhecimento semântica extraída automaticamente da Wikipédia, WordNet e GeoNames, contendo mais de 10 milhões de entidades (como pessoas, organizações, cidades, etc.) em diferentes idiomas e contém mais de 120 milhões de fatos sobre elas (categorias, redirecionamentos e infoboxes (MAX PLANCK INSTITUT INFORMATIK, 2017). A Sumo (Suggested Upper Merged Ontology), desenvolvida pela IEEE, é considerada a maior ontologia pública formal existente. Foi mapeada para todo o léxico WordNet e está escrita na linguagem SUO-KIF. Possui aproximadamente 25.000 termos e 85.000 axiomas, quando combinadas todas as ontologias de domínio que a constituem (ADAMPEASE, 2017). A Freebase, por sua vez, refere-se a uma base de conhecimento colaborativa, que recolhe dados estruturados online de diversas fontes. Foi desenvolvida pela empresa de software americana Metaweb e adquirida pela Google em 2010 (GOOGLE DEVELOPERS, 2017). Por fim, a DBPedia é uma base de conhecimento também colaborativa, que abrange diversos domínios, mantida por milhares de usuários, que tem como objetivo extrair informações estruturadas da Wikipedia e disponibilizá-las na Web, servindo de base para o desenvolvimento de novos mecanismos de busca, exploração e visualização, bem como para projetos de aperfeiçoamento da própria enciclopédia (DBPEDIA, 2017).

As pesquisas que adotam ontologias de domínio são as mais comuns e referem-se a trabalhos relacionados a contextos diversos, tais como: a) Recuperação de Informação na Web (KONDYLAKIS; PLEXOUSAKIS, 2011; ROZELL et al., 2012; PITTARELLO; GATTO, 2012b; VELART; ŠALOUN, 2007; ZHENG et al., 2012); b) Web Semântica (BERNSTEIN et al., 2005; GUPTA; BHOWMIK; GOVINDARAJU, 2008; SOYLU et al., 2016); c) Visualização de Informações (PAULHEIM; MEYER, 2011; SOUZA; SANTOS; EVANGELISTA, 2003; STOREY, 2007); d) Recuperação Multimídia (ALBERTONI; BERTONE; DE MARTINO, 2005; BERTINI et al., 2010; POPESCU; MILLET; MOËLLIC, 2007; WU et al., 2008); e) Desenvolvimento de Sistemas (EL-ATAWY; KHALEFA, 2016; PAULHEIM, 2009; ZHENG et al., 2012); f) Avaliação de Eficácia e Usabilidade de Interface (DUDYCZ, 2015; ZHUHADAR; NASRAOUI, 2010).

As ontologias de tarefa e de aplicação, por sua vez, são adotadas para o desenvolvimento de pesquisas em contextos específicos e bem definidos, relacionados principalmente as áreas de avaliação de resultados de busca (KAMEL; LEE; POWERS, 2007), dispositivos móveis (SHIN et al., 2013a, 2013b) e recuperação de informação na Web (CHEN; CHUA, 2013; PAPADAKIS et al., 2009; THAI; HANDSCHUH, 2009).

De todos os trabalhos analisados, não conseguimos identificar o tipo de ontologia adotada em apenas três deles, por não terem sido citadas pelos respectivos autores ou por tal informação ser indiferente ao projeto apresentado.

5.2 Áreas de Desenvolvimento de Pesquisas e Principais Abordagens

As ontologias estão sendo adotadas em uma multiplicidade de projetos, pertencentes a áreas variadas. Neste sentido, classificamos os trabalhos avaliados de acordo com a sua abordagem principal, conforme podemos observar na tabela 2.

Tabela 2 - Áreas de Desenvolvimento de Pesquisas

Área de Desenvolvimento de Pesquisas

Quantidade de Trabalhos

Recuperação de Informação na Web

23

Web Semântica

12

Visualização de Informações

07

Recuperação Multimídia

07

Avaliação (eficácia, resultados, usabilidade)

03

Dispositivos Móveis

03

Desenvolvimento de Interfaces e Sistemas

04

Fonte: Elaborada pelos autores

A maior parte das pesquisas está relacionada à área de Recuperação de Informação na Web, com propostas de trabalhos que visam a melhoria dos aspectos relacionados à busca nas suas diversas vertentes: 1) suporte à busca e navegação (GROTH; LANNERÖ, 2006; ISSERTIAL; TSUJI, 2013; PITTARELLO; GATTO, 2012b; WONG; LIU; BENNAMOUN, 2010); 2) indexação e representação de documentos (BASKAYA; KEKÄLÄINEN; JÄRVELIN, 2010; LEE; MIN; CHUNG, 2009; SIAHBANI et al., 2013); 3) formulação de queries, refinamento e expansão de consultas (ARFAOUI; HIDRI, 2016; KHATTAK, 2008; STOJANOVIC, 2005); e 4) visualização de informações (LIN et al., 2010; VELART; ŠALOUN, 2007).

Os projetos desta área são desenvolvidos em domínios variados, tais como: oceanografia biológica e química, dados públicos abertos, observatório virtual no campo da física solar terrestre (ROZELL et al., 2012), organização de dados pessoais (THAI; HANDSCHUH, 2009), mundos 3D (PITTARELLO; GATTO, 2012a, 2012b), mapas comunitários (MAURO, 2017), educação, mais especificamente cursos online (TIJERINO; SANATI, 2005; VELART; ŠALOUN, 2007), coleta e navegação de papers (ISSERTIAL; TSUJI, 2013), recursos geográficos (ALBERTONI; BERTONE; DE MARTINO, 2005), comércio eletrônico (CARVALHO et al., 2002), documentos XML (ARFAOUI; HIDRI, 2016), jornal eletrônico, com notícias relacionadas à economia, tecnologia e medicina (WONG; LIU; BENNAMOUN, 2010), textos biomédicos (CHUA; KIM, 2012), documentos bilíngues (BASKAYA; KEKÄLÄINEN; JÄRVELIN, 2010) e sistemas e técnicas de busca de informação (GROTH; LANNERÖ, 2006; LEE; MIN; CHUNG, 2009; LIN et al., 2010; SIAHBANI et al., 2013).

Outro destaque no uso de ontologias são os trabalhos direcionados para a Web Semântica, que visam desenvolver interfaces de busca, bem como métodos e técnicas de pesquisa, exploração e interpretação de grande quantidade de dados estruturados (BAST et al., 2007; GUPTA; BHOWMIK; GOVINDARAJU, 2008; SOYLU et al., 2013).

A área de Visualização de Informações, assim como a Web Semântica, também se destaca pelos inúmeros problemas relacionados à manipulação e visualização de quantidade volumosa de dados. Os projetos com este propósito buscam analisar aspectos relacionados com a visualização de ontologias de grande porte (TZITZIKAS; HAINAUT, 2006), avaliar métodos, técnicas e ferramentas de visualização (KATIFORI et al., 2007; PAULHEIM; MEYER, 2011; SILVA; FREITAS; SANTUCCI, 2012; STOREY, 2007) e propor novas técnicas e ferramentas de visualização de dados, metadados e ontologias (BUNTAIN, 2008; SOUZA; SANTOS; EVANGELISTA, 2003).

As ontologias também estão sendo adotadas para a melhoria do processo de Recuperação Multimídia, que é uma área que desperta o interesse de muitos pesquisadores em função da complexidade de recuperação de informação não textual, presente em arquivos de imagem, áudio e vídeo. Desta forma, as pesquisas desenvolvidas neste contexto buscam agregar os recursos presentes nas ontologias para minimizar os problemas e propor soluções mais eficientes. Entre os recursos utilizados, podemos destacar: raciocínio baseado em relações semânticas (ALBERTONI; BERTONE; DE MARTINO, 2005), expansão de espaço semântico (WU et al., 2008), busca e anotação baseadas em ontologias (BERTINI et al., 2010), anotação automática (GAO; LUO; FAN, 2006) e recuperação de conteúdo baseado nos conceitos da ontologia (POPESCU; MILLET; MOËLLIC, 2007). Também encontramos pesquisa comparando a recuperação de imagens baseada em palavras-chave com recuperação baseada em ontologias (WANG; LIU; CHIA, 2006).

Em menor quantidade, encontramos pesquisas relacionadas à Avaliação de projetos desenvolvidos na área, com o objetivo de identificar a aceitação do usuário e avaliar pontos fortes e fracos. Os trabalhos pertencentes a esta categoria referem-se à avaliação da eficácia e da usabilidade de interface de busca (DUDYCZ, 2015; ZHUHADAR; NASRAOUI, 2010) e à avaliação dos resultados de busca baseada em ontologia (KAMEL; LEE; POWERS, 2007).

Também encontramos pesquisas relacionadas à utilização de ontologias em aplicações para Dispositivos Móveis, com o objetivo de agregar recursos semânticos à busca (KO et al., 2014; SHIN et al., 2013a, 2013b) e como componentes para o Desenvolvimento de Interfaces e Sistemas, sendo utilizadas para implementar recursos semânticos variados, bem como para possibilitar reutilização de código, personalização de aplicações, acesso e persistência de dados, mapeamento relacional e integração de ontologias (EL-ATAWY; KHALEFA, 2016; PAULHEIM, 2009; ROZELL et al., 2012; ZHENG et al., 2012).

A tabela 3 apresenta resumidamente as áreas que possuem aplicações relacionadas ao uso de ontologias. Tais abordagens estão, de alguma forma, relacionadas à melhoria da recuperação de informação.

Tabela 3 - Abordagens Envolvendo Ontologias

Área

Abordagem

Quantidade

Recuperação de Informação na Web

Interfaces e recursos de suporte à busca e navegação

23

Indexação e representação de documentos

Formulação de queries, refinamento e expansão de consultas

Visualização de informações

Web Semântica

Interfaces de busca

12

Métodos e técnicas de pesquisa, exploração e interpretação de dados

Visualização de Informações

Avaliação de técnicas e ferramentas de visualização

07

Proposta de novas técnicas de visualização

Recuperação Multimídia

(imagem, áudio e vídeo)

Raciocínio baseado em relações semânticas

07

Expansão de espaço semântico

Busca e anotação baseadas em ontologias

Anotação automática

Recuperação de conteúdo baseada em ontologia

Comparação entre busca baseada em palavras-chave e em ontologias

Avaliação

Avaliação da eficácia da interface

03

Avaliação da usabilidade da interface

Avaliação de resultados de busca

Dispositivos Móveis

Busca semântica em dispositivos móveis

03

Desenvolvimento de Interfaces e Sistemas

Acesso e persistência de dados

04

Mapeamento relacional

Integração de ontologias

Fonte: elaborada pelos autores

A partir das áreas e abordagens envolvendo ontologias, na próxima seção discutiremos as contribuições e propostas de melhorias em cada uma das principais problemáticas relacionadas à busca de informações na Web.

5.3 Problemáticas e Propostas de Melhorias no Âmbito do Uso de Ontologias na Busca e Recuperação de Informação

Os trabalhos analisados, todos elaborados a partir de abordagens relacionadas ao uso de ontologias na Recuperação de Informação, foram agrupados em cinco categorias, conforme apresentadas na Tabela 4. Desta forma, foi possível analisar como as ontologias estão sendo utilizadas no suporte à busca de informações e quais são as principais propostas de melhorias apresentadas nesta área.

Tabela 4 - Problemáticas Discutidas

Problemática

Área

Paradigmas de Pesquisa

Outras Perspectivas

Busca

Navegação

Híbrido (Busca e Navegação)

Visualização

Software

Recuperação de Informação na Web

11

03

09

-

-

Web Semântica

08

-

04

-

-

Visualização de Informações

-

-

-

07

-

Recuperação Multimídia

02

01

04

-

-

Avaliação

-

-

03

-

-

Dispositivos Móveis

-

-

03

-

-

Desenvolvimento de Interfaces e Sistemas

-

-

-

-

04

Total

21

04

23

07

04

Validados (Estudos de Usuários)

02

-

04

02

-

Fonte: Elaborada pelos autores

Os estudos relacionados à primeira categoria são aqueles desenvolvidos com o propósito de utilizar ontologias para o aprimoramento da atividade de busca (search), que é aquela realizada pelo usuário com um objetivo específico e previamente definido. Neste tipo de busca, o pesquisador tem o intuito de encontrar um determinado conteúdo e, para isto, utiliza expressões ou palavras-chave referentes ao assunto de interesse. São geralmente realizadas por meio de caixas de busca, disponibilizados nos buscadores da Web ou em outros ambientes digitais, tais como bibliotecas, repositórios, sites, etc.

A segunda categoria refere-se aos trabalhos nos quais as ontologias são empregadas para possibilitar a exploração de informações (browsing) e, de certa forma, estimular o mecanismo associativo dos usuários e a serendipidade, ou seja, a descoberta de informações importantes por acaso, sem que elas estivessem sendo procuradas. Neste tipo de busca, o usuário não possui um objetivo específico e explora o conteúdo disponibilizado em um corpus documental com intenção de visualizar alguma informação relevante. Desta forma, o comportamento de busca do usuário não é planejado e que as informações são encontradas sem ação premeditada. Este cenário acontece frequentemente quando o pesquisador se depara com uma grande quantidade de informações, tais como: jornais eletrônicos, revistas, publicidade, quadro de avisos, sites, blogs e etc.

A terceira categoria, por sua vez, agrupou os trabalhos desenvolvidos com o propósito de apresentar melhorias para projetos que englobam a busca híbrida, contendo os dois paradigmas integrados: busca e navegação baseadas em ontologias (search and browsing). Na quarta categoria, analisamos pesquisas relacionadas à visualização de informações, com destaque principalmente para a problemática da escalabilidade de grande conjunto de dados e ontologias. E, na última categoria, agrupamos todos os trabalhos que não haviam relação com a busca, navegação e visualização de conteúdos, mas sim com a estrutura de desenvolvimento de software.

5.3.1 Busca Baseada em Ontologias

Dentre os trabalhos analisados, 21 destinavam-se à utilização de ontologias para o aprimoramento da atividade de busca. Neste grupo, encontramos trabalhos direcionados às áreas de Recuperação de Informação na Web, Web Semântica e Recuperação Multimídia.

Em relação à Recuperação de Informação na Web, as principais contribuições e propostas de melhorias por meio do uso de ontologias são destinadas à formulação de queries, refinamento e expansão de consultas, indexação e representação de documentos. Entre as propostas apresentadas, encontram-se:

a. funcionalidades e recursos interativos: diversas funcionalidades e recursos baseados em ontologias estão sendo implementados nas caixas de busca, com o objetivo de auxiliar o usuário a elaborar expressões ou palavras-chave melhores e mais significativas: autossugestão de informação semântica (PAPADAKIS et al., 2009), filtro de domínio, recomendação de termos de busca, correção ortográfica, expansão automática de consultas e recurso de autopreenchimento (CHEN; CHUA, 2013);

b. busca semântica baseada em comportamento do usuário: sugestão de termos de busca (SENDHILKUMAR; GEETHA, 2008) e reformulação de consultas (LIMBU, 2006; MAURO, 2017) baseada em ontologia personalizada, desenvolvida a partir do contexto, do perfil e do comportamento de busca do usuário;

c. busca semântica baseada em contexto: abordagem de busca que incorpora três técnicas principais: 1) contexto para cada conceito extraído de propriedades e axiomas, 2) interpretação de consulta baseada no contexto extraído e 3) classificação dos resultados da busca, usando algoritmo de aprendizagem (GAVANKAR; LI; RAMAKRISHNAN, 2015);

d. busca baseada na diversidade de relacionamentos semânticos: modelo de classificação baseado em ontologias, que considera o peso e número de relações semânticas significativas entre os recursos, para determinar a relevância de um documento (LEE; MIN; CHUNG, 2009);

e. busca baseada em múltiplas versões de ontologias: Kondylakis e Plexousakis (2011) propõem um estudo sobre a evolução de ontologias e apresentam uma plataforma Web que permite que as consultas dos usuários sejam respondidas automaticamente sobre múltiplas versões de ontologia;

f. expansão de consultas baseada em vizinhança semântica: este recurso permite que a expansão de consultas enviadas pelo usuário seja realizada a partir dos sinônimos e da vizinhança semântica, ou seja, dos conceitos próximos presentes na ontologia (KHATTAK et al., 2008);

g. expansão de consultas baseada em múltiplas ontologias: o processo de expansão de consultas é baseado na integração de múltiplas ontologias de domínio. Essa integração é realizada por meio de técnicas de alinhamento de ontologias, que encontra equivalências entre conceitos de ontologias diferentes (CHUA; KIM, 2012);

h. refinamento de consultas: o processo de refinamento de consultas é realizado por meio de uma ontologia e da análise do gap de conhecimento do usuário (lacuna cognitiva, necessidade de informação, informação procurada, preferências e tarefa em questão) (STOJANOVIC, 2005).

No contexto da Web Semântica, os trabalhos envolvendo o uso de ontologias são destinados ao desenvolvimento de interfaces de linguagem natural ou refinamento de consultas, com o objetivo de reduzir a complexidade do uso da lógica formal (XML, RDF, SPARQL) e minimizar as dificuldades dos usuários na elaboração de buscas e na utilização dos recursos disponíveis (ARFAOUI; HIDRI, 2016; BERNSTEIN et al., 2005; GUPTA; BHOWMIK; GOVINDARAJU, 2008). Outras propostas envolvem o desenvolvimento de interfaces gráficas para elaborar buscas na Web Semântica, tais como as apresentadas por Bast et al. (2007), Soylu et al. (2013, 2014) e Styperek, Ciesielczyk e Szwabe (2014). Além do desenvolvimento de interfaces de linguagem natural e visual para a elaboração de consultas, encontramos ainda em Demidova, Zhou e Nejdl (2013), o desenvolvimento de algoritmos para explorar espaços de interpretação de consultas de palavras-chave, além de novas opções de interação para permitir uma melhor escalabilidade.

As pesquisas envolvendo Recuperação Multimídia também utilizam os recursos das ontologias para propor melhorias para a área. Neste sentido, os trabalhos encontrados com este propósito visam expandir o espaço semântico de uma busca de vídeo, formulada pelo usuário por meio de uma palavra-chave e, a partir deste recurso, apresentar melhores resultados (WU et al., 2008). Além disso, Wang, Liu e Chia (2006) apresentam um estudo comparativo entre a recuperação de imagem baseada em palavras-chave e a recuperação de imagem baseada em ontologias. Apesar de não apresentar nenhuma proposta de implementação de novos recursos, o trabalho destaca a eficácia da utilização de ontologias para a recuperação de imagens, bem como apresenta contribuições e desafios para a área.

5.3.2 Navegação do Corpus Baseada em Ontologias

Na categoria relacionada à navegação do corpus documental baseada em ontologias, encontramos 4 trabalhos envolvendo ontologias, com contribuições importantes para as áreas: Recuperação de Informação na Web e Recuperação Multimídia.

Na área de Recuperação de Informação na Web, os trabalhos, em sua maioria, destinam-se ao desenvolvimento de interfaces gráficas baseadas em ontologias, que permitem a visualização e exploração do corpus documental e seleção de elementos (tags, facetas, links) para a formulação de queries e expressões de busca. Neste contexto, Thai e Handschuh (2009) apresentam uma interface visual, baseada em ontologia pessoal, que permite aos usuários a navegação em coleções de texto através de diferentes perspectivas e níveis de detalhamento e, posteriormente, a realização das consultas de interesse. Issertial e Tsuji (2013) apresentam uma interface de usuário, com recursos gráficos para facilitar a navegação e busca de chamadas de artigos (call for paper). A proposta é baseada em banco de dados estruturado a partir da extração de dados relevantes das chamadas de artigos, via mineração de textos e, posteriormente, enriquecidos através de uma ontologia. Além destes dois estudos, encontramos ainda a proposta de Velart e Šaloun (2007), que apresenta uma interface visual para a organização de um curso online e navegação de materiais de aprendizagem.

Em relação à área de Recuperação Multimídia, o trabalho de Albertoni, Bertone e De Martino (2005) apresenta uma abordagem baseada em técnicas de visualização de ontologias e interação gráfica, para apoiar a busca de imagens geográficas e facilitar a análise de metadados. A abordagem fornece dois tipos de raciocínios: uma baseada em visão e outro baseada em ontologia. O raciocínio visual tem como objetivo possibilitar o reconhecimento de padrões e a interação direta com eles, enquanto que o raciocínio baseado em ontologia é proposto para auxiliar a descoberta de relações semânticas entre os dados. Desta forma, o usuário tem uma visão geral e compacta dos dados disponíveis, facilitando a interpretação do conjunto de resultados, propriedades e relacionamentos existentes.

5.3.3 Busca Híbrida (Busca e Navegação do Corpus Baseadas em Ontologias)

A maior parte dos trabalhos selecionados foram classificados nesta categoria, pois apresentam contribuições que visam a utilização de ontologias em projetos direcionados à busca híbrida, que contêm ambas funcionalidades: busca e navegação (browsing) de informações. Neste cenário, encontramos trabalhos direcionados à diversas áreas: Recuperação de Informação na Web, Web Semântica, Recuperação Multimídia, Avaliação e Dispositivos Móveis.

Na área de Recuperação de Informação na Web, encontramos estudos que agregam as ontologias para melhorar a busca e exploração de informações e facilitar a realização de consultas pelo usuário. Entre as propostas apresentadas, encontram-se:

a. recursos implementados em interfaces de busca semântica: diversos recursos estão sendo implementados para facilitar a elaboração de consultas, tais como: nuvem de termos, onde as informações podem ser filtradas e selecionadas (WONG; LIU; BENNAMOUN, 2010); navegador de árvore de ontologia, conjunto de filtros de documentos, conjunto de painéis de visualização, visualizador de títulos de documentos recuperados, navegador de documentos recuperados (LIN et al., 2010); menu de busca e espaço de navegação (GROTH; LANNERÖ, 2006);

b. ferramenta de busca e recuperação de informações: a proposta apresentada por Siahbani et al. (2013) consiste no desenvolvimento de um sistema de visualização de informações (navegador visual), que pode ser usado para explorar e navegar eventos extraídos de uma grande coleção de texto em linguagem natural, com base na exploração de rótulos de função semântica (quem fez o que a quem, quando e como). No mesmo contexto, Tijerino e Sanati (2005) apresentam um mecanismo de busca que combina métodos de pesquisa estatística e semântica para fornecer uma interface semântica visual para educadores que desejam distribuir, compartilhar e pesquisar materiais de preparação de cursos. Baskaya, Kekäläinen e Järvelin (2010) apresentam uma ferramenta baseada em ontologias multilíngue, com múltiplas funcionalidades, direcionada à busca, exploração, análise e anotação de documentos on-line. A ferramenta oferece suporte a: 1) busca por palavras-chave: na qual o pesquisador pode combinar conceitos da ontologia aos termos que está procurando; 2) anotação: documentos recuperados podem ser anotados por meio das ontologias escolhidas, em várias línguas, para identificar conceitos de interesse no documento; 3) clustering: agrupamento e apresentação de documentos recuperados; 4) bookmarking: o pesquisador pode armazenar os links de uma ontologia para realizar buscas e análises posteriores; e 5) integração de funções: palavras de texto e rótulos de clusters identificados, podem ser usados com flexibilidade em uma próxima pesquisa;

c. interface visual para busca de documentos 3D: interface visual destinada à navegação e exploração de mundos 3D, incluindo informações geométricas e textuais. Possui recursos de busca, navegação e anotação de documentos (PITTARELLO; GATTO, 2012a, 2012b);

d. interface de busca dinâmica baseada em modelos de conhecimento: interface de busca dinâmica para o comércio eletrônico, projetada para possibilitar que o usuário navegue rapidamente nas páginas da Web e obtenha o conteúdo semanticamente relevante e relacionado ao seu perfil (CARVALHO et al., 2002).

Para a área da Web Semântica, as propostas apresentam estruturas de busca e navegação, elaboradas com o propósito de facilitar o acesso e a análise de grande quantidade de dados. Discutem a problemática da consulta às estruturas heterogêneas da Web Semântica, bem como a escalabilidade de informações (DELIGIANNIDIS; KOCHUT; SHETH, 2007; FREITAS; CURRY, 2014; SOYLU et al., 2016; SUH; BEDERSON, 2002).

No contexto da Recuperação Multimídia, as propostas de melhorias são fundamentadas no uso de ontologias e interfaces visuais de navegação para possibilitar melhores resultados na busca e exploração do corpus documental. O sistema proposto por Popescu, Millet e Moëllic (2007) foi projetado para realizar a busca de imagens de duas formas: por meio de navegação conceitual e navegação visual. Também permite a navegação do usuário na página de resultados, possibilitando que novas buscas sejam realizadas. Gao, Luo e Fan (2006) também colaboraram com a área e apresentaram um sistema de busca e navegação de imagem em banco de dados de larga escala, com o recurso de anotação automática, desenvolvido a partir de três abordagens diferentes: abordagem baseada em segmentação, abordagem baseada em grade e abordagem baseada em relacionamentos. O sistema Sírio, discutido por Alisi et al. (2009) e Bertini et al. (2010), tem como objetivo apresentar um motor de busca de vídeos baseado em ontologias, com aplicações voltadas para a transmissão de notícias, vídeos de vigilância e documentários de herança patrimonial e cultural. Possui recurso de anotação semântica, expansão de consultas e especialização de conceitos, além de uma interface voltada para usuários técnicos e não técnicos, permitindo diferentes modalidades de consulta: texto livre, linguagem natural e composição gráfica de expressões de busca.

Em relação à área de Avaliação, encontramos trabalhos com o objetivo de analisar a eficácia de uma interface de busca visual (DUDYCZ, 2015), a usabilidade de um sistema de busca (ZHUHADAR; NASRAOUI, 2010) e os resultados de um estudo de usuário comparativo entre a eficácia das consultas na Web formuladas por ontologias com aqueles obtidos usando apenas um motor de busca baseado em palavras-chave (KAMEL; LEE; POWERS, 2007). Os estudos contribuem com a área, uma vez que apresentam resultados positivos sobre a adoção de ontologias no processo busca e recuperação de informação e promovem discussões importantes sobre o assunto.

Na área de Dispositivos móveis, os trabalhos apresentados por Ko et al. (2014) e Shin et al. (2013a, 2013b) discutem a implementação de busca semântica para smartphones, agregando recursos e funcionalidades para promover resultados mais significativos, entre eles: 1) refinamento e expansão da busca, por meio do uso de ontologia subjacente; 2) pesquisa baseada em intenção e contexto de busca; 3) busca a partir do reconhecimento de voz; e 4) gráfico de respostas, no qual o usuário tem condições de indicar quais informações ele realmente precisa. Neste contexto, a captura do significado pretendido da consulta e a expansão da busca contribuem para que a pesquisa seja mais precisa, uma vez que os conceitos próximos de uma ontologia possuem uma conexão semanticamente forte.

5.3.4 Visualização de Informações

Nesta categoria agrupamos todos os trabalhos relacionados especificamente à problemática da Visualização de Informações, incluindo manipulação de ontologias e escalabilidade de grande quantidade de dados. Tzitzikas e Hainaut (2006) analisaram aspectos importantes relacionados à manipulação de grandes ontologias, destacando características de classificação, filtragem, clustering e layouts de visualização. Katifori et al. (2007), Paulheim e Meyer (2011), Silva, Freitas e Santucci (2012) e Storey (2007) apresentam estudos sobre métodos e técnicas de visualização de ontologias existentes, direcionados principalmente para o design, gerenciamento e navegação, destacando características, vantagens e desvantagens de cada um deles. Além da análise dos aspectos relacionados à manipulação de dados em grande quantidade e dos métodos e técnicas de visualização existentes, novas ferramentas de visualização de dados são propostas: aplicativo de visualização de ontologias, que utiliza a renderização tridimensional (BUNTAIN, 2008) e ferramenta de suporte à visualização de ontologias por meio de árvores hiperbólicas (SOUZA; SANTOS; EVANGELISTA, 2003).

5.3.5 Outras Perspectivas

Além das propostas de melhorias relacionadas aos paradigmas de pesquisa (busca, navegação e busca híbrida) e à visualização de informações, a área de desenvolvimento também tem utilizado as ontologias para a implementação de recursos diferenciados em interfaces e sistemas de busca.

El-Atawy e Khalefa (2016) utilizaram as ontologias para reduzir o custo do desenvolvimento e da manutenção de sistemas médicos, bem como para minimizar as dificuldades relacionadas à área: múltiplas especialidades, diversidade de conceitos clínicos, dados temporais, transações financeiras e ampla variação de detalhes em diferentes domínios e configurações. Desta forma, as ontologias foram adotadas para modelar as soluções e possibilitar a reutilização de código, a extensão e a personalização dos sistemas e o tratamento da persistência, acesso e troca de dados. Além disso, as ontologias facilitam a modelagem da lógica de negócios (fluxos e regras) dos sistemas médicos, garantindo a qualidade de dados, o suporte às especialidades da área e o desenvolvimento de sistemas fortemente acoplados a modelos de dados.

Rozell et al. (2012) adotaram as ontologias para a construção de uma estrutura para o desenvolvimento de interfaces de usuários interativas para catálogos de dados. Para isto, utilizaram tecnologias da Web Semântica, incluindo ontologia OWL, para descrever a semântica dos serviços de dados e os componentes da interface de usuário, bem como para possibilitar a extensibilidade e a reutilização. Para testar a proposta, a estrutura foi aplicada no desenvolvimento de três aplicações diferentes: 1) interface facetada de navegação, integrada com um mapeamento interativo e ferramenta de visualização de dados para a área de oceanografia biológica e química; 2) navegador facetado para mais de 700.000 conjuntos de dados públicos abertos em mais de 100 catálogos mundiais; e 3) interface de usuário para um observatório virtual no campo da física solar terrestre.

Zheng et al. (2012) apresentaram uma ferramenta que fornece uma camada intermediária entre repositórios de ontologias e banco de dados para apoiar operações semânticas, baseadas em linguagens de consulta, diretamente de dentro de um banco de dados convencional. Desta forma, facilita a integração e o uso de ontologias em bancos de dados e melhora o desempenho para a maioria das buscas.

Paulheim (2009) apresentou uma abordagem para a modularização de interfaces do usuário, que visa facilitar o desenvolvimento de aplicações em grande escala e reduzir a dependência entre plugins. Utiliza ontologia de aplicação para descrever os requisitos e os componentes da interface, além de ontologia de domínio para descrever os termos do domínio da aplicação. A interoperabilidade entre os plugins pode ser alcançada por meio de raciocínio ontológico, mesmo quando eles são atualizados ou recombinados.

5.4 Validação de Propostas por Meio de Estudos de Usuários

O desenvolvimento de estudos de usuários para a validação de pesquisas e propostas de melhorias, embora de grande importância, são pouco utilizados na área de Recuperação de Informação. Dentre os 59 trabalhos analisados no contexto da nossa pesquisa, apenas 08 foram validados por usuários, o que representa menos de 15% do total. Isto significa que os dados apresentados e discutidos, na maioria dos trabalhos, referem-se apenas à opinião dos autores e desenvolvedores, impossibilitando, portanto, uma análise mais aprofundada sobre o desempenho, a eficácia, a usabilidade e as limitações para adoção das ferramentas desenvolvidas, bem como sua aceitação pelo usuário final e sua contribuição efetiva no processo de recuperação de informação.

Em relação a este quesito, encontramos trabalhos validados no grupo das abordagens relacionadas a: 1) busca baseada em ontologias, nas áreas de Recuperação de Informação na Web (CHEN; CHUA, 2013) e Web Semântica (BERNSTEIN et al., 2005); 2) busca e navegação do corpus baseadas em ontologias, nas áreas Web Semântica (DELIGIANNIDIS; KOCHUT; SHETH, 2007; SOYLU et al., 2016) e Avaliação (DUDYCZ, 2015; KAMEL; LEE; POWERS, 2007); e 3) visualização de informações (PAULHEIM; MEYER, 2011; SOUZA; SANTOS; EVANGELISTA, 2003).

Dentre os trabalhos avaliados, Chen e Chua (2013) realizaram testes com 50 usuários para analisar o design de uma interface de busca baseada em ontologias, contendo diversos recursos interativos para auxiliar a busca. Foi possível obter feedback sobre os seguintes itens: facilidade de uso, facilidade de aprendizagem, utilidade da correção ortográfica e análise das funções de ajuda aos usuários na formulação de buscas.

O processo de validação do protótipo de uma interface de busca para a Web Semântica apresentada por Bernstein et al. (2005) contou com duas etapas: 1) execução de diversas consultas altamente complexas e comparação do desempenho de recuperação de informação; 2) testes de usabilidade e avaliação de desempenho realizados com 20 usuários, que executaram tarefas com diferentes níveis de complexidade.

Kamel, Lee e Powers (2007) elaboraram testes envolvendo a participação de 10 usuários para comparar a eficácia entre as buscas realizadas na Web (por meio de palavras-chave no Google) e as realizadas em uma ferramenta de busca baseada em ontologias. Entre os dados coletados, foi possível identificar a precisão dos resultados encontrados em cada grupo de consultas e a importância da definição do contexto de busca para a recuperação de resultados relevantes. Além disso, foi possível avaliar a visão dos usuários em relação ao design da interface.

O estudo de usuário apresentado por Dudycz (2015), com o objetivo de avaliar a eficácia e a usabilidade de uma interface de busca baseada em ontologias, contou com a utilização de questionário de satisfação do usuário e análise de usabilidade, que foi realizada de acordo com as métricas propostas por Shneiderman (1998): 1) tempo de familiarização com o sistema; 2) velocidade de desempenho da realização de tarefas; 3) erros nas tarefas atribuídas; 4) retenção das características do sistema; e 5) satisfação do usuário. O estudo foi realizado com 143 usuários, que foram subdivididos em quatro experimentos com propósitos e características diferenciadas.

Deligiannidis, Kochut e Sheth (2007) desenvolveram estudos envolvendo 10 participantes, com a intenção de avaliar o protótipo de uma ferramenta para a busca e a navegação de dados na Web Semântica. Foi possível identificar o desempenho do usuário em relação ao uso da ferramenta (tempo para completar a tarefa e para encontrar a informação desejada) e sua satisfação em relação à interface (interface amigável, facilidade de uso, facilidade de começar a utilizar e satisfação geral).

Também com o objetivo de avaliar uma ferramenta desenvolvida para o contexto da Web Semântica, Soylu et al. (2016) propuseram um estudo com usuários de duas empresas do ramo industrial: Statoil e Siemens. A análise permitiu a avaliação de dois grupos com características diferenciadas, uma vez que os participantes da Siemens possuíam mais habilidades e conhecimentos sobre a realização de buscas predefinidas que os participantes da Statoil. O estudo teve a finalidade de identificar: 1) necessidades de informação: domínios de interesse, tipos comuns de consultas e a sua complexidade, tipos de tarefas; 2) atributos de qualidade: análise que interferem no tempo de execução, design e experiência do usuário, tais como: usabilidade, modularidade, escalabilidade, adaptatividade, adaptabilidade, extensibilidade, interoperabilidade, portabilidade e reusabilidade.

Souza, Santos e Evangelista (2003) realizaram apenas estudos preliminares para avaliar uma ferramenta de visualização de ontologias por meio de árvores hiperbólicas. Os usuários foram treinados para utilizar o protótipo e relatar diretamente sua opinião sobre ele em relação à otimização das atividades e ganho de produtividade. E, por fim, Paulheim e Meyer (2011) apresentaram um estudo com 22 usuários voluntários para avaliar um protótipo de visualização de ontologias e redes semânticas. Para o desenvolvimento desta etapa da pesquisa, foram propostas doze tarefas de três níveis diferentes de complexidade. Com a utilização de um questionário, foi possível avaliar o tempo de conclusão das tarefas propostas, a taxa de erro, bem como a experiência do usuário nas seguintes perspectivas: atração, facilidade, perspicácia, eficiência, estimulação e novidade.

6 Conclusão

As pesquisas utilizando ontologias na área de Recuperação de Informação, direcionadas principalmente para a Web, vem se consolidando nos últimos anos, devido aos inúmeros benefícios evidenciados na representação, organização, disseminação e recuperação de conteúdos. Neste contexto, o presente estudo teve como objetivo traçar um panorama sobre a utilização de ontologias no âmbito da busca e recuperação de informação, destacando os tipos de ontologias adotadas, as áreas de desenvolvimento de pesquisas, as principais abordagens, problemáticas, contribuições e propostas de melhorias.

Os dados apresentados são relevantes para a área, pois permitem uma visão sistematizada sobre como as ontologias estão sendo utilizadas, destacando principalmente a possibilidade de agregar novos recursos e funcionalidades aos sistemas atuais, tais como: recursos interativos de busca e recuperação de informação, busca semântica, expansão e refinamento de consultas, desenvolvimento de interfaces gráficas de navegação, ferramenta visual para a exploração de conteúdos, interface visual para mundos 3D, entre outros. As ontologias também se destacam em projetos direcionados à Web Semântica, principalmente em propostas que apresentam interfaces para minimizar as dificuldades do usuário com a elaboração de buscas e visualização de grande quantidade de dados. Além dessas duas áreas de destaque, encontramos também contribuições nas áreas de Visualização de Informações, Recuperação Multimídia, Dispositivos Móveis e Desenvolvimento de Interfaces e Sistemas.

Apesar das inúmeras propostas e contribuições observadas no contexto da busca e recuperação de informações, percebemos que, em muitos projetos, as ontologias são utilizadas apenas como recurso de filtragem de informações (quando apresentadas como tags, facetas e links), deixando em segundo plano todo o potencial para o qual elas foram, de fato, desenvolvidas. Neste sentido, uma importante lacuna de pesquisa observada por este estudo é a necessidade de desenvolvimento de ferramentas que utilizem os recursos das ontologias, principalmente o contexto e o significado existente nas relações entre os conceitos, para amplificar a busca e não apenas para filtrar informações e resultados.

Sugerimos o desenvolvimento de trabalhos futuros que explorem o potencial das ontologias para desenvolver ferramentas que auxiliem o usuário a compreender e interpretar um corpus documental, a fim de identificar e anotar as relações existentes entre os documentos, individualmente ou em colaboração, independentemente do conhecimento que o usuário possa ter para correlacionar conceitos de domínio. Também seria de grande importância a elaboração de propostas que promovam a construção, expansão ou aperfeiçoamento de consultas, visando minimizar os problemas do usuário relacionados à elaboração de termos de busca, tais como: a) dificuldade de expressar uma necessidade de informação por meio de palavras-chave ou termos de busca; b) obrigatoriedade de conhecimento sobre o domínio pesquisado, ou seja, quanto mais o usuário souber sobre o domínio de interesse, mais opções de vocabulário e terminologia terá a sua disposição para enriquecer as buscas, ao mesmo tempo que, quanto menos conhecimento possuir, mais genéricas e inadequadas serão as expressões utilizadas; c) as ferramentas de busca não fornecem mecanismos que indiquem quais termos foram utilizados para representar o acervo documental, atribuindo ao usuário a árdua tarefa de testar inúmeras expressões durante a pesquisa até que encontre os resultados esperados; d) os buscadores não oferecem suporte para auxiliar o pesquisador quando ele não possui objetivos de busca bem definidos, ou seja, quando ele está à procura de algo que não sabe exatamente o que é ou quais termos de busca deve utilizar.

Referencias

ADAMPEASE. Suggested Upper Merged Ontology. 2017. Disponível em: <http://www. adampease.org/OP/>. Acesso em: 10 jun. 2017.

ALBERTONI, R.; BERTONE, A.; DE MARTINO, M. Visualization and semantic analysis of geographic metadata. In: PROCEEDINGS OF THE 2005 WORKSHOP ON GEOGRAPHIC INFORMATION RETRIEVAL (GIR ‘05). ACM, New York, NY, USA, 2005. p. 9-16.

ALISI, T. et al. Sirio: an ontology-based web search engine for videos. In: MM’09 - PROCEEDINGS OF THE 2009 ACM MULTIMEDIA CONFERENCE, WITH CO-LOCATED WORKSHOPS AND SYMPOSIUMS, 2009. p. 967-968.

ANTONIOU, G.; HARMELEN, F. V. A semantic web primer. Cambridge: MIT Press, 2004.

ARAUJO JUNIOR, R. H. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2007.

ARFAOUI, O.; HIDRI, M. S. Ontology-based query refinement for XML information retrieval. In: PROCEEDINGS OF THE 6th INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE, MINING AND SEMANTICS (WIMS ‘16), Rajendra Akerkar, Michel Plantié, Sylvie Ranwez, Sébastien Harispe, Anne Laurent, Patrice Bellot, Jacky Montmain, and François Trousset (Eds.). ACM, New York, NY, USA, Article 35, 4 pages, 2016.

BAEZA-YATES, R.; RIBEIRO-NETO, B. Recuperação de informação: conceitos e tecnologias das máquinas de busca. 2. ed. Porto Alegre: Bookman, 2013.

BASKAYA, F.; KEKÄLÄINEN, J.; JÄRVELIN, K. A tool for ontology-editing and ontology-based information exploration. In: PROCEEDINGS OF THE THIRD WORKSHOP ON EXPLOITING SEMANTIC ANNOTATIONS IN INFORMATION RETRIEVAL (ESAIR ‘10). ACM, New York, NY, USA. 2010. p. 29-30.

BAST, H. et al. ESTER: efficient search on text, entities, and relations. In: PROCEEDINGS OF THE 30th ANNUAL INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL (SIGIR ‘07). ACM, New York, NY, USA, 2007. p. 671-678.

BEPPLER, F. D. Um modelo para recuperação e busca de informação baseado em ontologia e no círculo hermenêutico. 2008. 123 f. Tese (Doutorado em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina, Florianópolis, 2008.

BERNSTEIN, A. et al. Querying ontologies: a controlled english interface for end-users. In: PROC. 4TH INTERNATIONAL SEMANTIC WEB CONFERENCE (ISWC05), Springer-Verlag Berlim Heidelberg, nov. 2005. p. 112-126.

BERTINI, M. et al. Sirio, orione and pan: an integrated web system for ontology-based video search and annotation. In: PROCEEDINGS OF THE 18th ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA (MM ‘10). ACM, New York, NY, USA, 2010. p. 1625-1628.

BORKO, H. Information science: what is it? American Documentation, v.19, n.1, p.3-5, jan. 1968.

BOVO, A. B. Um modelo de descoberta de conhecimento inerente à evolução temporal dos relacionamentos entre elementos textuais. 2011. 155 f. Tese (Doutorado em Engenharia e Gestão do Conhecimento) - Universidade Federal de Santa Catarina, Florianópolis, 2011.

BRANCO NETO, W. C. Web Semântica na construção de sistemas de aprendizagem adaptativos. 2006. 219 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Santa Catarina, Florianópolis, 2006.

BUNTAIN, C. 3D ontology visualization in semantic search. In: PROCEEDINGS OF THE 46th ANNUAL SOUTHEAST REGIONAL CONFERENCE ON XX (ACM-SE 46). ACM, New York, NY, USA, 2008. p. 204-208.

CARVALHO, M. et al. Linking dynamic query interfaces to knowledge models. In: PROCEEDINGS OF THE 7th INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES (IUI ‘02). ACM, New York, NY, USA, 2002. p. 186-187.

CHEN, L.; CHUA, C. Interactive interface for query formulation. In: PROCEEDINGS OF THE 25th AUSTRALIAN COMPUTER-HUMAN INTERACTION CONFERENCE: AUGMENTATION, APPLICATION, INNOVATION, COLLABORATION (OzCHI ‘13), Haifeng Shen, Ross Smith, Jeni Paay, Paul Calder, and Theodor Wyeld (Eds.). ACM, New York, NY, USA, 2013. p. 507-510.

CHUA, W. W. K.; KIM, J. Semantic querying over knowledge in biomedical text corpora annotated with multiple ontologies. In: PROCEEDINGS OF THE ACM CONFERENCE ON BIOINFORMATICS, COMPUTATIONAL BIOLOGY AND BIOMEDICINE (BCB ‘12). ACM, New York, NY, USA, 2012. p. 400-407.

CRISTOVÃO, H. M.; DUQUE, C. G.; SERQUEIRA, L. D. Recuperação de informação: uma aplicação na criação e configuração automáticas de cursos virtuais a distância. ENANCIB – ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 13., 2012, Rio de Janeiro. Anais… Disponível em: <http://www.eventosecongressos.com.br/metodo/ enancib2012/arearestrita/pdfs/19320.pdf>. Acesso em: 22 mar. 2017.

DBPEDIA. About Dbpedia. 2017. Disponível em: <http://wiki.dbpedia.org/about>. Acesso em: 05 jun. 2017.

DELIGIANNIDIS, L.; KOCHUT, K. J.; SHETH, A. P. RDF data exploration and visualization. In: PROCEEDINGS OF THE ACM FIRST WORKSHOP ON CYBERINFRASTRUCTURE: INFORMATION MANAGEMENT IN ESCIENCE (CIMS’ 07). ACM, New York, NY, USA, 2007. p. 39-46.

DEMIDOVA, E.; ZHOU, X.; NEJDL, W. Efficient query construction for large scale data. In: PROCEEDINGS OF THE 36th INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL (SIGIR ‘13). ACM, New York, NY, USA, 2013. p. 573-582.

DUDYCZ, H. Usability of business information semantic network search visualization. In: PROCEEDINGS OF THE MULITIMEDIA, INTERACTION, DESIGN AND INNNOVATION (MIDI ‘15). ACM, New York, NY, USA, Article 13, 9 pages, 2015.

EL-ATAWY, S. S.; KHALEFA, M. E. Building an Ontology-Based Electronic Health Record System. In: PROCEEDINGS OF THE 2nd AFRICA AND MIDDLE EAST CONFERENCE ON SOFTWARE ENGINEERING (AMECSE ‘16). ACM, New York, NY, USA, 2016. p. 40-45.

FENSEL, D. Ontologies: a silver bullet for knowledge management and eletronic commerce. 2. ed. New York: Springer-Verlag. 2003.

FERNEDA, E. Ontologia como recurso de padronização terminológica de um sistema de recuperação de informação. 2013. 96 f. Relatório de Pesquisa (Pós-Doutorado em Ciência da Informação) – Universidade Federal da Paraíba, João Pessoa, 2013.

FERNEDA, E. Recuperação de informação: análise sobre a contribuição da Ciência da Computação para a Ciência da Informação. 2003. 137 f. Tese (Doutorado em Ciências da Comunicação) – Universidade de São Paulo, São Paulo, 2003.

FREITAS, A.; CURRY, E. Natural language queries over heterogeneous linked data graphs: a distributional-compositional semantics approach. In: PROCEEDINGS OF THE 19th INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES (IUI ‘14). ACM, New York, NY, USA, 2014. p. 279-288.

GAO, Y.; LUO, H.; FAN, J. Searching and browsing large scale image database using keywords and ontology. In: PROCEEDINGS OF THE 14th ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA (MM ‘06). ACM, New York, NY, USA, 2006. p. 811-812.

GAVANKAR, C.; LI, Y-F.; RAMAKRISHNAN, G. Context-driven Concept Search across Web Ontologies using Keyword Queries. In: PROCEEDINGS OF THE 8th INTERNATIONAL CONFERENCE ON KNOWLEDGE CAPTURE (K-CAP 2015). ACM, New York, NY, USA, Article 20, 4 pages, 2015.

GOOGLE DEVELOPERS. Freebase. 2017. Disponível em: <https://developers.google.com/ freebase/>. Acesso em: 05 jun. 2017.

GROTH, K.; LANNERÖ, P. Context browser: ontology based navigation in information spaces. In: PROCEEDINGS OF THE 1st INTERNATIONAL CONFERENCE ON INFORMATION INTERACTION IN CONTEXT (IIiX). ACM, New York, NY, USA, 2006. p. 75-78.

GRUBER, T. R. A translation approach to portable ontology specification. Knowledge Acquisition, v.5, n.2, p. 199-220, 1993.

GRUBER, T. R. What is an ontology? 1996. Disponível em: <http://www.ksl.stanford.edu/ kst/what-is-an-ontology.html>. Acesso em: 12 mar. 2017.

GUARINO, N. Formal ontology in information systems. In: PROCEEDINGS OF FOIS’98, Trento, Italy, jun. 1998. Amsterdam, IOS Press. 1998. p.3-15.

GUPTA, C.; BHOWMIK, R.; GOVINDARAJU, M. Ontological framework for a free-form query based grid search engine. In: PROCEEDINGS OF THE 17th INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE DISTRIBUTED COMPUTING (HPDC ‘08). ACM, New York, NY, USA, 2008. p. 205-208.

HAAV, H. M.; LUBI, T. L. A survey of concept-based information retrieval tools on the web. In: PROC. OF 5th EAST-EUROPEAN CONFERENCE ADBIS*2001. A. Caplinkas and J. Eder (Eds). Advances in Databases and Information Systems, Vilnius Technika, v. 2. p.29-41, 2001.

ISSERTIAL, L.; TSUJI, H. Data management and user interface for a call for paper manager. In: COMPUTER SOFTWARE AND APPLICATIONS CONFERENCE (COMPSAC) 2013 IEEE 37th ANNUAL, July 2013. p.463-466.

JASPER, R.; USCHOLD, M. A framework for understanding and classifying ontology applications. In: IJCAI-99, ONTOLOGY WORKSHOP. Stockholm, Sweden, jul. 1999.

KAMEL, M; LEE, A.; POWERS, Ed. Ontology-aided vs. keyword-based web searches: a comparative user study. In: LARGE SCALE SEMANTIC ACCESS TO CONTENT (TEXT, IMAGE, VIDEO, AND SOUND) (RIAO ‘07). LE CENTRE DE HAUTES ETUDES INTERNATIONALES D’INFORMATIQUE DOCUMENTAIRE, Paris, France, France, 2007. p. 639-652.

KATIFORI, A. et al. Ontology visualization methods: a survey. ACM Computing Surveys, v. ٣٩, n. ٤, p.١٠-٤٣, ٢٠٠٧.

KHATTAK, A. M. et al. Intelligent search in digital documents. In: PROCEEDINGS OF THE 2008 IEEE/WIC/ACM INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE AND INTELLIGENT AGENT TECHNOLOGY - Volume 01 (WI-IAT ‘08), v. 1. IEEE Computer Society, Washington, DC, USA, 2008. p. 558-561.

KO, J. et al. Semantically enhanced keyword search for smartphones. In: PROCEEDINGS OF THE 23RD INTERNATIONAL CONFERENCE ON WORLD WIDE WEB (WWW ‘14 Companion). ACM, New York, NY, USA, 2014. p. 327-328.

KONDYLAKIS, H.; PLEXOUSAKIS, D. Exelixis: evolving ontology-based data integration system. In: PROCEEDINGS OF THE 2011 ACM SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA (SIGMOD ‘11). ACM, New York, NY, USA, 2011. p. 1283-1286.

LEE, J.; MIN, J-K.; CHUNG, C-W. An effective semantic search technique using ontology. In: PROCEEDINGS OF THE 18th INTERNATIONAL CONFERENCE ON WORLD WIDE WEB (WWW ‘09). ACM, New York, NY, USA, 2009. p. 1057-1058.

LIMBU, D. K. et al. Contextual relevance feedback in web information retrieval. In: PROCEEDINGS OF THE 1st INTERNATIONAL CONFERENCE ON INFORMATION INTERACTION IN CONTEXT (IIiX). ACM, New York, NY, USA, 2006. p. 138-143.

LIN, H. et al. Visualizations for the spyglass ontology-based information analysis and retrieval system. In: PROCEEDINGS OF THE 48th ANNUAL SOUTHEAST REGIONAL CONFERENCE (ACM SE ‘10). ACM, New York, NY, USA, Article 38, 6 pages, 2010.

LIN, J.; DEMNER-FUSHMAN, D. The role of knowledge in conceptual retrieval: a study in the domain of clinical medicine. In: PROCEEDINGS OF THE 29th ANNUAL INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL (SIGIR ‘06). ACM, New York, NY, USA, 2006. p. 99-106.

MAURO, N. Intelligent and personalized community maps. In: PROCEEDINGS OF THE 22nd INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES COMPANION (IUI ‘17 Companion). ACM, New York, NY, USA, 2017. p. 181-184.

MAX PLANCK INSTITUT INFORMATIK. Yago: a high-quality knowledge base. 2017. Disponível em: <http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/>. Acesso em: 10 jun. 2017.

McGUINNESS, D. L. Ontologies come of age. In: FENSEL et al. Spinning the semantic web: bringing the World Wide Web to its full potential. Cambridge: MIT Press, 2003. Cap. 6.

MOOERS, C. N. Zatocoding applied to mechanical organization of knowledge, American Documentation, v. 2, n. 1, p.20-32, 1951.

NOY, N. F.; MCGUINNESS, D. L. Ontology development 101: a guide to creating your first ontology. Stanford University, Stanford, 2001.

OWL. Web Ontology Language Guide. 2003. Disponível em: <http://www.w3.org/TR/ 2003/CR-owl-guide-20030818/>. Acesso em: 10 dez. 2017.

PAPADAKIS, I. et al. A query construction service for large-scale Web search engines. In: PROCEEDINGS OF THE 2009 IEEE/WIC/ACM INTERNATIONAL JOINT CONFERENCE ON WEB INTELLIGENCE AND INTELLIGENT AGENT TECHNOLOGY - Volume 03 (WI-IAT ‘09), v. 3. IEEE Computer Society, Washington, DC, USA, 2009. p. 96-99.

PAULHEIM, H. Ontology-based modularization of user interfaces. In: PROCEEDINGS OF THE 1st ACM SIGCHI SYMPOSIUM ON ENGINEERING INTERACTIVE COMPUTING SYSTEMS (EICS ‘09). ACM, New York, NY, USA, 2009. p. 23-28.

PAULHEIM, H.; MEYER, L. Ontology-based information visualization in integrated UIs. In: PROCEEDINGS OF THE 16th INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES (IUI ‘11). ACM, New York, NY, USA, 2011. p. 451-452.

PERINI, M. A. Sobre língua, linguagem e Linguística: uma entrevista com Mário A. Perini. ReVEL. v. 8, n. 14, 2010.

PITTARELLO, F.; GATTO, I. A visual interface for querying ontologically and socially annotated 3D worlds for the web. In: PROCEEDINGS OF THE INTERNATIONAL WORKING CONFERENCE ON ADVANCED VISUAL INTERFACES (AVI ‘12), Genny Tortora, Stefano Levialdi, and Maurizio Tucci (Eds.). ACM, New York, NY, USA, 2012a. p. 377-381.

PITTARELLO, F.; GATTO, I. An integrated ecosystem of interfaces for annotating, querying and browsing networks of Web3D worlds. In: PROCEEDINGS OF THE INTERNATIONAL WORKING CONFERENCE ON ADVANCED VISUAL INTERFACES (AVI ‘12), Genny Tortora, Stefano Levialdi, and Maurizio Tucci (Eds.). ACM, New York, NY, USA, 2012b. p. 794-795.

POPESCU, A.; MILLET, C.; MOËLLIC, P-A. Ontology driven content based image retrieval. In: PROCEEDINGS OF THE 6th ACM INTERNATIONAL CONFERENCE ON IMAGE AND VIDEO RETRIEVAL (CIVR ‘07). ACM, New York, NY, USA, 2007. p. 387-394.

ROZELL, E. et al. S2S architecture and faceted browsing applications. In: PROCEEDINGS OF THE 21st INTERNATIONAL CONFERENCE ON WORLD WIDE WEB (WWW ‘12 COMPANION). ACM, New York, NY, USA, 2012. p. 413-416.

RUIZ, F.; HILERA, J. R. Using ontologies in software engineering and technology. In: CALERO, C.; RUIZ, F.; PIATTINI, M. (Eds.). Ontologies for software engineering and software technology, p. 49-102. Springer, 2006.

SALTON, G. Automatic information retrieval. IEEE Computer, v. 13, p.41-56, 1980.

SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em Ciência da Informação, Belo Horizonte, v.1, n.1, p. 41-62, jan./jun. 1996.

SARACEVIC, T. Information science. Journal of the American Society for Information Science, v. 50, n. 12, 1999, p.1051-1063.

SARACEVIC, T. The stratified model of information retrieval interactions: extension and applications. American Society for Information Science, p. 313-327, 1997.

SENDHILKUMAR, S.; GEETHA, T. V. Personalized ontology for web search personalization. In: PROCEEDINGS OF THE 1ST BANGALORE ANNUAL COMPUTE CONFERENCE (COMPUTE ‘08). ACM, New York, NY, USA, Article 18, 7 pages, 2008.

SHIN, S. et al. Augmenting mobile search engine with semantic web and context awareness. In: PROCEEDINGS OF THE 2013 IEEE/WIC/ACM INTERNATIONAL JOINT CONFERENCES ON WEB INTELLIGENCE (WI) AND INTELLIGENT AGENT TECHNOLOGIES (IAT) - Volume 03 (WI-IAT ‘13), v. 3. IEEE Computer Society, Washington, DC, USA, 2013a. p. 278-279.

SHIN, S. et al. Semantic search for smart mobile devices. In: PROCEEDINGS OF THE COMPANION PUBLICATION OF THE 2013 INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES COMPANION (IUI ‘13 Companion). ACM, New York, NY, USA, 2013b. p. 95-96.

SHNEIDERMAN, B. Designing the user interface: strategies for effective human-computer interaction. Addison Wesley Longman, Addison Wesley Reading, Menlo Park, 1998.

SIAHBANI, M. et al. Knowledge base population and visualization using an ontology based on semantic roles. In: PROCEEDINGS OF THE 2013 WORKSHOP ON AUTOMATED KNOWLEDGE BASE CONSTRUCTION (AKBC ‘13). ACM, New York, NY, USA, 2013. p. 85-90.

SILVA, I. C. S.; FREITAS, C. M. D. S.; SANTUCCI, G. An integrated approach for evaluating the visualization of intensional and extensional levels of ontologies. In: PROCEEDINGS OF THE 2012 BELIV WORKSHOP: BEYOND TIME AND ERRORS - NOVEL EVALUATION METHODS FOR VISUALIZATION (BELIV ‘12). ACM, New York, NY, USA, Article 2, 7 pages, 2012.

SOUZA, K. X. S.; SANTOS, A. D.; EVANGELISTA, S. R. M. Visualization of ontologies through hypertrees. In: PROCEEDINGS OF THE LATIN AMERICAN CONFERENCE ON HUMAN-COMPUTER INTERACTION (CLIHC ‘03). ACM, New York, NY, USA, 2003. p. 251-255.

SOYLU, A. et al. OptiqueVQS: a visual query system over ontologies for industry, Semantic Web, IOS Press, p. 1-33, 2016.

SOYLU, A. et al. OptiqueVQS: towards an ontology-based visual query system for big data. In: PROCEEDINGS OF THE FIFTH INTERNATIONAL CONFERENCE ON MANAGEMENT OF EMERGENT DIGITAL ECOSYSTEMS (MEDES ‘13). ACM, New York, NY, USA, 2013. p. 119-126.

SOYLU, A. et al. Why not simply Google? In: PROCEEDINGS OF THE 8th NORDIC CONFERENCE ON HUMAN-COMPUTER INTERACTION: FUN, FAST, FOUNDATIONAL (NordiCHI ‘14). ACM, New York, NY, USA, 2014. p. 1039-1042.

STOJANOVIC, N. On the role of a user’s knowledge gap in an information retrieval process. In: PROCEEDINGS OF THE THIRD INTERNATIONAL CONFERENCE ON KNOWLEDGE CAPTURE.ACM K-CAP05, 2005. p. 83-90.

STOREY, M-A. D. Navigating documents using ontologies, taxonomies and folksonomies. In: PROCEEDINGS OF THE 2007 ACM SYMPOSIUM ON DOCUMENT ENGINEERING (DocEng ‘07). ACM, New York, NY, USA, 2007. p. 2-2.

STYPEREK, A.; CIESIELCZYK, M.; SZWABE, A. Semantic search engine with an intuitive user interface. In: PROCEEDINGS OF THE 23rd INTERNATIONAL CONFERENCE ON WORLD WIDE WEB (WWW ‘14 Companion). ACM, New York, NY, USA, 2014. p. 383-384.

SUH, B.; BEDERSON, B. B. OZONE: a zoomable interface for navigating ontology information. In: PROCEEDINGS OF THE WORKING CONFERENCE ON ADVANCED VISUAL INTERFACES (AVI ‘02), Maria De Marsico, Stefano Levialdi, and Emanuele Panizzi (Eds.). ACM, New York, NY, USA, 2002. p. 139-143.

THAI, V.; HANDSCHUH, S. IVEA: toward a personalized visual interface for exploring text collections. In: PROCEEDINGS OF THE 14th INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES (IUI ‘09). ACM, New York, NY, USA, 2009. p. 479-480.

TIJERINO, Y. A.; SANATI, R. Onto TEMAS: an ontology-based teaching materials search engine. J. Comput. Sci, v. 20, n. 4, p. 177-182, abr. 2005.

TZITZIKAS, Y.; HAINAUT, J-C. On the visualization of large-sized ontologies. In: PROCEEDINGS OF THE WORKING CONFERENCE ON ADVANCED VISUAL INTERFACES (AVI ‘06). ACM, New York, NY, USA, 2006. p. 99-102.

USCHOLD, M.; GRUNINGER, M. Ontologies: principles, methods and applications. Knowledge Engineering Review, v. 11, n. 2, p.1-69, 1996.

VAN HEIJIST, G.; SCHREIBER, A. T.; WIELINGA, B. J. Using explicit ontologies in KBS development. International Journal of Human - Computer Studies, v.46, n.2-3, p.183-192, fev./mar. 1997.

VELART, Z.; ŠALOUN, P. Ontology based course navigation. In: PROCEEDINGS OF THE EIGHTEENTH CONFERENCE ON HYPERTEXT AND HYPERMEDIA (HT ‘07). ACM, New York, NY, USA, 2007. p. 151-152.

WANG, H; LIU, S.; CHIA, L-T. Does ontology help in image retrieval?: a comparison between keyword, text ontology and multi-modality ontology approaches. In: PROCEEDINGS OF THE 14th ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA (MM ‹٠٦). ACM, New York, NY, USA, ٢٠٠٦. p. ١٠٩-١١٢.

WONG, W.; LIU, W.; BENNAMOUN, M. An ontology-based interface for improving information exploration. In: PROCEEDINGS OF THE FIRST INTERNATIONAL WORKSHOP ON INTELLIGENT VISUAL INTERFACES FOR TEXT ANALYSIS (IVITA ‘10), Shixia Liu, Michelle X. Zhou, Giuseppe Carenini, and Huamin Qu (Eds.). ACM, New York, NY, USA, 2010. p. 29-32.

WU, P. T. et al. Keyword-based concept search on consumer photos by web-based kernel function. In: PROCEEDINGS OF THE 16th ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA (MM ‘08). ACM, New York, NY, USA, 2008. p. 651-654.

ZHENG, S. et al. Enabling ontology based semantic queries in biomedical database systems. In: PROCEEDINGS OF THE 21st ACM INTERNATIONAL CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT (CIKM ‘12). ACM, New York, NY, USA, 2012. p. 2651-2654.

ZHUHADAR, L.; NASRAOUI, O. Evaluating usability and precision of visual search engine. In: PROCEEDINGS OF THE 2010 SPRING SIMULATION MULTICONFERENCE (SPRINGSIM ‘10). Society for Computer Simulation International, San Diego, CA, USA, Article 239, 4 pages, 2010.


1 Doutoranda em Ciência da Informação no Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista Júlio de Mesquita Filho, Brasil. Docente do Instituto Federal do Paraná, Campus Jacarezinho, Brasil. ORCID http://orcid.org/0000-0001-6199-0309. E-mail: http://orcid.org/0000-0001-6199-0309. E-mail: marcia.reis@ifpr.edu.br

2 Docente permanente no Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista Júlio de Mesquita Filho, Brasil. ORCID https://orcid.org/0000-0002-8808-1217. E-mail: https://orcid.org/0000-0002-8808-1217

3 http://dl.acm.org/

4 http://scholar.google.com.br/

artigo de revisão