<?xml version="1.0" encoding="UTF-8"?>
<item xmlns="http://omeka.org/schemas/omeka-xml/v5" itemId="4503" public="1" featured="1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://omeka.org/schemas/omeka-xml/v5 http://omeka.org/schemas/omeka-xml/v5/omeka-xml-5-0.xsd" uri="http://repositorio.febab.org.br/items/show/4503?output=omeka-xml" accessDate="2026-04-20T21:41:46-07:00">
  <fileContainer>
    <file fileId="3571">
      <src>http://repositorio.febab.org.br/files/original/31/4503/SNBU2016_121.pdf</src>
      <authentication>a69f69aa8fd9035ae19b9c0f2a54eaea</authentication>
      <elementSetContainer>
        <elementSet elementSetId="4">
          <name>PDF Text</name>
          <description/>
          <elementContainer>
            <element elementId="92">
              <name>Text</name>
              <description/>
              <elementTextContainer>
                <elementText elementTextId="50132">
                  <text>Sistema Inteligente de Indexação Automática de Ofícios do
Departamento de Computação da UFVJM
Aline Pereira da Costa (UFJF) - alinenovaera@gmail.com
Victor Oliveira Almeida (UFVJM) - victor.almeida.ti@gmail.com
Cristiano Grijó Pitangui (UFSJ) - pitangui.cristiano@gmail.com
Alessandro Vivas Andrade (UFVJM) - prof.alessandrovivas@gmail.com
Luciana Pereira Assis (UFVJM) - lupassis@gmail.com
Resumo:
Este projeto tem por objetivo sanar uma deficiência do Departamento de Computação da
UFVJM – Universidade Federal dos Vales do Jequitinhonha e Mucuri. Tal Departamento não
possui um local tanto físico quanto digital para armazenar seus ofícios. A falta de uma
organização eficiente e padronizada destes ofícios inviabiliza o acesso aos documentos e
dispende muito tempo na localização e recuperação da informação, podendo trazer grandes
prejuízos para a instituição. Visando solucionar o problema de
recuperação e organização das informações contidas nos ofícios, propõe-se a criação de um
Sistema Inteligente de Indexação Automática utilizando um vocabulário controlado, tesauro,
para que seja possível localizar com rapidez o ofício desejado. É importante que o sistema
esteja em ambiente virtual para que o acesso seja democratizado e o processo de tratamento
de novos ofícios seja automatizado. O projeto permeia o espaço de 2011 a 2014, totalizando
239 ofícios, sendo estes a base para a criação do tesauro. Sendo positiva a implementação do
projeto, sugere-se que os demais departamentos da UFVJM utilizem o mesmo sistema para
organização dos seus documentos, ganhando agilidade nos processos e satisfação do usuário
final na localização do que procura.
Palavras-chave: Vocabulário Controlado 1. Tesauro 2. Sistema Inteligente 3. Indexação 4.
Área temática: Eixo 3 - Ecologia da Informação
Subárea temática: Preservação de acervos digitais

Powered by TCPDF (www.tcpdf.org)

�1

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

1 Introdução
Diante do conceito de informação, faz-se necessário delimitar o contexto de sua
aplicação para utilizá-la de maneira mais adequada. A proposta deste estudo trata da
informação que se localiza em ambiente administrativo e organizacional. Rousseau e Couture
(1998) consideram que a informação deve ser tratada, numa empresa, como um recurso tão
importante quanto os recursos humanos, materiais ou financeiros
Essas informações aliadas às novas tecnologias assumiram um papel importante no
compartilhamento do conhecimento. Trata-se de grandes volumes de informação e
conhecimento, que são utilizados e compartilhados por inúmeras pessoas ao mesmo tempo.
Em uma instituição pública, grande parte da informação gerada são correspondências oficiais
denominadas ofícios. Entende-se por ofício uma correspondência oficial, enviada
normalmente a funcionários ou autoridades públicas. É o tipo mais comum de
correspondência oficial expedido por órgãos públicos. Seu destinatário pode ser outro órgão
público, como particular.
Este trabalho tem o objetivo de, através do uso de vocabulário controlado, criar um
Sistema Inteligente de Indexação Automática para localização dos ofícios do Departamento de
Computação da UFVJM – Universidade Federal dos Vales do Jequitinhonha e Mucuri. Os
ofícios recebidos e expedidos neste departamento discorrem sobre solicitações, deferimentos,
aquisições e diversas outras ações e recomendações importantes para o andamento das rotinas
e processos desenvolvidos no departamento.
Para que este projeto fosse desenvolvido, foi necessário lidar com o controle do
significado das palavras e escolher os melhores termos para a construção do vocabulário
controlado. Este processo é tecnicamente chamado de indexação que, segundo a NBR 12676,
é: “o ato de identificar e descrever o conteúdo de um documento com termos representativos
dos seus assuntos e que constituem uma linguagem de indexação”.
A indexação possui como finalidade principal traduzir a linguagem natural utilizada
pelos usuários para uma linguagem documental padronizada, aumentando a eficiência na
entrada de dados no sistema e a recuperação da informação.
Espera-se que com a conclusão do projeto, o usuário final tenha acesso aos ofícios do
Departamento de Computação da UFVJM e que consiga localizar o que necessita com
agilidade na hora da busca.
Este trabalho se organiza como segue. A seção atual, a introdução, apresenta e justifica
os objetivos do projeto. A segunda seção apresenta uma revisão da literatura e expõe os
fundamentos teóricos nos quais este trabalho se baseia. A terceira seção descreve a
metodologia utilizada na execução do trabalho. A quarta seção apresenta os resultados parciais
já alcançados. Finalmente, a última seção, indica os próximos passos a serem seguidos
visando a implantação completa do sistema.
1.1 Justificativa
Identificou-se que o Departamento de Computação da UFVJM não possui um local
onde seja possível pesquisar os ofícios já expedidos. Quando há uma determinada demanda
em localizar um ofício, recorre-se a e-mails enviados ou a alguma pasta arquivada no
computador ou fisicamente - o que dispende muito tempo na busca. Surgiu então, a
necessidade de procurar uma solução para este problema: arquivar os ofícios de uma forma
que seja mais fácil e mais rápida sua recuperação.
Para sanar tal deficiência na busca pelos ofícios, propõe-se o desenvolvimento de um
tesauro, tipo de vocabulário controlado. Vocabulário controlado é definido por Naves (2004,
p. 10-11), “como um tipo de linguagem artificial. Esta é construída cuidadosamente, através

�2

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

do processo minucioso da escolha dos termos a serem usados, o significado de cada um e as
relações que apresentam.”. O tesauro servirá como base para uma indexação automática dos
documentos e, assim, classificar os ofícios, de tal maneira que o usuário localize o que
procura.
Após a construção do vocabulário controlado, será necessário indexar os ofícios
utilizando os termos definidos no tesauro.
Segundo Lancaster (2004, p. 84) a prioridade da indexação precisa ser o usuário final,
pois:
a indexação de assuntos é normalmente feita visando a atender às
necessidades de determinada clientela, ou seja, é preciso que se tome
uma decisão não somente quanto ao que é tratado no documento, mas
que por ele se reveste de provável interesse para determinado grupo de
usuários. (LANCASTER, 2004, p. 84).
A necessidade de informação do indivíduo é expressa no momento da busca. Este
processo pela busca da informação é cíclico: digamos que um usuário está em um centro de
informação (biblioteca, arquivo) e necessita de uma informação. Ele então irá procurar o
especialista da informação, um bibliotecário, por exemplo, e diante do diálogo entre os dois,
será feito um pedido, uma solicitação do usuário, para o bibliotecário do que ele deseja.
Diante deste pedido, o especialista da informação prepara uma estratégia de busca, utilizando
para isso os termos da indexação. A estratégia de busca será então confrontada em uma Base
de Dados. Após a busca, alguns itens serão recuperados. O especialista da informação fará
uma filtragem e apresentará ao solicitante somente as informações pertinentes ao seu pedido.
Tal ciclo é representado na Figura 1.

Figura 1 – Fatores que influem nos resultados de uma busca pela informação
em uma Base de Dados

�3

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

O grande desafio para a gestão documental e do conhecimento nas empresas é,
corroborando com Araújo (2006, p. 62), estabelecer métodos que ofereçam ao usuário
“documentos que sejam realmente relevantes para ele, que contribuam para satisfazer suas
necessidades de pesquisa e, desse modo, a construção do conhecimento” de forma eficiente e
rápida, diminuindo o gasto de recursos e tempo. Neste contexto, elaborar eficientes políticas
de indexação e um sistema de recuperação são imprescindíveis para o sucesso da gestão da
informação no meio organizacional.
Com o intuito de otimizar o acesso, a busca e a recuperação da informação, propõe-se
neste trabalho um Sistema Inteligente de recuperação de informação que utilize um
vocabulário controlado elaborado através do conjunto representativo dos ofícios do
Departamento de Computação da UFVJM, emitidos no período de 2011 a 2014.
1.2 Objetivo geral
Propor a criação de um Sistema Inteligente de Indexação Automática, através do uso
de vocabulário controlado, para localização dos ofícios do Departamento de Computação da
UFVJM.
1.3 Objetivos específicos
 Construir um tesauro como instrumento base para a indexação automática do sistema;
 Propor um método de ranqueamento dos ofícios, para que a busca retorne em primeiro
lugar o que o usuário solicita.

 Criação de um Sistema Inteligente de Indexação Automática online para implementar
o objetivo específico acima citado e armazenar/recuperar os ofícios.

2 Revisão de literatura
Para que este projeto fosse desenvolvido, foi necessário lidar com o controle do
significado das palavras para uma futura recuperação dos termos para a construção do
vocabulário controlado.
O vocabulário controlado é um instrumento que através de termos previamente
determinados, isto é, uma linguagem padronizada, permite a representação e a recuperação de
documentos. Segundo (SOUZA, 2010), os vocabulários controlados são:
utilizados desde 1950 principalmente nas agências dos governos dos Estados Unidos
e dos países da Europa com o objetivo de gerenciar melhor a explosão do
conhecimento registrado na literatura científica e tecnológica de áreas
especializadas. (Souza, 2010).

Existem diferentes tipos de vocabulários controlados como mostra a Figura 2. São
eles: lista, anel de sinônimo, taxonomia e tesauro. O direcionamento da régua mostra um
aumento da complexidade das estruturas existentes. Essa complexidade é determinada pelas
formas de relacionamentos que cada tipo de vocabulário possui.

�4

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

Figura 2 – Crescimento estrutural da complexidade
entre tipos de Vocabulário Controlado
Observando-se a Figura 2, percebe-se que taxonomia e o tesauro são os tipos mais
complexos, enquanto que a lista e o anel de sinônimos são mais simples. Enquanto o tesauro
possui vários tipos de controles e relacionamentos em sua estrutura de termos, tais como
ambiguidade, sinonímia, relações hierárquicas e associativas, a lista considerada simples, é
uma lista de palavras em ordem alfabética ou em outra lógica evidente, sem nenhum outro
tipo de controle ou relacionamento. Segundo a ANSI/NISO Z39.19 (2005), as listas são
utilizadas para descrever aspectos do conteúdo de objetos ou entidades que tem um número
limitado de possibilidades.
Este trabalho utiliza o tesauro, tipo de vocabulário controlado, devido à complexidade
(ambiguidade dos termos, sinonímia, relações hierárquicas e associativas) dos ofícios.
Em 1990, a Norma Internacional de Elaboração de tesauros ANSI/NISO Z39-19-1993,
publicada pela National Information Standards Organization (NISO), sediada nos Estados
Unidos, define tesauro como:
um vocabulário controlado organizado em uma ordem conhecida na qual as relações
de equivalência, de homografias, hierárquicas e associativas entre os termos são
claramente exibidas e identificadas por meio de indicadores de relação
padronizadas, que devem ser empregados de forma recíproca (ANSI/NISO Z39-191993)

É, portanto, como salienta Sales (2008, p. 103), “uma linguagem documentária
caracterizada pela especificidade e pela complexidade existente no relacionamento entre os
termos” que representam uma determinada área do conhecimento.
Quanto à funcionalidade dos tesauros, a norma ANSI-NISO Z39. 19-2003 define
quatro funções distintas: a tradução, meio pelo qual a linguagem natural dos autores,
indexadores e usuários é traduzida para um vocabulário controlado usado na indexação e
recuperação da informação. A consistência que promove a coerência na escolha dos termos no
processo de indexação. A indicação de relacionamentos, que indica os relacionamentos
semânticos, ou seja, de sentido e significado entre os termos. E a recuperação, que serve como
auxílio na busca e na recuperação de documentos.
Lancaster (1993) sugere como método para construir vocabulário controlado:
 Gerar vocabulário empírico com base em um conjunto representativo de documentos.
 Modificar um vocabulário existente.
 Extrair o vocabulário de outro já existente.
 Reunir termos de diferentes fontes: especialistas, dicionários, glossários, índices, etc.

�5

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

Como mostra a Figura 3, para a elaboração de um vocabulário controlado é necessário
que a linguagem natural do usuário seja traduzida para uma linguagem padronizada
construída através de termos/descritores que sintetizem o conteúdo do documento através do
processo de indexação. A partir destes termos são elaborados índices que norteiam a
construção das linguagens documentárias. A partir desta linguagem documentária obtém-se o
vocabulário controlado e, consequentemente, o tesauro.

Figura 3 – Construção de vocabulário controlado
Em 2005, a norma ANSI/NISO Z39.19, estabeleceu diretrizes e convenções
consideradas como “um conjunto de recomendações baseadas em técnicas e procedimentos
preferenciais” utilizadas para o conteúdo, visualização, construção, ensaios, manutenção e
gestão dos vocabulários controlados. A elaboração do vocabulário controlado deve ser
efetivada observando três importantes princípios:
 Definição do escopo ou significado dos termos;
 Relação de equivalência de sinônimos e quase sinônimos;
 Distinção entre homógrafos.
Essas diretrizes visam nortear e padronizar a construção de vocabulários controlados
para facilitar o processo de recuperação da informação.
No entanto, segundo Lancaster (2004, p. 88-89), alguns fatores podem afetar a
qualidade do processo de indexação e consequentemente a elaboração do vocabulário
controlado. Estes fatores podem estar ligados ao: indexador, vocabulário, documento,
processo e ambiente.
A inexistência de conhecimento prévio sobre o assunto, a excessiva ou falta de
experiência no ato de indexar, o nível de capacidade de concentração em processos
minuciosos e cansativos e da capacidade de leitura, compreensão e síntese dos textos, são
fatores que podem influenciar negativamente a qualidade da indexação realizada pelo
profissional indexador.
O tipo de sintaxe utilizada para a criação do vocabulário controlado, a falta de controle
da ambiguidade ou imprecisão dos termos, a eficiência da estrutura de classificação dos
termos escolhidos e a falta da disponibilidade de instrumentos auxiliares, por exemplo,
dicionários e glossários especializados, afetam diretamente o processo de indexação.
O processo de indexação também pode ser influenciado de acordo com as regras
estabelecidas para a indexação, o nível de produtividade exigida para a tarefa, a exaustividade
da indexação, definida por Lancaster (2003, p. 23) como sendo “[...] o emprego de termos em
número suficiente para abranger o conteúdo temático do documento de modo bastante

�6

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

completo”, e o tipo de indexação escolhida: por atribuição, onde os termos são selecionados a
partir do vocabulário controlado ou por extração, que utiliza a linguagem natural empregada
pelo autor do documento.
Vale ressaltar ainda, que a qualidade da indexação pode ser afetada por fatores
ambientais que agem diretamente no processo intelectual e na capacidade de concentração do
profissional indexador: temperatura (frio/calor), iluminação, ruídos, entre outros.
De acordo com Oliveira (2008) os Sistemas de Recuperação da Informação (SRIs)
foram criados para atender as necessidades de organização, gestão, acesso e recuperação da
informação de forma que as demandas informacionais sejam sanadas com maior rapidez.
Portanto, a qualidade da indexação e da construção do vocabulário controlado é de vital
importância para a alimentação do sistema e para nortear as estratégias de busca.
Os SRIs, em instituições, têm como objetivos coletar, organizar, preservar e
disponibilizar informações e a produção do conhecimento organizacional. Elaborar um
Sistema Inteligente em ambiente virtual proporciona uma maior visibilidade dos documentos
recebidos e produzidos, e viabiliza o acesso em qualquer tempo e lugar de forma rápida e
eficiente.
Essa disponibilidade de informações de fácil acesso em um único repositório contribui
para que as necessidades informacionais do usuário final sejam atendidas prontamente, e a
gestão documental se torne mais eficiente, segura e ágil. No entanto, para que o sistema possa
recuperar informações relevantes relacionadas a necessidade informacional, é de extrema
importância que os documentos sejam indexados de acordo com uma linguagem padronizada;
um vocabulário controlado. O vocabulário controlado tem por finalidade categorizar,
organizar e representar o conteúdo dos documentos e se torna um instrumento imprescindível
para ampliar a eficiência na recuperação da informação por Sistemas Inteligentes.
A análise do acesso de informações relacionadas a legislação e especificadamente a
portarias em alguns SRIs de instituições públicas que utilizam vocabulários controlados na
indexação de seus documentos mostraram alguns aspectos importantes que valem ser
ressaltados: no site do INMETRO1 por exemplo, foi observada a existência de várias bases de
dados distintas em um único repositório e campos com possibilidades de buscas padronizadas
que diminuem a polissemia dos termos e melhoram as chances de sucesso e precisão na
recuperação da informação. Já no portal da UFJF2 a categorização deste tipo de informação é
realizada apenas por ano e/ou número da portaria, sem campos que orientem ou possibilitem
uma busca avançada. Isto é um aspecto que limita o acesso ao documento, pois, o usuário
precisa ter um conhecimento prévio para ter acesso à informação desejada. Na UFSC3 a
pesquisa por portarias pode ser feita através de várias possibilidades de categorização e
critérios de pesquisa/classificação que podem refinar a procura, apresentando, assim, maior
relevância dos resultados obtidos. A UFAL4 também possui um sistema com campos
padronizados para estabelecer as estratégias de busca por portarias, o que favorece a
autonomia do usuário no processo de recuperação da informação.
O vocabulário controlado, portanto, é uma ferramenta importantíssima para a
representação da informação e padronização da linguagem a ser utilizada no momento da
busca. Os termos definidos na política de indexação e utilizados por SRIs norteiam o usuário
nas estratégias de busca, favorecendo a autonomia no acesso à informação, a ampliação da
relevância, precisão dos resultados, e agilidade no processo.

1

Instituto Nacional de Metrologia, Qualidade e Tecnologia – INMETRO. Disponível em: &lt;www.inmetro.gov.br/legislacao/&gt;.

2

Universidade Federal de Juiz de Fora – UFJF. Disponível em: &lt;http://www.ufjf.br/portal/legislacao/portariasufjf/&gt;.

3

Universidade Federal de Santa Catarina – UFSC. Disponível em: &lt;http://notes.ufsc.br/aplic/portaria.nsf&gt;.

4

Universidade Federal de Alagoas – UFAL. Disponível em: &lt;http://sistemas.ufal.br/portarias/&gt;.

�7

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

3 Materiais e métodos
3.1 O Sistema Proposto
Diante dos problemas encontrados no Departamento de Computação da UFVJM, tais
como a falta de organização dos ofícios, falta de padronização no armazenamento e,
consequentemente, difícil recuperação desses ofícios, foi proposto um Sistema Inteligente de
Indexação Automática, que possibilita o armazenamento de forma organizada, padronizada e
digital, facilitando a recuperação dos ofícios. O Sistema de Indexação foi uma estratégia
encontrada com o propósito de sanar essas deficiências, e se utiliza de estudos aprofundados
das Ciências da Informação junto às Ferramentas Computacionais que apoiam em todo o
processo.
A metodologia aplicada a este projeto foi uma pesquisa documental embasada nos
ofícios do Departamento de Computação da UFVJM para dar suporte ao Sistema de
Indexação Automática. Para o sistema proposto foi utilizada a linguagem de programação
JAVA Standard Edition e JAVA Enterprise Edition, bem como o banco de dados MYSQL para
armazenamento dos dados referentes aos atributos do sistema.

3.2 O algoritmo simplificado do sistema
Inicialmente, foi feita a construção de um vocabulário controlado, extraindo todos os
termos relevantes dos 239 ofícios, compreendidos entre o período de 2011 e 2014. Esse
vocabulário deu suporte a toda implementação do Sistema Inteligente de Indexação
Automática de ofícios do Departamento de Computação da Universidade Federal dos Vales
do Jequitinhonha e Mucuri. O conjunto de termos extraídos dos ofícios, chamado de Tesauro,
foi inserido no banco de dados do sistema, uma vez que ele define a união dos termos mais
representativos de todos os ofícios analisados do Departamento de Computação, e todas as
relações existentes entre estes termos, que serão utilizados para representar (indexar) os
ofícios. As relações de cada termo são definidas no Tesauro, assim, cada termo pode possuir
ou não termos afins. Por exemplo, o termo docente é definido no Tesauro possuindo os termos
afins: mestres, doutores, gestor, representante, avaliadores, professores, professor substituto,
professor avaliador, professor adjunto, professor assistente, professor temporário, professor
palestrante, e professor visitante.

3.2.1 Indexação de um Ofício
Quando um novo ofício é inserido, o sistema recupera todos os termos presentes neste
ofício e todo o conjunto de termos representativos do Tesauro (presente no banco de dados).
Os termos do ofício que acabam de ser inseridos no sistema são comparados aos termos do
Tesauro existente. Logo, todos os termos em comum, pertencentes aos dois conjuntos, são
selecionados para a criação de um novo Tesauro.
Após feita a interseção e criação do novo Tesauro, serão escolhidos três termos (valor
arbitrário e sujeito a mudança em estudos posteriores), mediante à pertinência dos mesmos,
que é definida por meio da contagem individual da ocorrência de cada termo em todos os
ofícios indexados na Base de Dados do Sistema. Quanto menor o número de ocorrências para
um determinado termo, pressupõe-se uma especificidade maior para aquele termo, já que ele
está inserido em um número menor de ofícios, tornando-o mais representativo.
Posteriormente, é feito um ranking com todas as pertinências e selecionado os três
primeiros termos do ranking – considerados os mais representativos do novo ofício a ser
indexado – e, então, o ofício é indexado a estes três primeiros termos e aos seus termos

�8

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

interligados, pré-definidos no Tesauro.

3.2.2 Recuperação de um Ofício
Para a recuperação de um ofício, o usuário precisará entrar com dados do expedidor,
data do ofício e termos chaves. O número de termos chaves desejados será escolhido pelo
usuário arbitrariamente (num total de no máximo cinco). Em seguida, com a ajuda do sistema,
que irá propor opções de termos chaves baseadas no Tesauro, e também possíveis expedidores
baseados nos usuários já cadastrados no sistema, o usuário preencherá os dados.
Após a inserção destes dados, o sistema realizará uma busca ao banco de dados,
recuperando todos os ofícios que se “ligam” (casam) a todos os dados fornecidos pelo
usuário. Ademais, o sistema ordenará o resultado de acordo com o peso de cada “ligação”
individual entre ofício e termo, que é definida pela combinação da pertinência do termo
(explicado anteriormente como a frequência do termo dentre todos os ofícios cadastrados no
sistema)

3.3 Exemplo de Indexação e Recuperação de um Ofício
Para exemplificar, foi feita a inserção de um ofício no sistema - conforme a Figura 4, e
em seguida, automaticamente, foi capturado todos os termos do ofício que fazem intersecção
com o conjunto representativo de termos.

Figura 4 – Modelo de ofício

�9

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

Dentre os termos intersecionados pertencentes aos conjuntos ofício e Tesauro, estão:
docentes, computação, gabinetes, e impressoras multifuncionais.
O sistema identificou quais dos termos mencionados acima possui menos ocorrências
no conjunto total de ofícios armazenados no sistema, para então conseguir analisar a
pertinência de cada termo e criar um Ranking. Neste caso, os três primeiros termos do
Ranking foram: impressora multifuncional, computação e gabinetes; o sistema excluiu o
termo docentes, pois este possui um número relativamente alto se comparado aos outros
termos, tornando-o um termo fraco para a indexação.
Em seguida, o sistema busca no Tesauro por todas as palavras interligadas aos três
primeiros termos do Ranking. Neste exemplo, os termos interligados foram: renovação de
garantia, decom, ufvjm e cômodos. Essas ligações e termos estão definidos em nosso Tesauro,
sendo o termo renovação de garantia ligado ao termo impressoras multifuncionais, decom e
ufvjm ligados à departamento de computação, e gabinetes ligado a cômodos.
Após a indexação do ofício aos três termos ranqueados e a todos os seus afins,
qualquer usuário poderá recupera-lo facilmente. Para recuperar o ofício indexado basta inserir
os dados relativos a esse ofício, que no caso seriam os termos indexados ao ofício, citados
acima. A Figura 5 mostra uma busca que retornaria o ofício indexado.

Figura 5 – Modelo da tela de busca do ofício
Nesse exemplo, foi inserido a data do ofício, expedidor e alguns dos termos indexados
– definidos pelo algoritmo do sistema quando o ofício foi adicionado – que neste caso foram:
cômodos e computação. Como mostra na Figura 5, à medida que é digitado os termos
desejados, o sistema propõe termos para guiar o usuário ao acesso direto do Tesauro do
Sistema, o que faz a busca se tornar eficaz.

�10

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

3.4 Algumas telas do Sistema de Indexação Automática
Conforme apresenta a Figura 6, o sistema tem como página principal uma tela para
login que permite o acesso ao sistema.

Figura 6 - Página principal do sistema de indexação

Figura 7 – Página de inserção de novo ofício no sistema
Conforme apresenta a Figura 7, o Sistema possui três caixas de entrada na aba de
anexar ofício: Destinatário, Data de Expedição, Assunto, e o botão para carregar ofício. A
indexação de um ofício só poderá ser efetuada por algum usuário cadastrado no sistema.

�11

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

3.3 Pendências do Sistema
Na medida em que novos ofícios são inseridos, novos termos podem se tornar eficazes
para representação dos ofícios do Departamento, e, portanto, terão de ser inseridos no Tesauro
do Sistema. Devido a necessidade de mecanismos para prover a atualização constante do
Tesauro, devido ao aumento de ofícios e, consequentemente, o aumento de novos termos que
possam vir a representar novos conteúdos, está-se desenvolvendo um algoritmo que propõe a
auto alimentação do Tesauro ao longo do ciclo de vida do Sistema, com a análise de
relevância de novos termos em novos ofícios que advirão.
Acredita-se que com esta metodologia será possível sanar a deficiência do
Departamento de Computação da UFVJM de maneira rápida e satisfatória.

4 Resultados parciais/finais
Os resultados parciais deste projeto são: o Tesauro, que já está concluído e o Sistema
Inteligente de Indexação Automática que está sendo desenvolvido. O desenvolvimento do
Sistema precisa ser concluído, alimentado e implantado, para verificar sua utilidade e precisão
na recuperação dos ofícios desejados.

5 Considerações parciais/finais
A partir do estudo sugerido neste projeto, elaborou-se um Sistema Inteligente de
Indexação Automática (ainda em desenvolvimento), através do uso de um vocabulário
controlado. O Sistema foi construído utilizando-se técnicas da biblioteconomia e de técnicas
computacionais, sendo um sistema que utiliza tanto das análises qualitativas – feita
inicialmente para a construção do vocabulário controlado por uma bibliotecária – quanto das
análises quantitativas – utilizadas no algoritmo de auto alimentação do vocabulário
controlado.
Sendo positiva a implementação do projeto, sugere-se que demais departamentos da
UFVJM utilizem do mesmo sistema para organizar seus documentos. Espera-se, com isso,
agilidade nos processos, bem como a satisfação do usuário final ao localizar o que procura.

6 Referências
ARAÚJO, Vera Maria Araújo Pegozzi de. Documentação, terminologia e linguística: uma
interface produtiva. Porto Alegre, 2006. Disponível em: &lt;www.ufrgs/termisul/biblioteca/
dissertacoes/dissertacao_2006_ARAUJO.pdf&gt;. Acesso em: 22 mar. 2016.
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 12676: Métodos para
análise de documentos – determinação de seus assuntos e seleção de termos de indexação.
FUJITA, Mariângela Spotti Lopes. A identificação de conceitos no processo de análise para
indexação. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 1, n. 1,
p. 60-90, jul./dez. 2003. Disponível em: &lt; www.unesp .br/revistadigital&gt;. Acesso em: 10 abr.
2016.
LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Fundamentos de metodologia
científica. 5. ed. São Paulo: 2003. 311p.

�12

XIX Seminário Nacional de Bibliotecas Universitárias
BIBLIOTECA UNIVERSITÁRIA COMO AGENTE DE SUSTENTABILIDADE INSTITUCIONAL

LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos,
2004.
NAVES, Madalena M. L. Estudo de fatores interferentes no processo de análise de assunto.
Persp. Ci. inf., Belo Horizonte, v. 6, n. 2, p. 189 -203, jul./dez. 2001.
NAVES. Madalena M. L. Estudo de fatores interferentes no processo de análise de assunto.
Perspectivas em Ciência da Informação, Belo Horizonte, v. 5, n. 2, p. 189-203, jul./dez. 2001.
OLIVEIRA, Carla Cristina Vieira de. A interação dos usuários da UFMG com o catálogo
online do sistema Pergamum. Belo Horizonte, 2008. Dissertação (mestrado em Ciência da
Informação) – Universidade Federal de Minas Gerais – Escola de Ciência da Informação.
ROUSSEAU, Jean Yves; COUTURE, Carol. Os fundamentos da disciplina Arquivística.
Lisboa: Publicações Dom Quixote, 1998. 356 p.
SALES, Rodrigo de; CAFÉ, Ligia.. Diferenças entre tesauros e ontologias. Perspect. ciênc.
inf., Belo Horizonte, v. 14, n. 1, p. 99-116, jan./abr. 2009. Disponível em:
&lt;http://www.scielo.br/scielo.php?script=sci_arttext&amp;pid=S141399362009000100008&amp;lng=en&amp;nrm=iso&gt;. Acesso em: 22 mar. 2016.
SOUZA, Geraldo Magela.Taxonomias: o que são e para que servem. Websinder. [S. l.], maio.
2010. Disponível em: &lt;http://webinsider.com.br/2010/05/11/taxonomias-o-que-sao-e-paraque-servem-1/ &gt;. Acesso em: 20 de mar. 2016.

�</text>
                </elementText>
              </elementTextContainer>
            </element>
          </elementContainer>
        </elementSet>
      </elementSetContainer>
    </file>
  </fileContainer>
  <collection collectionId="31">
    <elementSetContainer>
      <elementSet elementSetId="1">
        <name>Dublin Core</name>
        <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
        <elementContainer>
          <element elementId="50">
            <name>Title</name>
            <description>A name given to the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49036">
                <text>SNBU - Edição: 19 - Ano: 2016 (UFAM - Manaus/AM)</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="49">
            <name>Subject</name>
            <description>The topic of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49037">
                <text>Biblioteconomia&#13;
Documentação&#13;
Ciência da Informação&#13;
Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="41">
            <name>Description</name>
            <description>An account of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49038">
                <text>Tema: A biblioteca universitária como agente de sustentabilidade institucional.</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="39">
            <name>Creator</name>
            <description>An entity primarily responsible for making the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49039">
                <text>SNBU - Seminário Nacional de Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="45">
            <name>Publisher</name>
            <description>An entity responsible for making the resource available</description>
            <elementTextContainer>
              <elementText elementTextId="49040">
                <text>UFAM</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="40">
            <name>Date</name>
            <description>A point or period of time associated with an event in the lifecycle of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49041">
                <text>2016</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="44">
            <name>Language</name>
            <description>A language of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49042">
                <text>Português</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="51">
            <name>Type</name>
            <description>The nature or genre of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="49043">
                <text>Evento</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="38">
            <name>Coverage</name>
            <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
            <elementTextContainer>
              <elementText elementTextId="49044">
                <text>Manaus (Amazônia)</text>
              </elementText>
            </elementTextContainer>
          </element>
        </elementContainer>
      </elementSet>
    </elementSetContainer>
  </collection>
  <itemType itemTypeId="8">
    <name>Event</name>
    <description>A non-persistent, time-based occurrence. Metadata for an event provides descriptive information that is the basis for discovery of the purpose, location, duration, and responsible agents associated with an event. Examples include an exhibition, webcast, conference, workshop, open day, performance, battle, trial, wedding, tea party, conflagration.</description>
  </itemType>
  <elementSetContainer>
    <elementSet elementSetId="1">
      <name>Dublin Core</name>
      <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
      <elementContainer>
        <element elementId="50">
          <name>Title</name>
          <description>A name given to the resource</description>
          <elementTextContainer>
            <elementText elementTextId="50124">
              <text>Sistema Inteligente de Indexação Automática de Ofícios do Departamento de Computação da UFVJM.</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="39">
          <name>Creator</name>
          <description>An entity primarily responsible for making the resource</description>
          <elementTextContainer>
            <elementText elementTextId="50125">
              <text>Costa, Aline Pereira da; Almeida, Victor Oliveira; Pitangui, Cristiano Grijó; Andrade, Alessandro Vivas; Assis, Luciana Pereira</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="38">
          <name>Coverage</name>
          <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
          <elementTextContainer>
            <elementText elementTextId="50126">
              <text>Manaus (Amazonas)</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="45">
          <name>Publisher</name>
          <description>An entity responsible for making the resource available</description>
          <elementTextContainer>
            <elementText elementTextId="50127">
              <text>UFAM</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="40">
          <name>Date</name>
          <description>A point or period of time associated with an event in the lifecycle of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="50128">
              <text>2016</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="51">
          <name>Type</name>
          <description>The nature or genre of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="50130">
              <text>Evento</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="41">
          <name>Description</name>
          <description>An account of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="50131">
              <text>Este projeto tem por objetivo sanar uma deficiência do Departamento de Computação da UFVJM – Universidade Federal dos Vales do Jequitinhonha e Mucuri. Tal Departamento não possui um local tanto físico quanto digital para armazenar seus ofícios. A falta de uma organização eficiente e padronizada destes ofícios inviabiliza o acesso aos documentos e dispende muito tempo na localização e recuperação da informação, podendo trazer grandes prejuízos para a instituição. Visando solucionar o problema de recuperação e organização das informações contidas nos ofícios, propõe-se a criação de um Sistema Inteligente de Indexação Automática utilizando um vocabulário controlado, tesauro, para que seja possível localizar com rapidez o ofício desejado. É importante que o sistema esteja em ambiente virtual para que o acesso seja democratizado e o processo de tratamento de novos ofícios seja automatizado. O projeto permeia o espaço de 2011 a 2014, totalizando 239 ofícios, sendo estes a base para a criação do tesauro. Sendo positiva a implementação do projeto, sugere-se que os demais departamentos da UFVJM utilizem o mesmo sistema para organização dos seus documentos, ganhando agilidade nos processos e satisfação do usuário final na localização do que procura.</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="44">
          <name>Language</name>
          <description>A language of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="68028">
              <text>pt</text>
            </elementText>
          </elementTextContainer>
        </element>
      </elementContainer>
    </elementSet>
  </elementSetContainer>
</item>
