<?xml version="1.0" encoding="UTF-8"?>
<item xmlns="http://omeka.org/schemas/omeka-xml/v5" itemId="6717" public="1" featured="0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://omeka.org/schemas/omeka-xml/v5 http://omeka.org/schemas/omeka-xml/v5/omeka-xml-5-0.xsd" uri="http://repositorio.febab.org.br/items/show/6717?output=omeka-xml" accessDate="2026-06-17T14:00:53-07:00">
  <fileContainer>
    <file fileId="5779">
      <src>http://repositorio.febab.org.br/files/original/62/6717/SNBU2014_203.pdf</src>
      <authentication>fc405dec4c2cd31a41e64a0cc804632c</authentication>
      <elementSetContainer>
        <elementSet elementSetId="4">
          <name>PDF Text</name>
          <description/>
          <elementContainer>
            <element elementId="92">
              <name>Text</name>
              <description/>
              <elementTextContainer>
                <elementText elementTextId="75463">
                  <text>XVIII Seminário Nacional de Bibliotecas Universitárias
SNBU 2014

ESTUDO DE FREQUÊNCIA E CONSISTÊNCIA EM INDEXAÇÃO

Hugo da Silva Carlos
Débora Soares de Brito Zanard
Anderson Scaramello
RESUMO
Analisa a consistência da indexação de um texto por diferentes pessoas, com base em estudos
anteriores pertencentes à área que abordam a análise de consistência através de cálculo de
frequência e coincidência de termos indexados. Com os primeiros dados da pesquisa ainda em
andamento foi possível identificar a frequência e posteriormente outros índices serão
analisados.
Palavras-Chave: Indexação; Consistência na indexação; Recuperação da informação;
Bibliotecas universitárias.
ABSTRACT
Performs consistency analysis of indexation of a text done by different people, based on
previous published studies in the area on consistency analysis through calculation of
frequency and coincidence of indexed terms. With the initial data analysis still in progress
could be identified the frequency, however others indexes are still under examination.
Keywords: Indexation; Consistency in indexing; Information retrieval; University libraries.

1 INTRODUÇÃO
A indexação é uma atividade técnica que tem como finalidade a recuperação da
informação, onde o conteúdo é analisado e identificado por meio de palavras-chaves
(assuntos) para auxiliar na recuperação de dados relevantes e pertinentes existentes em um
banco de dados bem como identificação de informações úteis que satisfaçam as necessidades
informacionais, poupando o tempo do usuário e evitando a recuperação de itens de menor
relevância. Sendo a indexação uma atividade intelectual subjetiva, há uma variação na seleção
dos termos por indexadores diferentes para o mesmo texto, o que implica na variação de
consistência dos termos, que é definida como a medida de similaridade da reação de
diferentes seres humanos processando a mesma informação. O presente trabalho tem por
objetivo responder à questão de pesquisa: Qual a relação entre o maior grau de coincidência e

2635

�o número médio de termos empregados, ou seja, a consistência dos termos indexados por
diferentes pessoas?

2 REVISÃO DE LITERATURA
Existe vasta literatura sobre Indexação, e a consistência é um aspecto de grande
relevância:
“A consistência na indexação é um elemento característico tanto do processo quanto
do resultado do tratamento temático da informação. Ela se caracteriza pelo grau de
semelhança na representação da informação documentária de um documento por meio
de termos de indexação selecionados por um ou vários indexadores, resultando em um
índice de consistência.” (GIL LEIVA, RUBI E FUJITA, 2008, p. 234).

Os estudos mais comuns sobre consistência costumam dividir-se em duas vertentes:
aqueles que focam aspectos relativos aos indexadores e aqueles que procuram métricas a fim
de produzir dados quantitativos sobre o tema:
“[...] parte importante da literatura está dedicada à quantificação da consistência, ou
seja, à obtenção de índices de consistência que vão desde o 1 ao 100%, mediante
fórmulas diversas de semelhança entre indexações, apoiando-se em diferentes aspectos
como a experiência (indexadores principiantes ou indexadores experientes) ou as
tipologias documentais” (livros, patentes, artigos de revista, fotografias, etc). (GIL
LEIVA, RUBI E FUJITA, 2008, p. 235).

Optou-se pela realização de análises quantitativas sobre consistência, aspecto
característico da indexação, utilizando-se de fórmulas matemáticas empregadas em estudos
anteriores. Em trabalho de Gil Leiva, Rubi e Fujita (2008, p. 238) que propõe atribuição de
pesos aos descritores comparados entre duas indexações e são utilizados para aplicar a
fórmula matemática desenvolvida por Gil Leiva (2008, p. 236) que seja:
Tco

Cl = (_A + B ) - Tco

Onde:
Ci = Índice de consistência
Tco = Número de termos comuns nas duas indexações
A = Número de termos usados na indexação A
B = Número de termos usados na indexação B
Além da comparação entre duas indexações para validar a consistência, também se
utilizou para este trabalho a análise de frequência de ocorrência de termos entre diversos
indexadores sobre um mesmo texto, uma vez que a literatura da área relaciona a frequência de

2636

�ocorrência de uma palavra em um documento com a sua capacidade de melhor representar
tematicamente seu conteúdo:
“O método de freqüência de palavras foi o primeiro a surgir. Foi proposto por
Luhn em 1957 e 1958. O autor demonstrou em seus trabalhos que a freqüência
de uma palavra em documentos está diretamente relacionada com a
capacidade dessa palavra de/para representar o conteúdo do documento, a
nível de indexação e de recuperação da informação. As palavras mais
adequadas para a indexação serão as que possuírem média freqüência.”
(VIEIRA, 1988 p. 48-49).

3 MATERIAIS E MÉTODOS
O artigo de divulgação científica “Alteração genética gera tomates duplos: plantas
com produção aumentada de um determinado micro-RNA produzem frutos modificados”320 ,
de autoria de Maria Guimarães, texto com 466 palavras em 10 parágrafos em apenas uma
lauda (disponível em apêndice) foi selecionado como ponto de partida da pesquisa e deveria
ser indexado por usuários da biblioteca da Universidade Federal do ABC.
Para a pesquisa foram escolhidas pessoas sem treinamento em indexação,
considerando que isso deixaria os termos escolhidos mais próximos da experiência de um
usuário ao escolher palavras de forma espontânea em uma pesquisa no catálogo da biblioteca.
Juntamente com o artigo impresso, foram distribuídos formulários, pranchetas, lápis e
borrachas. Foram informados do objetivo da presente pesquisa e receberam instruções de
procedimento, para sua realização. Na abordagem foi explicado brevemente o que é
indexação, sua importância e finalidade.
Contamos com dez participantes no total, que após a análise do texto transcreveram no
anexo ou sublinharam no mínimo três termos, que representassem o conteúdo do artigo com a
finalidade de possibilitar sua localização em uma base de dados.
Na orientação, ressaltamos que assim como estava exposto no anexo, não havia
restrições ou critérios na escolha dos termos, os termos definidos pelo participante não
precisariam constar necessariamente no documento, poderiam ser escolhidos termos
compostos de mais de uma palavra, poderiam ser escolhidos quantos termos se desejasse,
porém no mínimo três e que não havia tempo pré-estabelecido para a conclusão. Por não
haver limite de tempo para a realização, os materiais foram devolvidos em momentos
diferentes, os participantes levaram em média de 10 a 30 minutos na execução da atividade.

320 Artigo disponível no sítio eletrônico: http://revistapesquisa.fapesp.br/2014/04/28/alteracao-genetica-geratomates-multiplos/

2637

�Os dados colhidos foram tabulados e utilizados para a obtenção das seguintes
informações:
• Frequência dos termos;
• Análise de coincidência entre pares de indexadores;
• Verificação de percentual de termos existentes e não existentes no corpo do
texto;
• Verificação da relação entre o maior grau de coincidência e o número médio de
termos empregados.
4 RESULTADOS PARCIAIS/FINAIS
Todos os voluntários indexaram o texto com mais de três (3) termos, que foi o mínimo
solicitado, havendo sido empregados em média seis (6) termos por indexador, sendo que três
voluntários empregaram nove (9) termos. O total de termos únicos utilizados foi de cinquenta
e quatro (54), onde apenas nove (9) deles ocorreram em mais de uma indexação.
Como este trabalho ainda está em andamento, apenas a primeira das análises
pretendidas foi realizada, ou seja, a verificação da frequência com que cada termo ocorreu
entre o grupo de voluntários, e esses dados são apresentados na tabela e quadro abaixo.

Quadro 5 - Nuvem de termos com a frequência de ocorrência de termos na
indexação
Luiz Queiroz
.
material genético agricultura
Genetica
m j_
D M A
IC C
Geraldo Silva
m iC rO -U lN A ID O tomateiro Micro-TomFábio Nogueira f|or (j0 tomateiro
mutação genética
agrícola- micro-Tom p
* . .
tomates mú|tip|os
anomalias genéticas

1111 ^

| U

“ | \

|\ |

engenharia genética

o i i f o ç ♦ 't o n c Ò P I I I P Í Í ç
diversos aspectos das plantas
p ia l IW O U a I lo g C I llO a o
controle da arquitetura vegetativa
arquitetura vegetativa .
Lázaro Peres ~
&gt; _ ■
hormônios vegetais

a|teraçao genetica'™te

to m a te s Esalcfusp gené-ca
W W W
formação de frutos manipulação genética
capacidade de se diferenciar Q K I A desenvolvimento de frutos
mutagênese
células variação nos tomates | \ |
órgão determinado produção controlada
anomalias genéticas em frutos diferenciação celular
genética e frutos
pesquisa genética
frutos modificados
t
. .
m,it=.rãn dônira
transgênia identidade celular
moléculas de RNA transgemcos mutaçao gemca
tomateiros
vegetais the Plant Journal
pesquisa

2638

�Tabela 1 - Termos tabulados, organizados por frequência em que apareceram entre as
dez indexações_______________________________ _______________________________
Termo
agrícola
agricultura
alteração genética
anomalias genéticas
anomalias genéticas em frutos
arquitetura vegetativa
biotecnologia
capacidade de se diferenciar
células
controle da arquitetura vegetativa
desenvolvimento de frutos
diferenciação celular
diversos aspectos das plantas
engenharia genética
Esalq-USP
Fábio Nogueira
flor do tomateiro
formação de frutos
frutos
frutos modificados
genética
genética e frutos
Geraldo Silva
hormônios vegetais
identidade celular - (Genética)
identidade das células
Lázaro Peres
Luiz Queiroz
manipulação genética
material genético
micro-RNA
micro-RNA 156
micro-Tom
miR 156
moléculas de RNA
mutação genética
mutação gênica
mutagênese
órgão determinado
orgãos vegetais
pesquisa
pesquisa genética
plantas transgênicas
produção controlada
RNA
the Plant Journal
tomateiro Micro-Tom
tomateiros
tomates
tomates múltiplos
transgênia
transgênicos
variação nos tomates
vegetais

Frequência
1
1
3
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
3
2
1
2
1
1
1
1
1
1
1
1
2
1
3
1
1
1
5
1
1
1
1
1

2639

�A nuvem de palavras apresena os dados sem hierarquia ou correlação entre elas,
porém permite visualizar os termos mais utilizados para indexação do artigo ao apresentar
palavras com tamanho da fonte proporcionais ao número de ocorrências utilizadas entre os
indexadores. Foi construída com o auxílio do sítio online wordle.net

, gerador de nuvens de

tags. As palavras mais frequentes foram: Tomate (05 ocorrências), Frutos (05 ocorrências),
seguidos de alteração genética (03 ocorrências), micro-RNA (03 ocorrências) e RNA (03
ocorrências).

5 CONSIDERAÇÕES PARCIAIS/FINAIS
Até o momento verificou-se a frequência dos termos entre as indexações apresentadas
na pesquisa. Constata-se que a análise de consistência pode colaborar significativamente na
investigação de outros aspectos relevantes da indexação de documentos, como por exemplo, a
relação da exaustividade da indexação com um número “ideal” de termos indexadores. A
análise dos dados também aponta a necessidade de realizar uma comparação de consistência
de indexação realizada de forma espontânea, como se propôs o estudo, com uma indexação
realizada com auxílio de vocabulário controlado, para que se promova a aplicação de uma
política de indexação cada vez mais eficaz e capaz de atender as expectativas de seu público
alvo.

6 REFERÊNCIAS
GIL LEIVA, Isidoro; RUBI, Milena Polsinelli; FUJITA, Mariângela Spotti Lopes.
Consistência na indexação em bibliotecas universitárias brasileiras. TransInformação,
Campinas, v. 20, n. 3, p. 233-253, 2008. Disponível em: &lt; http://periodicos.puccampinas.edu.br/seer/index.php/transinfo/article/view/523/503&gt;. Acesso em: 12 maio 2014.
GUIMARÃES, Maria. Alteração genética gera tomates duplos: plantas com produção
aumentada de um determinado micro-RNA produzem frutos modificados. Pesquisa Fapesp,
São

Paulo,

n.

218,

abr.

2014.

Disponível

em:

&lt;http://revistapesquisa.fapesp.br/2014/04/28/alteracao-genetica-gera-tomates-multiplos/&gt;.
Acesso em: 12 maio 2014.
PINHEIRO, Lena Vânia Ribeiro. Medidas de consistência da indexação: interconsistência.
Ci. Inf., Brasília, v. 7, n. 2, p. 109-114, 1978.

321 Disponível em: http://www.wordle.net/ acesso em maio 2014.

2640

�SOUSA, Sandra Cristina Santos. Consistência na indexação em bibliotecas universitárias
de enfermagem/saúde em Portugal. 2012. 152 f. Dissertação (Mestrado) - Programa de PósGraduação em Ciências da Informação e Documentação, Faculdade de Filosofia,
Universidade Católica Portuguesa. Disponível em: &lt; http://catalogo.braga.ucp.pt/&gt;. Acesso
em: 12 maio 2014.
VIEIRA, Simone Bastos. Indexação automática e manual: revisão de literatura. Ci. Inf.,
Brasília, 17 (1): 43-57, jan./jun. 1988.

APÊNDICE
Alteração genética gera tomates múltiplos
Plantas com produção aumentada de um determinado micro-RNA produzem frutos
modificados
MARIA GUIMARÃES | Edição Online 23:16 28 de abril de 2014

Que um tomate é redondo, ou talvez oval, ninguém duvida. Mas há quem tente entender por
quê. É o caso do grupo coordenado pelo engenheiro agrônomo Fábio Nogueira, da Escola
Superior de Agricultura Luiz de Queiroz, da Universidade de São Paulo (Esalq-USP). Eles
acabam de mostrar que pequenas moléculas de RNA são centrais na transformação do ovário,
na flor do tomateiro, em fruto. Em artigo publicado este mês na revista The Plant Journal,
eles mostram que um excesso dessas moléculas pode gerar tomates muito esquisitos, dos
quais brotam outros frutos - como se fossem braços ou verrugas múltiplas - e até mesmo
folhas ou flores.
“Um fruto é um órgão determinado”, explica Nogueira. “Depois que está feito, acabou.” É
diferente de outros órgãos, como por exemplo os caules: as células que fazem parte deles têm
a capacidade de se diferenciar em outros tipos de células e dar origem a outras partes da
planta, como folhas e espinhos. Estudos de outros grupos já sugeriam que esse trecho do
material genético - um micro-RNA identificado como miR 156 - afeta a identidade das
células no que diz respeito à capacidade de se diferenciar.
Nogueira tinha detectado essas moléculas em seus trabalhos com cana-de-açúcar que, por
motivos óbvios, não é um bom modelo para investigar a formação de frutos. Os tomateiros
em miniatura do tipo Micro-Tom cultivados pelo grupo do agrônomo Lázaro Peres, na Esalq,
são ideais para esse tipo de pesquisa não só por ocuparem menos espaço mas também por
serem mais fáceis de manipular geneticamente. Para esse trabalho, pesquisa de mestrado de

2641

�Geraldo Silva, o grupo usou plantas transgênicas que produziam um excesso do micro-RNA
156 e examinou todos os frutos que nasceram. Em todas as plantas, observaram alterações nos
frutos. “Chegamos a ver até primórdios de órgãos florais brotando dos tomates”, conta
Nogueira.
Para ele, entender essa via de regulação é importante não só pelo conhecimento científico,
mas também por motivos comerciais. “Entender o que está por trás da variação nos tomates
pode permitir alterar o formato dos frutos e aumentar a produção e a aceitação”, exemplifica.
Os tomateiros mutantes também são menos produtivos em termos do número de frutos. No
doutorado, Silva vai investigar a relação entre os micro-RNAs e os hormônios que regulam
diversos aspectos das plantas, como o seu crescimento.

Projeto
Análise funcional do papel de micro-RNAs no controle da arquitetura vegetativa e
desenvolvimento

de

Regular Pesquisador

frutos

(n°

2012/51146-2); Modalidade Auxílio

responsável Fabio

Tebaldi

Silveira

à Pesquisa

Nogueira

-

(Esalq-

USP) Investimento R$ 320.851,93 (FAPESP).
Artigo científico
SILVA G. F. F. et al. MicroRNA156-targeted SPL/SBP-box transcription factors regulate
tomato ovary and fruit development. The Plant Journal. 7 abr 2014.

Fonte: http://revistapesquisa.fapesp.br/2014/04/28/alteracao-genetica-gera-tomates-multiplos/

2642

�Formulário de coleta de assuntos

Introdução:

A presente pesquisa quer saber que palavras as pessoas escolheriam para representar este
texto, esta atividade é conhecida como Indexação, processo de identificar palavras-chaves
(assuntos) que poderiam auxiliar na busca do tema.

Instruções para a indexação:

Leia o artigo e, segundo sua opinião, escolha livremente palavras que representem-no e
possam auxiliar sua recuperação em bancos de dados.

Observações:

•

Não há restrições ou critérios na escolha dos termos;

•

Os termos selecionados não precisam necessariamente constar no texto;

•

Podem também ser utilizados termos compostos (ex.: análise de conteúdo, modelos de
análise de documentos, etc.);

•

Utilize no mínimo três termos;

•

Não há limite de tempo para conclusão.

2643

�</text>
                </elementText>
              </elementTextContainer>
            </element>
          </elementContainer>
        </elementSet>
      </elementSetContainer>
    </file>
  </fileContainer>
  <collection collectionId="62">
    <elementSetContainer>
      <elementSet elementSetId="1">
        <name>Dublin Core</name>
        <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
        <elementContainer>
          <element elementId="50">
            <name>Title</name>
            <description>A name given to the resource</description>
            <elementTextContainer>
              <elementText elementTextId="71368">
                <text>SNBU - Edição: 18 - Ano: 2014 (UFMG - Belo Horizonte/MG)</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="49">
            <name>Subject</name>
            <description>The topic of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="71369">
                <text>Biblioteconomia&#13;
Documentação&#13;
Ciência da Informação&#13;
Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="41">
            <name>Description</name>
            <description>An account of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="71370">
                <text>Tema: Bibliotecas Universitárias e o Acesso Público à Informação: articulando leis, tecnologias, práticas e gestão</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="39">
            <name>Creator</name>
            <description>An entity primarily responsible for making the resource</description>
            <elementTextContainer>
              <elementText elementTextId="71371">
                <text>SNBU - Seminário Nacional de Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="45">
            <name>Publisher</name>
            <description>An entity responsible for making the resource available</description>
            <elementTextContainer>
              <elementText elementTextId="71372">
                <text>UFMG</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="44">
            <name>Language</name>
            <description>A language of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="71373">
                <text>pt</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="51">
            <name>Type</name>
            <description>The nature or genre of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="71374">
                <text>Evento</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="38">
            <name>Coverage</name>
            <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
            <elementTextContainer>
              <elementText elementTextId="71375">
                <text>Belo Horizonte (Minas Gerais)</text>
              </elementText>
            </elementTextContainer>
          </element>
        </elementContainer>
      </elementSet>
    </elementSetContainer>
  </collection>
  <itemType itemTypeId="8">
    <name>Event</name>
    <description>A non-persistent, time-based occurrence. Metadata for an event provides descriptive information that is the basis for discovery of the purpose, location, duration, and responsible agents associated with an event. Examples include an exhibition, webcast, conference, workshop, open day, performance, battle, trial, wedding, tea party, conflagration.</description>
  </itemType>
  <elementSetContainer>
    <elementSet elementSetId="1">
      <name>Dublin Core</name>
      <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
      <elementContainer>
        <element elementId="50">
          <name>Title</name>
          <description>A name given to the resource</description>
          <elementTextContainer>
            <elementText elementTextId="75455">
              <text>Estudo de frequência e consistência em indexação</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="39">
          <name>Creator</name>
          <description>An entity primarily responsible for making the resource</description>
          <elementTextContainer>
            <elementText elementTextId="75456">
              <text>Carlos, Hugo da Silva, Zanard, Débora Soares de Brito, Scaramello, Anderson</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="38">
          <name>Coverage</name>
          <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
          <elementTextContainer>
            <elementText elementTextId="75457">
              <text>Belo Horizonte (Minas Gerais)</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="45">
          <name>Publisher</name>
          <description>An entity responsible for making the resource available</description>
          <elementTextContainer>
            <elementText elementTextId="75458">
              <text>UFMG</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="40">
          <name>Date</name>
          <description>A point or period of time associated with an event in the lifecycle of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="75459">
              <text>2014</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="44">
          <name>Language</name>
          <description>A language of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="75460">
              <text>pt</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="51">
          <name>Type</name>
          <description>The nature or genre of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="75461">
              <text>Evento</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="41">
          <name>Description</name>
          <description>An account of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="75462">
              <text>Analisa a consistência da indexação de um texto por diferentes pessoas, com base em estudos anteriores pertencentes à área que abordam a análise de consistência através de cálculo de frequência e coincidência de termos indexados. Com os primeiros dados da pesquisa ainda em andamento foi possível identificar a frequência e posteriormente outros índices serão analisados.</text>
            </elementText>
          </elementTextContainer>
        </element>
      </elementContainer>
    </elementSet>
  </elementSetContainer>
</item>
