<?xml version="1.0" encoding="UTF-8"?>
<item xmlns="http://omeka.org/schemas/omeka-xml/v5" itemId="5406" public="1" featured="0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://omeka.org/schemas/omeka-xml/v5 http://omeka.org/schemas/omeka-xml/v5/omeka-xml-5-0.xsd" uri="http://repositorio.febab.org.br/items/show/5406?output=omeka-xml" accessDate="2026-05-28T07:13:34-07:00">
  <fileContainer>
    <file fileId="4473">
      <src>http://repositorio.febab.org.br/files/original/47/5406/SNBU2006_208.pdf</src>
      <authentication>d684bc628b4a05334214b30f69b1f7a4</authentication>
      <elementSetContainer>
        <elementSet elementSetId="4">
          <name>PDF Text</name>
          <description/>
          <elementContainer>
            <element elementId="92">
              <name>Text</name>
              <description/>
              <elementTextContainer>
                <elementText elementTextId="58558">
                  <text>METADADOS E SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO ON LINE:
UMA QUESTÃO DE SEMÂNTICA?1
Mônica de Fátima Loureiro
Doutoranda em Ciência da Informação
Escola de Comunicações e Artes (ECA) – Universidade de São Paulo (USP)
Brasil
monicaeros@hotmail.com
Marivalde Moacir Francelin
Doutorando em Ciência da Informação
Escola de Comunicações e Artes (ECA) – Universidade de São Paulo (USP)
Brasil
Bolsista Capes
mfrancelin@yahoo.com.br

EIXO TEMÁTICO: O Impacto das Tecnologias Eletrônicas e sua Mediação
Resumo
Problemas que interferem na comunicação humana mediada por computador, mais
especificamente as pesquisas sobre a interação homem-máquina, são os grandes desafios
que se apresentam à comunidade científica na contemporaneidade. Os sistemas
especializados de informação das universidades, que incorporam ferramentas
desenvolvidas com base em metadados, na perspectiva da WEB semântica, podem ilustrar
esse problema. A mobilização interdisciplinar de campos como a filosofia, a lingüística, a
neurociência e as ciências cognitivas, entre outras, aliada às tecnologias de informação,
sugerem respostas para esses problemas, apontando também para novas formas de
mediação da informação. Dessa forma, procura-se discutir, com base na literatura nacional
e internacional da Ciência da Informação, o desenvolvimento conceitual do termo metadado,
as principais linguagens de tratamento de dados e, principalmente, as questões semânticas
presentes nos ambientes de recuperação da informação on line. As pesquisas
contemporâneas indicam que a eficácia dos sistemas de informação depende da
incorporação de um mínimo semântico que opere como a base do entendimento mútuo
entre homem e máquina. Sistematiza-se, por fim, a importância deste tema para o
profissional da informação que atua em ambientes de ensino e pesquisa, como também
seus possíveis impactos no saber-fazer cotidiano.
Palavras-chave: metadados; sistemas de recuperação da informação; WEB semântica,
Ciência da Informação.

1

Trabalho desenvolvido a partir da disciplina Produção e Disseminação de Informações Documentárias no
Mundo Contemporâneo, ministrada pela Professora Dra. Nair Yumiko Kobashi no primeiro semestre de 2006,
do Programa de Pós Graduação em Ciência da Informação da Escola de Comunicações e Artes (ECA),
Universidade de São Paulo (USP).

�2

1 INTRODUÇÃO
Este trabalho procura refletir sobre alguns conceitos considerados importantes:
metadados e web semântica, abordando, de forma sucinta, algumas de suas
aplicações, além de destacar a postura do Profissional da Informação (PI) nesse
contexto. Relacionam-se algumas questões específicas sobre o ambiente on line e
os Sistemas de Recuperação da Informação (SRI), na perspectiva da web
semântica, levando em consideração o elemento humano na interação com a
máquina, de maneira que ela “entenda”, minimamente, o que lhe é exposto e/ou
requisitado e responda de maneira adequada.
De certa maneira, isto já nos foi anunciado pelo advento da Internet que,
tradicionalmente e popularmente, entendemos como algo que nos liga ao mundo.
Segundo Rowley (2002, p.187), “A internet é um conjunto de redes de
computadores, interligadas, ou seja, uma rede de redes”. É um sistema que permite
comunicação imediata com qualquer pessoa, em qualquer parte do globo – desde
que existam os recursos técnicos e tecnológicos necessários. Essa caracterização
da internet, para ser mais precisa, requer a discussão de elementos que nos
permitam vê-la como um ambiente que é mais do que um simples veículo de
comunicação e interação.
A internet se populariza a partir dos anos de 1990 e se massifica a partir de
2000. Incluímos nessa massificação não apenas aqueles que têm acesso a ela, mas
também aqueles que sabem que ela existe ou dela já fizeram uso. Assim como em
uma biblioteca comum, fazer uso pode ter vários significados, que varia desde a
entrada do indivíduo no ambiente, a consulta ao catálogo e/ou estante, a seleção e
retirada do material até uma suposta aquisição de conhecimento a partir de uma
informação obtida. O exemplo pode ser bem demonstrado em um ambiente físico,
com controle e auxílio especializado permanentes; mas, como seria a mesma busca
em um ambiente virtual, onde o único objeto com que se tem contato direto é a
máquina, interligada a uma rede, que contêm um volume de informações muito
maior do que qualquer biblioteca? A mudança do ambiente informacional físico para
o virtual fez com que aqueles que lidam com a informação, visando ao seu
tratamento, armazenamento e recuperação, adotassem novas posturas diante das
ferramentas de recuperação de informações em meio digital.

�3

Segundo Méndez Rodríguez (2002, p.19):
La información y las tecnologías aplicadas a la información se han convertido
ya en un punto crítico para la ciencia, la investigación y la empresa de nuestro
tiempo. Se promueve el acceso universal a las fuentes de información gracias
al crecimiento y desarrollo de las redes de telecomunicaciones, especialmente
de Internet y, sobre todo de la Word Wide Web. En menos de diez años, la
Web ha pasado de ser un sistema casi esotérico, utilizado por una comunidad
limitada de investigadores, a ser un almacén de datos ingente, universal,
abierto, multitemático y multilingüe, así como a considerarse una de las
herramientas por antonomasia para obtener información. Cada vez más se
están usando nuevas formas de representación de un conocimiento, distintas
del texto lineal impreso. Estos nuevos tipos de publicación digital – desde el
texto, hasta una grabación sonora o de vídeo, pasando por un mensaje de
correo electrónico, el código fuente de un programa de ordenador para el
cálculo de resultados, etc. – han multiplicado las formas de comunicación
científica, involucrando un proceso sin precedentes […]

Um dos pontos fundamentais, nessa nova tomada de posição, foi entender o
que são e como surgiram tais mídias, que na Sociedade da Informação (SI) estão
imbricadas às Tecnologias de Informação e Comunicação (TIC). Esse contexto foi e
ainda é bem explorado pela literatura no campo da Ciência da Informação
(MATTELART, 2002; 2005; TAKAHASHI, 2000). Os aspectos sócio-políticos,
culturais e econômicos, que norteiam o desenvolvimento das TIC e da SI são
importantes para as pesquisas sobre o acesso à informação. Outro ponto
fundamental, que está intimamente ligado à internet, está, igualmente, tomando
corpo nas pesquisas da área, ou seja, os Sistemas de Recuperação da Informação
(SRI) on line.
A internet é um repositório de informações. Boa parte delas não é recuperável,
outra parte recuperável, mas de maneira precária, e uma pequena parcela pode ser
recuperada com alguma exatidão – geralmente, aquelas que estão relacionadas às
bibliotecas ou a algum tipo de sistema especializado de informação. Essa situação
não se colocava como problemática enquanto o paradigma virtual estava
aparentemente distante de se tornar realidade; porém, atualmente, os problemas
têm se agravado, pelo crescimento da demanda informacional, e pelo aumento da
exigência do público usuário, por informações exatas e precisas em relação às suas
necessidades: tudo isso, no menor tempo possível.
Hoje, a “realidade” virtual é fato. Estamos tão dependentes dos sistemas on
line que poderíamos dizer que eles sempre existiram. Entramos no século XXI, não
mais com a perspectiva de um mundo virtual, mas como uma sociedade
tecnologicamente conectada, que faz comércio, política e cultura pela rede. É uma

�4

sociedade que se vê dividida e subdividida em comunidades virtualmente ligadas,
porém, que não existem na forma física e que talvez nunca existirão na forma de
grupos físicos, como tradicionalmente os conhecemos. E, assim como a sociedade
real, essa sociedade que chamamos virtual também consome, usa, produz
informação e conduz a uma nova forma de conhecimento. De acordo com San
Segundo Manuel (2003, p.50), “El conocimiento, por tanto, puede articularse, en la
actualidad, como un tipo de conocimiento artificial, o como información electrónica
útil, o bien como información en potencia desde una perspectiva pragmática.”
O ambiente virtual é, de fato, mais complexo do que o das bibliotecas e, o que
é mais importante: ele surgiu e se desenvolve, a cada dia, de maneira desordenada.
Compreendemos bem as estruturas, metodologias e conceitos que fazem parte dos
SRI das bibliotecas tradicionais porque nós os construímos, mas conhecemos muito
pouco dos pormenores técnicos deste ambiente virtual.
Em termos de bibliotecas e centros de informação em geral, criamos sistemas,
metodologias e ferramentas sofisticadas para o tratamento, armazenamento e
recuperação da informação. Alguns desses procedimentos foram adaptados para o
ciberespaço e outros precisam ser criados, considerando a informação eletrônica
sem um similar físico, ou seja, constituída puramente em meio virtual. Assim,
comparando os centros de informação físicos como bibliotecas, centros de
informação entre outros, com a internet, mesmo considerando os domínios que
precisam ser respeitados, percebemos que esse novo e enorme universo
informacional não foi criado por nós e, por isso, suas ferramentas de
armazenamento, tratamento e recuperação nos parecem, muitas vezes, estranhas,
apesar de algumas semelhanças de formatos de entrada de dados.
Embora nossos catálogos tradicionais pareçam ser extremamente sofisticados
e as ferramentas de tratamento muito avançadas, ao considerar o ambiente virtual,
as informações/dados devem ser traduzidas para uma linguagem que a máquina
também possa “entender”. Os catálogos físicos tradicionais não precisavam ser
legíveis por computadores. Os usuários tinham acesso direto a eles e encontravam
informações organizadas com base em alguma norma, norma essa que fazia parte
de um sistema pré-estabelecido pela própria biblioteca. Ou seja, havia todo um
controle, desde o vocabulário empregado até a conduta de acesso e uso do
material. Se o usuário precisasse de um intermediário, ele encontraria uma pessoa

�5

especializada disponível para auxiliá-lo. No entanto, no ambiente virtual, a dinâmica
de organização e uso é bastante diferenciada, pois como destacou Svenonius
(2001), com a revolução computacional houve uma mudança na natureza das
entidades a serem organizadas e, além disso, mudaram também os próprios meios
de sua organização.
No ciberespaço, a inclusão das informações não segue, via de regra, qualquer
tipo de norma ou padrão que possa facilitar o processo de recuperação. Além disso,
o volume de informação contida na rede é muito maior do que nos é apresentado
pelos buscadores. Sem dúvida, estamos diante de um novo contexto informacional
que temos que entender, em especial, os conceitos, linguagens e ferramentas que
lhe são característicos.
2 SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO ON LINE: METADADOS E
WEB SEMÂNTICA
Ao longo da história vários autores de vários campos do saber fizeram
previsões, com bases em estudos científicos e/ou mesmo através da ficção e da
literatura, apontando para uma nova realidade social: algumas se concretizaram,
principalmente aquelas relacionadas às tecnologias da informação (LÉVY, 1993;
1996; 2000; TAKAHASHI, 2000; CASTELLS, 2002). Exemplo emblemático parte,
justamente, da chamada SI: ela não se configura apenas pela web mas, também,
por uma série de mudanças ocorridas no campo das comunicações (mídias
radiofônicas, televisivas e impressas), na economia e na educação, entre outros
exemplos. Entendemos que o aspecto mais marcante da SI é o desenvolvimento da
Internet. Mattelart (2002) destaca a necessidade de um olhar crítico sobre este
período, no qual estamos imersos, para fugir da tecnofobia, deixando claro que o
sonho e a ilusão de um mundo mais solidário, a partir da instauração da SI, não foi
concretizado. Esta não é uma posição contra o avanço tecnológico, mas, um olhar
realista que consegue perceber as movimentações e manipulações de interesse
hegemônico capitalista como pano de fundo desses avanços.
Criada no período da Guerra Fria (SOUZA; ALVARENGA, 2004), a internet
tinha por objetivo conectar computadores, facilitando a troca de informações; apenas
algum tempo depois é que surge a World Wide Web (WWW), “a grande teia” ou a
“teia global”, também chamada simplesmente de web. Esse ambiente trouxe uma
nova perspectiva para a internet, estimulando interfaces e possibilitando tratamento,

�6

acesso e recuperação de documentos on line. De acordo com Souza e Alvarenga
(2004, p.132), a web surge nos anos de 1990 sendo atualmente
[...] tão popular e ubíqua, que, não raro, no imaginário dos usuários,
confunde-se com a própria e balzaquiana Internet – a infra-estrutura de
redes, servidores e canais de comunicação que lhe dá sustentação. Se a
Internet surgiu como proposta de um sistema distribuído de comunicação
entre computadores para possibilitar a troca de informações na época da
Guerra Fria, o projeto da web, ao implantar de forma magistral o conceito de
hipertexto imaginado por Ted Nelson &amp; Douglas Engelbart (1962), buscava
oferecer interfaces mais amigáveis e intuitivas para a organização e o
acesso ao crescente repositório de documentos que se tornava a Internet.
Entretanto, o enorme crescimento – além das expectativas – do alcance e
tamanho desta rede, além da ampliação das possibilidades de utilização,
fazem com que seja necessária uma nova filosofia, com suas tecnologias
subjacentes, além da ampliação da infra-estrutura tecnológica de
comunicação.

No entanto, a recuperação de informações na web ainda é limitada pela falta
de padrões adequados de tratamento da informação ao ser inserida na rede. A
eficiência dos “motores de busca”, como o Google e o Yahoo, por exemplo, é parcial
e imprecisa devido, em grande parte, a essa falta de padronização. Na tentativa de
solucionar este problema foram desenvolvidas as chamadas “linguagens de marca”
ou “linguagens de marcação”.
Em certa medida, as linguagens de marcação (markup languages),
representadas pelo Hyper Text Markup Languages (HTML), eXtensible Hyper Text
Markup Language (XHTML), Standard Generalized Markup Language (SGML) e
eXtensible Markup Language (XML) “[...] permitem a construção de padrões públicos
e abertos que estão sendo criados para se tentarem maiores avanços no tratamento
da informação: elas minimizam o problema de transferência de um formato de
representação para outro e liberam a informação das tecnologias de informação
proprietárias.” (BAX, 2001, p.32). Estas linguagens são constituídas de metadados,
que facilitam a recuperação da informação e apontam para uma revolução na busca
por informações no ambiente on line, pois tem como intenção permitir efetuar buscas
não apenas por palavras ou termos, porém, pelo conteúdo semântico do documento;
daí o aparecimento do termo web semântica.
Genericamente, os metadados são entendidos como dados sobre dados ou
dados estruturados sobre dados. Aparentemente, a definição apresenta-se de
maneira simples, mas o conceito de metadados toma proporções maiores quando
tentamos analisá-lo levando em consideração sua etimologia e aplicações. Segundo
Méndez Rodríguez (2002, p.30), metadados seriam “[...] datos {junto a / después de

�7

/ entre / con...} los datos”. A autora lembra que a difusão do termo metadado se deu
com a internet e com a web, porém ele já existia, ao menos, desde a década de
1970. Mas seu uso inicial não tinha nenhum compromisso semântico, apenas
designando uma espécie de marca comercial, o que não passa de curiosidade
histórica no desenvolvimento do termo.
Apesar do conceito de metadados, segundo Marcondes (2006, p.96), não estar
restrito à “descrição” e à recuperação da informação, o padrão Dublin Core parece
apropriado para esta tarefa. De acordo com Souza et al. (2000, p. 93):
Dublin Core pode ser definido como sendo o conjunto de elementos de
metadados planejado para facilitar a descrição de recursos eletrônicos.
Metadado significa dado sobre o dado. É a catalogação do dado ou
descrição do recurso eletrônico. A expectativa é que autores ou WEBsiters
sem conhecimento de catalogação sejam capazes de usar o Dublin Core
para descrição de recursos eletrônicos, tornando suas coleções mais
visíveis pelos engenhos de busca e sistemas de recuperação.

As autoras já citadas lembram que o Dublin Core não tem a intenção de
substituir modelos mais completos e abrangentes como o Anglo American
Cataloguing Rules (AACR2) e o MAchine Readable Catalog (MARC), mas apenas
auxiliar especialistas e não especialistas em catalogação, na descrição de
elementos básicos para a representação de uma informação e/ou de um documento
on line.
A finalidade principal dos metadados é documentar, com elementos
descritores, qualquer tipo de recurso disponível na Web, para permitir
comunicabilidade e interoperabilidade entre sistemas. A adoção de padrões de
metadados permite com mais facilidade o estabelecimento de mecanismos de
importação e exportação de informações, assim como a criação de uma visão
integrada dos dados de uma organização. Além disso, permite que agentes
inteligentes não somente possam intercambiar informações, mas também que
possam transferir para um sistema um conhecimento semântico estruturado,
que é a base da Web semântica (CAMPOS et al., 2006, p.60).

Estudos de Ingwersen (2002) abordam com profundidade a interação entre os
SRI e os estudos cognitivos, destacando pontos importantes no desenvolvimento e
aprimoramento desses sistemas, como: a) a necessidade de conhecimentos por
parte do projetista de um SRI do conhecimento anterior (ou background) de sua
população usuária, em dado domínio; b) a necessidade de um SRI, a partir da
diversidade de níveis culturais e educacionais de seu público, fazer agrupamentos a
partir de categorias, os chamados agrupamentos categoriais e, também, fazer
agrupamentos chamados situacionais.

�8

Ingwersen (2002, p. 129), conceitua a classificação categorial como aquela
onde “[...] os indivíduos selecionam um conceito abstrato e escolhem os objetos que
podem ser inseridos sob este conceito”. Já a classificação situacional é aquela onde
“[...] os indivíduos envolvem os objetos em diferentes situações concretas, de tal
modo agrupando objetos que pertencem ao mesmo conjunto” (INGWERSEN, 2002,
p. 129).
Podemos destacar que a necessidade dos usuários frente a um SRI é bastante
ligada aos estudos cognitivos humanos que precisam ser inseridos e aprofundados,
no campo da Ciência da Informação, visando a uma melhor recuperação de
informação. Além disso, não se pode pensar em usuários individuais e sim
considerar coletivos no processo de recuperação de informação na internet, mesmo
dentro de um domínio específico.
Nesse sentido, entendemos que as relações disciplinares da Ciência da
Informação com outros campos do saber se desenvolveram e estão se
desenvolvendo por incursões teóricas e práticas, especificamente em áreas como a
lingüística, a filosofia da linguagem, a filosofia cognitiva e a computação. No Brasil,
tais incursões podem ser observadas através dos trabalhos de Cintra et al. (2002),
Campos (2001), Lima (2003), Mendonça (2000), Borges et al. (2003), por exemplo.
Em língua estrangeira podemos citar os trabalhos de Blair (1990; 2006), Sowa
(2000), Svenonius (2001; 2004), Frohmann (2004), Hjorland (2003), Hemalata
(1995), Hutchins (1978), por exemplo. São trabalhos com características distintas,
uns mais sistemáticos e aplicados, outros mais teóricos, de cunho filosófico, porém,
pode-se dizer que a principal preocupação das abordagens das obras citadas é a
representação e a recuperação da informação. Nesse sentido, constituem um
grande painel interdisciplinar de estudos sobre a linguagem, o conceito e as
questões gerais sobre referência e significado no âmbito lingüístico e cognitivo.
Eventos da área de Ciência da Informação, dentre os quais destacamos a
International Society for Knowledge Organization (ISKO), cujo tema para 2007 é “La
interdisciplirariedad y la transdisciplinariedad en la organización del conocimiento
científico”,

enfatizam,

justamente,

pesquisas

interdisciplinares

entre

Lógica,

Lingüística, Ontologias e Organização do conhecimento, principalmente no ambiente
on line.

�9

Enquanto pesquisadores da informação precisamos entender a informação não
apenas enquanto veículo de comunicação, mas, também, enquanto processos de
significação para a construção de conhecimento. A informação é transmitida pela
linguagem, seja ela falada, escrita ou visual, e comporta elementos de significado,
porém, esses elementos, para terem sentido e serem apropriados, deverão fazer
parte do universo discursivo e simbólico daquele que os irá receber, seja ele
chamado de receptor, destinatário ou usuário.
O universo discursivo é constituído por comunidades lingüísticas distintas que
estão, via de regra, fora do alcance dos sistemas de recuperação da informação,
pois, estes sistemas não foram construídos a partir delas, mas sim a partir de
linguagens que podemos chamar, com algum cuidado, de universais, científicas ou
artificiais. Não queremos dizer que o sentido do termo ou do conceito foi eliminado
no momento de sua representação, pelo contrário, sentido há, mas restrito a uma
comunidade discursiva especializada.
A carga semântica de um termo, conceito ou de uma frase toma outras
proporções no ambiente web, pois trata-se se um sistema aberto, utilizado e
alimentado tanto por especialistas como por não especialistas (o termo especialista
significa, aqui, aqueles que têm domínio sobre a linguagem de um determinado
campo de estudos, seja ele profissional ou cientista, ou domínio sobre as
ferramentas de tratamento, um bibliotecário, por exemplo) e no qual se usa tanto a
linguagem natural quanto as linguagens construídas. Apesar de a web se pretender
universal, a linguagem nela utilizada não o é, por ser constituída por comunidades
discursivas distintas. O que precisamos saber é se as regras discursivas utilizadas
no ambiente “real” em determinada comunidade de significação são as mesmas que
os seus membros usam no ambiente web. Tudo indica que sim, portanto,
precisamos entender tais comunidades e identificar padrões para que possamos
melhor representar informações que elas necessitam.
No ambiente web algumas teorias sobre a linguagem e o seu tratamento são
de difícil aplicação, pois entre o usuário e a informação está a máquina. O usuário
precisa interagir com a máquina para recuperar o que precisa e esta última precisa
“entender”, de alguma maneira, o que lhe está sendo solicitado.
Uma possibilidade desse “entendimento” está sendo desenvolvida através do
que se vem chamando de web semântica. Segundo Berners-Lee (2001) apud Souza

�10

e Alvarenga (2004, p.133) “A web semântica não é uma web separada, mas uma
extensão da atual. Nela a informação é dada com um significado bem definido,
permitindo melhor interação entre os computadores e as pessoas”.
A web semântica é uma de tentativa de fazer com que a máquina não apenas
busque o termo, palavra, conceito ou frase que lhe foi solicitado, mas que “entenda”
a solicitação, ou seja, que imprima maior precisão e relevância às informações
recuperadas.
O projeto da web semântica, em sua essência, é a criação e implantação de
padrões (standards) tecnológicos para permitir este panorama, que não
somente facilite as trocas de informações entre agentes pessoais, mas
principalmente estabeleça uma língua franca para o compartilhamento mais
significativo de dados entre dispositivos e sistemas de informação de uma
maneira geral. (SOUZA; ALVARENGA, 2004, p.134).

Nesse caso, a idéia de precisão está relacionada aos padrões de metadados,
pois, é através deles que os dados/informações são inseridos na web. Quanto
melhor o tratamento desses dados em sua fonte, melhor a sua recuperação pela
máquina. Para isso, segundo Souza e Alvarenga (2004, p.134)
[...] é necessária uma padronização de tecnologias, de linguagens e de
metadados descritivos, de forma que todos os usuários da web obedeçam a
determinadas regras comuns e compartilhadas sobre como armazenar dados e
descrever a informação armazenada e que esta possa ser ‘consumida’ por
outros usuários humanos ou não, de maneira automática e não ambígua.

O que entendemos, portanto, é que o tratamento dos dados é feito,
inicialmente,

visando

à

máquina.

É

importante

que

ela

recupere

os

dados/informações com ou sem a mediação humana. Não diríamos que a máquina
seria dotada de um certo tipo de capacidade de “pensar”, mas que possa fazer
relações e operações consideradas simples do ponto de vista cognitivo humano.
Campos et al. (2006, p.63) nos dão um exemplo de como isso funcionaria na prática:
[...] um usuário poderia digitar ‘Qual o melhor programa de pós-graduação
sobre gestão de informação na área da região Sudeste no Brasil?’ Um agente
inteligente correria pela Web, compararia a pontuação das universidades de
acordo com as avaliações da Capes ou outras e traria uma lista de nomes. O
agente inteligente então apanharia o formulário de inscrição e os dados sobre
auxílio financeiro e informação do(s) melhor(es) programa(s) de pósgraduação.

Para que isto seja possível, a máquina precisa estar munida de uma série de
códigos e expressões, além de ferramentas para relacioná-los e operacionalizá-los,
que usamos em nosso dia-a-dia para busca e recuperação de informações. Mesmo
assim, levando-se em consideração o exemplo acima, a máquina teria que distinguir
o que o usuário está querendo dizer quando se refere ao “melhor programa de pós-

�11

graduação”. Em nosso cotidiano lingüístico essa frase pode ter vários sentidos,
várias cargas semânticas podendo significar o programa de pós-graduação que
possui os “melhores” professores, que tem mais tradição ou que é mais “antigo”, que
é mais recente e espelha novas tendências ou simplesmente aquele que se
encontra mais próximo, geograficamente, de onde reside o usuário, não significando,
necessariamente, o programa que possui melhor pontuação na Capes, por exemplo.
Para uma possível aproximação do exemplo colocado pelas autoras, o
enunciado “Qual o melhor programa de pós-graduação sobre gestão de informação
na área da região Sudeste no Brasil?” teria que refletir fielmente a intenção do
usuário, ou seja, o “melhor” programa de pós-graduação corresponde àquele que
possui melhor pontuação na Capes: melhor = mais pontos. Isto nos remete a uma
questão emblemática no campo da linguagem, pois poderíamos dizer: referente a
quê este programa de pós-graduação é melhor do que aquele? Se, em nossa lista
de programas, incluíssemos o item preço, por exemplo, qual seria o melhor preço?
Pensaríamos, inicialmente, no mais baixo, é claro. Mas, o usuário poderia ter como
referência a idéia de que “preço baixo” é igual a “ruim” e achar que o programa que
possui o preço mais alto é melhor.
Nesse sentido, mesmo se fizéssemos um roteiro analítico partindo do famoso
“Mito da Caverna” de Platão passando por von Humboldt até chegar a Peirce, Frege,
Saussure e Wittgenstein, apenas para citar alguns dos mais expressivos pensadores
da linguagem, talvez não chegássemos sequer próximos a um acordo ou conclusão
sobre a questão da referência, no exemplo discutido acima.
Portanto, parece-nos que este nível de profundidade não é o objetivo da web
semântica. Todo aporte teórico é necessário e indispensável para se chegar a um
mínimo de aplicabilidade, como nos demonstra Ingwersen (2002) em seus estudos
sobre cognição, no ambiente on line, o que já é um excepcional avanço para os
sistemas de recuperação da informação. Quando a máquina relacionar questões
como “melhor programa de pós-graduação” a mais “pontos” na Capes e a partir
disso realizar operações sem o comando humano, uma importante porta estará se
abrindo para os sistemas chamados “inteligentes”. Esta é uma possibilidade muito
próxima de se tornar realidade.

�12

3 O PROFISSIONAL DA INFORMAÇÃO E O AMBIENTE ON LINE: DESAFIOS DO
SABER-FAZER CONTEMPORÂNEOS
O Profissional da Informação (PI) trabalha com a informação em diferentes
contextos e formatos. No mundo contemporâneo, o contexto que se apresenta com
maior intensidade é o on line. Neste novo ambiente de circulação e consumo de
informação, o PI parece perder sua autoridade sobre a informação veiculada, ou
seja, sua capacidade de mediação não vai além dos sistemas de recuperação da
informação tradicionais. Ou seja, o usuário tem acesso direto às informações sem
necessitar de mediação humana, possuindo autonomia para pesquisar e acessar a
informação que achar mais relevante.
Muitos aspectos da SI transformaram nossa cultura, política e economia,
impondo, de certa forma, uma nova estrutura social. A internet surge como
paradigma em uma sociedade basicamente imediatista, porém, com uma diferença:
estamos aprendendo a entender e aceitar essa condição também como ambiente de
produção, desenvolvimento e divulgação de conhecimento.
Ao PI cabe a tarefa de se inserir neste novo contexto informacional. Esta não é
uma tarefa simples, pois os modelos de ambientes de informação tradicionais, aos
quais os PI estão habituados, possuem uma dinâmica bem diferente daqueles
encontrados no ambiente on line. Se o PI não precisa mais mediar a informação, se
o tratamento da informação no ambiente on line pode ser realizado por não
especialistas a partir de padrões pré-estabelecidos, qual seria a sua função? Como
dito anteriormente, nos ambientes de informação tradicionais as ferramentas e
técnicas de tratamento, representação e recuperação da informação são bem
sofisticadas e precisas se comparadas com o que ocorre na web. Assim,
entendemos que, uma das principais funções do PI é recriar, reconstruir e adaptar
seu conhecimento a um novo sistema que precisa tratar e recuperar as informações
nele contidas.
4 CONSIDERAÇÕES FINAIS
Os SRI têm nos metadados sua principal ferramenta de organização da
informação. As linguagens de marcação como o XHTML, por exemplo, estão
agilizando o tratamento e o acesso às informações no ambiente virtual.

�13

Mesmo com o desenvolvimento de pesquisas rumo à instauração efetiva da
web semântica, aqui brevemente colocadas, percebemos que essa intenção ainda
está distante de se tornar real, por motivos relacionados ao tratamento da
linguagem.
Com efeito, os estudos cognitivos colocam a manipulação simbólica versus o
significado e a significação, como componentes-chave no processo de recuperação
de informação em um SRI. Além disso, devem ser consideradas as diferenças entre
o processamento dos computadores e a manipulação semântica do homem.
A relação interdisciplinar entre a Ciência da Informação, as Ciências
Cognitivas, a Lingüística e a Informática, como vimos, será a base do
desenvolvimento e da melhoria dos procedimentos tanto de organização quanto de
recuperação de informação no século XXI. Assim, é importante para o PI se inteirar
desses avanços, dentro de sua área de atuação, quanto aos estudos e perspectivas
que a tecnologia coloca para o trato com a informação virtual.

5 REFERÊNCIAS
BAX, Marcello Peixoto. Introdução às linguagens de marcas. Ciência da
Informação, Brasília, v.30, n.1, p.32-38, jan./abr. 2001.
BLAIR, David C. Language and representation in information retrieval. New
York: Elsevier, 1990.
BLAIR, David C. Wittgenstein, language and information: ‘back to the rough
ground!’. Berlin, Heildelberg, New York: Springer, 2006.
BORGES, Mônica Erichsen Nassif. et al. Estudos cognitivos em ciência da
informação, Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n.15, jan./jun.
2003.
CAMPOS, Maria Luiza de Almeida. Linguagem Documentária: teorias que
fundamentam sua elaboração. Niterói: EdUFF, 2001.
CAMPOS, Maria Luiza Machado; CAMPOS, Maria Luiza de Almeida; CAMPOS,
Liniar Maria. Web semântica e a gestão de conteúdos informacionais. In:
MARCONDES, Carlos Henrique et al. (Orgs.). Bibliotecas digitais: saberes e
práticas. 2.ed. Brasília: IBICT, 2006.
CASTELLS, M. Sociedade em rede. 6.ed.rev.ampl. São Paulo: Paz e Terra, 2002.
CINTRA, Anna Maria Marques et al. Para entender as linguagens documentárias.
2.ed. São Paulo: Polis, 2002.
FROHMANN, Bernd. Documentation redux: prolegomenon to philosophy of
information. Library Trends, Wntr, 2004. Acesso em: 18 maio 2006. Disponível em:
http://www.findarticles.com/p/articles/mi_m1387/is_3_52/ai_n6080395/print

�14

HEMALATA, Iyer. Classificatory structures: concepts, relations and representation.
Frankfurt/Main: Indeks Verlag, 1995.
HJØRLAND, Birger. Fundamentals of knowledge organization. In: Trends in
Knowledge Organization Research. Salamanca: Ediciones Universidad de
Salamanca, 2003. p.83-116.
HUTCHINS, W. J. Languages of indexing and classification: a linguistic study of
structures and functions. England: Peter Peregrinus, 1978.
INGWERSEN, Peter. Information retrieval interaction. London: Taylor Graham,
2002. Disponível em: &lt;www.db.dk/pi&gt;. Acesso em: abr. 2003.
LÉVY, Pierre. As tecnologias da inteligência: o futuro do pensamento na era da
informática. Rio de Janeiro: Ed. 34, 1993.
LÉVY, Pierre. Cibercultura. Rio de Janeiro: Ed. 34, 2000.
LÉVY, Pierre. O que é o virtual? Rio de Janeiro: Ed. 34, 1996.
LIMA, Gercina Ângela Borém. Interfaces entre a ciência da informação e a ciência
cognitiva. Ciência da Informação, Brasília, v.32, n.1, p.77-87, jan./abr. 2003.
MARCONDES, Carlos Henrique. Metadados: descrição e recuperação de
informações na WEB. In: _________. et al. (Orgs.). Bibliotecas digitais: saberes e
práticas. 2.ed. Brasília: IBICT, 2006.
MATTELART, Armand. Diversidade cultural e mundialização. São Paulo:
Parábola, 2005.
MATTELART, Armand. História da sociedade da informação. São Paulo: Edições
Loyola, 2002.
MÉNDEZ RODRÍGUEZ, Eva. Metadados y recuperación de información:
estándares, problemas y aplicabilidad en bibliotecas digitales. Espanha: Ediciones
Trea, 2002.
MENDONÇA, Ercilia Severina. A lingüística e a ciência da informação: estudos de
uma interseção. Ciência da Informação, Brasília, v.29, n.3, p.50-70. set./dez. 2000.
ROWLEY, Jennifer. A biblioteca eletrônica. 2.ed. Brasília: Briquet de Lemos, 2002.
SAN SEGUNDO MANUEL, Rosa. Nueva concepción de conocimiento. In:
RODRIGUES, Georgete Medleg; LOPES, Ilza Leite. (Orgs.). Organização e
representação do conhecimento na perspectiva da Ciência da Informação.
Brasília: Thesaurus, 2003. (Estudos Avançados em Ciência da Informação, v.2).
SOUZA, Márcia Izabel Fugisawa; VENDRUSCULO, Laurimar Gonçalves; MELO,
Geane Cristina. Metadados para descrição de recursos de informação eletrônica:
utilização do padrão Dublin Core. Ciência da Informação, Brasília, v.29, n.1, p.93102, jan./abr. 2000.
SOUZA, Renato Rocha; ALVARENGA, Lídia. A web semântica e suas
constribuições para a ciência da informação. Ciência da Informação, Brasília, v.33,
n.1, p.132-141, jan./abr. 2004.
SOWA, John F. Knowledge representation: logical,
computational foundations. Pacific Grove: Brooks/Cole, 2000.

philosophical,

and

�15

SVENONIUS, E. Intelectual foundation of information organization. Cambridge:
MIT Press, 2001.
SVENONIUS, Elaine. The epistemological foundations of knowledge representations.
Library Trends, Wntr, 2004. Acesso em: 18 maio 2006. Disponível em:
http://www.findarticles.com/p/articles/mi_m1387/is_3_52/ai_n6080404/print
SVENONIUS, Elaine. The intellectual foundation of information organization.
Massachusetts: MIT Press, 2001.
TAKAHASHI, Tadao. (Org.). Sociedade da informação no Brasil: livro verde.
Brasília: Ministério da Ciência e Tecnologia, 2000.

�</text>
                </elementText>
              </elementTextContainer>
            </element>
          </elementContainer>
        </elementSet>
      </elementSetContainer>
    </file>
  </fileContainer>
  <collection collectionId="47">
    <elementSetContainer>
      <elementSet elementSetId="1">
        <name>Dublin Core</name>
        <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
        <elementContainer>
          <element elementId="50">
            <name>Title</name>
            <description>A name given to the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51378">
                <text>SNBU - Edição: 14 - Ano: 2006 (UFBA - Salvador/BA)</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="49">
            <name>Subject</name>
            <description>The topic of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51379">
                <text>Biblioteconomia&#13;
Documentação&#13;
Ciência da Informação&#13;
Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="41">
            <name>Description</name>
            <description>An account of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51380">
                <text>Tema: Acesso livre à informação científica e bibliotecas universitárias.</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="39">
            <name>Creator</name>
            <description>An entity primarily responsible for making the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51381">
                <text>SNBU - Seminário Nacional de Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="45">
            <name>Publisher</name>
            <description>An entity responsible for making the resource available</description>
            <elementTextContainer>
              <elementText elementTextId="51382">
                <text>UFBA</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="40">
            <name>Date</name>
            <description>A point or period of time associated with an event in the lifecycle of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51383">
                <text>2006</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="44">
            <name>Language</name>
            <description>A language of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51384">
                <text>Português</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="51">
            <name>Type</name>
            <description>The nature or genre of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51385">
                <text>Evento</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="38">
            <name>Coverage</name>
            <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
            <elementTextContainer>
              <elementText elementTextId="51386">
                <text>Salvador (Bahia)</text>
              </elementText>
            </elementTextContainer>
          </element>
        </elementContainer>
      </elementSet>
    </elementSetContainer>
  </collection>
  <itemType itemTypeId="8">
    <name>Event</name>
    <description>A non-persistent, time-based occurrence. Metadata for an event provides descriptive information that is the basis for discovery of the purpose, location, duration, and responsible agents associated with an event. Examples include an exhibition, webcast, conference, workshop, open day, performance, battle, trial, wedding, tea party, conflagration.</description>
  </itemType>
  <elementSetContainer>
    <elementSet elementSetId="1">
      <name>Dublin Core</name>
      <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
      <elementContainer>
        <element elementId="50">
          <name>Title</name>
          <description>A name given to the resource</description>
          <elementTextContainer>
            <elementText elementTextId="58532">
              <text>Metadados e sistemas de recuperação da informação on line: uma questão de semântica?</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="39">
          <name>Creator</name>
          <description>An entity primarily responsible for making the resource</description>
          <elementTextContainer>
            <elementText elementTextId="58533">
              <text>Loureiro, Mônica de Fátima; Francelin, Marivalde Moacir</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="38">
          <name>Coverage</name>
          <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
          <elementTextContainer>
            <elementText elementTextId="58534">
              <text>Salvador (Bahia)</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="45">
          <name>Publisher</name>
          <description>An entity responsible for making the resource available</description>
          <elementTextContainer>
            <elementText elementTextId="58535">
              <text>UFBA</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="40">
          <name>Date</name>
          <description>A point or period of time associated with an event in the lifecycle of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="58536">
              <text>2006</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="51">
          <name>Type</name>
          <description>The nature or genre of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="58538">
              <text>Evento</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="41">
          <name>Description</name>
          <description>An account of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="58539">
              <text>Problemas que interferem na comunicação humana mediada por computador, mais especificamente as pesquisas sobre a interação homem-máquina, são os grandes desafios que se apresentam à comunidade científica na contemporaneidade. Os sistemas especializados de informação das universidades, que incorporam ferramentas desenvolvidas com base em metadados, na perspectiva da WEB semântica, podem ilustrar esse problema. A mobilização interdisciplinar de campos como a filosofia, a lingüística, a neurociência e as ciências cognitivas, entre outras, aliada às tecnologias de informação, sugerem respostas para esses problemas, apontando também para novas formas de mediação da informação. Dessa forma, procura-se discutir, com base na literatura nacional e internacional da Ciência da Informação, o desenvolvimento conceitual do termo metadado, as principais linguagens de tratamento de dados e, principalmente, as questões semânticas presentes nos ambientes de recuperação da informação on line. As pesquisas contemporâneas indicam que a eficácia dos sistemas de informação depende da incorporação de um mínimo semântico que opere como a base do entendimento mútuo entre homem e máquina. Sistematiza-se, por fim, a importância deste tema para o profissional da informação que atua em ambientes de ensino e pesquisa, como também seus possíveis impactos no saber-fazer cotidiano.</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="44">
          <name>Language</name>
          <description>A language of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="68908">
              <text>pt</text>
            </elementText>
          </elementTextContainer>
        </element>
      </elementContainer>
    </elementSet>
  </elementSetContainer>
</item>
