http://repositorio.febab.org.br/files/original/47/5406/SNBU2006_208.pdf d684bc628b4a05334214b30f69b1f7a4 PDF Text Text METADADOS E SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO ON LINE: UMA QUESTÃO DE SEMÂNTICA?1 Mônica de Fátima Loureiro Doutoranda em Ciência da Informação Escola de Comunicações e Artes (ECA) – Universidade de São Paulo (USP) Brasil monicaeros@hotmail.com Marivalde Moacir Francelin Doutorando em Ciência da Informação Escola de Comunicações e Artes (ECA) – Universidade de São Paulo (USP) Brasil Bolsista Capes mfrancelin@yahoo.com.br EIXO TEMÁTICO: O Impacto das Tecnologias Eletrônicas e sua Mediação Resumo Problemas que interferem na comunicação humana mediada por computador, mais especificamente as pesquisas sobre a interação homem-máquina, são os grandes desafios que se apresentam à comunidade científica na contemporaneidade. Os sistemas especializados de informação das universidades, que incorporam ferramentas desenvolvidas com base em metadados, na perspectiva da WEB semântica, podem ilustrar esse problema. A mobilização interdisciplinar de campos como a filosofia, a lingüística, a neurociência e as ciências cognitivas, entre outras, aliada às tecnologias de informação, sugerem respostas para esses problemas, apontando também para novas formas de mediação da informação. Dessa forma, procura-se discutir, com base na literatura nacional e internacional da Ciência da Informação, o desenvolvimento conceitual do termo metadado, as principais linguagens de tratamento de dados e, principalmente, as questões semânticas presentes nos ambientes de recuperação da informação on line. As pesquisas contemporâneas indicam que a eficácia dos sistemas de informação depende da incorporação de um mínimo semântico que opere como a base do entendimento mútuo entre homem e máquina. Sistematiza-se, por fim, a importância deste tema para o profissional da informação que atua em ambientes de ensino e pesquisa, como também seus possíveis impactos no saber-fazer cotidiano. Palavras-chave: metadados; sistemas de recuperação da informação; WEB semântica, Ciência da Informação. 1 Trabalho desenvolvido a partir da disciplina Produção e Disseminação de Informações Documentárias no Mundo Contemporâneo, ministrada pela Professora Dra. Nair Yumiko Kobashi no primeiro semestre de 2006, do Programa de Pós Graduação em Ciência da Informação da Escola de Comunicações e Artes (ECA), Universidade de São Paulo (USP). �2 1 INTRODUÇÃO Este trabalho procura refletir sobre alguns conceitos considerados importantes: metadados e web semântica, abordando, de forma sucinta, algumas de suas aplicações, além de destacar a postura do Profissional da Informação (PI) nesse contexto. Relacionam-se algumas questões específicas sobre o ambiente on line e os Sistemas de Recuperação da Informação (SRI), na perspectiva da web semântica, levando em consideração o elemento humano na interação com a máquina, de maneira que ela “entenda”, minimamente, o que lhe é exposto e/ou requisitado e responda de maneira adequada. De certa maneira, isto já nos foi anunciado pelo advento da Internet que, tradicionalmente e popularmente, entendemos como algo que nos liga ao mundo. Segundo Rowley (2002, p.187), “A internet é um conjunto de redes de computadores, interligadas, ou seja, uma rede de redes”. É um sistema que permite comunicação imediata com qualquer pessoa, em qualquer parte do globo – desde que existam os recursos técnicos e tecnológicos necessários. Essa caracterização da internet, para ser mais precisa, requer a discussão de elementos que nos permitam vê-la como um ambiente que é mais do que um simples veículo de comunicação e interação. A internet se populariza a partir dos anos de 1990 e se massifica a partir de 2000. Incluímos nessa massificação não apenas aqueles que têm acesso a ela, mas também aqueles que sabem que ela existe ou dela já fizeram uso. Assim como em uma biblioteca comum, fazer uso pode ter vários significados, que varia desde a entrada do indivíduo no ambiente, a consulta ao catálogo e/ou estante, a seleção e retirada do material até uma suposta aquisição de conhecimento a partir de uma informação obtida. O exemplo pode ser bem demonstrado em um ambiente físico, com controle e auxílio especializado permanentes; mas, como seria a mesma busca em um ambiente virtual, onde o único objeto com que se tem contato direto é a máquina, interligada a uma rede, que contêm um volume de informações muito maior do que qualquer biblioteca? A mudança do ambiente informacional físico para o virtual fez com que aqueles que lidam com a informação, visando ao seu tratamento, armazenamento e recuperação, adotassem novas posturas diante das ferramentas de recuperação de informações em meio digital. �3 Segundo Méndez Rodríguez (2002, p.19): La información y las tecnologías aplicadas a la información se han convertido ya en un punto crítico para la ciencia, la investigación y la empresa de nuestro tiempo. Se promueve el acceso universal a las fuentes de información gracias al crecimiento y desarrollo de las redes de telecomunicaciones, especialmente de Internet y, sobre todo de la Word Wide Web. En menos de diez años, la Web ha pasado de ser un sistema casi esotérico, utilizado por una comunidad limitada de investigadores, a ser un almacén de datos ingente, universal, abierto, multitemático y multilingüe, así como a considerarse una de las herramientas por antonomasia para obtener información. Cada vez más se están usando nuevas formas de representación de un conocimiento, distintas del texto lineal impreso. Estos nuevos tipos de publicación digital – desde el texto, hasta una grabación sonora o de vídeo, pasando por un mensaje de correo electrónico, el código fuente de un programa de ordenador para el cálculo de resultados, etc. – han multiplicado las formas de comunicación científica, involucrando un proceso sin precedentes […] Um dos pontos fundamentais, nessa nova tomada de posição, foi entender o que são e como surgiram tais mídias, que na Sociedade da Informação (SI) estão imbricadas às Tecnologias de Informação e Comunicação (TIC). Esse contexto foi e ainda é bem explorado pela literatura no campo da Ciência da Informação (MATTELART, 2002; 2005; TAKAHASHI, 2000). Os aspectos sócio-políticos, culturais e econômicos, que norteiam o desenvolvimento das TIC e da SI são importantes para as pesquisas sobre o acesso à informação. Outro ponto fundamental, que está intimamente ligado à internet, está, igualmente, tomando corpo nas pesquisas da área, ou seja, os Sistemas de Recuperação da Informação (SRI) on line. A internet é um repositório de informações. Boa parte delas não é recuperável, outra parte recuperável, mas de maneira precária, e uma pequena parcela pode ser recuperada com alguma exatidão – geralmente, aquelas que estão relacionadas às bibliotecas ou a algum tipo de sistema especializado de informação. Essa situação não se colocava como problemática enquanto o paradigma virtual estava aparentemente distante de se tornar realidade; porém, atualmente, os problemas têm se agravado, pelo crescimento da demanda informacional, e pelo aumento da exigência do público usuário, por informações exatas e precisas em relação às suas necessidades: tudo isso, no menor tempo possível. Hoje, a “realidade” virtual é fato. Estamos tão dependentes dos sistemas on line que poderíamos dizer que eles sempre existiram. Entramos no século XXI, não mais com a perspectiva de um mundo virtual, mas como uma sociedade tecnologicamente conectada, que faz comércio, política e cultura pela rede. É uma �4 sociedade que se vê dividida e subdividida em comunidades virtualmente ligadas, porém, que não existem na forma física e que talvez nunca existirão na forma de grupos físicos, como tradicionalmente os conhecemos. E, assim como a sociedade real, essa sociedade que chamamos virtual também consome, usa, produz informação e conduz a uma nova forma de conhecimento. De acordo com San Segundo Manuel (2003, p.50), “El conocimiento, por tanto, puede articularse, en la actualidad, como un tipo de conocimiento artificial, o como información electrónica útil, o bien como información en potencia desde una perspectiva pragmática.” O ambiente virtual é, de fato, mais complexo do que o das bibliotecas e, o que é mais importante: ele surgiu e se desenvolve, a cada dia, de maneira desordenada. Compreendemos bem as estruturas, metodologias e conceitos que fazem parte dos SRI das bibliotecas tradicionais porque nós os construímos, mas conhecemos muito pouco dos pormenores técnicos deste ambiente virtual. Em termos de bibliotecas e centros de informação em geral, criamos sistemas, metodologias e ferramentas sofisticadas para o tratamento, armazenamento e recuperação da informação. Alguns desses procedimentos foram adaptados para o ciberespaço e outros precisam ser criados, considerando a informação eletrônica sem um similar físico, ou seja, constituída puramente em meio virtual. Assim, comparando os centros de informação físicos como bibliotecas, centros de informação entre outros, com a internet, mesmo considerando os domínios que precisam ser respeitados, percebemos que esse novo e enorme universo informacional não foi criado por nós e, por isso, suas ferramentas de armazenamento, tratamento e recuperação nos parecem, muitas vezes, estranhas, apesar de algumas semelhanças de formatos de entrada de dados. Embora nossos catálogos tradicionais pareçam ser extremamente sofisticados e as ferramentas de tratamento muito avançadas, ao considerar o ambiente virtual, as informações/dados devem ser traduzidas para uma linguagem que a máquina também possa “entender”. Os catálogos físicos tradicionais não precisavam ser legíveis por computadores. Os usuários tinham acesso direto a eles e encontravam informações organizadas com base em alguma norma, norma essa que fazia parte de um sistema pré-estabelecido pela própria biblioteca. Ou seja, havia todo um controle, desde o vocabulário empregado até a conduta de acesso e uso do material. Se o usuário precisasse de um intermediário, ele encontraria uma pessoa �5 especializada disponível para auxiliá-lo. No entanto, no ambiente virtual, a dinâmica de organização e uso é bastante diferenciada, pois como destacou Svenonius (2001), com a revolução computacional houve uma mudança na natureza das entidades a serem organizadas e, além disso, mudaram também os próprios meios de sua organização. No ciberespaço, a inclusão das informações não segue, via de regra, qualquer tipo de norma ou padrão que possa facilitar o processo de recuperação. Além disso, o volume de informação contida na rede é muito maior do que nos é apresentado pelos buscadores. Sem dúvida, estamos diante de um novo contexto informacional que temos que entender, em especial, os conceitos, linguagens e ferramentas que lhe são característicos. 2 SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO ON LINE: METADADOS E WEB SEMÂNTICA Ao longo da história vários autores de vários campos do saber fizeram previsões, com bases em estudos científicos e/ou mesmo através da ficção e da literatura, apontando para uma nova realidade social: algumas se concretizaram, principalmente aquelas relacionadas às tecnologias da informação (LÉVY, 1993; 1996; 2000; TAKAHASHI, 2000; CASTELLS, 2002). Exemplo emblemático parte, justamente, da chamada SI: ela não se configura apenas pela web mas, também, por uma série de mudanças ocorridas no campo das comunicações (mídias radiofônicas, televisivas e impressas), na economia e na educação, entre outros exemplos. Entendemos que o aspecto mais marcante da SI é o desenvolvimento da Internet. Mattelart (2002) destaca a necessidade de um olhar crítico sobre este período, no qual estamos imersos, para fugir da tecnofobia, deixando claro que o sonho e a ilusão de um mundo mais solidário, a partir da instauração da SI, não foi concretizado. Esta não é uma posição contra o avanço tecnológico, mas, um olhar realista que consegue perceber as movimentações e manipulações de interesse hegemônico capitalista como pano de fundo desses avanços. Criada no período da Guerra Fria (SOUZA; ALVARENGA, 2004), a internet tinha por objetivo conectar computadores, facilitando a troca de informações; apenas algum tempo depois é que surge a World Wide Web (WWW), “a grande teia” ou a “teia global”, também chamada simplesmente de web. Esse ambiente trouxe uma nova perspectiva para a internet, estimulando interfaces e possibilitando tratamento, �6 acesso e recuperação de documentos on line. De acordo com Souza e Alvarenga (2004, p.132), a web surge nos anos de 1990 sendo atualmente [...] tão popular e ubíqua, que, não raro, no imaginário dos usuários, confunde-se com a própria e balzaquiana Internet – a infra-estrutura de redes, servidores e canais de comunicação que lhe dá sustentação. Se a Internet surgiu como proposta de um sistema distribuído de comunicação entre computadores para possibilitar a troca de informações na época da Guerra Fria, o projeto da web, ao implantar de forma magistral o conceito de hipertexto imaginado por Ted Nelson & Douglas Engelbart (1962), buscava oferecer interfaces mais amigáveis e intuitivas para a organização e o acesso ao crescente repositório de documentos que se tornava a Internet. Entretanto, o enorme crescimento – além das expectativas – do alcance e tamanho desta rede, além da ampliação das possibilidades de utilização, fazem com que seja necessária uma nova filosofia, com suas tecnologias subjacentes, além da ampliação da infra-estrutura tecnológica de comunicação. No entanto, a recuperação de informações na web ainda é limitada pela falta de padrões adequados de tratamento da informação ao ser inserida na rede. A eficiência dos “motores de busca”, como o Google e o Yahoo, por exemplo, é parcial e imprecisa devido, em grande parte, a essa falta de padronização. Na tentativa de solucionar este problema foram desenvolvidas as chamadas “linguagens de marca” ou “linguagens de marcação”. Em certa medida, as linguagens de marcação (markup languages), representadas pelo Hyper Text Markup Languages (HTML), eXtensible Hyper Text Markup Language (XHTML), Standard Generalized Markup Language (SGML) e eXtensible Markup Language (XML) “[...] permitem a construção de padrões públicos e abertos que estão sendo criados para se tentarem maiores avanços no tratamento da informação: elas minimizam o problema de transferência de um formato de representação para outro e liberam a informação das tecnologias de informação proprietárias.” (BAX, 2001, p.32). Estas linguagens são constituídas de metadados, que facilitam a recuperação da informação e apontam para uma revolução na busca por informações no ambiente on line, pois tem como intenção permitir efetuar buscas não apenas por palavras ou termos, porém, pelo conteúdo semântico do documento; daí o aparecimento do termo web semântica. Genericamente, os metadados são entendidos como dados sobre dados ou dados estruturados sobre dados. Aparentemente, a definição apresenta-se de maneira simples, mas o conceito de metadados toma proporções maiores quando tentamos analisá-lo levando em consideração sua etimologia e aplicações. Segundo Méndez Rodríguez (2002, p.30), metadados seriam “[...] datos {junto a / después de �7 / entre / con...} los datos”. A autora lembra que a difusão do termo metadado se deu com a internet e com a web, porém ele já existia, ao menos, desde a década de 1970. Mas seu uso inicial não tinha nenhum compromisso semântico, apenas designando uma espécie de marca comercial, o que não passa de curiosidade histórica no desenvolvimento do termo. Apesar do conceito de metadados, segundo Marcondes (2006, p.96), não estar restrito à “descrição” e à recuperação da informação, o padrão Dublin Core parece apropriado para esta tarefa. De acordo com Souza et al. (2000, p. 93): Dublin Core pode ser definido como sendo o conjunto de elementos de metadados planejado para facilitar a descrição de recursos eletrônicos. Metadado significa dado sobre o dado. É a catalogação do dado ou descrição do recurso eletrônico. A expectativa é que autores ou WEBsiters sem conhecimento de catalogação sejam capazes de usar o Dublin Core para descrição de recursos eletrônicos, tornando suas coleções mais visíveis pelos engenhos de busca e sistemas de recuperação. As autoras já citadas lembram que o Dublin Core não tem a intenção de substituir modelos mais completos e abrangentes como o Anglo American Cataloguing Rules (AACR2) e o MAchine Readable Catalog (MARC), mas apenas auxiliar especialistas e não especialistas em catalogação, na descrição de elementos básicos para a representação de uma informação e/ou de um documento on line. A finalidade principal dos metadados é documentar, com elementos descritores, qualquer tipo de recurso disponível na Web, para permitir comunicabilidade e interoperabilidade entre sistemas. A adoção de padrões de metadados permite com mais facilidade o estabelecimento de mecanismos de importação e exportação de informações, assim como a criação de uma visão integrada dos dados de uma organização. Além disso, permite que agentes inteligentes não somente possam intercambiar informações, mas também que possam transferir para um sistema um conhecimento semântico estruturado, que é a base da Web semântica (CAMPOS et al., 2006, p.60). Estudos de Ingwersen (2002) abordam com profundidade a interação entre os SRI e os estudos cognitivos, destacando pontos importantes no desenvolvimento e aprimoramento desses sistemas, como: a) a necessidade de conhecimentos por parte do projetista de um SRI do conhecimento anterior (ou background) de sua população usuária, em dado domínio; b) a necessidade de um SRI, a partir da diversidade de níveis culturais e educacionais de seu público, fazer agrupamentos a partir de categorias, os chamados agrupamentos categoriais e, também, fazer agrupamentos chamados situacionais. �8 Ingwersen (2002, p. 129), conceitua a classificação categorial como aquela onde “[...] os indivíduos selecionam um conceito abstrato e escolhem os objetos que podem ser inseridos sob este conceito”. Já a classificação situacional é aquela onde “[...] os indivíduos envolvem os objetos em diferentes situações concretas, de tal modo agrupando objetos que pertencem ao mesmo conjunto” (INGWERSEN, 2002, p. 129). Podemos destacar que a necessidade dos usuários frente a um SRI é bastante ligada aos estudos cognitivos humanos que precisam ser inseridos e aprofundados, no campo da Ciência da Informação, visando a uma melhor recuperação de informação. Além disso, não se pode pensar em usuários individuais e sim considerar coletivos no processo de recuperação de informação na internet, mesmo dentro de um domínio específico. Nesse sentido, entendemos que as relações disciplinares da Ciência da Informação com outros campos do saber se desenvolveram e estão se desenvolvendo por incursões teóricas e práticas, especificamente em áreas como a lingüística, a filosofia da linguagem, a filosofia cognitiva e a computação. No Brasil, tais incursões podem ser observadas através dos trabalhos de Cintra et al. (2002), Campos (2001), Lima (2003), Mendonça (2000), Borges et al. (2003), por exemplo. Em língua estrangeira podemos citar os trabalhos de Blair (1990; 2006), Sowa (2000), Svenonius (2001; 2004), Frohmann (2004), Hjorland (2003), Hemalata (1995), Hutchins (1978), por exemplo. São trabalhos com características distintas, uns mais sistemáticos e aplicados, outros mais teóricos, de cunho filosófico, porém, pode-se dizer que a principal preocupação das abordagens das obras citadas é a representação e a recuperação da informação. Nesse sentido, constituem um grande painel interdisciplinar de estudos sobre a linguagem, o conceito e as questões gerais sobre referência e significado no âmbito lingüístico e cognitivo. Eventos da área de Ciência da Informação, dentre os quais destacamos a International Society for Knowledge Organization (ISKO), cujo tema para 2007 é “La interdisciplirariedad y la transdisciplinariedad en la organización del conocimiento científico”, enfatizam, justamente, pesquisas interdisciplinares entre Lógica, Lingüística, Ontologias e Organização do conhecimento, principalmente no ambiente on line. �9 Enquanto pesquisadores da informação precisamos entender a informação não apenas enquanto veículo de comunicação, mas, também, enquanto processos de significação para a construção de conhecimento. A informação é transmitida pela linguagem, seja ela falada, escrita ou visual, e comporta elementos de significado, porém, esses elementos, para terem sentido e serem apropriados, deverão fazer parte do universo discursivo e simbólico daquele que os irá receber, seja ele chamado de receptor, destinatário ou usuário. O universo discursivo é constituído por comunidades lingüísticas distintas que estão, via de regra, fora do alcance dos sistemas de recuperação da informação, pois, estes sistemas não foram construídos a partir delas, mas sim a partir de linguagens que podemos chamar, com algum cuidado, de universais, científicas ou artificiais. Não queremos dizer que o sentido do termo ou do conceito foi eliminado no momento de sua representação, pelo contrário, sentido há, mas restrito a uma comunidade discursiva especializada. A carga semântica de um termo, conceito ou de uma frase toma outras proporções no ambiente web, pois trata-se se um sistema aberto, utilizado e alimentado tanto por especialistas como por não especialistas (o termo especialista significa, aqui, aqueles que têm domínio sobre a linguagem de um determinado campo de estudos, seja ele profissional ou cientista, ou domínio sobre as ferramentas de tratamento, um bibliotecário, por exemplo) e no qual se usa tanto a linguagem natural quanto as linguagens construídas. Apesar de a web se pretender universal, a linguagem nela utilizada não o é, por ser constituída por comunidades discursivas distintas. O que precisamos saber é se as regras discursivas utilizadas no ambiente “real” em determinada comunidade de significação são as mesmas que os seus membros usam no ambiente web. Tudo indica que sim, portanto, precisamos entender tais comunidades e identificar padrões para que possamos melhor representar informações que elas necessitam. No ambiente web algumas teorias sobre a linguagem e o seu tratamento são de difícil aplicação, pois entre o usuário e a informação está a máquina. O usuário precisa interagir com a máquina para recuperar o que precisa e esta última precisa “entender”, de alguma maneira, o que lhe está sendo solicitado. Uma possibilidade desse “entendimento” está sendo desenvolvida através do que se vem chamando de web semântica. Segundo Berners-Lee (2001) apud Souza �10 e Alvarenga (2004, p.133) “A web semântica não é uma web separada, mas uma extensão da atual. Nela a informação é dada com um significado bem definido, permitindo melhor interação entre os computadores e as pessoas”. A web semântica é uma de tentativa de fazer com que a máquina não apenas busque o termo, palavra, conceito ou frase que lhe foi solicitado, mas que “entenda” a solicitação, ou seja, que imprima maior precisão e relevância às informações recuperadas. O projeto da web semântica, em sua essência, é a criação e implantação de padrões (standards) tecnológicos para permitir este panorama, que não somente facilite as trocas de informações entre agentes pessoais, mas principalmente estabeleça uma língua franca para o compartilhamento mais significativo de dados entre dispositivos e sistemas de informação de uma maneira geral. (SOUZA; ALVARENGA, 2004, p.134). Nesse caso, a idéia de precisão está relacionada aos padrões de metadados, pois, é através deles que os dados/informações são inseridos na web. Quanto melhor o tratamento desses dados em sua fonte, melhor a sua recuperação pela máquina. Para isso, segundo Souza e Alvarenga (2004, p.134) [...] é necessária uma padronização de tecnologias, de linguagens e de metadados descritivos, de forma que todos os usuários da web obedeçam a determinadas regras comuns e compartilhadas sobre como armazenar dados e descrever a informação armazenada e que esta possa ser ‘consumida’ por outros usuários humanos ou não, de maneira automática e não ambígua. O que entendemos, portanto, é que o tratamento dos dados é feito, inicialmente, visando à máquina. É importante que ela recupere os dados/informações com ou sem a mediação humana. Não diríamos que a máquina seria dotada de um certo tipo de capacidade de “pensar”, mas que possa fazer relações e operações consideradas simples do ponto de vista cognitivo humano. Campos et al. (2006, p.63) nos dão um exemplo de como isso funcionaria na prática: [...] um usuário poderia digitar ‘Qual o melhor programa de pós-graduação sobre gestão de informação na área da região Sudeste no Brasil?’ Um agente inteligente correria pela Web, compararia a pontuação das universidades de acordo com as avaliações da Capes ou outras e traria uma lista de nomes. O agente inteligente então apanharia o formulário de inscrição e os dados sobre auxílio financeiro e informação do(s) melhor(es) programa(s) de pósgraduação. Para que isto seja possível, a máquina precisa estar munida de uma série de códigos e expressões, além de ferramentas para relacioná-los e operacionalizá-los, que usamos em nosso dia-a-dia para busca e recuperação de informações. Mesmo assim, levando-se em consideração o exemplo acima, a máquina teria que distinguir o que o usuário está querendo dizer quando se refere ao “melhor programa de pós- �11 graduação”. Em nosso cotidiano lingüístico essa frase pode ter vários sentidos, várias cargas semânticas podendo significar o programa de pós-graduação que possui os “melhores” professores, que tem mais tradição ou que é mais “antigo”, que é mais recente e espelha novas tendências ou simplesmente aquele que se encontra mais próximo, geograficamente, de onde reside o usuário, não significando, necessariamente, o programa que possui melhor pontuação na Capes, por exemplo. Para uma possível aproximação do exemplo colocado pelas autoras, o enunciado “Qual o melhor programa de pós-graduação sobre gestão de informação na área da região Sudeste no Brasil?” teria que refletir fielmente a intenção do usuário, ou seja, o “melhor” programa de pós-graduação corresponde àquele que possui melhor pontuação na Capes: melhor = mais pontos. Isto nos remete a uma questão emblemática no campo da linguagem, pois poderíamos dizer: referente a quê este programa de pós-graduação é melhor do que aquele? Se, em nossa lista de programas, incluíssemos o item preço, por exemplo, qual seria o melhor preço? Pensaríamos, inicialmente, no mais baixo, é claro. Mas, o usuário poderia ter como referência a idéia de que “preço baixo” é igual a “ruim” e achar que o programa que possui o preço mais alto é melhor. Nesse sentido, mesmo se fizéssemos um roteiro analítico partindo do famoso “Mito da Caverna” de Platão passando por von Humboldt até chegar a Peirce, Frege, Saussure e Wittgenstein, apenas para citar alguns dos mais expressivos pensadores da linguagem, talvez não chegássemos sequer próximos a um acordo ou conclusão sobre a questão da referência, no exemplo discutido acima. Portanto, parece-nos que este nível de profundidade não é o objetivo da web semântica. Todo aporte teórico é necessário e indispensável para se chegar a um mínimo de aplicabilidade, como nos demonstra Ingwersen (2002) em seus estudos sobre cognição, no ambiente on line, o que já é um excepcional avanço para os sistemas de recuperação da informação. Quando a máquina relacionar questões como “melhor programa de pós-graduação” a mais “pontos” na Capes e a partir disso realizar operações sem o comando humano, uma importante porta estará se abrindo para os sistemas chamados “inteligentes”. Esta é uma possibilidade muito próxima de se tornar realidade. �12 3 O PROFISSIONAL DA INFORMAÇÃO E O AMBIENTE ON LINE: DESAFIOS DO SABER-FAZER CONTEMPORÂNEOS O Profissional da Informação (PI) trabalha com a informação em diferentes contextos e formatos. No mundo contemporâneo, o contexto que se apresenta com maior intensidade é o on line. Neste novo ambiente de circulação e consumo de informação, o PI parece perder sua autoridade sobre a informação veiculada, ou seja, sua capacidade de mediação não vai além dos sistemas de recuperação da informação tradicionais. Ou seja, o usuário tem acesso direto às informações sem necessitar de mediação humana, possuindo autonomia para pesquisar e acessar a informação que achar mais relevante. Muitos aspectos da SI transformaram nossa cultura, política e economia, impondo, de certa forma, uma nova estrutura social. A internet surge como paradigma em uma sociedade basicamente imediatista, porém, com uma diferença: estamos aprendendo a entender e aceitar essa condição também como ambiente de produção, desenvolvimento e divulgação de conhecimento. Ao PI cabe a tarefa de se inserir neste novo contexto informacional. Esta não é uma tarefa simples, pois os modelos de ambientes de informação tradicionais, aos quais os PI estão habituados, possuem uma dinâmica bem diferente daqueles encontrados no ambiente on line. Se o PI não precisa mais mediar a informação, se o tratamento da informação no ambiente on line pode ser realizado por não especialistas a partir de padrões pré-estabelecidos, qual seria a sua função? Como dito anteriormente, nos ambientes de informação tradicionais as ferramentas e técnicas de tratamento, representação e recuperação da informação são bem sofisticadas e precisas se comparadas com o que ocorre na web. Assim, entendemos que, uma das principais funções do PI é recriar, reconstruir e adaptar seu conhecimento a um novo sistema que precisa tratar e recuperar as informações nele contidas. 4 CONSIDERAÇÕES FINAIS Os SRI têm nos metadados sua principal ferramenta de organização da informação. As linguagens de marcação como o XHTML, por exemplo, estão agilizando o tratamento e o acesso às informações no ambiente virtual. �13 Mesmo com o desenvolvimento de pesquisas rumo à instauração efetiva da web semântica, aqui brevemente colocadas, percebemos que essa intenção ainda está distante de se tornar real, por motivos relacionados ao tratamento da linguagem. Com efeito, os estudos cognitivos colocam a manipulação simbólica versus o significado e a significação, como componentes-chave no processo de recuperação de informação em um SRI. Além disso, devem ser consideradas as diferenças entre o processamento dos computadores e a manipulação semântica do homem. A relação interdisciplinar entre a Ciência da Informação, as Ciências Cognitivas, a Lingüística e a Informática, como vimos, será a base do desenvolvimento e da melhoria dos procedimentos tanto de organização quanto de recuperação de informação no século XXI. Assim, é importante para o PI se inteirar desses avanços, dentro de sua área de atuação, quanto aos estudos e perspectivas que a tecnologia coloca para o trato com a informação virtual. 5 REFERÊNCIAS BAX, Marcello Peixoto. Introdução às linguagens de marcas. Ciência da Informação, Brasília, v.30, n.1, p.32-38, jan./abr. 2001. BLAIR, David C. Language and representation in information retrieval. New York: Elsevier, 1990. BLAIR, David C. Wittgenstein, language and information: ‘back to the rough ground!’. Berlin, Heildelberg, New York: Springer, 2006. BORGES, Mônica Erichsen Nassif. et al. Estudos cognitivos em ciência da informação, Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n.15, jan./jun. 2003. CAMPOS, Maria Luiza de Almeida. Linguagem Documentária: teorias que fundamentam sua elaboração. Niterói: EdUFF, 2001. CAMPOS, Maria Luiza Machado; CAMPOS, Maria Luiza de Almeida; CAMPOS, Liniar Maria. Web semântica e a gestão de conteúdos informacionais. In: MARCONDES, Carlos Henrique et al. (Orgs.). Bibliotecas digitais: saberes e práticas. 2.ed. Brasília: IBICT, 2006. CASTELLS, M. Sociedade em rede. 6.ed.rev.ampl. São Paulo: Paz e Terra, 2002. CINTRA, Anna Maria Marques et al. Para entender as linguagens documentárias. 2.ed. São Paulo: Polis, 2002. FROHMANN, Bernd. Documentation redux: prolegomenon to philosophy of information. Library Trends, Wntr, 2004. Acesso em: 18 maio 2006. Disponível em: http://www.findarticles.com/p/articles/mi_m1387/is_3_52/ai_n6080395/print �14 HEMALATA, Iyer. Classificatory structures: concepts, relations and representation. Frankfurt/Main: Indeks Verlag, 1995. HJØRLAND, Birger. Fundamentals of knowledge organization. In: Trends in Knowledge Organization Research. Salamanca: Ediciones Universidad de Salamanca, 2003. p.83-116. HUTCHINS, W. J. Languages of indexing and classification: a linguistic study of structures and functions. England: Peter Peregrinus, 1978. INGWERSEN, Peter. Information retrieval interaction. London: Taylor Graham, 2002. Disponível em: <www.db.dk/pi>. Acesso em: abr. 2003. LÉVY, Pierre. As tecnologias da inteligência: o futuro do pensamento na era da informática. Rio de Janeiro: Ed. 34, 1993. LÉVY, Pierre. Cibercultura. Rio de Janeiro: Ed. 34, 2000. LÉVY, Pierre. O que é o virtual? Rio de Janeiro: Ed. 34, 1996. LIMA, Gercina Ângela Borém. Interfaces entre a ciência da informação e a ciência cognitiva. Ciência da Informação, Brasília, v.32, n.1, p.77-87, jan./abr. 2003. MARCONDES, Carlos Henrique. Metadados: descrição e recuperação de informações na WEB. In: _________. et al. (Orgs.). Bibliotecas digitais: saberes e práticas. 2.ed. Brasília: IBICT, 2006. MATTELART, Armand. Diversidade cultural e mundialização. São Paulo: Parábola, 2005. MATTELART, Armand. História da sociedade da informação. São Paulo: Edições Loyola, 2002. MÉNDEZ RODRÍGUEZ, Eva. Metadados y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Espanha: Ediciones Trea, 2002. MENDONÇA, Ercilia Severina. A lingüística e a ciência da informação: estudos de uma interseção. Ciência da Informação, Brasília, v.29, n.3, p.50-70. set./dez. 2000. ROWLEY, Jennifer. A biblioteca eletrônica. 2.ed. Brasília: Briquet de Lemos, 2002. SAN SEGUNDO MANUEL, Rosa. Nueva concepción de conocimiento. In: RODRIGUES, Georgete Medleg; LOPES, Ilza Leite. (Orgs.). Organização e representação do conhecimento na perspectiva da Ciência da Informação. Brasília: Thesaurus, 2003. (Estudos Avançados em Ciência da Informação, v.2). SOUZA, Márcia Izabel Fugisawa; VENDRUSCULO, Laurimar Gonçalves; MELO, Geane Cristina. Metadados para descrição de recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da Informação, Brasília, v.29, n.1, p.93102, jan./abr. 2000. SOUZA, Renato Rocha; ALVARENGA, Lídia. A web semântica e suas constribuições para a ciência da informação. Ciência da Informação, Brasília, v.33, n.1, p.132-141, jan./abr. 2004. SOWA, John F. Knowledge representation: logical, computational foundations. Pacific Grove: Brooks/Cole, 2000. philosophical, and �15 SVENONIUS, E. Intelectual foundation of information organization. Cambridge: MIT Press, 2001. SVENONIUS, Elaine. The epistemological foundations of knowledge representations. Library Trends, Wntr, 2004. Acesso em: 18 maio 2006. Disponível em: http://www.findarticles.com/p/articles/mi_m1387/is_3_52/ai_n6080404/print SVENONIUS, Elaine. The intellectual foundation of information organization. Massachusetts: MIT Press, 2001. TAKAHASHI, Tadao. (Org.). Sociedade da informação no Brasil: livro verde. Brasília: Ministério da Ciência e Tecnologia, 2000. � Dublin Core The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/. Title A name given to the resource SNBU - Edição: 14 - Ano: 2006 (UFBA - Salvador/BA) Subject The topic of the resource Biblioteconomia Documentação Ciência da Informação Bibliotecas Universitárias Description An account of the resource Tema: Acesso livre à informação científica e bibliotecas universitárias. Creator An entity primarily responsible for making the resource SNBU - Seminário Nacional de Bibliotecas Universitárias Publisher An entity responsible for making the resource available UFBA Date A point or period of time associated with an event in the lifecycle of the resource 2006 Language A language of the resource Português Type The nature or genre of the resource Evento Coverage The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant Salvador (Bahia) Event A non-persistent, time-based occurrence. Metadata for an event provides descriptive information that is the basis for discovery of the purpose, location, duration, and responsible agents associated with an event. Examples include an exhibition, webcast, conference, workshop, open day, performance, battle, trial, wedding, tea party, conflagration. Dublin Core The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/. Title A name given to the resource Metadados e sistemas de recuperação da informação on line: uma questão de semântica? Creator An entity primarily responsible for making the resource Loureiro, Mônica de Fátima; Francelin, Marivalde Moacir Coverage The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant Salvador (Bahia) Publisher An entity responsible for making the resource available UFBA Date A point or period of time associated with an event in the lifecycle of the resource 2006 Type The nature or genre of the resource Evento Description An account of the resource Problemas que interferem na comunicação humana mediada por computador, mais especificamente as pesquisas sobre a interação homem-máquina, são os grandes desafios que se apresentam à comunidade científica na contemporaneidade. Os sistemas especializados de informação das universidades, que incorporam ferramentas desenvolvidas com base em metadados, na perspectiva da WEB semântica, podem ilustrar esse problema. A mobilização interdisciplinar de campos como a filosofia, a lingüística, a neurociência e as ciências cognitivas, entre outras, aliada às tecnologias de informação, sugerem respostas para esses problemas, apontando também para novas formas de mediação da informação. Dessa forma, procura-se discutir, com base na literatura nacional e internacional da Ciência da Informação, o desenvolvimento conceitual do termo metadado, as principais linguagens de tratamento de dados e, principalmente, as questões semânticas presentes nos ambientes de recuperação da informação on line. As pesquisas contemporâneas indicam que a eficácia dos sistemas de informação depende da incorporação de um mínimo semântico que opere como a base do entendimento mútuo entre homem e máquina. Sistematiza-se, por fim, a importância deste tema para o profissional da informação que atua em ambientes de ensino e pesquisa, como também seus possíveis impactos no saber-fazer cotidiano. Language A language of the resource pt