<?xml version="1.0" encoding="UTF-8"?>
<item xmlns="http://omeka.org/schemas/omeka-xml/v5" itemId="5602" public="1" featured="0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://omeka.org/schemas/omeka-xml/v5 http://omeka.org/schemas/omeka-xml/v5/omeka-xml-5-0.xsd" uri="http://repositorio.febab.org.br/items/show/5602?output=omeka-xml" accessDate="2026-04-05T04:06:12-07:00">
  <fileContainer>
    <file fileId="4667">
      <src>http://repositorio.febab.org.br/files/original/47/5602/SNBU2006_278.pdf</src>
      <authentication>8bc432a73aeadfd9cab9b83ad0db110e</authentication>
      <elementSetContainer>
        <elementSet elementSetId="4">
          <name>PDF Text</name>
          <description/>
          <elementContainer>
            <element elementId="92">
              <name>Text</name>
              <description/>
              <elementTextContainer>
                <elementText elementTextId="60320">
                  <text>PRESERVAÇÃO DE ARQUIVOS DIGITAIS : DESAFIOS E SOLUÇÕES

JOSÉ ANTONIO RODRIGUES VIANA

UFF - UNIVERSIDADE FEDERAL FLUMINENSE
Biblioteca de Administração , Ciências Contábeis e Turismo
R. São Paulo, 30 sala 817
Campus do Valonguinho
24040-110 - Centro - Niterói  RJ- Brasil
e-mail: bac@ndc.uff.br

Analisa a preservação dos suportes dos arquivos digitais e das informações já
nascidas em meio digital ( e-books, periódicos, textos na internet). Apresenta
problemas e soluções já utilizadas. Discorre sobre a necessidade de migração
dos formatos de codificação e mídias devido ao avanço tecnológico.

I. INTRODUÇÃO

É cada vez mais importante a informação por meio digital na nossa sociedade,
devido a popularização da internet, aos custos cada vez menores de
equipamentos e a facilidade para divulgação e armazenamento. Essa revolução
digital está forçando as bibliotecas a repensarem seus objetivos, desenvolverem
novas políticas, técnicas, além de investimento em infraestrutura de informática.
Porém a medida que essas milhões de novas informações são geradas , elas
automaticamente estão correndo risco de desaparecimento. Novos softwares,
formatos, hardware aparecem a cada dia pondo em risco a informação corrente.
Segundo Sant Anna ( 2001) documento digital ou eletrônico é todo registro
gerado ou recebido por uma entidade pública ou priva, no desempenho de suas

�atividades, armazenado e disponibilizado ou não, através de algum sistema de
computação. Há também o documento digitalizado, que é a cópia digital de um
documento original existente em outro suporte. No presente trabalho trataremos
apenas do primeiro tipo.

II. PRESERVAÇÃO DE ARQUIVOS DIGITAIS

 A natureza dos documentos digitais está permitindo ampla produção e
disseminação de informação no mundo atual. É fato que na era da informação
digital se está dando muita ênfase à geração e/ou aquisição de material digital, em
vez de manter a preservação e o acesso a longo prazo aos acervos eletrônicos
existentes. O suporte físico da informação, o papel e a superfície metálica
magnetizada se desintegram ou podem se tornar irrecuperáveis. Existem,
ademais, os efeitos da temperatura, umidade, nível de poluição do ar e das
ameaças biológicas; os danos provocados pelo uso indevido e o uso regular, as
catástrofes naturais e a obsolescência tecnológica. A aplicação de estratégias de
preservação para documentos digitais é uma prioridade, pois sem elas não
existiria nenhuma garantia de acesso, confiabilidade e integridade dos
documentos a longo prazo.  (Arellano, 2004 )
Segundo Verdegem (2004 ) o principal problema relativo a preservação de
arquivos digitais é a obsolescência técnica. Ele levanta a questão sobre o que
fazer com softwares e suportes antigos, que atualmente não podem mais ser
usados. É preciso garantir que esses arquivos possam ser lidos por tecnologias do
futuro.
Wiggins ( 2001 ) afirma que para combater esse problema são necessárias
diversas estratégias :
•

Preservar o software : Requere manter o programa original usado para ver
e editar o conteúdo. Um problema adicional é preservar o sistema
operacional e o hardware necessário.

•

Atualizar ou migrar quando possível.

�•

Emular : Providenciar ferramentas para emular os aplicativos ou sistemas
operacionais.

•

Encapsular : Quando armazenar conteúdo digital é importante não
preservar somente texto, imagens, vídeos, etc. Mas também armazenar a
informação necessária para que esta informação seja acessada no futuro
em qualquer sistema operacional.

Estas estratégias parecem simples na teoria. Uma coisa é copiar o
conteúdo de um disquete para um cd ou se conseguir um software que simule um
sistema operacional antigo, mas não podemos esquecer que são criados
mensalmente em páginas web aproximadamente dez terabytes de informação no
mundo inteiro. Para se entender o tamanho do problema, todos os textos da
biblioteca do congresso norte americano alcançariam 17 terabytes se fossem
digitalizados para sua armazenagem (Wiggins, 2001)
Isto contribui para que as webpages sejam possivelmente o maior desafio
para serem preservadas. Inúmeras páginas nascem e morrem diariamente, das
mais variadas origens : governamentais, ongs, revistas, jornais, empresas. É
imensurável a quantidade de informação que se está simplesmente sendo
eliminada para as gerações futuras.
Edwardes( 2004) estima que 93 por cento de todas as novas informações já
nascem no formato digital . E essas informações tem como característica básica
sua volatibilidade. A vida média de um site na internet é de seis semanas!! O autor
cita que 44 por cento dos sites online em 1998 já estavam fora do ar no ano
seguinte.
Popova-Gosart ( 2004 ) lembra que a dificuldade para se incluir as
coleções digitais dos países em desenvolvimento em uma política de preservação
pode resultar em uma perda cultural para a humanidade. A necessidade de se
preservar a informação digital é fundamental para um futuro estudo dos tempos

�atuais. É que é um dever de cada bibliotecário se exercitar para resgatar para a
preservação os arquivos digitais que estão ameaçados.
Wiggins (2001) analisa as ameaças que os arquivos digitais sofrem, além
da óbvia destruição física, segundo ele este arquivos podem sofrer uma  morte
digital como nos seguintes casos :

•

Quando o novo toma lugar do velho: Toda vez que uma organização tem
uma nova informação para colocar no site é comum publicar o novo
conteúdo e simplesmente apagar o antigo.

•

Reorganização do conteúdo : Nas páginas web é comum reorganizar o
espaço da mesma. Geralmente acontece quando um novo webdesigner
assume a função. Neste processo muita informação simplesmente
desaparece.

•

Morte do patrocinador : Quando a organização mantenedora morre,
geralmente a informação morre com ela. Por exemplo, no dia seguinte da
derrota do candidato a presidência dos Estados Unidos, Al Gore, o seu site
saiu do ar. Impossibilitando os historiadores do futuro a analisar este
período da história americana.

•

Patrocinador perde o interesse: Muitos editores consideram que não vale a
pena manter o arquivos de edições anteriores em suas páginas.

•

Patrocinador teme a história : Em muitos casos, as empresas evitam
manter documentos históricos no site por medo de serem processadas.
Empresas como a Ford e a IBM, foram indiciadas por erros cometidos há
50 anos. Várias organizações estão incentivando a destruição de originais
potencialmente perigosos. O que acarreta a destruição da história da
companhia e o conhecimento incorporado a este processo.

�•

Formato da mídia ultrapassado : Um caso típico foi a transição do disquete
5 1/4" para o novo formato.

•

Formato da informação ultrapassado : Dados estocados em softwares
antigos como WordPerfect ou PC Write, podem ser ilegíveis para novos
softwares. Mesmo conteúdo já feito para a web pode se tornar obsoleto
para softwares que acessam as novas versões de html ou xml.

Abrahans ( 2004 ) afirma que sem uma compreensão completa dos
detalhes internos dos formatos em que os objetos digitais são codificados, a
preservação a longo prazo desses objetos é impraticável. Os formatos necessitam
ser compreendidos no sentido geral, de modo que as ferramentas genéricas e os
serviços possam ser criados. Segundo ele o estabelecimento de um registro
digital global de formato seria o melhor a ser feito para se otimizar o uso de
recursos geralmente escassos destinados a coleção e preservação dos acervos
pelo mundo.
Brown (2003) analisa que diferente do papel, a preservação de documentos
digitais envolve uma combinação de hardware e software. Mas a rápida mudança
tecnológica pode ser um obstáculo para esta preservação. É preciso desenvolver
uma estratégia que permita preservar a informação para gerações futuras ,
independente da tecnologia a ser utilizada. Nesta área duas correntes disputam a
primazia : emulação e migração. A emulação cobre uma variedade de técnicas pra
recriar o antigo ambiente em novos computadores. Os defensores da emulação
afirmam que esta é a única maneira de se recriar de modo fidedigno um arquivo
digital, mas é um processo que envolve uma grande quantidade de profissionais,
além do preço, proibitivo na maior parte dos casos.

�Diagrama de uma emulação (Verdegem, 2004 )

Hoje

1a. Geração

2a. Geração

Hardware 0

Hardware 1

Hardware 2

Software 0

Software
emulando
Hardware 0

Software
emulando
Hardware 1

Dados 0

Os adeptos da migração tem um visão diferente, que é converter os
arquivos para novos formatos, assim que os formatos originais se tornam
obsoletos.É uma técnica mais simples, mas existem problemas relacionados a ela.
Alguma parte da informação pode ser perdida no processo : por exemplo, na
conversão de um documento no formato de wordstar 5.0 para o Word xp pode
ocorrer a perda de algumas formatações. A questão é determinar até quanto se
pode perder sem comprometer a autenticidade do documento.
Rothenberg (1999) afirma que a migração é uma falsa promessa , já que
essa migração só ocorre naturalmente enquanto os originais estejam em uso
contínuo dentro das organizações e são copiados em formatos novos quando
necessitados. Entretanto, quando o original deixa de ser útil dificilmente será
atualizado, já que poucas organizações podem justificar o custo de transferir os
originais sem nenhuma perspectiva de uso a curto prazo. A sucessiva da tradução

�para novos formatos traz o problema de perda da informação, já que cada
tradução pode introduzir perdas novas.

Diagrama de uma migração (Verdegem, 2004)
1a. Geração

Hoje

2a. Geração

Hardware 2

Hardware 0

Hardware 1

Software 0

Software 1

Software 2

Dados 0

Dados 1

Dados 2

Conversão 1Conversão
de formato

Conversão
1

de f

de formato 2

2

1

Jones (2004) afirma que a preservação de arquivos digitais deve ter a
responsabilidade compartilhada. As decisões necessárias para a preservação
devem ser tomadas no momento da criação do documento, o que leva a um
papel primordial dos criadores no processo. O papel dos criadores de publicações
digitais é crucial e ao mesmo tempo difícil para se conseguir esta integração, já
que eles possuem conhecimento profundo da matéria, mas ao mesmo tempo
podem faltar as habilidades de arquivo necessárias. A solução nestes casos
pôde ser uma aliança entre a organização que vai controlar dados digitais, e os
criadores, de modo que aqueles com o conhecimento do material mantivessem o
controle sobre decisões sobre a necessidade do que será preservado e em que
intervalos. Embora a autora do artigo não pretenda que se ache uma solução

�única (o formato digital global ) para a preservação quanto aos formatos , porque
diferentes visões e tipos de material seriam benéficos no desenvolvimento de
estratégias nesta fase de início da discussão.

III. SELECIONANDO MATERIAL PARA A PRESERVAÇÃO

Com a imensa quantidade de informações produzidas diretamente torna-se
primordial a seleção do material a ser preservado. A avaliação deve ser executada
por uma comissão formada por usuários, gestores dos documentos e arquivistas.
Deve ser feita de modo imparcial, objetivo e profissional (Sant Anna, 2001)
Por exemplo, o Arquivo Nacional da Inglaterra trabalha com páginas
governamentais. E desenvolveram a política de seleção baseada em três
perguntas simples : Quais websites devem ser preservados, qual a frequência
para arquiva-los e como tecnicamente permitir a recuperação dos dados. A
instituição classifica os sites em duas categorias: Websites que se relacionam a
eventos específicos, tais como os projetos públicos, que são selecionados de
acordo com políticas existentes - estes têm uma vida finita e são arquivados na
sua conclusão. O Arquvio também busca preservar as informações dos Websites
de atividades e de funções do governo. Para isso selecionaram 50 sites
importantes de todas as atividades principais do governo para serem preservados
integralmente. A freqüência do arquivamento desses sites são flexíveis - durante
um evento tal como a guerra de Iraque, o arquivamento era semanal , mas na
maioria das vezes esse arquivamento é feito a cada dois meses. (Brown, 2003)

IV. CONCLUSÃO

Apesar de todos os esforços feitos ainda estamos no começo da era digital
e provavelmente muita informação importante para as futuras gerações estão
sendo eliminadas neste momento.

�Enquanto o papel, suporte aparentemente frágil, alcança uma durabilidade
de milênios, não podemos afirmar se os bibliotecários do futuro poderão acessar
este CD do SNBU. Existirá daqui a cinquenta anos alguma máquina que poderá
ler o CD? E o formato pdf? Será visto como alguma coisa da pré-história digital?
É preciso pensar seriamente na preservação de arquivos digitais para que o
nosso conhecimento possa ser apreciado pelas gerações futuras.

V. BIBLIOGRAFIA

Abrahans, Stephen L .The role of format in digital preservation. Vine, Bradford,
v.34, n.2, p. 49, 2004.

Arellano, Miguel Angel . Preservação de documentos digitais. Ci. Inf., Brasília, v.
33, n. 2, p. 15-27, maio/ago. 2004.

Brown, Adrian. Preserving the digital heritage: building a digital archive for UK
Government records. Online Information....Proceedings...2003. p. 67.

Edwardes, Eli. Ephemeral to Enduring: The Internet Archive and Its Role in
Preserving Digital Media. Information Technology and Libraries, Chicago, v.23, n.
1, pg. 3- 6 , 2004.

Jones, Maggie. The digital preservation coalition. Vine, Bradford, v.34, n. 2, p. 84,
2004.

Popova-Gosart, Ulia .Library preservation in Russia: hope and despair on the edge
of the technological revolution. Library Management, Bradford, v.25, n. 8/9, p.
343, 2004.

�Rothenberg, Jeff. Ensuring the Longevity of Digital Information. s.l : 1999. 18p.
(Versão extendida do texto Ensuring the Longevity of Digital Documents. Scientific
American , v. 272, n. 1, p. 42-7, 1995)

Sant Anna, Marcelo Leone. Os desafios da preservação de documentos públicos
digitais. Informática Pública, v.3, n.2, p. 123-135, dez. 2001

Verdegem, Remco, Stats, Jacqueline. Practical experiences of the Dutch digital
preservation test-bad. Vine, Bradford, v.34, n. 2, p. 56, 2004.

Wiggins, Richard.Digital preservation: Paradox &amp; promise. Library Journal, New
York, n. 12, p.12-16, spring 2001.

�</text>
                </elementText>
              </elementTextContainer>
            </element>
          </elementContainer>
        </elementSet>
      </elementSetContainer>
    </file>
  </fileContainer>
  <collection collectionId="47">
    <elementSetContainer>
      <elementSet elementSetId="1">
        <name>Dublin Core</name>
        <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
        <elementContainer>
          <element elementId="50">
            <name>Title</name>
            <description>A name given to the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51378">
                <text>SNBU - Edição: 14 - Ano: 2006 (UFBA - Salvador/BA)</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="49">
            <name>Subject</name>
            <description>The topic of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51379">
                <text>Biblioteconomia&#13;
Documentação&#13;
Ciência da Informação&#13;
Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="41">
            <name>Description</name>
            <description>An account of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51380">
                <text>Tema: Acesso livre à informação científica e bibliotecas universitárias.</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="39">
            <name>Creator</name>
            <description>An entity primarily responsible for making the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51381">
                <text>SNBU - Seminário Nacional de Bibliotecas Universitárias</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="45">
            <name>Publisher</name>
            <description>An entity responsible for making the resource available</description>
            <elementTextContainer>
              <elementText elementTextId="51382">
                <text>UFBA</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="40">
            <name>Date</name>
            <description>A point or period of time associated with an event in the lifecycle of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51383">
                <text>2006</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="44">
            <name>Language</name>
            <description>A language of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51384">
                <text>Português</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="51">
            <name>Type</name>
            <description>The nature or genre of the resource</description>
            <elementTextContainer>
              <elementText elementTextId="51385">
                <text>Evento</text>
              </elementText>
            </elementTextContainer>
          </element>
          <element elementId="38">
            <name>Coverage</name>
            <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
            <elementTextContainer>
              <elementText elementTextId="51386">
                <text>Salvador (Bahia)</text>
              </elementText>
            </elementTextContainer>
          </element>
        </elementContainer>
      </elementSet>
    </elementSetContainer>
  </collection>
  <itemType itemTypeId="8">
    <name>Event</name>
    <description>A non-persistent, time-based occurrence. Metadata for an event provides descriptive information that is the basis for discovery of the purpose, location, duration, and responsible agents associated with an event. Examples include an exhibition, webcast, conference, workshop, open day, performance, battle, trial, wedding, tea party, conflagration.</description>
  </itemType>
  <elementSetContainer>
    <elementSet elementSetId="1">
      <name>Dublin Core</name>
      <description>The Dublin Core metadata element set is common to all Omeka records, including items, files, and collections. For more information see, http://dublincore.org/documents/dces/.</description>
      <elementContainer>
        <element elementId="50">
          <name>Title</name>
          <description>A name given to the resource</description>
          <elementTextContainer>
            <elementText elementTextId="60294">
              <text>Preservação de arquivos digitais: desafios e soluções</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="39">
          <name>Creator</name>
          <description>An entity primarily responsible for making the resource</description>
          <elementTextContainer>
            <elementText elementTextId="60295">
              <text>Viana, José Antonio Rodrigues</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="38">
          <name>Coverage</name>
          <description>The spatial or temporal topic of the resource, the spatial applicability of the resource, or the jurisdiction under which the resource is relevant</description>
          <elementTextContainer>
            <elementText elementTextId="60296">
              <text>Salvador (Bahia)</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="45">
          <name>Publisher</name>
          <description>An entity responsible for making the resource available</description>
          <elementTextContainer>
            <elementText elementTextId="60297">
              <text>UFBA</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="40">
          <name>Date</name>
          <description>A point or period of time associated with an event in the lifecycle of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="60298">
              <text>2006</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="51">
          <name>Type</name>
          <description>The nature or genre of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="60300">
              <text>Evento</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="41">
          <name>Description</name>
          <description>An account of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="60301">
              <text>Analisa a preservação dos suportes dos arquivos digitais e das informações já nascidas em meio digital ( e-books, periódicos, textos na internet). Apresenta problemas e soluções já utilizadas. Discorre sobre a necessidade de migração dos formatos de codificação e mídias devido ao avanço tecnológico.</text>
            </elementText>
          </elementTextContainer>
        </element>
        <element elementId="44">
          <name>Language</name>
          <description>A language of the resource</description>
          <elementTextContainer>
            <elementText elementTextId="69103">
              <text>pt</text>
            </elementText>
          </elementTextContainer>
        </element>
      </elementContainer>
    </elementSet>
  </elementSetContainer>
</item>
