sexta-feira, 25 de janeiro de 2013

As dificuldades e desafios encontrados para a preservação digital

“A maior parte das tecnologias, das metodologias que foram desenvolvidas para a tecnologia digital, aliás, para as tecnologias de uma forma geral [...] foram desenvolvidas em países ricos. Países [...] que estão na Europa, no sul dos Estados Unidos. Países, geralmente, que estão em clima temperado, ou seja, frio e seco. Nós temos no Brasil um clima totalmente diferenciado. Nós estamos em um país tropical e subtropical, de clima quente e úmido. Ou seja, nós importamos tecnologia que foi desenvolvida para um clima totalmente diferente da gente e aplicamos essa tecnologia sem a devida reflexão. [...] Uma das coisas que a preservação digital em modo físico tem feito é estudar esses novos ambientes para que eles possam gerar metodologias, tratamentos, que sejam aplicáveis a nossa realidade tropical. [...] Será que a gente preserva corretamente um CD-ROM da mesma forma, no Brasil, do que se preserva na Europa? [...] Lógico que não. [...] Nós temos, na verdade, um grande clima de cultura para fungos, bactérias, para agentes biodegradadores. Nós não temos políticas de preservação no que diz respeito ao manuseio desses materiais nem ao fabrico de certos materiais que são utilizados para o suporte dessa tecnologia. [...]

Além disso, a gente tem outras preocupações que são mais do ponto de vista político especificamente. Como o Estado vê a ação de preservar? O que é que tem que ser preservado e como é que tem que ser preservado. Nós temos uma coisa que vai muito bem, que é a segurança da informação. [...] Que dado tem que ser preservado em função de sigilo, não em função de memória? Então a pesquisa, de modo geral, ela se situa nesses campos onde os problemas são mais evidentes”.

Entrevista com Marcos Galindo Lima, professor do Departamento de Ciência da Informação da UFPE e doutor em Línguas e Cultura da América Latina pela Universidade de Leiden, na Holanda.



Link da entrevista completa em https://www.youtube.com/watch?v=WITR9AaNVtA. Acesso em 16 de janeiro de 2013, às 13:20. 

Para saber mais sobre o entrevistado, acessar: http://buscatextual.cnpq.br/buscatextual/visualizacv.do?metodo=apresentar&id=K4780167T3. Acesso em 16 de janeiro de 2013, às 13:33



De acordo com Tomaz e Soares (2004). Somam-se a esses problemas fundamentais da preservação digital, outras dificuldades de ordem técnica, política, econômica e social, dentre as quais destacamos:  

* risco de agravamento do problema da exclusão social (p.ex., INTO..., 1997);

* dificuldade de definição de estratégias e custos associados às atividades de preservação digital (p.ex. CONWAY, 1996, TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION, 1996; HEDSTROM, 1997/1998; ROTHENBERG, 1999);

* agravamento do impacto ambiental com o fenômeno do “lixo eletrônico” (p.ex., ENTULHO..., 2000);

* falta de preparo de gestores de acervos e especialistas de preservação nas questões ligadas ao ambiente da tecnologia da informação (p.ex. ROUSSEAU & COUTURE, 1998);

* mercado altamente competitivo da tecnologia da informação levando a ciclos de renovação de tecnologia a cada 3 a 5 anos (p.ex. HEDSTROM, 1997/1998; BRAND, 1999);

* falta de linguagem própria nas diversas áreas do conhecimento para descrever os novos relacionamentos e tipos de documentos (p.ex. BELLOTTO, 1991; JARDIM, 1992);

* dificuldade para estabelecer as fronteiras dos documentos de natureza multimídia e hipertextual em redes distribuídas de longa distância (p.ex., INTO..., 1997);

* no contexto digital a distinção entre documento original e cópia  não é clara (p.ex. DURANTI, 2002);

* aumento da facilidade de uso e oferta de recursos da tecnologia da informação, acompanhado de aumento equivalente da complexidade e dependência tecnológica dos objetos digitais subjacentes (p.ex. INGWERSEN, 1995; TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION, 1996);

* aumento exponencial da capacidade de armazenamento, acompanhado de redução equivalente da expectativa de vida dos meios de armazenamento (p.ex., CONWAY, 1996,);

* abandono de fontes de informação digital quando as instituições deixam ou perdem o interesse pelos negócios (p.ex. TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION, 1996; LUSENET, 2002,);

* a tecnologia digital reformula antigos papéis e traz novos atores para o sistema sócio-econômico da informação (p.ex., CONWAY, 1996; TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION, 1996; HEDSTROM, 1997/1998);

* ausência de produtos de prateleira que considerem os requisitos de preservação por longo prazo (p.ex., BULLOCK, 1999);

* os atuais direitos de propriedade intelectual/copyright podem interferir na capacidade de preservar objetos digitais através de cópia sistemática (p.ex., BULLOCK, 1999);

* ênfase na geração e/ou aquisição de material digital numa era de redução de recursos, ao invés de manter a preservação e o acesso aos acervos eletrônicos existentes (p.ex., BULLOCK, 1999).



“Durante algum tempo acreditava-se (por ignorância, interesses ou negligência) que a documentação digital estaria livre de problemas tradicionais relacionados ao acondicionamento, degradação do suporte, obsolescência, falta de confiabilidade e espaço de armazenamento, porém o tempo nos ensinou que a tecnologia por si só não soluciona todos esses problemas, pelo contrário, inclui novos problemas, os quais dependem diretamente da interferência humana e de políticas de preservação digital para serem solucionados.” (Innarelli, 2011, p. 4)




“Temos muito mais a discutir sobre documento digital antes de chegarmos a qualquer fórmula ou resultado, porém, é assustador imaginar que enquanto discutimos, muitos documentos foram e estão sendo perdidos” Innarelli (2003)

Referências:

INNARELLI, H.C. Preservação digital: a influência da gestão dos documentos digitais na preservação da informação e da cultura. Revista Digital de Biblioteconomia e Ciência da Informação,Campinas, v.8, n. 2, p. 75, jan./jun. 2011.



Innarelli, H. C., Sollero, P. Reliability and durability of CD-ROM and CD-R medias: its fragility related to digital preservation. In: 7th World Multiconference on Systemics, Cybernetics and Informatics. Orlando: IIIS, 2003.



THOMAZ, Kátia. P; Soares, Antônio José. A preservação digital e o modelo de referência Open Archival Information System (OAIS). DataGamazero – Revista de Ciência da Informação – v.5 n. 1 fev/04. Disponível em: http://www.dgz.org.br/fev04/Art_01.htm Acesso em 15 de janeiro, às 15:23.


Comentário

Inúmeras estratégias foram criadas para sanar os problemas da preservação digital, mas é preciso ter consenso na sua aplicabilidade, pois há uma grande defasagem  de estudos científicos comprobatórios e uma política de preservação que envolva todos os produtos e criações característicos da web e integrado a outros sistemas internacionais.

___________________________________________________

Garantir meios de acesso à informação digital às futuras gerações, salvar nossa memória em meio digital.  



Para Duranti (2002) este momento trás novos desafios e renova a profissão, "quando percebi que os documentos digitais se tornaram uma realidade, achei que fosse o final da profissão do Arquivista..., mas o que percebi foi que ao invés de perder espaço, o a profissão do Arquivista foi valorizada e ganhou um novo ´status". 



Mediante essas problemáticas, A carta para a Preservação do Patrimônio Arquivístico Digital, publicada pela CTDE/CONARQ e UNESCO em 2004 , expressa algumas considerações a respeito dos documentos digitais, e a emergência dos profissionais da ciência da informação estarem atualizados de acordo com os avanços tecnológicos. Tais medidas garantem ao documento arquivístico sua credibilidade, uma vez que estes registram informações culturais, históricas, científicas, técnicas, econômicas e administrativas.



“Considerando que este patrimônio arquivístico digital se encontra em perigo de desaparecimento e de falta de confiabilidade, e que sua preservação em benefício das gerações atuais e futuras é uma preocupação urgente no mundo inteiro.”



“Entretanto, como a informação em formato digital é extremamente suscetível à degradação física e à obsolescência tecnológica – de hardware, software e formatos –,essas novas facilidades trazem conseqüências e desafios importantes para assegurar sua integridade e acessibilidade. A preservação dos documentos arquivísticos digitais requer ações arquivísticas, a serem incorporadas em todo o seu ciclo de vida, antes mesmo de terem sido criados, incluindo as etapas de planejamento e concepção de sistemas eletrônicos, a fim de que não haja perda nem adulteração dos registros. Somente desta forma se garantirá que esses documentos permaneçam disponíveis, recuperáveis e compreensíveis pelo tempo que se fizer necessário.”


Obsolescência das mídias

Obsolescência dos softwares/suportes. http://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/ged-10.pdf. Acesso em 16 de janeiro de 2013, às 16:22.

Iniciativas brasileiras ligadas a preservação digital

Hemeroteca Digital Brasileira – iniciativa da Biblioteca Nacional

http://hemerotecadigital.bn.br/. Acesso em 16 de janeiro de 2013, às 17:03.


Biblioteca Digital Brasileira de Teses e Dissertações 

O que é a BDTD? 

O Ibict coordena o projeto da Biblioteca Digital Brasileira de Teses e Dissertações (BDTD), que integra os sistemas de informação de teses e dissertações existentes nas instituições de ensino e pesquisa brasileiras, e também estimula o registro e a publicação de teses e dissertações em meio eletrônico. Este projeto − iniciativa inovadora do IBICT, em parceria com as instituições brasileiras de ensino e pesquisa − possibilita que a comunidade brasileira de C&T publique suas teses e dissertações produzidas no país e no exterior, dando maior visibilidade a produção científica nacional.

http://bdtd.ibict.br/. Acesso em 16 de janeiro de 2013, às 17:10.

 

InterPARES, sigla em inglês para Pesquisa Internacional sobre Documentos Arquivísticos Autênticos Permanentes em Sistemas Eletrônicos. O projeto foi criado em 1997 pela Universidade de British Columbia (UBC) do Canadá. O InterPARES envolve instituições de dez países. A preocupação, segundo as historiadoras, é evitar danos à informação e a perda de documentos como consequência da rápida obsolescência tecnológica. No Brasil, a pesquisa é coordenada pelo Arquivo Nacional, instituição federal vinculada ao Ministério da Justiça.

http://www.interpares.org/ip3/ip3_index.cfm?team=4. Acesso em 16 de janeiro de 2013, às 17:16. 
 

Base Minerva
Base Minerva, de acesso público, através da Internet, premite a consulta aos catálogos de todas as bibliotecas da UFRJ. http://www.minerva.ufrj.br/. Acesso em 16 de janeiro de 2013, às 17:20. 

 

Biblioteca Digital PUC 

http://www.sapientia.pucsp.br/tde_busca/index.php?tipoPesquisa=1. Acesso em 16 de janeiro de 2013, às 17:25.

A ferramenta de repositório DSpace e de que forma ela apoia a preservação digital




As bibliotecas do Massachusetts Institute of Technology (MIT) e os laboratórios da Hewlett-Packard em novembro de 2002, conforme Smith et al. (2003), trabalharam cooperativamente para desenvolver o repositório de recursos abertos conhecido como DSpace. O sistema DSpace possibilita gerenciar os diferentes e complexos recursos no formato digital (padrões de documentos como TIFF, AIFF, XML, ou publicados como especificações PDF, RIFF) para coletar, preservar, indexar e distribuir os itens digitais de ambientes acadêmicos (departamentos, laboratórios, centros, escolas, programas). Já em novembro de 2002 mais de 1500 instituições realizaram o download do DSpace.[...] 


Para facilitar a instalação o DSpace Donohue; Phillips, Salo (c2006-2007) disponibilizaram um guia de instalação e muitas dicas. Orientam que para acompanhar informações sobre criou-se na Internet o ambiente http://www.dspace.org/ reúne informação sobre o software, recursos, listas de discussão, comunidades, noticias.[...] 



No DSpace foi adotado o protocolo para coleta de metadados da Iniciativa dos Arquivos Abertos (Open Archives Initiative Protocol for Metadata Harvesting - OAI-PMH) e está registrado como provedor de dados.[...] 



Conforme Marcondes (2005) a vantagem do uso do OAI-PMH consiste em permitir a coleta automática de metadados de documentos armazenados em arquivos de publicações eletrônicas os provedores de dados. Os metadados são coletados conforme o Dublin Core (padrão internacional), pois é mais específico para informação bibliográfica. 



A Plataforma DSpace de código aberto está disponível gratuitamente para qualquer pessoa e pode ser baixado a partir do repositório de software de código aberto sourceforge. O código está licenciado sob a licença de código aberto BSD. Isto significa que qualquer organização pode usar, modificar e até mesmo integrar o código em sua aplicação comercial sem pagar quaisquer taxas de licenciamento. [...]



A aplicação DSpace pode reconhecer e gerenciar um grande número de formatos de arquivos e tipos mime. Alguns dos formatos mais comuns atualmente gerenciados dentro do ambiente DSpace são Word, PDF, JPEG, MPEG, arquivos TIFF. É importante ressaltar que, embora fora-da-caixa DSpace apenas auto-reconhece formatos de arquivos comuns, arquivos de qualquer formato pode ser gerenciado por DSpace. DSpace também proporciona um formato simples de registo de arquivo onde pode registar qualquer formato não reconhecido, de modo que possa ser identificado no futuro. [...] 

BLATTMANN, Ursula; WEBER, Claudiane. DSpace como repositório digital na organização. ACB: Biblioteconomia em Santa Catarina, Florianópolis, v. 13, n.2, p.467-485, jul./dez., 2008. Acesso em 16 de janeiro de 2013, às 14:21.

DSpace vem com uma interface baseada na web facilmente configurável, que qualquer administrador de sistema pode instalar em um único Linux, Mac OSX ou caixa de Windows para começar. (tradução nossa) 



http://www.dspace.org/why-use. Acesso em 16 de janeiro de 2013, às 13:06

O que são metadados de preservação




São dados que descrevem completamente os dados (bases) que representam, permitindo ao usuário decidir sobre a utilização desses dados da melhor forma possível.

São dados que permitem informar as pessoas sobre a existência de um conjunto de dados ligados as suas necessidades especificas.

(Slideshare de Miguel Ángel Márdero Arellano, disponível em http://www.slideshare.net/gemireki/metadados-dados-a-respeito-de-dados-presentation-596079. Acesso em 30 de dezembro de 2012, às 16:15.

OAIS e para que serve


O modelo para repositórios de metadados de preservação mais usado atualmente é o modelo de referência Open Archival Information System (OAIS), publicado pelo Consultive Committee for Space Data Systems (CCSDS).

OAIS é uma iniciativa ISO (International Organization for Standardization), desde junho 2003, que define um alto nível de modelo de referência para arquivos que precisem de uma preservação de longo prazo.[...]

No modelo atuam quatro entidades: produtores, consumidores, administração e o arquivo propriamente dito. No esquema do OAIS, está incluído um modelo de informação para inserção dos metadados de preservação (figura 1), a seguir.




No modelo, objeto físico e objeto digital podem ser, coletivamente, referenciados como objetos de dados. Eles são interpretados pela combinação da base de conhecimento da comunidade alvo e a informação de representação associada ao objeto de dados. 

http://www.scielo.br/scielo.php?pid=S0100-19652004000200002&script=sci_arttext. Acesso em 17 de janeiro de 2013, às 15:20.

ARELLANO, Miguel Ángelo. Preservação de documentos digitais. Ci. Inf., vol.33, n.2, Brasília, maio/ago, 2044.

Técnicas de Preservação


Preservação de tecnologia - Conservação e manutenção de todo software e hardware

necessários a correta apresentação dos objetos digitais; 

 

Refrescamento - Transferência de informação de um suporte físico para outro mais atual; 



Emulação - Uma forma de superar a obsolescência de software e hardwares através do desenvolvimento de tecnologias para imitar sistemas obsoletos em gerações futuras de computadores; 


Migração para suportes analógicos - Consiste na reprodução de um objeto digital em suportes analógicos tais como papel, microfilme ou qualquer outro suporte analógico de longa duração; 


Atualização de versões - Consiste em atualizar materiais digitais produzidos por um

determinado software através de regravação em uma versão mais atual do mesmo; 


Conversão para formatos concorrentes - Trata-se de converter um objeto digital para um formato que necessariamente não tenha sido desenvolvido pela mesma empresa que elaborou o software proprietário no qual este foi produzido. Também está restrito a alguns tipos de objetos. Pretende resguardar conteúdos da descontinuidade dos software, ou seja, quando o software não passar por versões atuais; 


Adesão a padrões (inclui a técnica de normalização) - Adesão a padrões abertos estáveis e largamente utilizados ao criar e arquivar recursos digitais. Eles não estão presos a plataformas específicas de hardwares e software o que resguarda por algum tempo a mais o recurso digital da obsolescência tecnológica. Pode ainda ser auto imposto por instituições que geram recursos digitais ou impostas por agências que os recebam;  


Migração a pedido - esta técnica foi proposta para evitar a deformação de objetos digitais originais. Então toda migração feita de um formato para outro partirá sempre do original, e não de uma versão que já foi atualizada; Vídeo sobre
:



http://www.youtube.com/watch?v=EKnsZZzuUr4. Acesso em 13 de janeiro de 2013, às 19:00.


Migração distribuída - trata-se do desenvolvimento e distribuição de conversores através da net que podem ser utilizados através de aplicações cliente. De acordo com Ferreira (2006) O Lister Hill National Center for Biomedical Communications possui um serviço web que converte objetos digitais de 50 formatos distintos para pdf. A Universidade do Minho está desenvolvendo serviço para disponibilização de várias centenas de serviços de conversão; 



 Encapsulamento - Reunir em coso a ele. Isto pode incluir metadados, software visualizador e arquivos específicos constituintes do recurso diginjunto com o recurso digital e o que quer que seja necessário para manter o acestal; 



Identificadores permanentes - Um meio de localizar um objeto digital mesmo quando sua localização muda; 


Arqueologia digital - É resgatar recursos digitais os quais tornaram-se inacessíveis pelo resultado da obsolescência tecnológica e/ou degradação da mídia, não é tanto uma estratégia em si mesma, mas uma substituta para quando materiais digitais ficaram fora de um programa de preservação sistemática; 


Pedra da Roseta Digital - O modelo baseia-se em três momentos diferentes os quais sejam: Processo de preservação do conhecimento [1] registro da codificação do formato de arquivo e do conteúdo em binários, [2] recuperação dos dados e [3] reconstrução dos documentos a partir das especificações construídas na primeira etapa. Denomina-se Pedra da Roseta Digital por tratar-se de uma técnica que pretende traduzir para novos software os arquivos digitais advindos de tecnologias já obsoletas, com parâmetros que permitam uma tradução, assim como a Pedra da Roseta, descoberta por soldados franceses no ano de 1799 e que permitiu a tradução dos hieróglifos egípcios; 


Metadados de preservação - a metainformação de preservação é responsável por reunir, junto do material custodiado, informação detalhada sobre a sua proveniência, autenticidade, atividades de preservação, ambiente tecnológico e condicionantes legais. 

http://repositorio.ufrn.br:8080/jspui/bitstream/1/34/1/2007Ev_Preservacaodigital_JacquelineAC.pdf. Acesso em 13 de janeiro de 2013, às 18:16.

 CUNHA, Jacqueline de Araújo; LIMA, Marcos Galindo. Preservação digital: o estado da arte. VIII ENANCIB- ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 28 a 31 de outubro de 2007, Salvador,  Bahia, Brasil.

 

 

Problemas


Os problemas relacionados à preservação digital não se limita apenas ao Brasil. Instituições internacionais com amplo desenvolvimento tecnológico e com diferentes técnicas das nossas, passam pela mesma problemática que ainda perpetua no meio digital. Com o surgimento da Web A durabilidade dos suportes digitais foi o ponto inicial para levantar questões e debates a respeito da preservação digital. A obsolescência tecnológica coloca em risco todos os documentos criados no meio analógico que dependem de software e hardware digitais. Vale ressaltar que a fragilidade das mídias é outro problema que afeta todos os tipos de nichos digitais. Os objetos digitais possuem especificidades que para um melhor desempenho necessitam de adequação material e suporte humano. Segundo Lusenet (2001):


Para compreender o conjunto de problemas associados à preservação digital é preciso, principalmente e antes de mais nada, conscientizar-se de que: 1) as mídias são suportes transitórios que prestam sua função somente por um período limitado de tempo e que a transferência para novas mídias é absolutamente necessária; 2) o software e o hardware tornam-se obsoletos em questão de anos, ao invés de décadas, e que embora as versões sucessivas de programas possam ser compatíveis, os fabricantes de software normalmente não garantem a compatibilidade por um longo período; e 3) o software proprietário é problemático não somente porque é protegido e o código fonte não está disponível mas, também, porque normalmente está documentado de forma inadequada tornando a conversão de dados muito mais complexa.

 

Referências:

LUSENET, Yola. Digital heritage for the future. Cadernos BAD, v. 2, p. 15-27, 2002.