6.8. El archivo de la web

 Autores: Ciro Llueca y M. Carmen  Marcos

 

INTRODUCCIÓN 

En los últimos años el desarrollo de las TIC han permitido que el patrimonio digital y cultural se publique también en formato digital dando lugar a un crecimiento exponencial de los recursos digitales publicados en línea.

Pese a las dificultades se están haciendo acciones para la preservación de la producción digital como las páginas web, creando así repositorios digitales = depósitos contemporáneos de la memoria. Actualmente, estos representan el espacio natural de crecimiento de los servicios de información.

Es necesario archivar Internet. Entre los repositorios digitales  más conocidos están:

·         El sueco Kulturarw3

·         El australiano Pandora

·         Internet Archive

·         Y muchos más

En cuanto a las políticas de colección se observan varios modelos:

1.   modelo integral o exhaustivo: que persigue la integración automática de la web a partir de determinados criterios infraestructurales.

2.    modelo selectivo: compila la web en base a una política selectiva.

3.    modelo hibrido. Captura de forma periódica un dominio geográfico, con acciones selectivas temáticas o sociales. 

El número de repositorios que permite acceder libremente a sus colecciones es limitado.

Los países europeos se agrupan dentro del INTERNATIONAL INTERNET PRESERVATION CONSORTIUM (IIPC): con el fin de compilar, preservar y difundir el conocimiento de Internet para futuras generaciones en todo el mundo y permitiendo el intercambio internacional.

En España, la Biblioteca de Catalunya inició el proyecto PADICAT en el 2005. Y el gobierno vasco en el 2007 inició el proyecto ONDARET. Desde 2009 la Biblioteca Nacional encarga capturas periódicas del dominio .es a “Internet Archive”

 

EJEMPLOS DE ARCHIVOS WEB

INTERNET ARCHIVE: creado por una asociación sin ánimo de lucro en 1996 y es un ambicioso proyecto que tiene por objetivo guardar una copia de todos los sitios web a nivel mundial. Es un repositorio mundial.

 

PANDORA: creado también en 1996 por la National Library of Australia es un repositorio australiano. Sigue el modelo hibrido

 

NETARKIVET.dk: es el repositorio de la cultura danesa creado en 2005

 

PADICAT: Es uno de los proyectos digitales de Cataluña. Creado en 2005 para conservar el patrimonio catalán y aumentar la presencia de los contenidos catalanes en internet. Sigue también el modelo hibrido. Es un repositorio de acceso abierto.

 

PRESERVACIÓN DIGITAL

La preservación de estos repositorios digitales plantea problemas. Las estrategias de conservación a largo plazo de objetos digitales son:

  • la migración periódica o refresh de los datos, es la solución más aceptada
  • la emulación
  • la recreación

 

ASPECTOS TÉCNICOS

La mayoría de los proyectos de repositorios utilizan un paquete de programas informáticos de código abierto conocidos bajo el paraguas del nombre del software principal: HERITRIX, para la captura de los recursos. Para la organización y gestión de los mismos se usa el programa NUTCH-WAX.

El acceso permanente a los recursos, una vez capturados e indizados se realiza con el programa WERA o con WAYBACK.

Es la comunidad bibliotecaria mundial la que trabaja cooperativamente para mejorar estos paquetes.

 

También existen servicios que permiten crear archivos de sitios web. Ofrecen un software rastreador (crawler) que recorre los sitios que se le incida y almacena una copia de todas sus páginas. Las más conocidos son WebCite y Archive-It

 

ASPECTOS LEGALES

En la mayoría de los países la legislación sobre depósito legal se ha quedado obsoleta y no contempla la producción digital como objeto de depósito legal obligatorio por ley.

Hay una situación de alegalidad de esta producción digital y ello ha hecho que se haya perdido una gran parte de esta.

Los REPOSITORIOS DIGITALES son, de momento, el único recurso para garantizar el acceso permanente a los recursos digitales publicados en internet.

Los retos de futuro son muchos:

  • crear y consolidar estructuras tecnológicas que permitan asumir el crecimiento exponencial de este tipo de archivos.
  • Definir estrategias de preservación digital.
  • Abordar procesos de cooperación entre archivos web e instituciones de la memoria para dar respuesta de futuro a los retos de la preservación digital.

PADICAT Y ONDARENET: dos ejemplos de archivos digitales autonómicos en España