Jueves 28 de Marzo de 2024 | San Luis Potosí, S.L.P.
tecnologia

Qué es el Error 404 y porqué es importante preservar el contenido digital

Muy Interesante | 07/04/2020 | 01:54

La biblioteca digital Internet Archive consagrada a la preservación de archivos y sitios web, lo dedica a recordar el famoso error 404 «No encontrado». Por Sarai J. Rangel

 

Te habrá ocurrido: entrar a algún sitio solo para darte cuenta de que el vinculo se ha roto y la información perdido. Entonces aparece la leyenda «404 page not found» que señala que la web ha sido borrada.

 

Parece un problema trivial, mas no lo es. «Gran parte de la información actual es generada y distribuida en el ecosistema de Internet. Un ecosistema sumamente vulnerable a la pérdida o alteración de la información», explicó Jenny Guerra González, investigadora del Instituto de Investigaciones Bibliotecológicas y de la Información (IIBI) de la UNAM.

 

El riesgo de perderla es constante.«No preservarla pone en riesgo el que nosotros y las generaciones futuras podamos acceder a información veraz y de calidad como sí podemos hacerlo con los archivos, los periódicos, los libros y aquellos materiales que se resguardan en bibliotecas y otros centros de información», refirió la experta.

 

Preservar la memoria digital: ¿Cómo hacerlo?

 

Internet Archive, a través de su herramienta Wayback Machine, busca preservar parte de esta memoria al replicar y mantener «copias de seguridad» de una gran variedad de sitios. Sin embargo, con las millones de páginas que surgen y desaparecen día a día, es imposible mantener actualizada su base de datos. 

 

«La mitad de la información total del planeta ha sido producida en los últimos cinco años, y gran parte de ello solo existe en formato digital», comentó Juan Voutssás, doctor en Bibliotecología y Estudios de la Información, UNAM. 

 

Lo más preocupante es que se calcula que más de la mitad de los sitios web que se han producido ya no existen. ¿Cuántos «error 404» te han aparecido en lo que va del año?

 

«Este 2020 habrá 5,100 Gigabytes o 5.1 Terabytes de información por cada ser humano del planeta —señaló—. Considérese que un Terabyte de información equivale a 500 millones de cuartillas de texto de dos mil caracteres cada una, o dos millones de libros de 250 páginas cada uno».

 

Aunque el personal de Wayback Machine resguarda a diario cientos de millones de URL, nosotros podemos poner nuestro grano de arena ingresando la URL de sitios que creas deben preservarse en la página de guardado de Wayback Machine:

 

Basta con copiar la liga del sitio que desees y la pegues en el siguiente enlace: web.archive.org/save.

 

También existe una extensión para el navegador que te permite almacenar enlaces con un solo click.

 

«Como ciudadanos de a pie no le damos la misma importancia a lo digital que a lo impreso hasta que entramos a una página o sitio y la información ya no está y la necesitamos. Si la tuviéramos resguardada en un archivo permanente en línea, a semejanza de lo que hace el Internet Archive, eso no sería un problema pues iríamos directo a las versiones archivadas de ese sitio con solo tener una fecha aproximada o una palabra clave», dijo Jenny Guerra.

 

El origen del error 404 se estableció en 1992 por el World Wide Web Consortium (W3C) como parte de las especificaciones de la versión 0.9 del protocolo HTTP.

 

Como señala Internet Archive se trata de preservar Internet para que todos puedan disfrutarlo. ¿Te unes?