Svalbard, Noruega, es donde descansarán terabytes de programas

Svalbard, Noruega, es donde descansarán terabytes de programas GitHub Omicrono

Software

El código fuente de millones de programadores descansará en el Ártico durante 1.000 años

El proyecto de GitHub para almacenar el código fuente de incontables programas en un almacén el Ártico garantizará que estará disponible durante generaciones.

17 julio, 2020 18:43

Noticias relacionadas

GitHub ha anunciado que el código fuente que forma parte del programa GitHub Archive ya descansa para que futuras generaciones puedan acceder a esta información.

Hablamos de futuras generaciones pero, por supuesto, en estos momentos no hay muchas garantías de que estas vayan a existir; por eso existen proyectos como la 'Bóveda del Fin del Mundo', una serie de búnqueres en las que se almacena información, bienes, e incluso seres vivos, por si acaso algún día son necesarios.

El búnquer de Svalbard es el más conocido, llamado el 'Arca de Noé de las semillas" por la variedad y cantidad de muestras de plantas que almacena; suficientes para recuperarlas en caso de extinción por causas naturales o por la mano del hombre.

El código fuente que sobrevivirá cientos de años

Ahora la Bóveda de Svalbard tiene otro bien muy valioso: una colección de cintas en las que están almacenados todos los proyectos activos en GitHub, el trabajo de millones de trabajadores en los últimos años.

GitHub es el sitio de referencia para alojar proyectos de software, y es especialmente popular en el sector del software libre. El código fuente de infinidad de programas, servicios y aplicaciones está disponible en esa web para que cualquiera lo descargue y trabaje con él.

Uno de los contenedores de almacenamiento de datos, entre los que está Unicef y GitHub

Uno de los contenedores de almacenamiento de datos, entre los que está Unicef y GitHub GitHub Omicrono

Pero tarde o temprano, GitHub cerrará, o puede que el código se pierda por un fallo catastrófico o por un ataque. No solo se perderá código fuente, se perderán tanto proyectos personales como piezas de software sin las que Internet no puede funcionar.

Terabytes y terabytes de datos

El GitHub Archive Program nació para almacenar la mayor cantidad posible de estos proyectos en Svalbard, donde se espera que permanezcan durante unos 1.000 años. Si todo sale bien, eso supone que en el futuro se podrán recuperar todos estos proyectos.

Las cajas que transportaron el código fuente de GitHub

Las cajas que transportaron el código fuente de GitHub GitHub Omicrono

En concreto, GitHub hizo una copia de todos los proyectos que estaban activos el pasado 2 de febrero de 2020, y la almacenó en 186 cintas piclFilm, capaces de durar mucho más que los discos duros tradicionales.

Las cintas en las que se almacenaron los proyectos de GitHub

Las cintas en las que se almacenaron los proyectos de GitHub GitHub Omicrono

En total se almacenaron 21 terabytes de datos, cada proyecto un archivo TAR independiente, y almacenado en forma de códigos QR para mejorar la eficiencia. La única parte que podrá ser leída por un humano es el índice y la guía incluida, que enseña cómo recuperar los datos almacenados y cómo están almacenados.

Además, The Internet Archive también está inmerso en un proyecto semejante, aunque este afecta a todos los repositorios que sean públicos, no solo los activos; por el momento ya lleva catalogados 55 terabytes de datos, incluyendo comentarios y metadatos.