GitHub ha anunciado que el código fuente que forma parte del programa GitHub Archive ya descansa para que futuras generaciones puedan acceder a esta información.
Hablamos de futuras generaciones pero, por supuesto, en estos momentos no hay muchas garantías de que estas vayan a existir; por eso existen proyectos como la 'Bóveda del Fin del Mundo', una serie de búnqueres en las que se almacena información, bienes, e incluso seres vivos, por si acaso algún día son necesarios.
El búnquer de Svalbard es el más conocido, llamado el 'Arca de Noé de las semillas" por la variedad y cantidad de muestras de plantas que almacena; suficientes para recuperarlas en caso de extinción por causas naturales o por la mano del hombre.
El código fuente que sobrevivirá cientos de años
Ahora la Bóveda de Svalbard tiene otro bien muy valioso: una colección de cintas en las que están almacenados todos los proyectos activos en GitHub, el trabajo de millones de trabajadores en los últimos años.
GitHub es el sitio de referencia para alojar proyectos de software, y es especialmente popular en el sector del software libre. El código fuente de infinidad de programas, servicios y aplicaciones está disponible en esa web para que cualquiera lo descargue y trabaje con él.
Pero tarde o temprano, GitHub cerrará, o puede que el código se pierda por un fallo catastrófico o por un ataque. No solo se perderá código fuente, se perderán tanto proyectos personales como piezas de software sin las que Internet no puede funcionar.
Terabytes y terabytes de datos
El GitHub Archive Program nació para almacenar la mayor cantidad posible de estos proyectos en Svalbard, donde se espera que permanezcan durante unos 1.000 años. Si todo sale bien, eso supone que en el futuro se podrán recuperar todos estos proyectos.
En concreto, GitHub hizo una copia de todos los proyectos que estaban activos el pasado 2 de febrero de 2020, y la almacenó en 186 cintas piclFilm, capaces de durar mucho más que los discos duros tradicionales.
En total se almacenaron 21 terabytes de datos, cada proyecto un archivo TAR independiente, y almacenado en forma de códigos QR para mejorar la eficiencia. La única parte que podrá ser leída por un humano es el índice y la guía incluida, que enseña cómo recuperar los datos almacenados y cómo están almacenados.
Además, The Internet Archive también está inmerso en un proyecto semejante, aunque este afecta a todos los repositorios que sean públicos, no solo los activos; por el momento ya lleva catalogados 55 terabytes de datos, incluyendo comentarios y metadatos.