El archivo de Software Heritage" />
Close

Nuestro objetivo a largo plazo es recopilar todo el software públicamente disponible en formato de código fuente junto consu historial de desarrollo, replicarlo a gran escala para asegurar su preservación, y compartirlo con todos quienes lo necesiten.

El archivo de Software Heritage estácreciendo con el tiempo conforme arrastramos nuevo código fuente de proyectos de software y forjas de desarrollo. Publicaremos gradualmente funcionalidades de búsqueda y navegación del archivo — actualmente, ustedpuede verificar si el código fuente que le interesa ya está presente o no en elarchivo.

Contenido

Aunque apenas comenzamos, ya hemos incorporado en el archivo de Software Heritage una cantidad significativa de código fuente, reuniendo posiblemente el mayor archivo de código fuente en el mundo. El archivo incluye actualmente:

Las cifras a continuación permiten dar un vistazo en el archivo y su evolución en el tiempo.

Archivos fuente

loading…

Commits

loading…

Proyectos

loading…

¿Ya tenemos su código?

Todo contenido almacenado en el archivo tiene un identificador intrínseco, único, obtenido componiendo varias funciones hash diferentes. Utilizando el cuadro debúsqueda a continuación, puede verificar si el archivo ya contiene el códigofuente de su interés a través de su SHA1. Simplemente arrastre y suelte los archivos relevantes del código fuente en el cuadro (si los tiene) o introduzca el SHA1de uno de ellos.

Ejemplos:

  • el SHA1 de Player.cpp del videojuego DOOM 3 es a4d0c728252b18f66ac38d0a6f5e51fc471aa68d, ¿se encuentra en el archivo?
  • el texto de la licencia bajo la que se publicó DOOM 3 (GPL3) tiene SHA1 8624bcdae55baeef00cd11d5dfcfa60f68710a02
  • un archivo de código fuente presente en el archivo tiene SHA1 3ae58a7760b841b9588c81cf65602e0f5361bd22, ¿puede averiguar de qué se trata?

Navegación

Se puede navegar el archivo está a través de la aplicación web Software Heritage.

La aplicación wep permite buscar qué orígenes de software (repositorios, paquetes fuente, etc.) ya hemos archivado y cuándo lo hemos visitado, implementando una “máquina del tiempo” para el código fuente. Una vez encontrada la origen de interés, la aplicación web le permite navegar a través de ella como lo hace normalmente con las interfaces de exploración del sistema de control de versiones.

Navegar el archivo

API

El acceso programático al contenido del archivo está disponible a través de la API Software Heritage. La API permite navegar el archivo como un grafo de objetos relacionados con el desarrollo, como contenido de archivos, directorios, commits, y releases. 

Con la API, los desarrolladores pueden buscar objetos individuales por sus ID, recuperar sus metadatos y pasar de uno a otro los siguientes enlaces, por ejemplo, desde commits a los directorios correspondientes o commits precedentes, desde releases hasta commits, y cosas por el estilo.

La API también le permite recuperar información de rastreo, como orígenes de software rastreados y la lista completa de visitas realizadas en cada uno de ellos. Esto permite, por ejemplo, saber cuándo se tomaron las instantáneas de un repositorio de Git específico para cada una de ellas, y donde cada rama apuntaba en ese momento.

Leer la documentación de la API

Ayúdenos a desbloquear los niveles siguientes

Están en preparación funcionalidades adicionales del archivo de Software Heritage. He aquí algunos de los elementos en nuestra hojade ruta:

Aumentar la cobertura

En términos de qué está en el archivo… estamos comenzando. Planificamos rastrear muchos más proyectos de software y forjas de desarrollo, así como permitir a las personas presentar directamente URLs de proyectos faltantes que se deben archivar.

Información de procedencia

Todo el contenido archivado se marca con la fecha y hora en el momento de la recuperación y se asocia con dónde lo encontramos (su origen). Estamos trabajando en exponer la información de procedencia ya que ésta es útil para una infinidad de diferentes aplicaciones.

Búsqueda de textos completos

Estamos construyendo el archivo de código fuente más grande jamás concebido. Para permitir que la gente lo aproveche totalmente, estamos trabajando en la indexación del código fuente y en la búsqueda de textos completos. Aunque para cumplir lo prometido en esta escala necesitaremos superar varios desafíos.

Usted puede ayudar

El archivo de Software Heritage servirá a las necesidades demuchos, desde instituciones culturales hasta científicos e industrias. Todos pueden ayudarnos a lograr estosambiciosos objetivos y hay varias maneras de ayudar.

Convertirse en un patrocinador

Seguir nuestra hoja de ruta para el archivo requiere considerables recursos. Damos la bienvenida a empresas, institucionese individuos que quieran unirse a nuestro programa de patrocinio y respaldar el proyecto de Software Heritage.

Descubra nuestro programa de patrocinio
Enfrentar los desafíos científicos

Desarrollar, mantener y explotar el archivo de código fuente universal plantea importantes desafíos científicos. Damos labienvenida a los científicos que quieran contribuir a esta misión participando en nuestras actividades de investigación.

Únase a nuestra comunidad investigadora
Codifique con nosotros

Todo el software que desarrollamos es decódigo abierto. Damos la bienvenida a los colaboradores que estén dispuestos aprofundizar en esto y ayudarnos a desarrollar los diversos componentes que senecesitan para hacer que el archivo avance hacia los siguientes hitos.

Sumergirse en el código