
Hacia una infraestructura distribuida y de múltiples partes interesadas
Para evitar la pérdida de información y simplificar el acceso al patrimonio de software de la humanidad, estamos construyendo una red internacional de réplicas.
Una réplica es una copia completa del archivo Software Heritage, operada por una institución asociada. Esta página enumera las organizaciones que ya han firmado un acuerdo de réplica y describe los requisitos para unirse al programa.
Esperamos que más instituciones de todo el mundo se unan a esta creciente red.
Requisitos
Para establecer una réplica de Software Heritage, es necesario reunir dos tipos de requisitos: por un lado, la disponibilidad de los conocimientos técnicos y los recursos necesarios para desplegar la infraestructura necesaria; por otro lado, la capacidad de satisfacer los requisitos legales necesarios para firmar un acuerdo de mirroring.
Requisitos técnicos
Una réplica contiene una copia completa del archivo, lo que implica el aprovisionamiento de la infraestructura para alojar un gran stock de objetos y un grafo muy grande. En nuestra documentación, que se actualiza periódicamente y que incluye la arquitectura de referencia de una réplica y varias guías prácticas, se puede encontrar una visión general de lo que implica el funcionamiento de una réplica.
Hay muchas opciones diferentes para desplegar una réplica, pero hay requisitos generales comunes que se presentan en una página dedicada en nuestra documentación.
Requisitos jurídicos
Una organización interesada en albergar una réplica tendrá que firmar un acuerdo legal en el que se detallan los distintos derechos y obligaciones, así como la interacción con la organización de Software Heritage. En particular, esto incluye el compromiso de
1. respetar la carta ética de las réplicas, y establecer una carta ética alineada con la de Software Heritage
2. establecer términos de uso alineados con los de Software Heritage, tanto para el acceso a la API como para el acceso masivo a los datos
3. tratar los contenidos de los archivos, y especialmente los datos personales, de forma alineada con la política de contenidos de Software Heritage
4. Garantizar el correcto funcionamiento de la réplica durante un mínimo de tres años.
Usando un espejo
Un espejo es una copia de solo lectura del archivo principal de Software Heritage. Por lo tanto, debe permitir el acceso al contenido del archivo, pero puede que no ofrezca todas las funciones de Software Heritage.
Funciones proporcionadas
- Manténgase prácticamente actualizado con el archivo principal, generalmente con un retraso mínimo de menos de unas pocas horas.
- Proporcione acceso público a una interfaz web para explorar el archivo.
- Permita que los usuarios busquen por la URL original.
- Brinde acceso público a la mayor parte de la API pública, con límites de velocidad.
Diferencias
Un espejo se comporta de forma diferente al archivo de Software Heritage:
- Save Code Now redirigirá al archivo principal de Software Heritage.
- Add Forge Now redirigirá al archivo principal de Software Heritage.
- No hay servicio de Deposit .
- Las estadísticas y los contadores no se muestran en la página principal.
- Al ser asíncrona, un espejo solo es consistente eventualmente. Un objeto podría faltar temporalmente en el espejo, lo que genera un mensaje de error 404 al explorarlo.
Características opcionales
Un espejo también puede proporcionar opcionalmente algunas de las características del archivo principal de Software Heritage, como:
- Un motor de búsqueda avanzado
- Metadatos extendidos
- Una API avanzada de consulta de grafos (REST y GRPC)
- Autenticación para mayores límites de velocidad de la API