Close

mars 1, 2024

Ingénieur⸱e architecture et développement Big Data

Le projet Software Heritage

Software Heritage est un projet d’archive universelle du code source logiciel, dont l’objectif est de récupérer, préserver dans le très long terme et partager la totalité du code source qui est publiquement disponible, avec l’historique de son développement (p.ex., comme stocké dans des systèmes de gestion de version). L’archive de Software Heritage contient déjà plus de 17 milliards des fichiers source uniques et 3,6 milliards de commits, récupérés à partir de plus de 266 millions de projets de développement logiciel. L’initiative Software Heritage, hébergée par la Fondation Inria est un projet entièrement logiciel libre (FOSS) et à but non lucratif.

Le Poste

Nous recherchons un·e ingénieur·e expérimenté·e logiciel orienté·e Big Data. Le·a candidat·e idéal·e sera une personne ayant un un intérêt et une expérience significatifs pour les architectures de traitement et d’exploitation de données à grande échelle, incluant le stockage, l’indexation et l’extraction.

Vous pouvez consulter une liste détaillée de nos projets en cours sur la Roadmap 2023 de Software Heritage (https://docs.softwareheritage.org/devel/roadmap/roadmap-2023.html)

Missions et activités principales

– Mise en place d’une architecture de traitement de données (à la Spark)
– Conception et modélisation d’architectures Big Data
– Implémentation de solutions sur la base des architectures définies
– Mise en place de pipelines big data

Compétences

Le·a candidat·e idéal·e doit avoir de l’expérience dans le développement et l’architecture Big Data, de préférence dans le contexte du logiciel libre. Nous attendons des compétences d’auto-organisation et d’autonomie proportionnelles à l’expérience du·de la candidat·e. La participation à des projets FOSS existants, à quelque titre que ce soit (développeur·se, organisateur communautaire, rédacteur technique, etc.) constitue un atout supplémentaire.

Les compétences suivantes sont attendues:

– Maîtrise d’un système de traitement de données à grande échelle (par exemple Apache Spark, Flink, ou Hadoop)
– Pratique courante du développement logiciel (Bases en Rust et Python)
– Bon niveau d’anglais (écrit et oral)
– Utilisation de Git
– Utilisation d’outils d’intégration continue (par exemple Gitlab et/ou Jenkins)

La connaissance et l’expérience des éléments suivants seront considérées comme un atout:

– Expérience dans du traitement de données à l’échelle de dizaines de tera-octets, voire peta-octets
– Expérience avec Cassandra et Kafka
– Connaissances en Java
– Connaissances Kubernetes
– Data visualization

Software Heritage est une architecture technique complexe, basée sur de nombreuses technologies différentes et qui continue à évoluer. Nous n’attendons pas que les candidat·es en maîtrisent l’intégralité, mais plutôt qu’iels soient disponibles à la découverte et à l’apprentissage. Une connaissance préalable de l’un ou plusieurs des sujets mentionnés auparavant sera une aide dans le processus de prise en main du projet, mais nous vous encourageons à candidater quelque soit votre niveau d’expérience dans ces technologies.

Conditions de travail

Nous sommes une équipe de 15 personnes dont 9 personnes pour l’équipe technique (5 developpeurs et 4 sysadmins)
L’autonomie, la transparence et la concertation sont au coeur de nos valeurs (Le projet est libre et Open Source).

La majorité de l’équipe est rattachée au centre Inria de Paris, mais le poste est ouvert à toute localisation en France à proximité d’un centre Inria (Bordeaux, Lille, Lyon, Grenoble, Rennes, Saclay, Sophia Antipolis, Nancy)

Le contrat proposé par Inria est un CDD à temps complet de 2 ans renouvelable, avec perspective de pérennisation.
– Télétravail: 90 jours /an (en moyenne 2 jours par semaine)
– Congés: 35 jours + 10 jours de RTT
– Fourchette de salaire : 30 à 70 k€ selon profil et expérience.

Candidature

Merci d’envoyer votre candidature (CV + Lettre de motivation) à hiring@softwareheritage.org

mars 1, 2024