APPRENTISSAGE - Data Scientist (H/F)

France, Vélizy-Villacoublay
Apprentissage

Au sein du département « R&D Information System », vous rejoignez l’équipe R&D Data Science qui est en charge de la spécification, du développement, de la mise en production et de la maintenance d’un système décisionnel permettant d’aider l’équipe DevOps dans la supervision et l’optimisation de notre chaine de production : intégration continue et déploiement continu.

Dans l’approche DevOps, l’équipe prend en charge les parties Continuous Monitoring and Learning soit :

  • Le développement des robots de collection et d’agrégation de données massives issues de nos chaînes de développement, d’opérations et de production.
  • La conception, le développement et le test des algorithmes innovants : Descriptive analytics, Predictive analytics, Discovery analytics and Perspective analytics. 
  • La présentation des résultats sous forme de Dashboard pour nos équipes DevOps. 

 

Vous travaillerez en collaboration étroite avec l’équipe Data Science et les autres équipes du département, plus particulièrement les équipes : SI, BI, développeurs et architectes.

 

Les Large Language Models (LLM) comme Mistral (Mistral AI), GPT (OpenAI) ou Llama3 (Meta), fondés sur des architectures Transformers [1], révolutionnent la génération de code en automatisant des tâches complexes (développement, débogage, optimisation), offrant une assistance précieuse aux développeurs. Cependant, leur production reste aléatoire (erreurs logiques, code non testé, dépendance à la reformulation de prompts précis), ce qui exige des mécanismes de validation rigoureux pour garantir fiabilité et sécurité.

Pour adresser ces limites, les systèmes multi-agents collaboratifs émergent comme une solution prometteuse. Inspirés des méthodologies humaines (planification itérative, tests, correction), ces frameworks décomposent le processus de codage en étapes spécialisées, confiées à des agents autonomes interagissant de manière synergique. Par exemple, le framework AgentCoder [2] propose une architecture où un agent programmeur génère du code à partir des spécifications, un agent testeur conçoit des cas de test pertinents, et un agent exécuteur de tests valide le code en fonction de ces tests, fournissant ainsi un feedback détaillé et précis (succès/échecs, erreurs, logs, …) pour réduire les hallucinations des LLMs et améliorer continuellement la qualité du code produit. CODESIM [3], basé sur une approche par simulation, est un framework multi-agents pour la génération de code qui intègre planification, codage et débogage via une simulation étape par étape, améliorant significativement la précision et réduisant la dépendance aux outils externes. Inspiré par la résolution de problèmes humaine, il combine aussi trois agents spécialisés : un agent planificateur modélise les entrées/sorties attendues avant la génération de code. Un agent programmeur génère le code aligné sur ce plan et un troisième agent déboggeur simule l’exécution pour détecter les incohérences et corriger en temps réel.

L'intégration de tels systèmes multi-agents dans le processus de développement logiciel, combinant créativité des LLMs (génération rapide d'idées) et rigueur systémique (validation structurée) pourrait améliorer la qualité et l'efficacité de la génération de code assistée par l'IA.

 

Vos missions

 

Au sein de notre équipe Data Science, votre mission consistera à concevoir et implémenter un système multiagents collaboratif dédié à l'assistance aux tâches liées au code. Ce système visera à permettre une collaboration intelligente entre différents agents, avec des mécanismes de feedback et d'itération pour améliorer la qualité du code généré. Les tâches spécifiques incluront :

·        Analyse des capacités des LLM pour les tâches liées au code : évaluer les performances de différents LLMs dans des tâches telles que la génération, la correction d'erreurs et l'optimisation de code.

·        Conception de l'architecture du système multi-agents : Définir les rôles et interactions des agents (par exemple, agent programmeur, agent concepteur de tests, agent exécuteur de tests) pour assurer une collaboration efficace.

·        Implémentation des agents : Développer les agents en utilisant des bibliothèques Python spécialisées, telles que LangChain et LangGraph, pour faciliter la création et l'orchestration des agents basés sur des modèles LLMs.

·        Intégration de mécanismes de feedback et d'itération : Mettre en place des processus où les agents peuvent s'évaluer mutuellement, générer des cas de test, exécuter le code produit et fournir des retours pour améliorer continuellement la qualité du code.

·        Automatisation des tests et de l'exécution : Développer des workflows automatisés pour tester et exécuter le code généré, en utilisant des outils tels que pytest, junit pour les tests unitaires et Docker pour la conteneurisation des environnements d'exécution.

·        Suivi et évaluation des performances : Intégrer des outils de suivi tels que MLflow pour monitorer les performances des agents, analyser les résultats des tests et ajuster les modèles en conséquence.

·        Documentation et partage des connaissances : Participer à la rédaction de la documentation technique et partager les meilleures pratiques au sein de l'équipe pour assurer une adoption efficace du système développé.

 

Références bibliographique:

[1] Vaswani, A. et al. (2017). Attention is All You Need. arxiv.org/abs/1706.03762.

[2] Huang D. et al. (2023). AgentCoder: Multi-Agent-based Code Generation with Iterative Testing and Optimisation. arxiv.org/abs/2312.13010.

[3] Islam A. et al. (2025). CODESIM: Multi-Agent Code Generation and Problem Solving through SimulationDriven Planning and Debugging. arxiv.org/abs/2502.05664.

Vos qualifications

 

Etudiant(e) en cursus universitaire ou Ecole d’ingénieurs, en recherche de contrat d’apprentissage pour une durée minimum de 18 mois.

Spécialité(s) / Option(s) souhaitée(s): Data Science, Machine/Deep Learning

 

Compétences techniques attendues :

  • Langages de programmation : Maîtrise avancée de Python.
  • Bibliothèques IA : Expérience avec LangChain, LangGraph ou autres frameworks pertinents pour le développement d'agents basés sur des modèles LLMs
  • Systèmes multi-agents : Connaissance des concepts et techniques liés aux systèmes multi-agents et à leur application dans les tâches liées au code.
  • Machine Learning / NLP : Compréhension des modèles LLMs et de leur utilisation dans des tâches de génération, de correction ou optimisation de code.
  • Tests et déploiement : Familiarité avec les frameworks de tests tels que Pytest, Junit, eslint, Docker.
  • Suivi des modèles : Expérience avec des outils de suivi tels que MLflow est un plus
  • API et intégration : Compétence dans la création et l'utilisation d'API RESTet FastAPI.
  • Gestion de projet et documentation : Maîtrise de Git pour le contrôle de version et utilisation des outils internes pour la documentation.
  • Bon niveau d’anglais à l’écrit et à l’oral

Profil :

  • Capacité d’analyse, de synthèse et de formalisation
  • Volonté d’implication et d’initiative, autonomie
  • Aptitude au travail en équipe et à communiquer

 

Nous rejoindre c'est aussi

 

Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans.

  • Environnement collaboratif et innovant
  • Collaboration internationale
  • Diversité des technologies, produits et solutions
  • Engagement en faveur de la diversité et de l’inclusion

Déclaration de diversité

Dassault Systèmes, avant-gardiste en matière de technologie et d’innovation durable, s’efforce de créer des équipes toujours plus inclusives et diverses à travers le monde. Nous avons la forte conviction que nos employés sont notre atout numéro 1 et nous voulons que tous, se sentent libres d’être pleinement qui ils sont vraiment. Notre objectif est qu’ils ressentent fierté et sentiment d’appartenance. En tant qu’entreprise à la pointe du changement, il nous incombe de favoriser l’inclusion de tous et participer à création du monde de demain.
Key Job Details
Location:
France, Vélizy-Villacoublay
Job type:
Apprentissage
Brand:
Dassault Systèmes
Experience level:
Not specified
Date Period:
4/7/2025
Ref ID:
543593
Dassault Systèmes Logo > Dassault Systèmes

Dassault Systèmes est un accélérateur de progrès humain. Nous proposons aux entreprises et aux particuliers des environnements virtuels collaboratifs permettant d’imaginer des innovations durables. Grâce aux jumeaux virtuels d’expérience du monde réel qu’ils créent avec la plateforme 3DEXPERIENCE et ses applications, Dassault Systèmes est un créateur de valeur, au service de plus de 350,000 clients de toutes tailles et de tous secteurs d’activité, dans plus de 150 pays. Rejoignez notre communauté mondiale de plus de 23,800 personnes passionnées !

Vous voulez en savoir plus ?

Pour en savoir plus, consultez toutes les rubriques de notre site web.

Étudiants et jeunes diplômés

Rejoignez-nous et consultez nos offres de stage et d'emploi.

Parcours de recrutement

En savoir plus sur votre parcours de recrutement.

Nos valeurs et notre culture

Découvrez nos valeurs et notre culture.