APPRENTISSAGE – Data Scientist – AI-powered Code Fix - Développement et Optimisation de la Correction de Code (H/F)
Au sein du département « R&D Information System », vous rejoignez l’équipe R&D Data Science qui est en charge de la spécification, du développement, de la mise en production et de la maintenance d’un système décisionnel permettant d’aider l’équipe DevOps dans la supervision et l’optimisation de notre chaine de production : intégration continue et déploiement continu.
Dans l’approche DevOps, l’équipe prend en charge les parties Continuous Monitoring and Learning soit :
- Le développement des robots de collection et d’agrégation de données massives issues de nos chaînes de développement, d’opérations et de production.
- La conception, le développement et le test des algorithmes innovants : Descriptive analytics, Predictive analytics, Discovery analytics and Perspective analytics.
- La présentation des résultats sous forme de Dashboard pour nos équipes DevOps.
Vos Missions
Lors de la validation de nos logiciels, l'analyse statique du code source est une étape essentielle pour détecter les erreurs de programmation et de conception, facilitant ainsi la maintenance du code. Dans cette optique, cet apprentissage consiste à exploiter les données résultant de l'analyse statistique du code source, telles que les patterns d'erreurs et de corrections, afin de développer des algorithmes de Deep Learning fiables pouvant aider les développeurs à corriger ces erreurs.
La correction des erreurs de code est une tâche indispensable pour garantir une bonne qualité de code et de minimiser les erreurs qui peuvent causer des problèmes majeurs dans les logiciels. Cependant, la correction des erreurs de code est une tâche fastidieuse et chronophage pour les développeurs, surtout lorsqu'il s'agit de corriger des erreurs complexes. Les modèles génératifs ont récemment été proposés comme une solution potentielle pour automatiser cette tâche en proposant des corrections de code précises et efficaces. Cependant, ces modèles sont souvent confrontés à des défis spécifiques liés à la complexité syntaxique et sémantique du code, à la variabilité des styles de codage, ainsi qu'à la nécessité de prendre en compte le contexte du code pour proposer une correction précise et complète.
Dans ce contexte, le/la candidat(e) aura pour mission la réalisation des objectifs suivants :
- Comprendre les défis spécifiques associés à la tâche de correction des erreurs de code.
- Proposer de nouvelles approches d'optimisation pour améliorer l'efficacité des modèles génératifs dans la correction des erreurs de code, en utilisant des techniques d'apprentissage automatique avancées.
- Implémenter et expérimenter les nouvelles approches proposées en utilisant des données de code existantes et des outils de modélisation générative tels que les modèles Llama-3, Mistral, etc.
- Evaluer les nouvelles approches proposées en termes d'efficacité et de performance, en utilisant des métriques adaptées.
- Intégrer les modèles dans nos chaînes de DevOps de production.
- Communiquer et présenter les résultats de façon innovante pour les autres équipes.
Le/la candidat(e) travaillera en collaboration étroite avec l’équipe Data Science et les autres équipes du département pour l’aspect collecte de données et plus particulièrement les équipes : SI, BI, développeurs et architectes.
Qualifications
Etudiant(e) en cursus universitaire ou Ecole d’ingénieurs, en recherche d'un contrat d’apprentissage de 12 mois.
Spécialité(s) / Option(s) souhaitée(s): Data Science, Machine/Deep Learning, Big Data, Statistiques
Compétences techniques attendues :
· Compréhension des modèles basés sur les transformers
· Maîtrise de la programmation OO : Python
· Maîtrise des librairies dédiées au développement d’algorithmes de Machine Learning et de Deep Learning (scikit-learn, tensorflow, pytorch, transformers…)
· Maîtrise d’outils Git et Gitlab
· Bon niveau d’anglais à l’écrit et à l’oral
Profil :
· Capacité d’analyse, de synthèse et de formalisation
· Volonté d’implication et d’initiative, autonomie
· Aptitude au travail en équipe et à communiquer
Les atouts en nous rejoignant
· Environnement collaboratif et innovant
· Collaboration internationale
· Diversité des technologies, produits et solutions
· Apprentissage au sein d’une équipe experte
Diversity statement
Join Dassault Systèmes, The 3DEXPERIENCE Company Everything becomes possible with Dassault Systèmes’ 3DEXPERIENCE virtual universes! Serving 230,000 customers in 11 industries, from high-tech to life sciences, fashion to transportation, we help businesses and people around the world to create sustainable innovations for today and tomorrow. Get on board a leading and fast-growing company of 20,000 talented professionals.