STAGE - Ingénieur(e) de recherche : Simulation de données synthétiques par GEN-IA (H/F)
Lieu du stage : Biot (06)
Au sein du département Corporate Strategy & Research, vous intégrerez l'équipe Living Twins for Practitioners, riche de compétences en médecine, biologie, mathématique et informatique, et qui conduit plusieurs projets en oncologie, neurologie et cardiologie.
Dans le cadre de la diversification de nos activités en santé, vous ferez partie de l’équipe « Clinical Decision » et serez responsable de la mise en place de méthodes de Deep learning permettant
· de générer des cohortes de données synthétiques de patients via des modèles génératifs,
· et d’évaluer la qualité des données générées en les comparant avec des données réelles de patients.
Missions
Le but de ce stage sera de mettre en place une méthodologie pour la génération de données cliniques de patients, permettant d’enrichir les bases de données servant à l’entraînement d’algorithme d’IA utilisés pour prédire la progression de patients atteints de cancer.
L’évolution de la maladie d’un patient peut être vu comme une succession d’évènement cliniques, en particulier dans le domaine de l’oncologie.
Les bases de données médicales existantes peuvent être restreintes. Cela a un impact sur l’apprentissage de modèles basés sur des algorithmes d’IA pour la prédiction de survenue d’évènements cliniques des patients. De plus, ces bases de données n’offrent pas forcément l’historique des données récoltées depuis le début du suivi du patient, entraînant une perte d’information du parcours patient.
La génération de données synthétiques devient aujourd’hui une solution populaire pour augmenter le nombre de données disponibles et améliorer la représentation de groupes sous-représentés dans la population.
L’enjeu sera alors de développer une méthode permettant de générer des caractéristiques patient évoluant au cours du temps ainsi que l’évolution de la maladie chez ces mêmes patients synthétiques.
Votre contribution consistera à :
· Effectuer un état de l’art des méthodes statistiques et de Deep Learning pour la génération de données cliniques de patients variant au cours du temps ;
· Implémenter un algorithme permettant la génération d’une cohorte de données synthétiques de patient ;
· Comparer la nouvelle méthodologie développée avec les méthodes existantes dans la littérature ;
· Effectuer une synthèse des résultats obtenus.
Vos qualifications
Etudiant(e) en école d’ingénieur ou Master Universitaire, de niveau Bac+5, vous recherchez un stage.
Compétences techniques souhaitées :
Statistiques / Mathématiques appliquées
Machine learning / Deep learning
Langage python et bonnes connaissances d’un framework de Deep Learning (Tensorflow, Pytorch)
Anglais courant
Une connaissance en biologie et/ou en médecine est un plus.
Qualités appréciées pour la bonne démarche de ce stage :
Autonomie, Motivation, Esprit critique, Esprit d'initiative, Bon sens de la communication
Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans.
- Environnement collaboratif et innovant
- Collaboration internationale
- Diversité des technologies, produits et solutions
- Engagement en faveur de la diversité et de l’inclusion
Diversity statement
Join Dassault Systèmes, The 3DEXPERIENCE Company Everything becomes possible with Dassault Systèmes’ 3DEXPERIENCE virtual universes! Serving 230,000 customers in 11 industries, from high-tech to life sciences, fashion to transportation, we help businesses and people around the world to create sustainable innovations for today and tomorrow. Get on board a leading and fast-growing company of 20,000 talented professionals.