Stage – Ingénieur en Science des Données et IA : OCR et VLM F/H
Référence 2025-21893
Stage
La Défense, Hauts-de-Seine (92)
IS - SYSTEMES D'INFORMATION
Etudiant
Barème Alternance, Stage et VIE
Vos missions
Contexte
L’équipe DSAM a développé une pipeline d’OCR avancée permettant l’extraction automatique et l’exploitation de données structurées à partir d’une grande base documentaire. Basée sur des architectures CNN pour la détection [1] et Transformers pour la reconnaissance [2] de texte, cette pipeline nécessite désormais une consolidation : amélioration des performances, validation approfondie, tests de robustesse et intégration d’une interface utilisateur, avant son déploiement industriel.
Les missions
Votre travail s’articulera autour de trois axes :
1- Amélioration des méthodes OCR
• Revue détaillée de la littérature, avec une attention particulière sur les architectures à l’état de l’art Transformers tels que TrOCR [3] ou GOT [4] et les Vision Language Models (VLM) tel que olmOCR [5].
• Expérimentation de ces nouveaux modèles et comparaison avec la solution actuelle.
2- Exploitation des données extraites
Développement d’algorithmes avancés issus de l’Information Retrieval [6] (Semantic Search, Word embedding, BERT, etc.) permettant un requêtage performant des données extraites.
3- Validation des performances
• Annotation d’un échantillon représentatif de documents Framatome pour une validation approfondie des méthodes.
• Analyse fine des performances, de la robustesse et diagnostic des cas d’échecs (compromis faux positifs / faux négatifs) en tenant compte des spécificités métiers.
Rejoignez notre équipe de R&D en IA et Data Science
Vous intégrerez le Centre de compétences en Data Science et Mathématiques Avancées (DSAM) de Framatome. L’équipe, composée d’experts en IA, apprentissage machine et ingénierie nucléaire, développe des solutions innovantes appliquées à des domaines tels que les systèmes critiques embarqués, les méthodes statistiques pour la démonstration de sûreté nucléaire, l’analyse de données multiphysiques expérimentales, la robotique ou l’IA générative.
Vous êtes
Etudiant(e) en Master 2 ou équivalent, spécialisé(e) en science des données et intelligence artificielle, vous possédez :
• De solides compétences en apprentissage statistique et apprentissage profond.
• Une grande maîtrise de python, ses librairies usuelles et d’un framework Deep Learning (PyTorch, TensorFlow).
• Une maîtrise théorique des architectures Transformers et LLM, idéalement appuyée par une expérience sur un projet réel.
• Très bon niveau d’anglais technique.
Vous aimez évoluer en équipe, êtes dynamique, curieux(se), créatif(ve), impliqué(e), et souhaitez rapidement monter en compétences dans un environnement stimulant de recherche appliquée industrielle.
Informations additionnelles
Spécialité : IS5 - Digital
Niveau d’études (tous) Bac+5
Lieu : France, Ile-de-France, Hauts-de-Seine (92), La Défense
Déplacements : Non
Niveau d’emploi : Etudiant
Poste soumis à enquête administrative : Oui
Framatome s’engage activement en faveur de l’inclusion et de la diversité. L’entreprise met en œuvre des actions concrètes pour l’intégration des personnes en situation de handicap et l’égalité professionnelle entre les femmes et les hommes. En savoir plus.
Domaine d'activité
Témoignage

Apporter du bien-être au quotidien des utilisateurs et pouvoir améliorer leur expérience
Happy Trainees

Rejoignez-nous
Alors rejoignez-nous, nous avons plus d’un atome en commun.
Les avantages
Bénéficiez d’un pacte social avantageux dans une entreprise financièrement saine
Framatome a mis en place des packages de rémunération attractifs, évolutifs et globaux. En plus de salaires attractifs, ils comprennent des primes, un intéressement et de la participation aux résultats. Vous pouvez souscrire à un Compte Épargne Temps, au Plan d’Épargne Groupe d’EDF et à un Plan d’Épargne Retraite Collectif. Vous avez accès à une couverture santé et prévoyance intéressante, à des chèques CESU et bien d’autres avantages.