
RÉSUMÉ DE L’ATELIER :
LE DÉFI DES BENCHMARKS ET DE LA SOUVERAINETÉ EUROPÉENNE DE L’IA EN FINANCE
L’Institut Louis Bachelier (ILB), en partenariat avec GENCI, a organisé au Palais Brongniart un atelier consacré à « l’IA Factory » et aux enjeux de l’intelligence artificielle en finance. Cette rencontre a réuni chercheurs, institutions et acteurs de marché autour d’un objectif commun : identifier les besoins du secteur en jeux de données de référence, en benchmarks et en métriques adaptés aux réalités financières. Les échanges ont été particulièrement riches, suivis de nombreuses questions du public, témoignant de l’intérêt marqué de l’écosystème pour ces sujets. La finance fait partie des secteurs les plus impactés par l’IA, ce qui renforce la nécessité de standards d’évaluation robustes et partagés.
Lors de la session d’ouverture, Marie Brière (Directrice générale de l’ILB) et Cédric Auliac (GENCI) ont rappelé que l’IA est déjà présente à tous les niveaux de la décision financière — conformité, détection de fraude, prévision, allocation, analyse des risques et relation client. Cédric Auliac a souligné en particulier que, si la puissance de calcul de GENCI servait historiquement la physique nucléaire et la mécanique des fluides, la finance est désormais devenue une verticale essentielle pour ces ressources nationales. La priorité se déplace aujourd’hui vers la fiabilité, la mesure et les cadres d’évaluation.
Les intervenants ont abordé des questions fondamentales : qu’est-ce qui définit un modèle d’IA fiable en finance ? Comment mesurer sa précision et sa robustesse face aux changements de régime ou aux attaques adversariales ? Comment évaluer les biais et la valeur ajoutée globale dans une approche multidimensionnelle intégrant coûts financiers et environnementaux ? L’atelier a également soulevé des enjeux majeurs de souveraineté et d’indépendance : faut-il affiner et évaluer ces modèles spécifiquement sur des données européennes ?
La table ronde a réuni des chercheurs et praticiens de BNP Paribas Global Markets, Natixis CIB, ARDIAN, Dragon LLM, l’École Polytechnique et Google DeepMind. Les échanges ont mis en évidence un écart important : si des cas d’usage des grands modèles de langage (LLM) existent déjà en finance, les cadres d’évaluation restent insuffisamment structurés. Le principal goulot d’étranglement ne concerne pas l’application elle-même, mais la mesure de la fiabilité. De même pour les usages en gestion des risques et en valorisation (deep hedging, pricing rapide), les experts ont insisté sur la nécessité d’imposer des standards scientifiques stricts, incluant des « jeux de test d’évaluation » pour chaque cas d’usage avant mise en production. La validation humaine reste centrale, avec une exigence de supervision continue pour garantir que l’IA demeure un « assistant de productivité » et non un risque autonome.
Les intervenants ont également mis en avant des approches de sobriété et de ciblage : choisir le bon modèle pour le bon usage, privilégier la méthodologie, la traçabilité et le contrôle. Ils ont mis en garde contre les tests in-sample et les évaluations qualitatives, au profit de comparaisons out-of-sample sur des benchmarks clairement définis. Pour le traitement du texte, cela inclut l’usage de petits modèles spécialisés, capables de surpasser de grands modèles généralistes sur des tâches financières ciblées, tout en étant plus économiques et plus sobres en énergie.
La table ronde a couvert les thèmes de la productivité opérationnelle, de la valorisation, de la couverture et de la gestion des risques, ainsi que de l’évaluation des modèles en présence de décalages de distribution, pour conclure sur les enjeux de souveraineté.
Le constat partagé est que l’objectif n’est plus seulement de « faire fonctionner les modèles », mais de démontrer, mesurer et encadrer leur comportement dans un environnement financier. Tous les participants ont souligné l’importance de développer des benchmarks européens structurés afin de garantir la souveraineté. Cette dynamique implique un effort collectif de mutualisation des données, des métriques et des méthodes entre recherche et industrie. Dans ce cadre, un groupe de travail est en cours de constitution en partenariat avec l’Institut Louis Bachelier, la verticale IA Finance de l’IA Factory et GENCI, ainsi que le Cercle IA et Finance, afin de faire progresser ces standards souverains.