A ce jour, la surveillance des parois en interaction avec le plasma est principalement réalisée par des caméras infrarouges. En salle de contrôle, ces films permettent à l'équipe chargée de la protection de la première paroi de disposer, après chaque plasma, d'un tableau de bord combinant à la fois images infrarouges et courbes de températures. Ces données permettent d'évaluer rapidement l'état des parois et de repérer des zones présentant des défaillances ou étant endommagées.
Afin d'analyser automatiquement les films infrarouges de la paroi de WEST, le CEA-IRFM a développé un nouvel outil basé sur un modèle de langage multimodal* : LLM4PPO (Large Language Models for the Plasma-facing component Protection Officer). Grâce aux avancées récentes, LLM4PPO est capable de mobiliser des connaissances proches de celles des experts humains. Il peut ainsi, en analysant automatiquement les caméras infrarouges du tokamak, identifier et hiérarchiser les zones critiques et générer un rapport d'analyse, offrant un appui décisionnel quasi immédiat aux équipes en salle de contrôle.
Les premiers tests en conditions réelles sont encourageants. LLM4PPO a atteint un taux de satisfaction des experts en charge de la protection des composants face au plasma (PPO) de 43 %, auxquels s'ajoutent 30 % de réponses jugées neutres. Ces résultats sont prometteurs, d'autant plus que le modèle n'a été entraîné que sur une seule campagne expérimentale à ce stade, représentant un jeu de données relativement restreint. Pour s'améliorer, LLM4PPO s'appuie sur un mécanisme de retour d'expérience direct des experts via une interface web, et ces retours sont intégrés dans la base d'apprentissage.
Cette première application de modèles multimodaux de type LLM dans le domaine de la fusion ouvre la voie au développement de nouveaux outils d'assistance pour la protection des parois. A terme, ces outils permettront d'accélérer significativement la montée en puissance fusion d'ITER tout en garantissant l'intégrité des composants exposés au plasma.
*Les Large Language Models (LLM) représentent un type d'intelligence artificielle conçu pour traiter et générer du texte en langage naturel. Les LLM multimodaux complètent les capacités des modèles traditionnels par le traitement d'informations multimodales comme les images ou des formats audio et vidéo.