Trimestre thématique: IA pour les deux infinis

Bannière trimestre IA pour les deux infinis

Site web du trimestre

Ce trimestre est constitué de plusieurs ateliers différents couvrant différentes thématiques de la physique des particules.

L’intelligence artificielle et le challenge des incertitudes en physique fondamentale

L’intégration de l’intelligence artificielle (IA) dans le domaine de la science fondamentale connaît un essor sans précédent. Cependant, des défis spécifiques doivent être relevés :

Toute mesure ou prédiction doit être assortie d’un intervalle de confiance précis
les mesures reposent sur de nombreuses données, chacune présentant des incertitudes inhérentes et des corrélations potentielles
la confiance dans la mesure doit être communiquée aux pairs
la complexité d’une expérience se situe entre le jeu de casse-tête et la voiture autonome : il existe des simulateurs détaillés, coûteux et imparfaits
chaque dispositif expérimental est un dispositif unique complexe, produisant des données semi-structurées
des données coûteuses de l’ordre du pétaoctet

Ces défis ont été relevés dans le passé pour des mesures extraordinairement complexes où le rôle de l’IA n’était pas majeur (par exemple, les découvertes du boson de Higgs ou des ondes gravitationnelles). Par ailleurs, la science fondamentale possède une culture des big data vieille de plusieurs dizaines d’années.

Cet atelier a pour objectif de réunir des experts en sciences fondamentales, informatique et statistiques pour échanger autour du thème des incertitudes, qui a été divisé en plusieurs thèmes :

Quantification de l’incertitude, prédiction de l’incertitude

IA explicable, IA digne de confiance
Inférence basée sur la simulation
Approches frugales en données, IA centrée sur les données ; données de référence et défis
Hackathon Fair Universe
Dépliage (ou dé-biaisage, dé-floutage)
Contrôle des incertitudes dans les modèles génératifs
Architectures (Adversarial, Bayesian, … )

Chaque thème fera l’objet d’exposés introductifs par des experts de premier plan, suivis de contributions.

La détection d’anomalies 

L’atelier AISSAI sur la détection d’anomalies se tiendra du 4 au 7 mars 2024 à Clermont-Ferrand, en France.

La détection d’anomalies est un problème difficile qui peut grandement bénéficier de l’utilisation de méthodes d’apprentissage machine (ML) : non supervisées et semi-supervisées. Les algorithmes d’apprentissage automatique doivent être capables de traiter des ensembles de données complexes et massifs et de rechercher des anomalies dans des conditions extrêmes (rapport signal/bruit très faible, données en temps réel, etc.) Le champ d’application des méthodes de détection d’anomalies est vaste, et les avancées réalisées dans un domaine scientifique peuvent souvent être transférées à d’autres disciplines, au bénéfice des deux parties concernées.

Cet événement rassemble des scientifiques issus de différents domaines scientifiques, notamment l’informatique, les statistiques, la physique des particules et l’astrophysique, ainsi que des domaines transversaux tels que le développement d’algorithmes de détection d’anomalies, l’analyse d’images médicales, la physique des accélérateurs, et d’autres encore. L’objectif de cet atelier est d’entamer un dialogue entre différents experts, en favorisant un environnement collaboratif où les expériences, les connaissances et les méthodologies peuvent être partagées.

L’atelier explorera des sujets liés à, mais non limités à :

Nouveaux algorithmes d’apprentissage automatique pour la détection des anomalies
Techniques statistiques pour la détection d’événements rares
Détection d’anomalies pour la découverte de nouveaux phénomènes en physique
Détection d’anomalies dans les observations astrophysiques
Détection d’anomalies en temps réel dans les flux de données et l’acquisition de données
Intégration de la connaissance du domaine avec des approches d’apprentissage automatique
Applications transversales, y compris les détecteurs, la médecine et la biologie.

Des présentations introductives par des experts de premier plan de chaque sujet seront suivies par des présentations contributives pendant l’atelier.

Données hétérogènes et grands modèles de représentation en science

Les données scientifiques sont souvent hétérogènes et multimodales par nature, provenant de différents capteurs dans les systèmes embarqués (robotique, aérospatiale), de différents sous-systèmes de détection ou de différents instruments en physique fondamentale, ou de différentes sources de signaux dans une expérience scientifique en général. Les modèles peuvent combiner des représentations issues de réseaux neuronaux avec des représentations symboliques intégrant des connaissances a priori du domaine scientifique. L’intégration de données scientifiques multimodales hétérogènes provenant de différents systèmes de capteurs ou de sources dans les GRL est un sujet émergent qui peut donner lieu à des résultats scientifiques de premier plan.

L’objectif de cet atelier est de réunir des scientifiques de différents domaines (pour n’en citer que quelques-uns : informatique, cosmologie, sciences humaines, mathématiques, physique, robotique, statistiques, etc.) et de différents profils (expérimentateurs, théoriciens, développeurs) pour discuter de ces sujets à la pointe de la recherche en IA/ML, en encourageant la collaboration et l’innovation dans ce domaine qui évolue rapidement.

Cet atelier se penchera sur une série de sujets, qui incluent, mais ne sont pas limités à :

La construction de modèles d’apprentissage automatique capables d’apprendre à partir de divers types de données.
La gestion de données multimodales provenant de sources variées, ou de données hétérogènes provenant d’instruments scientifiques qui combinent plusieurs technologies de détection, pour des applications d’apprentissage automatique.
l’étude d’encastrements contrastifs adaptés à des données scientifiques hétérogènes et multimodales, parallèlement à des représentations d’encastrement partagées
Exploration de l’intégration de l’IA neuro-symbolique et des représentations multi-niveaux.
Modélisation mathématique de la représentation combinée.
Exploration de l’explicabilité et de l’interprétabilité des grands modèles de représentation dans le contexte scientifique.
Adoption de la frugalité et de la gestion de la taille dans les grands modèles de représentation.
éventuellement à plus long terme, l’exploration des encodages numériques pour les grandes représentations linguistiques dans des contextes scientifiques.

Le programme prévoit un mélange de présentations de conférenciers invités de haut niveau et de contributions.

Partager