Intelligence artificielle et numérique
- ️Wed Oct 04 2023
Transcription textuelle | le supercalculateur Jean Zay
Pierre-François Lavallée, je suis le directeur de l'IDRIS, le centre national du calcul haute performance et l'infrastructure nationale pour la communauté d'intelligence artificielle du CNRS. Bonjour, je suis Léo Hunout, je suis ingénieur au support IA de l'IDRIS sur le calculateur Jean Zay. Le supercalculateur Jean Zay a été installé en 2019. C'est aujourd'hui le supercalculateur le plus puissant de France. Il a une puissance de 126 pétaflops, 126 millions de milliards d'opérations flottantes par seconde. Pour faire fonctionner un super ordinateur comme Jean Zay, on a besoin de beaucoup d'équipes, à différents niveaux, au niveau du matériel ou sur la partie logicielle. Au sein du support utilisateur, je m'occupe, plutôt en fin de chaîne, d'aider les nombreux utilisateurs de l'IDRIS à faire tourner leurs codes et applications sur le supercalculateur en essayant d'accélérer leur prise en main de la machine, afin qu'ils puissent utiliser facilement l'ordinateur, parce que ce n'est pas un ordinateur si simple que ça, mais aussi en allant un peu plus loin, en essayant d'optimiser leurs codes, dans le but tout simplement soit de réduire les ressources consommées ou de pousser le plus loin possible la recherche à ressources constantes. Le supercalculateur est un très grand instrument. Les ressources sont distribuées par un organisme, qui a acheté la machine Jean Zay, qui s'appelle Genci. On s'adresse essentiellement au monde académique de la recherche. On a plus de 3000 utilisateurs sur le supercalculateur. Il faut savoir que les accès sont gratuits. Le seul critère qui est pris en compte pour obtenir des ressources, c'est la qualité scientifique des projets. Ensuite, les meilleurs projets vont avoir le droit d'obtenir une allocation sur la machine. Ces projets peuvent être des projets de recherche académique, mais aussi des projets de recherche privée, sous une condition, c'est de faire ce qu'on appelle de la recherche ouverte. Pour nous, ça veut dire publication des résultats qui ont été obtenus en utilisant des ressources du supercalculateur. Donc cela peut être les algorithmes, les résultats scientifiques, les données qui sont utilisées. Tout ça doit être disponible pour pouvoir reproduire la recherche qui a été faite par le supercalculateur. Historiquement, il y a 4-5 ans... L'IA c'est un domaine qui est très jeune et très dynamique. L'IA, c'était beaucoup du machine learning, c'était de l'analyse de données qui ne pouvait pas forcément traiter des quantités de données gigantesques. Par la suite, il y a eu une tendance importante au niveau de l'image, parce que les premiers résultats scientifiques, qui ont ensuite été transférés vers des applications, ont été les plus probants. Typiquement la détection des chiffres est un des premiers exemples d'IA en deep learning [apprentissage profond] qui a très bien marché. Cela permet de classer les lettres, de récupérer les chiffres quand vous mettez un chèque à la banque. Il y avait vraiment un domaine d'applications qui en découlait très facilement et qui était très visible. Par la suite, l'image a continué, on a commencé à avoir le texte, le traitement des langues, qui permet là aussi d'avoir un flot d'applications qui est très important. Et maintenant, depuis 2-3 ans, on commence vraiment à avoir l'IA qui rentre dans toutes les sphères scientifiques, où on s'aperçoit que les méthodes qui ont été développées, comme je le disais sur les utilisations de l'image ou de la langue, peuvent être appliquées à d'autres thématiques. Il y a quelques années, on a eu l'apparition des premiers modèles capables de faire le repliement de protéines avec AlphaFold. Maintenant, on a les modèles qui sont capables de traiter du texte, ce qui permet d'avoir des bases de connaissances très importantes. On a des modèles qui sont capables de prédire, faire des prédictions du moins, sur les tremblements de terre, sur le climat. C'est très large. Au niveau de la chimie, on arrive à prévoir des nouvelles molécules. Il y a une infinité de domaines. Dans tout ce qui est sciences sociales, on peut utiliser les modèles actuels pour faire de l'analyse de données sur les emplois, sur le logement, sur l'administration. C'est très large. L'IA est capable de faire ce que l'humain n'est pas capable de faire, dans le sens où il est capable de travailler sur de très grandes masses de données et d'extraire des signaux faibles qui sont complètement invisibles à l'humain. Par exemple pour post-traiter des résultats qui sont issus de radiotélescopes, des résultats qui sont issus de synchrotrons. Et on se rend compte que de plus en plus, l'IA va être indispensable dans tous les domaines scientifiques.