Depuis le lancement des fameux Cray, en 1976, les performances des supercalculateurs n'en finissent pas d'exploser. Ils suscitent un besoin accru en termes de simulations scientifiques, de plus en plus fines et complexes. Quels sont les enjeux de secteur en plein essor ? Explications et analyses.
En photo : l'espace Clément Ader où vont être installées les infrastructures de calcul de Météo France et du PRES Université de Toulouse
Après les octets de notre dossier « Big Data », voici les flops. N'y voyez pas la fin des microprocesseurs, mais au contraire, une déclinaison particulière de leur utilisation : les supercalculateurs. Leurs capacités de calculs se mesurent en « flops » : un acronyme qui désigne le nombre d'opérations en « virgule flottante » à la seconde. Aujourd'hui, le plus performant superordinateur de la planète est le « Séquoïa » d'IBM, utilisé par le département d'Energie des Etats-Unis. Il peut effectuer jusqu'à 16,32 petaflops, soit 16 320 suivi de douze zeros opérations à la seconde...!
Ces imposantes armoires bourrées d'électronique se multiplient, à en croire un graphique du site spécialisé top500.org qui recense les plateformes de calculs les plus puissantes de la planète. Leurs usages ? Ils sont nombreux, mais portent souvent sur la simulation de phénomènes physiques et mathématiques difficiles à appréhender : physique des plasmas, résistance des matériaux, aérodynamique, météorologie, décryptage de données... L'un des plus spectaculaires projets de calcul intensif a été présenté récemment par l'Observatoire de Paris, le CNRS et l'Université Paris Diderot. « Dark Energy Universe Simulation DEUS » vise en effet à reproduire l'ensemble de l'univers observable, et ce, dans le temps, en remontant jusqu'au Big Bang ! Pour cela, des modèles mathématiques ont été injectés dans le superordinateur « Curie » qui vient d'être inauguré au CEA. C'est le plus puissant de France, et il figure 9ème au plan mondial. Les chiffres donnent le tournis : grâce aux 92 000 cœurs de processeurs de la bête, 2 millions de milliards de points de l'espace ont été calculés pour représenter l'évolution de Cosmos (cf vidéo DEUS Full Universe Run - Inside present dark... par DEUSConsortium).
Ne pas confondre Cloud Computing et supercalculateurs
Depuis quelques années, le cloud computing est devenu un outil essentiel pour mettre en œuvre des projets de traitements de données massives, autrement dénommés « Big Data ». Exemple : le génome, l'analyse des données issues d'accélérateurs de particules ou l'observation de la Terre. Dans ces domaines, l'EMBL, le CERN et l'ESA viennent de lancer la plateforme "Helix Nébula" qui rassemble un consortium de laboratoires et d'industriels. Pour autant, le cloud computing est t-il une alternative aux supercalculateurs ? Non, car le propre de ces derniers est d'effectuer un seul gros calcul scientifique, par exemple la modélisation atmosphérique, ce qui nécessite une puissance brute phénoménale. Or une solution de cloud computing, consiste à reproduire un même calcul sur des milliers ou millions de petits morceaux de données, issus de la segmentation de l'énorme fichier initial. Certes, un projet de calcul « Big Data » mené dans une infrastructure cloud peut mobiliser autant de processeurs que dans un superordinateur. Mais dans ce cas, ils font leur office séparément et ne communiquent pas entre eux. Dans un supercalculateur, il s'agit au contraire de mutualiser et de faire communiquer les processeurs entre eux. Ce qui suppose qu'ils soient localisés dans un même espace pour pouvoir être interconnectés par un réseau au plus haut-débit possible (qui peut atteindre plusieurs centaines de Gigabit/s). Au contraire du cloud, dont l'un des principes est de répartir les ordinateurs ou processeurs utilisés dans le « nuage », parfois éloignés de milliers de kilomètres.
Croissance très forte des besoins de simulation d'Airbus
Si les supercalculateurs demeurent l'apanage des grands centres de recherche du monde, les entreprises disposent parfois de solutions de ce type, notamment les industriels. C'est le cas d'Airbus, dont la plateforme est positionnée au 69 ème rang mondial en termes de puissance, avec près 300 Teraflops. L'avionneur, qui a engagé depuis les années 80 des programmes de simulation numérique de la physique du vol, envisage d'atteindre l'exaflops (1000 pétaflops) à l'horizon des années 2020 ! A terme, il sera possible de tester virtuellement l'intégralité d'un avion dans ses moindres détails, par diminution de la maille de calcul et l'intégration d'un maximum de paramètres physiques. Bénéfice : des économies substantielles de bancs d'essais grandeurs nature, notamment de soufflerie.
Toulouse, siège de l'avionneur, est aussi l'une des villes précurseurs dans le domaine du calcul scientifique. Il faut en effet se souvenir qu'Emile Durand, doyen de la faculté des sciences de 1953 à 1968, avait fait venir l'un des tous premiers ordinateurs d'IBM en 1957. Il créa la même année l'Institut de Calcul Numérique. Objectif : mettre en œuvre les premiers calculs numériques dans le domaine de l'optique électronique, dont les recherches étaient menées dans le cadre de la « boule » et de son microscope électronique, bien connus dans la Ville Rose.
Météo France et l'Université de Toulouse rassemblent leurs plateformes de calcul
Aujourd'hui, l'activité de calcul scientifique s'y est largement développée. Basée à l'Université Paul Sabatier et sous tutelle du PRES « Université de Toulouse », géré par un Groupement de coopération scientifique régional, Calmip est une plateforme de calcul utilisée par 30 laboratoires et 5 PME en moyenne. Lancée en 1999 et financée au travers du Contrat de Projet Etat-Région, elle totalise une puissance de 38,5 Teraflops. L'année 2013 marquera une étape importante de son évolution avec l'émergence de l'Espace Clément Ader, dans le cadre du vaste campus de Montaudran Aerospace. Les 14 000 m2 de ce bâtiment abriteront l'Institut éponyme, un CRITT, la fondation STAE. Quant aux plateformes Calmip et celle de Météo France, elles disposeront de 750 m2, dont 500 m2 pour cette dernière. Le centre de prévision du temps redimensionne en effet son infrastructure de calcul scientifique : la puissance de ses machines passera de 40 teraflops aujourd'hui à 2 pétaflops en 2015. Objectifs : une analyse du temps plus fine, le développement d'offres de services à haute valeur ajoutée, et une meilleure anticipation de l'évolution du climat.
Des enjeux énergétiques et de formation
Cette course vertigineuse aux puissance de calcul ne doit pas masquer certaines problématiques qui apparaissent dans son sillage. Lorsqu'on sait que la consommation des fermes de serveurs de Google représente l'équivalent de celle de 200 000 foyers, il y a de quoi s'inquiéter. « Pour 1 pétaflops, la consommation électrique atteint environ 1,4 MW dans le cadre de la machine Curie. Un niveau qui peut varier, on pourra le constater en consultant le classement des superordinateurs Green 500. Pour maîtriser leurs impacts énergétiques, l'approche actuelle consiste à diminuer la fréquence des processeurs tout en multipliant le nombre de leurs cœurs. Ce qui induit un autre problème : les algorithmes de calculs vont perdre en performances si les chercheurs ne savent pas les adapter à ces futures architectures », précise Boris Dintrans, responsable scientifique de Calmip et chercheur du CNRS en astrophysique. Plus généralement, on a finalement beaucoup investi sur le hardware, mais peu sur la formation. S'il existe, par exemple en 2ème et 3ème cycles de mathématiques appliquées, des formations au développement logiciel de calcul scientifique, les cursus plus généralistes, en écoles d'ingénieurs comme dans les facultés, en sont souvent dépourvus », souligne t-il.
Frédéric Dessort |