Chroniques : Comment Internet a bouleversé la vie
de gens ordinaires
Groupe IGS

Sur Internet et nulle part ailleurs

GRID : Utiliser l'intelligence collective
L'astronome français Urbain Le Verrier, qui a contribué par ses calculs à la découverte de la planète Neptune par l'Allemand Johann Galle en 1846, avait eu besoin de plusieurs centaines de personnes travaillant sans relâche à ces calculs pendant une année et demie. Des chercheurs de l'Université de Notre-Dame, dans l'Indiana, n'ont pas eu ce problème. Afin de résoudre un problème mathématique complexe ils ont utilisé Internet pour utiliser la puissance informatique combinée de plusieurs milliers de micros ordinateurs. Ce dispositif associant les capacités de calculs de milliers de micros processeurs grâce à Internet commence à être connu sous le terme de Grid ou « Grille ».

Internet fournit un moyen unique pour regrouper et coordonner des puissances de calcul phénoménales qui dépassent celles des plus gros ordinateurs jamais construits. Ce moyen qui prend généralement le nom ce calcul partagé, ou encore calcul distribué, réparti ou coopératif, s'est vu appliqué à des programmes variés de recherche en mathématique pour découvrir de nouveaux nombres premiers, pour reconnaître les signaux intelligents venus de l'univers à la recherche d'éventuelles intelligences extra-terrestres. Il est sur le point d'entrer dans le traitement d'affaires commerciales et il existe déjà dans de vastes programmes de recherches scientifiques appliqués à la médecine pour des maladies telles que le cancer, le sida et le charbon. Il est utilisé aussi pour faciliter le « crakage » de codes puissamments cryptés et parfois même … à l'insu des propriétaires des micros ordinateurs ou des serveurs composant la toile.

Tout possesseur d'ordinateurs personnels, individu, petits pays, universités ou groupes industriels est désormais en mesure d'accéder à une puissance informatique phénoménale et sous une forme inédite, celle de la puissance inutilisée des ordinateurs au repos accessible par le net. Sachant qu'un micro-ordinateur personnel utilise entre 13 % et 18 % de sa puissance de calcul; que même en cours d'utilisation il fonctionne en sous régime — l'utilisateur le plus expert parvient rarement à frapper plus d'une dizaine de touches par seconde, ce qui est peu pour occuper un processeur qui traite quelque 100 millions d'instructions à la seconde — des programmes ont été créés pour rendre productives ces heures qui se chiffrent par milliards. L'idée est de regrouper ces puissances disponibles en demandant aux propriétaires de participer à des projets. Il leur suffit de télécharger un logiciel qui fonctionne comme un économiseur d'écran, tourne en tâche de fond dès que l'ordinateur dispose de ressources inutilisées, et qui exige peu d'espace disque et de RAM. Quand l'utilisateur se connecte à Internet, son ordinateur envoie ses résultats et reçoit de nouvelles données ou consignes. Si le projet a suffisamment de participants, il fournit des résultats plus rapidement que le plus gros superordinateur du monde et même mieux lorsque le projet suscite l'intérêt de plusieurs centaines de milliers voire de plusieurs millions de propriétaires d'ordinateurs personnels.

L'intelligence terrestre utilisée pour chercher un signe d'intelligence extra-terrestre
La plus connue des applications de ces calculs partagés sur Internet, appelés “méta-calculs”, a démarré vers la fin de la décennie 1980 avec la relance du programme SETI (Search for ExtraTerrestrial Intelligence, recherche d'intelligence extraterrestre). Le programme SETI avait été lancé de manière indépendante en 1960 par l'astronome américain Frank Drake qui s'était amusé à écrire le nombre potentiel de civilisations intelligentes possibles dans la galaxie à l'aide d'une formule appelée l'équation de Drake. Le projet avait alors fait grand bruit avec les énormes capteurs de signaux radio-électriques du plus grand radiotélescope du monde d'Arecibo à Porto Rico, faisant sourire certains qui raillaient la recherche des petits hommes verts, ou les grandes oreilles du radio téléscope. En fait le projet est tout à fait sérieux sur le plan scientifique. En avance sur son temps il a connu des difficultés en raison de l'absence de résultats obtenus et de l'impuissance à analyser les milliards de données venues de l'espace.

Les responsables du programme SETI ont alors l'idée de créer une puissance de calcul phénoménale à l'aide des ordinateurs personnels. Cette première opération de calcul partagé de grande amplitude fut appliquée au programme d'analyse des signaux extraterrestres SETI@home (lire SETI at home :SETI à domicile) fut lancé en 1992. Au début de la décennie 1990 le programme SETI@home est lancé par David Anderson, créateur de United Devices situé à Austin (Texas), une SSII spécialisée dans la création de logiciels de calcul partagé, qui gère les calculs auxquels participent en 2002 quelque 4 millions de micro-ordinateurs répartis dans 226 pays. Le goulet d'étranglement qui était la puissance de calcul est en passe d'être résolu : le temps perdu se rattrape peu à peu et l'on est en passe de traiter des données venant de fichiers enregistrés récemment. Au fur et à mesure que le télescope scrute les cieux, les signaux radio-électriques recueillis sont découpés en tranches de bandes de fréquences longues de 250 k-octets et transmis aux micro-ordinateurs disponibles. Cette tâche s'applique parfaitement au calcul partagé sur Internet puisqu'il s'agit de transmettre dans les deux sens de petits blocs de données sur lesquels un grand nombre de traitements ont été effectués . Environ 470 millions de résultats ont été reçus, le temps total de calcul cumulé représente environ un million d'années ! Les États-Unis avec 1,5 million de participants arrivent en tête. Mais, en pourcentage de participants par habitants, la minuscule île de Pitcairn détient le gros lot avec 25 utilisateurs pour 49 habitants soit 51 %de la population totale.

Aujourd'hui la recherche des planètes et de la vie extra-terrestres intéresse de nombreux scientifiques de diverses disciplines, le programme SETI participe à cette recherche avec une stratégie originale, qui pourrait bien donner des résultats valables plus rapidement que d'autres, certes moins audacieuses.

Curiosités mathématiques : les nombres de Mersenne
Ce deuxième exemple de calcul partagé montre les liens du passé et du futur, un passé de plusieurs siècle car il commence au milieu du XVIIe siècle. En 1644 un religieux mathématicien français du nom de Marin Mersenne passionné par les très grands nombres et par la recherche des nombres premiers qui sont divisibles par eux-mêmes ou par 1, tels que 1, 2, 3, 5, 7, 13 17, 19, etc., avait posé comme hypothèse que les nombres du type 2p — 1 étaient premiers pour certaines valeurs de p, nombre premier. Ces nombres appelés “nombres de Mersenne” forment les plus grands nombres premiers connus. À la suite de divers travaux de mathématiciens des algorithmes très performants ont permis d'identifier si un nombre était premier ou non et à partir de 1979, la chasse aux nombres premiers a été dominée par les superordinateurs de type Cray.

En août 1996 le projet GIMPS (The Great Internet Mersenne Prime Search = la grande recherche Internet des nombres premiers de Mersenne) est lancé sous forme de calcul partagé sur Internet. Son initiateur, George Woltman est programmeur à Orlando et auteur d'un logiciel de cryptage qui utilise ce type de nombres. Le logiciel (sa vingt et unième version est parue en mars 2002), permet de tester un nombre comportant 24 millions de chiffres et de savoir s'il s'agit d'un nombre premier. La puissance cumulée par l'ensemble des ordinateurs participant à la GIMPS dépasse 1,4 téraflops soit 1400 milliards d'opérations par seconde. Elle croît de 25% par an. Entre le 23 novembre 1997 et le 10 mars 2001, le GIMPS a effectué 69 687 années-machines de calculs.

Grâce à GIMPS, de nouveaux nombres de Mersenne ont été identifiés à un rythme inégalé jusqu'alors : novembre 1996 le français Joël Armengaud découvre le 35e nombre de Mersenne où p = 1398269 ; 24 août 1998 Gordon Spence annonce avoir identifié le 36e, correspondant à p = 2976221 ; 2 février 1998 un étudiant de 19 ans, Roland Clarkson découvre le 37e nombre de Mersenne : 23021377 — 1 qui comprend 909526 chiffres ; 1er juin 1999, Nayan Hajratwala trouve le nombre premier qui dépasse 2 millions de chiffres, le 38e nombre de Mersenne correspondant à p = 6972593 ; 14 novembre 2001, Michael Cameron prouve que 213466917 — 1 (plus de 4 millions de chiffres) est un nombre premier, le 39e nombre de Mersenne — et le plus grand nombre premier — jamais mis en évidence. Il lui a fallu quelques semaines sur son micro-ordinateur AMD à 800 Mhz. Le projet GIMPS a utilisé ainsi 130000 ans de temps d'ordinateur pour trouver M(39).

Nous sommes dans le gigantisme qui aurait plu au moine français amateur des grands nombres. Mais aujourd'hui, pour quelles raisons les professeurs de mathématiques des classes secondaires aux États-Unis encouragent-ils leurs élèves à rejoindre la GIMPS ? En rejoignant cette recherche, les élèves participent à un défi qui les met en appétit et les pousse à s'intéresser aux maths, et puis les jeunes contribuent ainsi à cette recherche mathématique théorique en prêtant leur puissance de calcul. Quelle est son utilité pratique au-delà du goût des mathématiciens ? Une utilité fondamentale dans le cryptage indispensable à la sécurité sur Internet pour les transferts de fonds ou de données sensibles et une utilité moins connue dans le test des matériels informatiques avant leur mise sur le marché, notamment les puces sans lesquelles aucun ordinateur ne fonctionnerait.

Des capacités inégalables de recherches scientifiques
Troisième exemple du calcul partagé qui montre des voies pour les solidarités du XXIe siècle. Les chercheurs de l'université d'Oxford avaient déjà en avril 2001 lancé comme mot d'ordre « Processeurs de tous les pays, unissez-vous » en vue de constituer une chaîne d'au moins un million d'ordinateurs pour lutter contre une forme particulière de cancer : la leucémie. Chacun d'entre eux devaient analyser la structure en trois dimensions d'une centaine de molécules susceptibles d'agir en espérant qu'en un an, des dizaines de millions de molécules seraient ainsi examinées. Pour ce projet le département de chimie de l'université d'Oxford s'était allié à Intel, United Devices, la même SSII qui participe au programme SETI@home, et la fondation américaine pour la recherche contre le cancer (NFCR).

Depuis la vague de cas mortels de la maladie du charbon, qui a suivi les attentats du 11 septembre 2001, une nouvelle urgence s'est fait jour. La même équipe à laquelle s'est joint Microsoft, a demandé le 22 janvier 2002, aux utilisateurs de micro-ordinateurs du projet pour la leucémie de les rejoindre pour l'Anthrax Research Project. Les propriétaires d'ordinateurs participant au projet contre le cancer ont été invités à se mettre temporairement au service du projet Anthrax, leur ordinateur recevant automatiquement les instructions correspondantes.

La maladie du charbon est relativement facile à soigner grâce aux antibiotiques, encore faut-il que ceux-ci soient administrés avant l'apparition des symptômes ! Un traitement difficile à administrer si l'on ignore que l'on a été infecté. C'est pourquoi il y a eu tant de victimes décédées aux États-Unis durant l'automne 2001. Il faut pour que le bacille du charbon soit mortel qu'il s'assemble de telle sorte qu'il puisse pénétrer dans une cellule et l'infecter. Ainsi toute substance susceptible d'empêcher cet assemblage devient potentiellement capable de lutter avec efficacité contre la maladie. Les chercheurs d'Oxford ont mis au point un logiciel développé par Treweren Consultants qui passe en revue des multitudes de molécules pour vérifier si elles ont des chances d'empêcher la liaison et donc l'infection des cellules. Après avoir passé au crible 3,57 milliards de molécules, la phase de tri s'est achevée le 19 février 2002, soit 24 jours après le démarrage du projet. Les promoteurs pensaient qu'il faudrait au moins entre 3 et 6 semaines pour parvenir à la fin du tri. Celui-ci a été accompli dans le temps le plus optimiste escompté et ce grâce à la participation de plus d'un million d'ordinateurs personnels dans le monde entier.

Le 8 mars 2002, le professeur Graham Richards, responsable scientifique du projet, a remis solennellement au représentant du département de la Défense américain et au gouvernement britannique un cédérom contenant les 376064 molécules sélectionnées parmi lesquelles 12000 semblent particulièrement prometteuses. Dès que le projet Anthrax a été terminé, les recherches sur le cancer ont repris leur cours. Si vous souhaitez rejoindre ce projet, cliquer sur le lien «d'un pc contre le cancer».

De l'énergie informatique bon marché disponible pour tous
Cette puissance de calcul immense, quasiment illimitée et gratuite, a commencé à faire rêver les industriels et les pays dont les besoins vont eux aussi grandissant pour leurs programmes de recherches. Mais voilà, la distribution auprès de millions d'ordinateurs ne va pas sans risques pour des raisons de sécurité, de propriété intellectuelle, d'erreurs (involontaires ou volontaires) et de coûts de transmission. Ainsi les entreprises ont-elles pris du temps pour mettre en place un partage des calculs original, apparenté au calcul distribué, et généralement appelé “grid” computing (grid signifie grillage, quadrillage, c'est aussi le nom donné au réseau électrique américain, ainsi littéralement : calcul quadrillé ; grids sont aussi des groupes d'ordinateurs connectés qui sont capables de prendre en charge de vastes problèmes informatiques ou de fournir rapidement un accès à de très grandes bases de données). Il ne s'agit plus ici de mise à disposition gratuite d'un temps d'ordinateur non utilisé, mais de louer en quelque sorte du temps d'ordinateurs utilisés à un type de tâches donné, une sorte de mise en réseau de calculs.

Ainsi Compaq a récemment renforcé son effort de “ calcul quadrillé ” en annonçant un accord visant à l'utilisation d'une plateforme commerciale regroupant des ordinateurs pour constituer une sorte de super-ordinateur collectif. De son côté IBM est devenu plus favorable au “ calcul quadrillé ” qui est plutôt utilisé dans les firmes pharmaceutiques ou dans le domaine de la recherche génétique. IBM entend étendre le concept d'informatique distribuée, utilisé dans les domaines de la recherche, à la réalité des affaires. Sa division “ Global Services ” envisage de créer des “ fermes computationnelles ” pour une valeur de 4 milliards de $, sur toute la planète. Le vice-président du département d'IBM “ Linux and emerging technologies ”, Dave Turek, déclarait en août 2001 : « Nous allons mettre à la disposition du client un accès à des ressources d'ordinateurs, qui ne sont pas physiquement présents dans l'entreprise et qui répondront rapidement et exactement à la demande en termes de capacité et de besoins.» En proposant un concept d'accès universel à l'énergie informatique disponible à la demande, il espère que, dans de brefs délais, la technologie se développera dans une direction commerciale plus conventionnelle.

L'analyste du cabinet d'études marketing Gartner, Karen Benson, estime que cette technologie est encore trop récente pour savoir de quelle manière les vendeurs vont construire leur offre, sachant que les profits sont bien plus élevés en utilisant des ordinateurs-serveurs que de simples micro-ordinateurs de bureau. D'ailleurs, à côté de l'aspect financier, l'utilisation de serveurs permet aussi de mieux répondre aux besoins de sécurité et de prévention des risques d'espionnage industriel. En effet si les scientifiques de l'Université de Notre Dame dans l'Indiana ont trouvé la solution qu'ils cherchaient c'est à l'insu des propriétaires des serveurs qu'ils ont utilisé.

Au final, il faudra sans doute encore plusieurs mois pour que les stratégies deviennent plus évidentes, mais les acteurs sont désormais déjà en place et vont jouer chacun leur partie pour chercher à en retirer de substantiels profits de la vente d'énergie informatique « grid computing » associée à des programmes dédiés pour toutes sortes d'applications de recherche et de développement autrefois inaccesssibles aux entreprises ne disposant pas d'ordinateurs superpuissants.

Denis Ettighoffer et Gérard Blanc