Clustering Partie 2
Présentation des méthodes de clustering
2 Les Clusters (suite) :
2.4 Les GrillesUne grille, tirant son nom de ses similitudes avec celle du réseau électrique ( le nom de "Grid" en anglais, provient de power grid), peut être définie comme: "un environnement de systèmes d'exploitation et d'architectures hétérogènes, dont l'accès est fourni à l'utilisateur sous une forme unifiée par un logiciel appelé intergiciel" [7]. On peut aussi la voir comme un "cluster par dessus des clusters". Ses buts sont comparables à ceux d'un cluster. Parmi ceux-ci on trouve la mise en commun des ressources de calcul ou des ressources de stockage. Cependant l'environnement de leur mise en oeuvre diffère.
Dans le cas du cluster, les noeuds se trouvent en général dans un même lieu géographique. Cette proximité permet un contrôle plus grand du matériel, des logiciel et de la politique de sécurité donc d'avoir un environnement aussi homogène que l'on souhaite. Il est possible de bénéficier d'un réseau de communication dédié ayant un haut débit et une faible latence.
La répartition géographique des noeuds dans le cas des grilles est complètement différente. Elle est beaucoup plus vaste que pour les clusters. Bien souvent, les noeuds sont situés dans des organisations éloignées. On se trouve donc dans un environnement qui a peu de chance d'être homogène [13].
La grille du CERN prévue pour le LHC en est un exemple [10]. L'accélérateur fournira entre 12 et 14 PétaBytes de données chaque année, ce qui représente plus de 20 millions de CD. L'analyse de ces données demandera plus de 70'000 machines équipées du processeur le plus performant du marché actuel. Il est totalement impensable de mettre l'ensemble de ce parc dans un même lieu, ni même d'imaginer pouvoir disposer d'un parc de machines homogènes.
Fig.2.8 Répartition géographique de la grille du CERN pour le LHC
Plus proche de nous, on peut citer d'autres exemples comme certains réseaux de peer to peer ou de calcul divers : limewire, emule, bittorrent qui sont des grilles d'informations ou de stockage et dnetc ou SETI qui forment des grilles de calcul d'ordinateurs hétérogènes.
Aujourd'hui, les grilles sont sujettes à quelques faiblesses qui dissuadent les entreprises de les adopter:
- niveau de sécurité faible dû à leur branchement sur internet
- temps d'accès élevé
- outil de répartition de charge peu évolué pour le moment
Fin de la seconde partie
Nous parlerons dans un dernier article des librairies et des OS servant au clustering.