FR | Français
SOLUTIONS LOGICIELLES.

Les solutions logicielles.

 

Sous peine de n’être qu’une coquille vide et inutilisable, un cluster HPC ne se résume pas à du matériel de haute volée. C’est pourquoi il est nécessaire d’avoir les outils logiciels pour faciliter à la fois son utilisation, sa gestion et sa surveillance.

 

La complexité de ces systèmes peut représenter un défi pour les administrateurs et les utilisateurs. BECHTLE est présent à vos côtés pour faire les bons choix technologiques appropriés aux objectifs que vous souhaitez atteindre.

 

 

BECHTLE est capable de vous fournir des solutions diverses et variées en adéquation avec vos souhaits mais aussi avec votre environnement informatique. Ces solutions peuvent être classées dans deux catégories :

  • D’un côté, les logiciels commerciaux tels que Bright Cluster Manager ou NICE EnginFrame, qui sont sous licence payante vous offrant ainsi un support éprouvé et professionnel.
  • D’un autre côté, les solutions de type « open source » tels que xCAT, openHPC, Nagios, SLURM…et beaucoup d’autres.

Dans les deux cas, nous sommes prêts à vous accompagner dans toutes les étapes de la mise en œuvre et de l’utilisation de votre cluster HPC.

 

Vous pouvez retrouver ci-dessous les besoins les plus courants de l’univers HPC, ainsi que des exemples de solutions que nous sommes en mesure de vous proposer.

Vous avez des questions sur HPC ?

Envoyez-nous tout simplement un e-mail à : 
project-hpc.direct-fr@bechtle.com

ou appelez-nous au : +33 3 90 40 45 45.

Nous nous ferons un plaisir de vous aider.

 

EN SAVOIR PLUS

Stockage.

 

BeeGFS est un système de fichiers parallèle, développé et optimisé pour le HPC.  Un système de fichiers parallèle découpe les données en plusieurs morceaux et les distribue à travers l’espace de stockage. Le but est d’améliorer sensiblement l’accès simultané et les performances, par-rapport à un système de fichiers « classique ».

 

BeeGFS peut être téléchargé et installé sans frais d’utilisation. Il s’agit d’un produit qui est utilisé dans de nombreux superordinateurs du TOP 500. BeeGFS s’exécute sur n’importe quelle machine Linux. Il se compose de nombreux services : serveur de stockage, serveur de métadonnées, client…

 

Un support professionnel est possible, délivré par ThinkParQ.

 

Les principaux atouts de BeeGFS sont :

  • Evolutivité : Possibilité d’étendre très rapidement et très facilement un stockage existant.
  • Flexibilité : Fonctionne sur un très grand nombre de machines. N’est pas contraint à l’aspect matériel.
  • Convivialité : Fonctionne de manière transparente pour les utilisateurs. Dispose d’une interface graphique pour les administrateurs.

OpenIO transforme des serveurs standards en plateformes de stockage de très gros volumes de données, grâce à une technologie intelligente de distribution des données d’applications, offrant une évolutivité surprenante.

 

OpenIO est une solution logicielle de stockage objet. Le principe du stockage objet est de traiter les données comme des objets et non comme hiérarchie de fichiers ou comme blocs / secteurs de disques. Ce genre de stockage est particulièrement adapté lorsqu’on souhaite gérer des fichiers image, des fichiers musicaux, …

 

Les avantages de cette solution sont :

  • Disparition du « single point of failure » grâce à une organisation des serveurs de stockage en forme de grille.
  • Optimisation des performances par une distribution des données intelligente selon des mesures en temps réel.
  • Des mécanismes de réplication, assurant une redondance et protection des données.

Gestion de cluster.

Bright Cluster Manager, développé par Bright Computing, permet de déployer des clusters HPC et de les gérer. Cet outil offre une interface unifiée pour le matériel, le système d’exploitation, les logiciels HPC et les utilisateurs.

 

Les administrateurs peuvent installer des clusters rapidement et les garder en état de marche optimal pendant tout leur cycle de fonctionnement.

 

Les principaux avantages de Bright Cluster Manager sont :

  • Facilité de déploiement : Outil graphique d’installation simple et puissant ; Installation directe sur des
    serveurs « nus ».
  • Facilité de surveillance : Une interface graphique offrant des métriques détaillées et personnalisables ainsi que des alertes en cas de besoin ; Des vérifications automatiques permettant de surveiller le cluster à votre place.
  • Facilité de gestion :  Choisissez entre interface graphique ou commande pour exécuter votre travail ; Optimisez l’utilisation des ressources IT ; Inclut des outils et librairies HPC.

OpenHPC est un ensemble d’outils Open Source pour les clusters HPC. Ces outils permettent l’installation des clusters, leur administration, la gestion des ressources, le développement de logiciels, des librairies ainsi que de la surveillance et des analyses de métriques. Son architecture est modulaire pour permettre aux utilisateurs de choisir parmi les composants disponibles.

 

Quelques exemples de logiciels qui sont disponibles dans les dépôts OpenHPC : xCAT, BeeGFS, MPICH, PBS Pro, …

 

OpenHPC s’installe sur un serveur maître où le système d’exploitation est déjà installé.

Virtualisation graphique.

NICE DCV est une technologie, développée par NICE SOFTWARE, qui permet d’accéder à des applications et des bureaux 2D/3D à distance.

 

Le protocole DCV est capable de s’adapter à des réseaux hétérogènes (LAN, WAN, VPN) afin d’optimiser l’expérience utilisateur selon la latence et la bande passante.

 

Le principe de cette technologie est simple : sur un serveur équipé d’une ou plusieurs cartes graphiques, une application 2D/3D envoie des données qui sont transformées en images par les cartes graphiques. Les images sont ensuite compressées et envoyées à travers le réseau à des clients. Ces clients ont alors uniquement besoin d’une simple application légère voire d’un navigateur Internet pour recevoir et afficher les données graphiques. Le rendu et l’expérience sont très proches d’une utilisation en local.

 

NICE DCV est capable de se connecter à des bureaux Windows ou Linux, pour des applications OpenGL et DirectX. Il est également possible de découper un GPU en plusieurs morceaux et d’attribuer chaque morceau à un utilisateur différent (cartes NVIDIA requises).

Software Image

Gestionnaire de ressources.

SLURM est une solution Open Source de gestion des ressources d’un cluster HPC. Il est tolérant aux pannes et est capable de supporter des clusters de tailles variées, allant de 2 à plusieurs milliers de nœuds.

 

Ses 3 fonctions clés sont :

  • Allocation des ressources, ou nœuds de calcul, aux utilisateurs pendant une certaine durée.
  • Mise à disposition d’un framework pour démarrer, exécuter et surveiller les travaux parallèles.
  • Gestion de la contention des ressources par le biais d’une file d’attente.

PBS Professional optimise la planification des travaux et la charge de travail dans un environnement HPC.

 

Les fonctionnalités clés de PBS Professional sont :

  • Evolutivité : Supporte des millions de cœurs en gardant une latence minimale.
  • Planification par stratégies : Répartition optimale des travaux et équilibrage du temps d’exécution.
  • Résilience : Architecture de failover automatique, les travaux ne sont jamais perdus.
  • Framework de plugin flexible : Simplifie l’administration avec des meilleures visibilité et extensibilité.
  • Surveillance : Framework permettant une tolérance aux pannes et un contrôle de l’état de santé des composants.

Surveillance.

Nagios est connu pour être le meilleur logiciel de surveillance de serveurs sur le marché. Cette surveillance est facilitée par la possibilité de se passer d’un agent sur les clients. Plus de 5000 plugins sont disponibles pour personnaliser l’environnement.

 

Nagios est disponible sous deux éditions :

  • Nagios Core, gratuit mais limité en fonctionnalités.
  • Nagios XI, payant mais disposant d’une interface de configuration, de meilleurs graphiques de surveillance, et plein d’autres fonctionnalités exclusives.

 

Les principales caractéristiques de Nagios sont :

  • Une architecture conçue pour la flexibilité et l’évolutivité.
  • Un cadre concentré principalement vers la planification des contrôles, leur exécution, leur traitement, la gestion des évènements et les alertes.
  • Une interface Web pour visionner les éléments surveillés par Nagios.
  • Une grande variété de plugins qui offrent des fonctionnalités supplémentaires : interfaces de configuration, graphes de performance, découverte automatique, …

Ganglia est un outil distribué capable d’afficher en temps réel des métriques (utilisation CPU, RAM, réseau, …) provenant des divers éléments constitutifs d’un cluster HPC.

 

Il est disponible directement depuis les paquets des distributions Linux les plus utilisées.

 

Ganglia parvient à s’exécuter sur des très grands clusters tout en gardant une empreinte minimale. Il peut s’installer sur un grand nombre d’architectures et est utilisé sur plus de 500 clusters à travers le monde. Il permet aussi de lier des clusters situés à des emplacements géographiques différents.

 

L’écosystème Ganglia regroupe 2 services pour l’envoi et la récolte des données, une interface Web PHP, et quelques programmes utilitaires.

Le Laboratoire de Physique et d’Etude des matériaux (LPEM) est une unité mixte de recherche (UMR 8213) de l’ESPCI, CNRS et UPMC.
EN SAVOIR PLUS