LES OBJECTIFS DU PROJET.

La plateforme GenomEast dispose d’une infrastructure de calcul composée d’un Cluster de calcul (20 noeuds / 304 coeurs physique / 608 coeurs virtuels) couplé à un Stockage de 390To utiles.

Le séquenceur de la plateforme est relié à ce cluster via un câble réseau 1G et y transfère les données au fur et à mesure de leur génération.


Cette infrastructure est accessible :

  • aux bio informaticiens de la plateforme en lecture et écriture : lecture des fichiers issus du séquenceur, calculs à partir de ces fichiers puis écriture des résultats correspondants (la plupart de ces fichiers sont compressés).
  • aux clients de la plateforme, uniquement en lecture : les clients récupèrent leurs données via un serveur ftp sur lequel des points de montage NFS leur permettent d’accéder aux données stockées sur le cluster de stockage de la plateforme.

 

Les enjeux de ce projet étaient donc :

  • l'acquisition d'une nouvelle infrastructure de stockage (et son système de fichiers parallèle),
  • supporter un mécanisme de tiering permettant l’utilisation de disques de différentes performances au sein d’un même volume logique. La volumétrie sur des disques rapides doit être au minimum de 20To.,
  • solution devant être extensible en volumétrie (scale-up) par simple ajout de composants au moins jusqu'à 1 Po avec des pas d’extension de 250To minimum, tout en conservant au minimum des performances équivalentes à la solution initiale.
solution_image_server

 

LA SOLUTION.

Un ensemble de 2 serveurs « Spectrum Scale » basés sur des serveurs LENOVO SR650, interconnectés
à un ensemble de 3 baies/systèmes de stockage Lenovo dont 1 baie principale (GPFS controller) équipée de deux contrôleurs Dual Ports SAS 12Gbs actif/actif, de 4 disques de 3.2TB SSD couplés à 20 disques de 1.6TB SSD et de 2 tiroirs d’extension respectivement de 60 disques de 12To 7.2k NLSAS et 20 disques de 12To 7.2k NLSAS et 4 disques de 3.2TB SSD, le tout configuré en plusieurs LUN de 10 disques (8+2P), avec un débit cumulé de l’ordre de >2Go/s.

 

Dans le but de pérenniser les données existantes de l’IGBMC, une phase de migration a été déployée depuis le système de stockage existant vers le nouveau système Spectrum Scale.

 

La nouvelle infrastructure est couverte par une garantie matérielle et logicielle respectivement de 5 et 8 ans.

LES BÉNÉFICES DE LA SOLUTION.

La solution apporte une forte densité de stockage, 14U consommés pour ~736TB, une haute disponibilité à travers les 2 serveurs d’accès et les conceptions matérielles ainsi que des performances élevées (>2 Go/s) tout en apportant des fonctionnalités « enterprise » telles que tiering, snapshots, réplication, quotas et export multi-protocoles.