cw21_mainbanner_igbmc-fr

IGBMC – Nouveau stockage HPC appliqué à la génomique

Créé en 1994 par Pierre Chambon, une des figures les plus importantes de la recherche biomédicale, l’institut est aujourd’hui un des principaux centres de recherche en Europe dans le domaine de la génétique et de la biologie moléculaire. En France, c’est la plus grande unité de recherche qui associe l’Inserm, le CNRS et l’Université de Strasbourg. Outre ses quatre départements scientifiques, l’IGBMC a développé des services scientifiques et plateformes technologiques de pointe pour une utilisation en interne, mais également ouverte à la communauté scientifique extérieure. L’objectif de l’institut est de développer la recherche transdisciplinaire à l’interface de la biologie, la biochimie, la physique et la médecine, mais également d’attirer les étudiants du monde entier par une offre de formation de très haut niveau dans le domaine des sciences biomédicales. Le campus de l’IGBMC est situé sur le Parc d’innovation d’Illkirch dans la banlieue strasbourgeoise, un environnement scientifique académique et industriel exceptionnel qui favorise largement les collaborations et le transfert technologique.

Données du projet.

igbmc
  • Services professionnels
  • Serveurs et stockage
  • Enseignement / Recherche
  • Lenovo
  • 250 > 1 500 collaborateurs

LES OBJECTIFS DU PROJET.

La plateforme GenomEast dispose d’une infrastructure de calcul composée d’un Cluster de calcul (20 noeuds / 304 coeurs physique / 608 coeurs virtuels) couplé à un Stockage de 390To utiles.

Le séquenceur de la plateforme est relié à ce cluster via un câble réseau 1G et y transfère les données au fur et à mesure de leur génération.


Cette infrastructure est accessible :

  • aux bio informaticiens de la plateforme en lecture et écriture : lecture des fichiers issus du séquenceur, calculs à partir de ces fichiers puis écriture des résultats correspondants (la plupart de ces fichiers sont compressés).
  • aux clients de la plateforme, uniquement en lecture : les clients récupèrent leurs données via un serveur ftp sur lequel des points de montage NFS leur permettent d’accéder aux données stockées sur le cluster de stockage de la plateforme.

 

Les enjeux de ce projet étaient donc :

  • l'acquisition d'une nouvelle infrastructure de stockage (et son système de fichiers parallèle),
  • supporter un mécanisme de tiering permettant l’utilisation de disques de différentes performances au sein d’un même volume logique. La volumétrie sur des disques rapides doit être au minimum de 20To.,
  • solution devant être extensible en volumétrie (scale-up) par simple ajout de composants au moins jusqu'à 1 Po avec des pas d’extension de 250To minimum, tout en conservant au minimum des performances équivalentes à la solution initiale.
solution_image_server

 

LA SOLUTION.

Un ensemble de 2 serveurs « Spectrum Scale » basés sur des serveurs LENOVO SR650, interconnectés
à un ensemble de 3 baies/systèmes de stockage Lenovo dont 1 baie principale (GPFS controller) équipée de deux contrôleurs Dual Ports SAS 12Gbs actif/actif, de 4 disques de 3.2TB SSD couplés à 20 disques de 1.6TB SSD et de 2 tiroirs d’extension respectivement de 60 disques de 12To 7.2k NLSAS et 20 disques de 12To 7.2k NLSAS et 4 disques de 3.2TB SSD, le tout configuré en plusieurs LUN de 10 disques (8+2P), avec un débit cumulé de l’ordre de >2Go/s.

 

Dans le but de pérenniser les données existantes de l’IGBMC, une phase de migration a été déployée depuis le système de stockage existant vers le nouveau système Spectrum Scale.

 

La nouvelle infrastructure est couverte par une garantie matérielle et logicielle respectivement de 5 et 8 ans.

LES BÉNÉFICES DE LA SOLUTION.

La solution apporte une forte densité de stockage, 14U consommés pour ~736TB, une haute disponibilité à travers les 2 serveurs d’accès et les conceptions matérielles ainsi que des performances élevées (>2 Go/s) tout en apportant des fonctionnalités « enterprise » telles que tiering, snapshots, réplication, quotas et export multi-protocoles.

Référence complète.

pdf Téléchargement