Pourquoi s’appuyer sur les baies IBM FlashSystem
Interview de Christian Sié
Architecte Infrastructures, ACMI
Alors que l’information est produite à un rythme sans précédent, les entreprises d’aujourd’hui entrent dans l’ère du Big Data et se trouvent confrontées à de nouveaux défis en matière de données et de stockage.
Les organisations sont en permanence à la recherche d’une infrastructure de stockage adaptable et d’outils qui offrent une aide pour optimiser et rationaliser les opérations quotidiennes.
La famille IBM FlashSystem a évolué et s’est adaptée à des besoins qui ont changé : stratégie de plateforme unique, meilleure gestion et plus grande durabilité de la mémoire flash, réduction et chiffrement des données fonction du matériel, innovation apportée par la technologie FlashCore, nouvelles capacités de cloud hybride et adoption de NVMe, pour ne citer que quelques exemples. Les améliorations majeures ont porté sur la simplicité, la rentabilité, la densité et une rapidité exceptionnelle.
Christian Sié, Architecte Infrastructures ACMI, revient sur les principaux bénéfices des baies IBM FlashSystem dans un contexte où les besoins de performances applicatives explosent en même temps que les environnements IT se complexifient.
Le Flash se généralise pour les besoins de performance. Comment en est-on arrivé là ?
De l’invention de l’enregistrement magnétique sur télégraphone – ancêtre du magnétophone – en 1898 jusqu’à l’avènement de la technologie Flash, les systèmes de stockage ont toujours fonctionné sur le principe de la polarité positive ou négative. Inventé en 1956, le tout premier disque dur IBM 350 a connu de nombreuses évolutions en termes de capacité et de performances, mais le principe sous-jacent a toujours été le même.
L’avènement du Flash – avec les clés USB et les disques SSD notamment – a totalement changé le monde du stockage. Avec des disques durs hautes performances tournant à 15.000 tours par minutes, nous commencions à atteindre les limites des systèmes mécaniques. Multiplier le nombre de disques était le seul moyen d’augmenter l’IOPS mais les répercussions en termes de coût et d’encombrement étaient trop importantes.
Aujourd’hui, on peut continuer à les envisager pour de la sauvegarde mais dès qu’il s’agit de besoins liés à la performance applicative, la technologie Flash s’impose naturellement. Dès son apparition, on s’est aperçu à quel point cette technologie s’adaptait rapidement aux besoins des clients. En 2013, la technologie Flash SLC (Single level Cell) écrivait un bit sur une cellule. A peine un an plus tard, le MLC permettait d’écrire deux bits par cellule, puis 3 en 2018 et 4 en 2020. Contrairement au système mécanique, le flash offre cette capacité à augmenter la densité des données très rapidement.
Comment résumeriez-vous les avantages et les inconvénients du stockage flash par rapport aux disques durs ?
Le Flash est indiscutablement la meilleure technologie pour les applications transactionnelles. Le dernier système « Storage Class Memory » (SCM), supporté par toutes les baies FlashSystem IBM, permet d’obtenir une latence encore plus faible. D’un temps d’accès de 100 microsecondes avec le Flash, on passe à 10 microsecondes avec le SCM. A titre de comparaison, un disque dur à 15.000 tours/ minute offre un temps d’accès d’une milliseconde…
En revanche, le Flash est plus sensible à la détérioration des données. Avec les disques durs, nous avons l’assurance que les données restent bien sur les disques, même éteints. Il y a cependant le revers de la médaille. Après plusieurs années de fonctionnement, des problèmes mécaniques peuvent survenir, empêchant le redémarrage des disques. Si la mémoire Flash nous met totalement à l’abri de ce type d’incident, elle n’est cependant pas inusable, c’est-à-dire que les cellules ne peuvent pas être réécrites indéfiniment.
IBM apporte cependant une solution à cette problématique avec les baies FlashSystem. Grâce à son partenariat avec le fabricant de cellules Flash Micron, IBM a dès le départ mené une série de développements pour garantir la pérennité de ses cellules.
En termes de conception, sur quelles spécificités reposent les performances des baies IBM FlashSystem ?
C’est la combinaison de nombreux paramètres qui conduit à de hauts niveaux de performances. Tout d’abord, l’utilisation de la technologie MicroLatency d’IBM permet aux baies FlashSystem d’afficher une latence de l’ordre de 100 microsecondes. A profil I/O équivalent, les baies IBM FlashSystem sont 30 % plus rapides que leurs concurrentes… Du point de vue de la bande passante, le principal concurrent d’IBM atteint les 18Go par seconde, alors que les baies FlashSystem sont à 80Go par seconde et peuvent également supporter 18 millions d’opérations par seconde.
Par ailleurs, il ne faut pas négliger l’importance des processeurs Intel dernière génération qui accélèrent le traitement des données, ni le rôle de la technologie NVMe, conçue spécifiquement pour fonctionner avec la mémoire Flash et permettant au SSD de travailler à une vitesse bien plus importante qu’avec l’ancien protocole SCSI.
Il faut également noter que les baies FlashSystem peuvent être mises en cluster, ce qui permet de démarrer petit, avec un seul tiroir, pour aller jusqu’à un cluster de quatre contrôleurs flash. La plupart des concurrents d’IBM proposent la clusterisation, mais en occupant en moyenne 80U, c’est-à-dire deux racks complets, alors qu’un cluster IBM n’occupe que 8U tout en délivrant 18 millions opérations, contre 15 pour les concurrents.
Enfin, les fonctionnalités de tiering automatique (IBM Easy Tier), composante de la couche IBM Spectrum Virtualize sont très intéressantes pour optimiser les performances dans le cadre d’un pool hybride composé de Flash et de SCM, par exemple. Le système permet de distinguer les données chaudes des données plus froides et de jongler sur les supports les plus rapides en fonction des besoins. Statistiquement, on sait que 80% des données de l’activité occupent 20 % du stockage. Il est donc pertinent d’utiliser des baies très rapides à hauteur de ces 20 % afin d’augmenter les performances de la solution dans sa globalité. On peut même imaginer une architecture incluant un troisième « tier » avec des disques durs plus lents pour traiter les données froides. Ensuite, la solution Easy Tier se charge de déplacer les données automatiquement sur le support le plus pertinent et fonction de leurs caractéristiques et des besoins.
Nous avons évoqué Spectrum Virtualize. En quoi consiste cette couche logicielle ?
Toutes les baies Flash System s’appuient sur IBM Spectrum Virtualize, la couche logicielle embarquée initialement dans SAN Volume Controller (SVC).
Dès l’origine, le but de SVC était de créer un niveau d’abstraction au-dessus de l’infrastructure de stockage en place de façon à permettre une gestion des ressources par niveaux de service, mais aussi d’offrir des services de stockage avancés indépendants des baies comme des services de migration de données ou de réplication. Concrètement, la virtualisation permet de déplacer des données d’un pool de stockage à un autre de manière totalement transparente pour l’utilisateur.
Une fois que les données sont déplacées d’un pool à l’autre, il est possible de déconnecter la première baie et de ne conserver que la deuxième, sans aucun arrêt au niveau du serveur. La réplication ou la migration des données est possible à partir de systèmes de stockage hétérogènes, par exemple entre un environnement sur site et dans le cloud.
Comment assurer la sécurité des données ?
Les baies IBM FlashSystem offrent un niveau élevé de redondance. Grâce au « spare », qui assure le remplacement d’une machine en panne, on peut subir deux pannes sans être affecté.
Des modules FCM utilisent de puissantes technologies de compression et de chiffrement des données en ligne accélérées par matériel. Ces technologies fournissent un chiffrement cohérent dans toute la gamme des charges de travail, sans pénaliser les performances.
Par ailleurs, le RBAC (Role Based Access Control) permet d’attribuer des droits différents à des groupes d’utilisateurs prédéfinis : l’administrateur dispose de tous les droits, puis vient l’opérateur, un profil spécifique cantonné aux fonctions de copie, puis le monitor qui dispose des accès les plus réduits. La sécurité passe aussi par cette politique de contrôle des droits. Dans le même ordre d’idée, une baie peut être compartimentée en fonction de groupes d’utilisateurs, de manière à limiter les accès aux données sensibles à certaines populations uniquement.
Enfin, IBM annonce une disponibilité des gammes FlashSystem à 99,9999 %. Pour obtenir ces chiffres, IBM se base sur le temps d’indisponibilité toutes baies confondues dans le monde entier, ce qui donne un résultat quasiment inexistant …
A l’heure où les malwares et autres ransomwares pullulent, comment se protéger contre les attaques ?
Basée sur la technologie de virtualisation Spectrum Virtualize, la fonctionnalité IBM « Safeguarded Copy » permet de réaliser des snapshots, c’est-à-dire des images d’un volume. Cette technologie existe depuis longtemps mais elle est ici automatisée : un ordonnanceur agence les images, paramètre le nombre d’images souhaitées par jour ou par heure (séquencement) et définit combien de temps on souhaite les garder (rétention).
Tout cela est piloté par un utilitaire faisant partie de la solution Safeguarded Copy. Les images sont placées dans un pool spécial accessible uniquement aux personnes possédant les droits. En cas d’attaque, il est ainsi possible de revenir à l’image précédant l’intrusion et de rétablir la situation antérieure.
On parle d’intelligence artificielle embarquée dans les baies Flash System. A quoi cela correspond-il ?
Cette intelligence artificielle est embarquée dans IBM Spectrum Insight. Toute l’activité de la baie ainsi que ses performances, tant au niveau des contrôleurs que de la mémoire, des processeurs, des disques est enregistrée dans le cloud IBM et analysé en tenant compte des environnements : VMware, Linux, Redhat Openshift…
L’intelligence artificielle définit ensuite un profil d’activité, que nous appelons un profil I/O. Mis à jour quotidiennement, ce profil permet de déterminer les paramètres optimaux en fonction des caractéristiques de la baie, mais également de mettre en place une détection proactive des incidents. Par exemple, si une erreur se répète un certain nombre de fois au sein d’une baie, un signalement est automatiquement envoyé.
Les environnements informatiques mêlent de plus en plus ressources on-premise et cloud voire multicloud. Comment composer avec ces environnements hétérogènes et comment assurer la résilience des données ?
Là encore, la couche Spectrum Virtualize rend les baies FlashSystem totalement compatibles avec le cloud. A partir d’une baie locale FlashSystem, nous sommes capables d’envoyer une image dans le cloud, comme dans un coffre-fort. Ainsi, en cas d’incident, les données peuvent être récupérées dans le cloud.
Ces capacités peuvent être mises en œuvre dans le cadre d’un PRA (plan de reprise d’activité). Dans ce cas, on peut envisager une réplication de la baie FlashSystem chez notre client. A la différence d’une image, la réplication a lieu en temps réel, c’est-à-dire que les enregistrements sur la baie locale sont synchronisés en permanence avec la baie distante. En cas d’incident sur le site local, on peut ainsi repartir avec des données à jour au moment de l’incident sur le site distant. Cela dit, vu que la réplication est permanente, une attaque sur le site local sera propagée sur le site distant … D’où l’intérêt de recourir aux deux méthodes.
On peut également mettre en place un PCA (plan de continuité d’activité). Dans ce cadre, la perte d’une baie sur le site principal sera totalement transparente pour le serveur qui accède au site secondaire, alors que dans un PRA le même incident aurait obligé soit à redémarrer un serveur sur le site de secours, soit à connecter le serveur principal vers le site de secours et à prendre des actions pour que les volumes redeviennent disponibles pour le serveur, ce qui implique forcément une interruption de l’activité. D’un point de vue technologique, la mise en place d’un PCA fait entrer en jeu la technologie IBM Hyperswap sur FlashSystem.
Quand on parle du cloud, on évoque également toutes les technologies associées, notamment les conteneurs. Pour simplifier la conteneurisation des applications, IBM propose une offre de stockage logicielle. L’ensemble de la gamme de stockage Flash d’IBM prend en charge Red Hat OpenShift, Container Storage Interface (CSI) pour Kubernetes, l’automatisation avec Ansible et Kubernetes, ainsi que les environnements VMWare et bare metal.
Elle est également fournie avec IBM Storage Insights, qui peut donner aux utilisateurs une visibilité sur les environnements de stockage complexes pour les aider à prendre des décisions éclairées, et IBM Spectrum Virtualize, qui permet aux utilisateurs de consolider et de gérer le stockage comme s’il s’agissait d’un seul pool, conçu pour améliorer les performances et réduire les frais d’exploitation.
Avez-vous un exemple de terrain pour illustrer les bénéfices de la technologie Flash ?
Il y a beaucoup d’exemples à donner pour des usages liés aux bases de données et au transactionnel. Récemment, nous sommes intervenus chez un leader de l’industrie du luxe, qui exploitait des serveurs IBM Power d’ancienne génération associés à deux racks complets de disques rotatifs de 15.000 tours et 300 Go. En passant sur une solution Flash, nous avons pu réduire l’espace de stockage à un demi-rack, tout en divisant les temps de traitement par deux. Par la suite, nous nous sommes aperçus qu’il était encore possible d’améliorer les performances en remplaçant les serveurs d’origine par des modèles plus rapides et possédant plus de mémoire.
En fait, cette remarque peut être généralisée. Avec la transition vers le Flash, on a en quelque-sorte déplacé le maillon faible, qui était à l’origine le disque dur. Alors qu’auparavant, les processeurs travaillaient trop vite pour les disques, c’est désormais l’inverse qui se produit : les performances du Flash conduisent souvent à une saturation des serveurs, d’où la décision de les faire évoluer chez notre client.
Notons également que les performances du Flash entraînent des répercussions économiques en matière de licences, qui sont souvent facturées au nombre de processeurs (c’est le cas d’Oracle notamment). Dans l’hypothèse où le processeur est sous-utilisé à cause d’un stockage trop lent, on est contraint de multiplier les serveurs qui accèdent chacun à leur ressource de stockage pour augmenter les performances. A l’inverse, en passant par des baies Flash performantes, on pourra exploiter toutes les ressources des processeurs, voire même utiliser des processeurs possédant moins de cœurs et ainsi faire baisser le coût des licences.