Le stockage objet et les systèmes distribués en scale out commencent à prendre leur place dans les entreprises ayant à gérer de très gros volumes de données. Plus qu’un simple stockage, ce type de solution devient le support de nouvelles applications dans différents secteurs d’activité.
Selon le cabinet Gartner, en 2022 ce sont 80 % des données qui seront stockées dans des environnements distribués en scale out, en augmentation de 43 % par rapport à 2018. La même source indique que ces systèmes connaissent une croissance à la fois en nombre de déploiements mais aussi en capacité, pour faire face au déluge des données non-structurées dans les entreprises. Celles-ci croissent de plus de 50 % par an.
Une offre déjà importante
L’offre du marché est importante et combine des systèmes NAS en scale out et des systèmes objets. Les grands du secteur sont tous présents : Pure Storage avec sa solution FlashBlade, IBM avec ses offres Spectrum et COS, Dell EMC avec Isilon et Elastic Cloud Storage, Hitachi Vantara avec Hitachi Content Platform, Huawei avec OceanStor et Fusion Storage, NetApp avec StorageGrid, Western Digital avec ActiveScale et DDN avec WOS.
À côté d’eux, des start-up et des spécialistes du NAS scale out, ou des systèmes objets, luttent pour se faire une place au soleil. Scality est aujourd’hui un des plus connus et L’Informaticien a abondamment parlé de sa technologie Ring. L’éditeur a récemment ajouté une possibilité d’intégration multicloud avec Zenko. Les entreprises sont encore au début de cette démarche. La montée en puissance autour de cette nouveauté devrait donc prendre du temps. Y travaillent Caringo, Cloudian, Qumulo, Inspur (acteur chinois qui se diversifie dans le stockage), SwiftStack avec OpenStack Swift, Red Hat, Suse avec Ceph.
De nombreux autres acteurs comme Elastifile, Hedvig, Nexenta, Nutanix, Rozo Systems (d’origine française), Open IO, WekaIO émergent peu à peu mais n’ont pas encore atteint une taille assez critique sur le marché pour revendiquer des positions de leadership. Il faut noter que les marchés et les applications des différents systèmes comme les NAS scale out et les systèmes objets connaissent une convergence de plus en plus forte, explique le cabinet américain d’analystes pour justifier son dernier rapport mêlant les deux catégories.
L'interface de l'outil de Cloudian.
Une standardisation de fait autour de S3
La délivrance des offres sous forme purement logicielle avec des configurations sur certains matériels x86 est une autre tendance forte du moment. La standardisation de fait autour de l’API S3 d’AWS est aussi un point marquant. Elle apporte un langage commun à la plupart des solutions et autorise des environnements hybrides avec des débordements vers le Cloud. Cette tendance va d’ailleurs beaucoup plus loin aujourd’hui avec la volonté de développer de nouvelles possibilités métier, comme pour le rendering dans le secteur de l’animation ou de la vidéo et de nouvelles applications sur des charges de travail liées à l’analytique ou au Machine Learning.
L’autre aspect important de la standardisation autour de S3 provient de la tendance DevOps qui permet aux développeurs de travailler à plus d’interaction avec l’infrastructure par cette API et de choisir pour leurs applications le meilleur environnement. C’est particulièrement visible pour le développement d’applications liées à la mobilité. Minio, est un exemple de cette tendance. Après avoir tenté de percer sur le marché avec une solution de stockage objet distribuée compatible S3, Minio a désormais l’ambition de devenir une couche de stockage objet neutre disponible sur plusieurs plates-formes cloud. L’idée est d’apporter la compatibilité S3 sur Azure Blob Storage par exemple pour offrir cette fonctionnalité aux clients de Microsoft.
Pourquoi un stockage objet ?
Les systèmes blocs traditionnels deviennent complexes à gérer à une échelle relativement faible. Le concept de création d’un pool unique de données n’est plus aussi performant quand le nombre d’appliances augmente, surtout si le pool dépasse les limites des différents types d’équipement. Les serveurs de fichiers (filers) fonctionnent avec des hiérarchies de dossiers de fichiers qui deviennent complexes quand il s’agit d’étendre le système, et ce alors que les milliers d’instances virtuelles actuelles rendent les systèmes de partage de fichiers carrément maladroits. Une des caractéristiques des instances de stockage objet est la distribution des objets sur tous les périphériques de stockage, ou au moins en sous-ensembles s’il y a un grand nombre de périphériques dans le cluster. Cela supprime une faiblesse de conception de l’approche type bloc/fichier, où la défaillance d’une appliance ou de plusieurs unités peut entraîner une perte de disponibilité des données ou même une perte des données. Ce type de protection est connu sous le nom d’Erasure Coding.
Scality Ring 6.
Simple ajout de nœud
Un objet est un bout de données couplé à des métadonnées extensibles décrivant toutes sortes de choses sur ces données, toutes identifiées par un identificateur global unique. Il peut s’agir de n’importe quoi : d’une ligne de base de données à un document Word en passant par un résultat quotidien de la NASA. Le GUID est généralement un hachage de données et sert à garantir que les données sont intactes ou non altérées, ainsi qu’à identifier l’objet unique. Le fait que les objets puissent contenir n’importe quelle structure de données signifie que le stockage de fichiers et en mode bloc est effectivement un sous-ensemble.
Un autre avantage de ces systèmes est l’évolutivité par simple ajout de nœud. Encore à ses débuts, ce type de stockage était utilisé en complément du stockage traditionnel pour les environnements transactionnels. Du fait de son intégration aux applications, aux systèmes traditionnels et aux autres environnements objets par API, et la standardisation de fait autour de S3, le stockage objet a la possibilité de devenir le stockage « universel » dans l’entreprise. Il reste cependant plus adapté aux environnements massifs en données froides pour l’archivage ou à l’agrégation de fichiers.
Une baie Hitachi content platform d'Hitachi Vantara.