Les SSD pourraient bientôt doubler leur capacité sans changer de taille grâce à cette technologie

Les SSD pourraient bientôt doubler leur capacité sans changer de taille grâce à cette technologie

Des fabricants de stockage et plusieurs acteurs du semi-conducteur travaillent sur une nouvelle génération de SSD capables d’afficher jusqu’à 128 To dans un format proche des modèles actuels, en s’appuyant sur une compression à la volée pilotée par une puce intelligente.

L’idée consiste à réduire la quantité de données écrites et lues sur la mémoire flash, tout en maintenant une compatibilité logicielle, pour obtenir plus de capacité utile et des transferts plus rapides dans certains scénarios. Cette approche vise surtout les centres de données, l’IA et les usages professionnels, mais elle pourrait aussi influencer, à terme, le marché grand public des SSD NVMe.

Une puce dédiée compresse les données avant l’écriture en NAND

La promesse d’un SSD affichant 128 To repose moins sur un saut unique de densité de la mémoire flash que sur une combinaison, plus pragmatique, entre flash de forte capacité et compression à la volée. Concrètement, une puce intelligente placée sur le SSD, ou intégrée au contrôleur, analyse les blocs de données au moment où l’ordinateur les envoie, puis les compresse avant de les écrire en NAND. À la lecture, le chemin inverse s’applique, la puce décompresse et renvoie au système des données identiques à l’original, sans modification visible pour l’application.

Cette logique ressemble à ce que font déjà certains logiciels de compression, mais l’exécution dans le matériel change l’équation. Un algorithme exécuté par le CPU consomme des cycles et peut devenir un goulot d’étranglement, surtout quand les débits dépassent plusieurs gigaoctets par seconde. Une compression gérée dans une puce dédiée vise à limiter l’impact sur le processeur, à réduire la latence, et à stabiliser les performances quand plusieurs flux d’E/S s’exécutent en parallèle, par exemple sur un serveur de virtualisation.

Dans les cas favorables, l’intérêt est double. D’abord, la capacité utile augmente, car une partie des données occupe moins de place physique. Ensuite, le débit perçu peut progresser, car le SSD lit et écrit moins de données brutes sur la NAND. Sur une interface PCIe 5.0, un SSD moderne peut déjà atteindre des vitesses séquentielles de l’ordre de 10 à 14 Go/s selon les modèles. Si la puce réduit de 30% la quantité de données à transférer sur la flash pour un même fichier logique, le contrôleur peut, dans certains scénarios, maintenir des débits élevés plus longtemps, notamment lorsque la mémoire cache SLC se vide.

La qualité de l’approche dépend de points techniques rarement visibles sur la fiche produit. Le taux de compression varie selon la nature des données, texte et bases structurées se compressant souvent mieux que des vidéos déjà encodées. La puce doit aussi gérer l’alignement en pages NAND, la correction d’erreurs, et les tables de correspondance logiques, sans augmenter excessivement la consommation. Dans un datacenter, quelques watts de plus par SSD se traduisent rapidement en coûts d’énergie et de refroidissement, ce qui pousse les fabricants à optimiser le rapport performance par watt.

Autre paramètre sensible, la sécurité. Si le SSD chiffre les données, la compression doit se faire avant le chiffrement, car des données chiffrées se compressent très mal. Cela implique une chaîne de traitement précise, compression puis chiffrement matériel, avec des clés gérées par le contrôleur. Dans les environnements régulés, la conformité et la traçabilité des mécanismes de chiffrement restent des critères d’achat au même titre que la capacité.

Les gains réels dépendent des fichiers, de 1,1:1 à plus de 2:1

La perspective d’un SSD de 128 To peut laisser penser à un gain automatique et constant. Dans la pratique, la compression est opportuniste, et le bénéfice dépend du type de données. Sur des documents bureautiques, des logs applicatifs, des bases de données relationnelles ou certaines images non optimisées, un ratio de 1,5:1 est fréquemment cité comme plausible dans des environnements professionnels. Cela signifie qu’un téraoctet logique peut n’occuper qu’environ 0,67 To sur la NAND, ce qui se traduit par une capacité utile accrue à coût de flash constant.

À l’inverse, des contenus déjà compressés, comme des vidéos H.264 ou H.265, des photos JPEG, des archives ZIP, ou des jeux vidéo distribués en paquets compressés, offrent souvent un ratio proche de 1,0:1 à 1,1:1. Dans ces cas, la puce travaille, mais le gain de place est limité. Les fabricants peuvent alors décider de basculer vers un mode de compression plus léger, ou de détecter les données incompressibles pour éviter d’ajouter de la latence. Cette capacité d’adaptation fait partie des points qui distinguent une solution mature d’une démonstration de laboratoire.

Les charges de travail d’entreprise sont souvent plus favorables que les usages domestiques. Un serveur qui stocke des instantanés de machines virtuelles, des sauvegardes incrémentales, ou des bases de données transactionnelles manipule beaucoup de redondance. Un exemple concret, des environnements de postes virtuels où des centaines d’images système se ressemblent, peut générer un gain important, parfois au-delà de 2:1 dans les meilleurs cas, même si ce chiffre varie fortement selon les politiques de déduplication en amont. La compression à la volée n’est pas la déduplication, mais elle profite quand les données contiennent des motifs répétitifs.

Sur la performance, le raisonnement est similaire. Si un SSD doit écrire 700 Go physiques au lieu de 1 To logique, l’endurance et le débit peuvent s’améliorer, car la NAND subit moins de cycles d’écriture. La métrique TBW utilisée sur le marché grand public, ou les indicateurs DWPD dans l’entreprise, pourraient bénéficier indirectement d’une réduction de l’amplification d’écriture. Mais le gain n’est pas garanti, car la compression introduit une étape de calcul, et la gestion des petits blocs peut compliquer l’écriture séquentielle.

Il faut aussi tenir compte des limites de l’interface. Sur PCIe 4.0, un SSD haut de gamme vise souvent autour de 7 Go/s en lecture séquentielle. Sur PCIe 5.0, les meilleurs modèles dépassent 10 Go/s. Si la compression réduit les octets à transférer entre le contrôleur et la NAND, le SSD peut, dans certains cas, approcher plus souvent les plafonds de l’interface, mais seulement si la file d’attente et le contrôleur ne saturent pas. Les gains les plus visibles sont attendus sur des flux répétitifs, comme des compilations, des exports de bases, ou des traitements de logs, plutôt que sur des copies de vidéos déjà encodées.

Dernier point, la transparence. Les entreprises veulent savoir ce qu’elles achètent. Une capacité annoncée à 128 To peut correspondre à une capacité logique maximale sous hypothèse de compression, et non à une quantité de NAND brute. Les contrats et les fiches techniques devront préciser la capacité physique, la capacité logique, et les conditions de mesure, faute de quoi le risque de confusion commerciale est élevé, surtout dans les appels d’offres publics et les marchés régulés.

Centres de données, IA et cloud visent d’abord la densité au rack

Le premier marché visé par des SSD très haute capacité reste le datacenter. Pour un opérateur cloud, augmenter la densité de stockage par serveur réduit le nombre de machines nécessaires, donc l’espace au sol, l’énergie et le réseau interne. Dans un châssis 1U ou 2U, passer de SSD de 30, 60 ou 100 To à des modèles affichant 128 To permet d’augmenter la capacité par baie sans changer l’infrastructure. Les formats entreprise, comme EDSFF, sont justement conçus pour optimiser le refroidissement et la densité, ce qui colle à l’arrivée de supports plus capacitaires et parfois plus énergivores.

Les usages liés à l’IA renforcent cette demande. L’entraînement et l’inférence s’appuient sur des jeux de données massifs, souvent composés de millions de fichiers, d’images, de texte ou de séquences audio. Les pipelines modernes cherchent à réduire le temps d’attente des GPU, ce qui pousse à rapprocher les données des serveurs de calcul. Un SSD qui compresse à la volée peut stocker davantage de données sur place, et limiter les transferts sur le réseau, ce qui est crucial quand les clusters saturent déjà des liens à 100 ou 200 GbE dans les architectures récentes.

Dans les systèmes distribués, la latence compte parfois plus que le débit maximal. Un stockage local NVMe réduit la dépendance à un stockage partagé, mais il faut alors gérer la réplication et la résilience. Les SSD très haute capacité aident à consolider plusieurs jeux de données sur un même nud, mais ils augmentent aussi l’impact d’une panne. Les opérateurs compensent par des schémas d’erasure coding, des copies multiples, ou des politiques de sauvegarde. La compression matérielle ne remplace pas ces mécanismes, elle vise surtout à diminuer le coût par téraoctet utile.

Un autre segment, moins visible, concerne les bases de données et l’analytique. Les entrepôts de données et les moteurs de recherche stockent des index volumineux, parfois déjà compressés au niveau applicatif. L’intérêt d’une puce intelligente sur le SSD dépend alors de la redondance restante. Dans certains cas, le gain est marginal, mais la réduction des écritures physiques peut améliorer la durée de vie, ce qui compte pour des SSD entreprise notés en DWPD. Un SSD capable de maintenir un bon niveau d’endurance à haute capacité évite de multiplier les supports, ce qui réduit la complexité opérationnelle.

La question économique reste centrale. Les SSD très haute capacité sont chers, et les entreprises raisonnent en coût total de possession. Si la compression permet de réduire de 20% le nombre de SSD nécessaires pour un même volume utile, l’économie peut être significative, même si chaque unité coûte plus cher. Mais l’arbitrage dépend du prix de la NAND, des contraintes d’énergie, et des besoins de performance. Les opérateurs comparent souvent à des solutions hybrides, NVMe pour les données chaudes et disques durs pour l’archivage. La compression embarquée vise à repousser ce point de bascule, en rendant le flash plus compétitif sur des volumes plus importants.

Compatibilité NVMe et limites, latence, chiffrement et risques de verrouillage

Pour s’imposer, la compression à la volée doit rester compatible avec l’écosystème existant. Les entreprises déploient des milliers de serveurs, avec des piles logicielles standardisées. Une solution acceptable doit se présenter comme un SSD NVMe classique, sans imposer un pilote propriétaire fragile. C’est l’un des arguments mis en avant par les promoteurs de la compression à la volée, la transparence pour l’OS et les applications. Mais cette transparence a un prix, car la gestion des métadonnées internes devient plus complexe.

La latence est le premier point de vigilance. Un SSD très rapide se joue parfois à quelques microsecondes sur des lectures aléatoires. Ajouter une étape de compression ou de décompression peut augmenter la latence, surtout sur des petits blocs de 4K, fréquents dans les bases de données. Les fabricants cherchent à compenser par du parallélisme matériel, des accélérateurs dédiés et des caches. Le résultat dépendra des implémentations. Un SSD peut afficher un excellent débit séquentiel sur un benchmark, mais se comporter moins bien sur des charges réelles si la compression introduit des variations de temps de réponse.

Le chiffrement est un autre sujet structurant. Beaucoup d’organisations exigent du chiffrement matériel, parfois avec des exigences de conformité. Pour conserver l’efficacité, la chaîne doit suivre l’ordre logique, compresser puis chiffrer. Cela nécessite une intégration propre entre la puce de compression, le contrôleur et le module de sécurité. Dans les environnements où le chiffrement est géré au niveau applicatif ou via des volumes chiffrés, la compression au niveau SSD peut perdre une partie de son intérêt, car les données arrivent déjà chiffrées et donc difficiles à compresser.

La fiabilité et la récupération sont également scrutées. Dans un SSD standard, les outils de diagnostic et les procédures de maintenance sont bien connus. Avec une couche de compression, la corruption de métadonnées internes peut avoir un impact plus large, car un bloc compressé peut contenir plusieurs segments logiques. Les fabricants devront démontrer des mécanismes robustes de journalisation interne et de correction, et fournir des garanties claires. Dans l’entreprise, un incident rare mais coûteux peut suffire à écarter une technologie, même si elle est performante sur le papier.

Le risque de verrouillage fournisseur est souvent sous-estimé. Si la compression est mise en uvre de façon propriétaire, la migration vers un autre modèle de SSD, ou la récupération de données dans un contexte de panne contrôleur, peut devenir délicate. Les acheteurs professionnels demandent des engagements, documentation, compatibilité, procédures de remplacement, et parfois des options de désactivation de la compression. Un mode de fonctionnement qui permet d’exposer la capacité physique sans compression, pour des données déjà compressées, peut aussi rassurer, car il évite de payer une complexité inutile.

Enfin, la communication marketing devra rester prudente. Annoncer 128 To sans préciser les hypothèses de compression peut créer des attentes irréalistes. Les professionnels attendent des tests indépendants, des profils de performance sur différents types de fichiers, et des indicateurs d’endurance en conditions réelles. L’adoption se jouera sur des preuves, pas sur des promesses, surtout quand les SSD se trouvent au cur de services critiques, facturation, santé, finance ou administration.

Ce que cela change pour le grand public, PC portables, consoles et création

Le grand public est fasciné par les chiffres de capacité, mais l’arrivée de SSD affichant 128 To ne signifie pas une démocratisation immédiate. Les premiers produits de ce type visent généralement l’entreprise, où le prix par unité peut être très élevé. Pour les particuliers, la tendance récente s’est plutôt concentrée sur des SSD NVMe de 1 à 4 To devenus accessibles, avec des promotions régulières, tandis que les modèles de 8 To restent plus rares et chers. La compression matérielle pourrait, à terme, aider à proposer des capacités perçues plus élevées sans multiplier les puces de NAND.

Les usages domestiques sont contrastés. Un joueur sur PC ou console installe des jeux qui contiennent déjà des archives compressées. Dans ce cas, le gain de place risque d’être limité. En revanche, les bibliothèques de captures, les mods, les projets de création, ou des dossiers de travail remplis de fichiers intermédiaires non optimisés peuvent mieux se compresser. Un monteur vidéo qui manipule des proxys, des caches, ou des exports temporaires peut voir un bénéfice plus tangible, même si les fichiers finaux, déjà encodés, se compressent peu.

La vitesse de transfert est un argument plus audible pour le public. Si la puce réduit la quantité de données écrites, les copies de gros projets peuvent être plus rapides dans certains cas, et l’usure de la NAND peut diminuer. Mais il faut rester prudent, car un SSD grand public est souvent limité par la dissipation thermique. Sur un PC portable fin, un SSD PCIe 4.0 peut déjà throttler après quelques minutes d’écriture soutenue. Ajouter une puce de compression peut augmenter la consommation, donc la chaleur, ce qui peut annuler une partie du gain. Les fabricants devront optimiser le refroidissement, ou réserver ces fonctions à des gammes plus épaisses.

Les consoles et appareils portables posent d’autres contraintes. Dans une console, le stockage est intégré à une architecture de streaming d’actifs, avec des débits et des latences calibrés. Une compression au niveau SSD pourrait interagir avec des mécanismes déjà présents dans le moteur de jeu ou le système. Certaines plateformes utilisent déjà des décompressions matérielles dédiées au chargement d’actifs. Ajouter une compression supplémentaire peut compliquer la chaîne, ou apporter peu si les données sont déjà empaquetées. Le bénéfice pourrait être plus net sur des bibliothèques de jeux rétro, des ROMs, ou des contenus non compressés.

Pour les particuliers, l’effet le plus probable à court terme est indirect. Les innovations destinées aux datacenters finissent souvent par influencer les contrôleurs grand public, en améliorant la gestion de la latence, la correction d’erreurs, ou l’efficacité énergétique. La compression à la volée pourrait devenir une option, activable selon les usages, plutôt qu’un argument unique de capacité. Les consommateurs devront surveiller des éléments concrets, capacité disponible, performances sur fichiers incompressibles, compatibilité avec le chiffrement, et conditions de garantie, car ces détails comptent autant que le chiffre mis en avant sur la boîte.

Laisser un commentaire