SSD Intel X25-M 80 Go : une bombe ?

Considérations sur la fiabilité des SSD (3/3)

Publié le 08 septembre 2008 , par Stephane CHARPENTIER - mis à jour le 02 février 2010 à 23h

Comment évaluer la durée de vie d’un SSD ?


Maintenant que nous avons approché ces principes, nous pouvons reparler du concept de Raw Bit Error Rate. Il est crucial de calculer ce RBER pour là aussi pouvoir juger de la fiabilité d’un produit à base de mémoire NAND Flash. Diverses études ont montré sans surprises que ce taux d’erreur augmentait avec le nombre de cycles de programmation/écritures mais de manière inégale selon l’origine des puces. Il est clair que la qualité des puces et des cellules a une influence directe sur ces erreurs d’écritures. Ces tests ont également mis en lumière le fait que ces erreurs sont aléatoires. De nombreux bits qui ont défailli après 5000 cycles d’écriture n’ont pas posé de problèmes à la 10.000ème écriture. L’explication à cela serait que les pertes dues à l’oxyde sont transitoires.
Mais le problème provient aussi de la façon dont sont effectués ces tests de vérifications. Si les vérifications ne sont faites qu’après N cycles d’écriture, les résultats ne seront pas les mêmes que si l’on vérifie les erreurs éventuelles après chaque cycle, les uns après les autres. D’où la difficulté d’estimer ce taux d’erreur précisément. Ce qui est certain par contre, c’est que ce taux augmente proportionnellement au nombre de cycles d’écriture. Cependant, le RBER n’est pas uniquement influencé par les écritures. Le taux d’erreur au niveau des bits a également tendance à augmenter en fonction du temps de rétention et en fonction du nombre de lectures. Bref, plus on utilise un SSD, plus son RBER augmente.

Le MTBF ne suffit pas, il faut aussi tenir compte de l’UBER


A ce stade, le MTBF, Mean time between failures, qui exprime le temps qui s’écoule avant défaillance intégrale du produit, est insuffisant pour juger la durée de vie et la qualité d’un SSD. Il faut aussi tenir compte de la perte de données. Car il peut y avoir perte de données sans pour autant que le SSD ou la clé USB ne fonctionne plus. Cette estimation de la perte de données est appelée UBER pour « uncorrectable bit error rate ». En bon français, on peut traduire cela par le taux d’erreur de bit non corrigible. Le problème c’est que même si cet UBER fait une apparition dans certaines fiches techniques de produits à base de NAND Flash, il n’existe pas de standard exact le définissant précisément. Il faut donc le considérer avec les réserves d’usage.

Minimiser l’amplification d’écriture : second moyen d’augmenter la durée de vie


Il y a cependant moyen de produire des SSD avec de très faibles taux d’UBER. Pour y parvenir, un des moyens est de minimiser le nombre d’écritures inutiles sur la NAND Flash. De la sorte, on maximise la fiabilité du SSD mais on maximise également sa performance. C’est à ce stade qu’intervient la notion de « Write Amplification » ou l’amplification de l’écriture. Il s’agit du nombre d’écritures exécutées au niveau de la mémoire NAND Flash pour stocker une certaine quantité de données en provenance de l’hôte émetteur. Car comme nous l’avons évoqué ci-avant, l’écriture sur de la NAND Flash nécessite un effacement du bloc avant écriture et il en résulte que la quantité de données à écrire en provenance de l’hôte est très souvent moins importante en taille que le nombre de cellules qu’il a fallu « effacer ». Concrètement, si un bloc contient déjà quelques données et qu’il faut y stocker de nouvelles données, les données existantes sont montées dans la mémoire système, la RAM du PC donc, le bloc est ensuite intégralement effacé avant écriture des nouvelles données et réécriture des anciennes. On a donc très souvent un nombre d’écritures au niveau de la NAND Flash supérieur à la quantité de données à écrire. Les schémas traditionnels à ce niveau parlent d’une amplification allant de 20 à 40x. Ceci signifie par exemple que pour écrire 4 Ko de données depuis l’hôte qui envoie les données, il peut arriver qu’il faille écrire sur 128 Ko de NAND Flash. Attention cependant que cela n’entame pas la capacité du disque, les 128 Ko écrits étant en partie composés d’anciennes données déjà stockées auparavant. Vu que la fiabilité dépend du nombre de cycles d’écriture, l’amplification d’écriture a un rôle important à jouer. Le but est de minimiser cette amplification afin de toucher le moins possibles de blocs et dès lors augmenter la durée de vie du SSD et la fiabilité des données.

http://wd.ch-img.com/86641-ssd-intel-x25-m-80-go.jpg
Le phénomène d'amplification d'écriture sur un bon* (SSD du dessous)
et un moins bon SSD (SSD du dessus)


* pas forcément un Intel mais ce schéma exprime bien le phénomène d'amplification d'écriture


Tous les SSD ne sont pas égaux en termes de durée de vie


Intel évoque pour ces nouveaux SSD haute performances une amplification d’écriture inférieure à 1.1, ce qui est exceptionnel si cela se confirme en pratique. Cette amplification d’écriture, combinée au wear leveling évoqué ci-avant détermine, entre autres, la durée de vie d’un SSD mais pas la rétention. Pour rappel, le wear leveling consiste à arranger les données à écrire afin de correctement les répartir au sein de la mémoire Flash dans le but de ne pas toujours écrire sur les mêmes blocs, ce qui entraînerait une mort prématurée de ces derniers. Pour ce faire, il convient de tenir compte des cycles passés et de l’historique des blocs. Chaque fabricant se doit de développer à ce niveau des algorithmes de Wear Leveling afin d’optimiser ces répartitions. C’est à ce stade également qu’on peut distinguer les bons des mauvais SSD. Un bon SSD aura une amplification d’écriture basse associée à une gestion efficace du wear leveling et a contrario un mauvais SSD aura une amplification d’écriture élevée associée à une efficacité douteuse du wear leveling. Intel affirme à ce propos que leurs SSD à base de MLC peuvent avoir une durée de vie supérieure à de mauvais SSD SLC grâce à la combinaison d’une basse amplification d’écriture et une gestion efficace du wear leveling. Malheureusement, ces données sont très souvent indisponibles dans les fiches techniques des SSD et sont très difficilement vérifiables.

De son côté, Intel annonce ces chiffres car ils sont bas dans la conception de leur SSD et les transforment donc en argument marketing. Ainsi le SSD InteX25-M 80 Go à base de MLC est annoncé pour une durée de vie de 5 ans. Cela peut sembler peu vu que le MTBF est donné pour 1.2 millions d’heures, soit l’équivalent de 137 années. Même constat pour les SSD à base de SLC dont le MTBF est donné pour 2 millions d’heures (228 années) mais la durée de vie maintenue à 5 ans. Pourquoi une durée de vie si basse ? Parce qu’Intel calcule sa durée de vie selon l’usage qui peut être fait du disque. Les versions SLC, Intel les a conçus à destination du monde professionnel des serveurs et estime donc qu’ils vont être utilisés très intensivement 24h sur 24, 7 jours sur 7. Ses SSD à base de MLC sont plutôt destinés quant à eux aux consommateurs et plus particulièrement les utilisateurs de PC portables. Et Intel se donne une sacrée marge vu que les 5 années de durée de vie des SSD à base de MLC sont calculés en estimant que la quantité de données écrites par jour est de 100 Go, 7 jours sur 7. Donc si vous n’écrivez que 20 Go par jour, la durée de vie peut être multipliée par 5, soit 25 ans !
Après ces considérations techniques, passons à la présentation des SSD que nous allons opposer.

Considérations sur la fiabilité des SSD (2/3)   Intel X25-M 80 Go : présentation
Les commentaires sur ce document sont clos.
  • Tout
  • Hi-Tech
  • Matériel
  • Mac
  • Jeux

Derniers Tests

Tous les tests