Grappe RAID hétérogène : quelle contrepartie ?

26/06/2008 à 08:40 par Patrick Schmid, Rédaction Tom's France

Introduction

Aujourd’hui bien ancré dans les mœurs des entreprises, le RAID est de prime abord devenu une technologie relativement simple à mettre en œuvre. Toutefois, selon la configuration choisie et l’application désirée, les grappes peuvent, dans les faits, devenir très complexes et obliger l’administrateur système à être particulièrement attentif au choix et au paramétrage du matériel. Il reste néanmoins un point sur lequel tous les professionnels du stockage s’accordent en général : les disques constituant une grappe doivent être identiques – même marque, même modèle, même firmware. Cette nécessité est d’ordinaire bien comprise des grandes entreprises, leurs fournisseurs passant généralement beaucoup de temps à tester différents composants matériels afin de vérifier que le système fonctionne comme il se doit. Les petites et moyennes entreprises, en revanche, sont souvent plus enclines au bricolage et peuvent considérer comme assez logique, d’un point de vue pratique, de mélanger disques durs neufs et existants. C’est exactement ce que nous avons fait pour cet article.

RAID hétérogène

Une technologie de plus en plus importante

Bien que le prix des disques durs ait considérablement baissé ces dernières années, les coûts de stockage représentent toujours une part appréciable du budget informatique des entreprises, les données à traiter devenant de plus en plus nombreuses et volumineuses. Lorsqu’on passe de l’organisation de simples données personnelles à la gestion de gros volumes d’informations professionnelles, les divers paramètres que sont la redondance, les performances, la fiabilité, l’évolutivité, la facilité de gestion et enfin le prix des composants finissent par former une équation passablement complexe. De nos jours, les grappes de stockage basées sur la technologie RAID sont un élément clé de tout système stratégique, où la fiabilité et la capacité à éviter toute interruption du service sont des critères essentiels.

Une pléthore de choix

En matière de RAID, les choix sont innombrables, allant des grappes les plus simples aux systèmes redondants les plus complexes. La première décision porte sur le type de RAID : matériel, avec une puissante carte contrôleur spécifiquement prévue à cet effet, où logiciel, qui fait appel au CPU pour les calculs de parité ? Vient ensuite le choix de l’interface : celle-ci peut être le SAS (Serial Attached SCSI, l’évolution moderne et en série du SCSI) ou le plus classique SATA (Serial ATA). Il est à noter que les contrôleurs SAS professionnels prennent en charge à la fois les disques SAS et SATA, tandis que les contrôleurs SATA ne gèrent que les disques SATA. Ces premiers choix effectués, il faut ensuite décider si vous souhaitez brancher les disques en interne ou en externe, via l’interface eSATA ou à l’aide de modules d’extension SAS et de câbles multilignes. Il y a ensuite les possibilités d’installer des disques de rechange (dits « hot spares »), d’utiliser ou non la mémoire cache du contrôleur ou encore de protéger le contenu de celle-ci à l’aide d’une batterie de secours.

On le voit, les possibilités sont infinies. Par conséquent, l’un des moyens que les administrateurs emploient fréquemment pour réduire la complexité des systèmes RAID est d’employer des disques durs identiques. Pour des raisons de performances, ce caractère identique va généralement jusqu’à la version du firmware utilisé.

Nous ne pouvons qu’approuver cette recommandation pour les grappes RAID hautement optimisées et utilisées pour des applications très spécifiques, où il est effectivement crucial de bénéficier de performances maximales. Toutefois, comme nous sommes curieux, nous avons voulu quantifier avec précision la différence de performances entre une grappe homogène et une grappe hétérogène : à cet effet, nous avons créé un système RAID composé de quatre disques identiques (Samsung 320 Go en SATA), et un autre constitué de deux Samsung, d’un Seagate et d’un Western Digital.

Liens commerciaux
Commentaires
geek_du_44 26/06/2008 09:15
Masquer
-1+

et pour le particulier, le RAID 0 hétérogène c'est bien

Anonyme 26/06/2008 09:22
Masquer
-10+

Très bon article, intéressant, mais il me semble que vous avez oublié un point essentiel.

Dans la plupart des solutions de stockage "massif" (l'unique exception étant les baies EMC) on préconise justement l'inverse de votre conclusion : monter plusieurs modèles différents, afin de diminuer les potentielles pannes -simultanées- de disques.

la préconisation est, par exemple pour un ensemble de baies de stockage en raid 5+5 (raid 5 ou 6 entre 3-4 baies ou plus, elles-memes en raid 5 ou 6) de disposer d'eu moins 4 modeles de disques "similaires" (vitesse de rotation, cache, interface) mais de marques différentes.

De plus, dans le cas de disques identiques, les fournisseurs pro sont capables de fournir jusqu'a 16 à 20 disques identiques, mais issus de séries ou de chaines de montage différentes, voire d'usines différentes pour certains constructeurs.

L'idée sous-jacente est qu'il peut y avoir une série de disques défectueux (par exemple une série d'IBM/Hitachi 72Go SCA reste dans les mémoires de tout ingénieur stockage).

Le probleme est qu'avec une série défectueuse, les chances de panne simultanée (pendant la reconstruction par exemple) peuvent augmenter tres vite, et pour certains systèmes, ce risque vaut les 15 a 20% de pertes en performances.


Je me souviens d'un systeme de 144 disques que j'avais mis en place il y a quelques temps (10 baies de 14 disques, chaque baie constituée de 12 disques en RAID6 plus 2 hot-spare, puis RAID6 sur 9 baies avec 1 baie en hot-spare).
Au bout de 3-4 mois, deux disques tombent a 10 minutes d'intervalle. La reconstruction commence, et 1 autre tombe pendant celle-ci.
Heureusement que l'on avait des disques cold-spare prêts à étre installés, car apres 15 jours de reconstructions sur reconstruction, tous les disques d'une certaine marque et d'un certain modele étaient grillés, sauf 2. "série défectueuse"....

Bref: si vous pouvez vivre avec 20% de perfs en moins, prenez des disques "similaires" mais pas identiques :-)




Florian c 26/06/2008 09:38
Masquer
-1+

The Flagada > Merci pour ton expérience intéressante ! Bon là on parlait plus de grappes de 4 disques au plus, mais il est vrai que le risque reste présent. :jap:

rastadd 26/06/2008 09:44
Masquer
-1+

+1 pour Flagada ;)

Anonyme 26/06/2008 10:07
Masquer
-4+

Il y a quelques années, j'ai eu un raid 5 de 6 disques de 200Go Maxtor, 1 premier est tombé en panne, pendant la reconstruction un autre est tombé en panne, le temps de changer de disque 2 autres disques sont tombés en panne ...
Ca fait toujours plaisir de perdre 1To ^_^

gaboul49 26/06/2008 10:43
Masquer
-1+

Merci pour le commentaire The Flagada.

chr17 26/06/2008 13:10
Masquer
-1+

Je voulais ecrire un commentaire pour vous raconter un probleme similaire sur un serveur iSeries IBM mais Flagada l'a deja bon expliqué.

Au pire si il vous faut vraiment de la performance, changer juste de modele pour les disques hot-spares.

D'un autre coter je suis pas sur que beaucoup de pme peuvent ce permetre des systems avec des disques de rab : )

darkbul 26/06/2008 13:40
Masquer
-1+

Est il possible de rajouter dans votre test les Raid1 car sur les serveur le raid 0 n'est pratiquement jamais utiliser (sauf raid 10)?

Je me demande depuis longtemps si le raid 1 est plus rapide que le raid 5 enfaite. Et chaque fabricant de serveur a son opinion mais sans pouvoir avancer des chiffre.

Dans mon entreprise pratiquement tous les serveur sont configurer de la façon suivant: Raid1 sur 2 disque pour l'os et raid5 sur 3ou4 disque pour les data + 1 hot spare par raid le toutes sur 1 contrôleur.

Sinon il est très intéressant votre article Bravo et Merci.

ograweb 26/06/2008 14:10
Masquer
-1+

Test peu constructif pour moi.

Ici rien ne prouve que c'est l'hétérogénéité de la grappe qui réduit les performance ! Les performance sont réduites surement a cause des disque de plus faible performance.

Le test aurait été convaincant si vous aviez testé 2 samsung avec 2 autres disque plus performant que les samsung (en temps d'accès et débit) et que les performance soient inférieur a la grappe homogène

pilip 26/06/2008 14:35
Masquer
-0+

pourrais t'on expliquer aussi pourquoi dans certains cas la grappe hétérogène est la plus rapide?

car si il n'y a pas d'explication logique il ce pourrais bien que les résultats du test en question soit faux.

Anonyme 26/06/2008 16:35
Masquer
-2+

je suis assez d'accord avec "ograweb"
Qui dit comparatif dit référence.
Pour que votre test aie été significatif il aurait fallu d?abord déterminer quel disque ralentissait l?ensemble et comparer à votre raid hétérogène ,un raid homogène constitué de 4 exemplaire de ce disque.
Vous comparer
A quoi sert de comparer la vitesse d'une voiture (ayant 4 pneus identiques ) avec une Renault mégane équipée de deux pneus Mich?., un UniRoy.., et un pneu crevés???? Pas besoin de test pour vous dire que celle qui a le pneu crevé ira moins vite.
Même pire je parie que si on équipe la voiture de 4 pneus crevés, elle ira encore moi vite qu?avec un seul.

Anonyme 26/06/2008 17:24
Masquer
-2+

Oui, pareil:
- faudrait comparer la grappe inhomogène avec une grappe homogène du disque le plus lent
- quand je monte un RAID-1 de 2 disques, je prends 2 marques différentes, ou j'achète des disques identiques à quelques mois d'écart. J'ai déjà eu sur un Dell le crash de 2 disques identiques à 15 jours d'intervalle après 10 mois d'utilisation.

Gus84 26/06/2008 17:52
Masquer
-3+

Citation :A quoi sert de comparer la vitesse d'une voiture (ayant 4 pneus identiques ) avec une Renault mégane équipée de deux pneus Mich?., un UniRoy.., et un pneu crevés???? Pas besoin de test pour vous dire que celle qui a le pneu crevé ira moins vite.
Même pire je parie que si on équipe la voiture de 4 pneus crevés, elle ira encore moi vite qu?avec un seul.


Bah, c'est sur que si le western digital il est crevé alors... [:kouilloman:4]

CBL 26/06/2008 22:06
Masquer
-1+

Pareil,
Quand on monte un RAID on a des disques identiques. Si l'un tombe en panne, on en achete un autre là soit on trouve le même que ceux tomber en panne pas de soucis, soit on en achete un autre. Puisque plus récent il isque d'être plus rapide. Dans ce cas est ce que le raid ira plus vite? ou moins vite?

Autre question: on a un raid5 avec 3 disque identique. L'un taombe en panne. Vau-il mieux se monter un raid1 avec les 2 disque survivant ou se refaire un raid5 avec un nouveau disque mais de marque/type différent (soit plus soit moins rapide).

CBL 26/06/2008 22:09
Masquer
-0+

Dans le m^ême ordre d'idée,

on a un raid5 de 3 disque avec 1 disque qui tombe en panne. Vaut-il mieux faire un raid1 avec les 2 survivant ou acheter un nouveau disque .

Si nouveau disque, que se passe-t-il s'il est plus rapide que les précédente? S'il est moins rapide? s'il a une plus grosse capacité?....

Anonyme 27/06/2008 01:38
Masquer
-0+

Sans la différence de performance entre les disques Samsung utilises dans la grappe homogène et le disque peu performant utilisé dans la grappe hétérogène, il est impossible de conclure. La perte de performance est-elle due a l'hétérogénéité, ou simplement a l'utilisation d'un disque peu performant ?

Anonyme 27/06/2008 09:31
Masquer
-0+

Je suis allé voir la composition de mon anti-moustique RAID, et nulle part dans la composition il n'est fait référence à quelque disque dur que ce soit. Y aurait-il tromperie sur la marchandise ?

the_k586 06/07/2008 06:10
Masquer
-1+

[:rofl]

Sinon, article intéressant, :)

bokan 08/07/2008 20:16
Masquer
-0+

Quand on monte une grappe de disque en raid 5 on a toujours envie d'utiliser des disques identiques. Mais comment fait-on quand il y en a un qui tombe en panne ? Il faut bien le remplacer et quelques années plus tard on va pas faire les brocantes pour trouver un DD !

Il faut savoir que dans une grappe c'est le disque le plus lent qui limite les performances (surtout pour les temps d'accès).

Anonyme 26/08/2008 22:29
Masquer
-0+

Juste un petit mot sur les performances du Raid1: le RAID1 est plus performant qu'un seul disque en lecture (parce que le controleur RAID bien fouttu ou le raid soft sous linux) cale la tete du second disque sur les prochaines données à lire, pendant la lecture d'un premier fragment sur le premier disque.
En ce qui concernet l'écriture: c'est moins bon qu'un disque, pour les petites écritures, le cache joue, mais sur des grosses écritures, le disque le plus lent du raid1 vient limiter les perfs globales.

Sinon contre les pertes de 2 disque à intervalles réguliers, il y a le raid6 qui a 2 disques de parité (c'est intéressant à partir de 8+2 (10 disques en tout 8 utiles + 2 de parité), pour avoir les memes pertes en disques de parité qu'un raid 5 en 2*(4+1) 2 arrays de 4 disque utiles + 1 de parité).

Voili pour mon expérience perso apres, niveau controleurs raid, il y a tout et n'importe quoi (dont les controleurs semi-matériels qui sont une belle arnaque).
Bref, faire attention, et regarder s'il ne vaut pas mieux faire du raid soft.

Anonyme 26/08/2008 22:47
Masquer
-0+

Une petite question: pour faire du raid0 heterogene, ca passe tout seul: on additionne les capacités des disques et c'est bon, alors que pour le raid5: on prend le disque le plus petit et on multiplie sa taille par le nombre de disques utiles du raid5 (soit 4-1=3), ici, il me semble que le disque le plus petit fait 320G (enfin on va prendre la valeur là pour illustrer) => 180Go non utilisés sur les maxtor de 500G.
Donc cote raid5, heterogene, on se retrouve avec 3*320 Go utiles et surtout du raid5 sur les 320 premiers Go des disques (en partant de l'extérieur) => on se retrouve avec un raid5 constitués de disques globalement plus performant car les gros disques abandonnent l'intérieur des plateaux.
Voila ce qui peut expliquer une bonne partie des différences de perfs sur raid5 heterogene.
Pour le raid0, si les petits disques sont plus performants que les gros, c'est normal qu'on tire plus de perfs sur la durée de l'écriture ou de la lecture qui se trouve sur ces disques, alors que les perfs sont identiques quant on est sur les memes modèles que l'homogene.

Du coup, si on veut des performances que l'on peut controler, il faut un raid homogene: le raid, ce n'est pas de l'archivage, c'est du stockage, meme si à la maison c'est kifkif comme concept

geilgestorm 12/01/2010 20:27
Masquer
-0+

Une petite mis à jour, les choses ayant bougées depuis ce temps, cela serait intéressant.

Ce sujet ne peut plus être commenté.
Liens commerciaux
Publicité

Les offres du moment

Tout sur les Disques durs
 Derniers articles sur les Disques durs
Tous les articles Disques durs
 Comparatif Disques durs
Tous les comparatifs
 Dernières actualités Disques durs
Toutes les actualités Disques durs

Newsletters


  • Besoin d'aide ? Publiez votre question
  • Publier