De nombreux sites Internet ont souffert aujourd’hui de problèmes de stabilité ou d’accessibilité aujourd’hui en raison d’une panne qui a touché Level3 Communications, une société américaine spécialisée dans les télécommunications et informations et qui possède un important datacenter en France.
C’est plus exactement une panne du système de climatisation – une canalisation d’eau alimentant le circuit de refroidissement ayant lâché – qui est à l’origine de la panne. Sans refroidissement digne de ce nom, la température a rapidement atteint un niveau intolérable pour les serveurs : 55°C, soit plusieurs dizaines de degrés au dessus de la température préconisés pour un datacenter. Les techniciens ont bien tenté de mettre en place une solution temporaire à base de ventilateurs (sic), mais cela s’est sans surprise avéré insuffisant. Il a donc fallu attendre que la fuite soit réparée et que le système soit rempli et sous pression pour que la température revienne peu à peu à la normale, et avec elle la disponibilité de nombreux sites.
Une chose est sure : l’absence de redondance dans un système aussi critique est assez surprenante…
Ensuite, dans un datacenter, c'est 22 et pas 16 ! Pas la peine d'être dans un frigo... d'ailleurs en temps normal à L3, il fait 22.
Suivant la configuration de la salle et la conception de la diffusion des flux d'air frais, l'air est en général pulsé à une température ne générant pas de point de condensation (minimum 15°C), les flus d'air traversent les armoires contenant les serveurs, les refroidissent et sont rejetés dans la salle pour une température ambiante permettant un certain confort de travail pour les opérateurs; l'air ambient est extrait vers les unités de refroidissement pour nouveau cycle. En général, un apport partiel d'air neuf permet le renouvellement de l'air en fonction du nombre d'opérateurs pouvant se trouver simultanément dans la salle.
Normalement, l'ensemble des circuits de production d'énergie et de refroidissement de l'air doivent être redondés de manière à éviter un "point of failure", mais... cela a un certain prix.
Pour un datacenter aussi stratégique que celui de L3, l'absence de redondance complète des circuits d'eau froide est condamnable.
Sans connaître l'installation existante et le risque zéro n'existant pas en matière de piping, une double alimentation en boucle des équipements de diffusion de froid avec vannes d'arrêt entre chaque équipement, eut été un minimum de précaution à prendre.
MDV-D2C