HYPERCONVERGENCE : La révolution du SDDC

Afin de fêter la nouvelle année, je relance mon blog avec une série d’articles sur l’hyperconvergence. Ce premier article, en forme d’introduction, me permettra de centraliser les différents sujets qui tourneront autour de la convergence de l’hyperviseur.
Avant d’aborder de manière poussée les différents concepts / produits qui sous-tendent ce sujet, il m’apparait nécessaire de bien définir ce que j’entends par hyperconvergence

  • Qu’est-ce que l’hyper convergence ?

L’hyperconvergence, n’est pas une hyper-convergence, une GIGA CONVERGENCE qu’il faudrait voir comme un élément ultime. C’est vraiment dans le sens  convergence dans l’hyperviseur qu’il faut le comprendre. L’apparition de l’hyperviseur et son explosion au milieu des années 2000 a imposé de plus en plus de stress au matériel. En effet les concepts qui sous-tendaient l’architecture IT était alors plutôt dédié à du client-server x86 voir à des gros systèmes. Le stockage en particulier par son aspect centralisé et monolithique a longtemps empêché de prévoir un scaleout simple.

Un boitier hyperconvergé, HCI en anglais, est donc un boitier concentrant le compute, le stockage et les liens réseau permettant de se relier au réseau global entreprise. Le noeud d’hyperviseur, voir plusieurs noeuds dans un boitier 2U devient l’élément atomique, la commodities, la cellule dans mon modèle de datacenter organique.

  • Prenons un exemple :
Il est normal qu’un service de développement logiciel ait besoin pour un projet donnée de mettre en place une infrastructure rapidement afin de commencer à développer ASAP pour répondre à la demande client . Attendre 8 mois pour obtenir une VM car le budget de l’IT a été consommé et qu’il faut racheter une baie de stockage n’est pas envisageable. Que reste-il comme option ? rajouter une VM ? rajouter xVM ? admettons que le projet prenne de l’importance,  il faut déployer un environnement de production, de préproduction, de formation, une vitrine.  et c’est la lente agonie de l’infrastructure que l’équipe de développement va subir. Cela vient-il de la conception ? de l’infrastructure répartie ? où est le bottleneck ? c’est extrêmement interessant pour l’expert technique de rechercher la cause dans le sens où il va devoir investiguer toute la chaine aller dans le coeur du système, du stockage… mais pour le client final ? et pour le business ? dans tous les cas après l’analyse comment corriger ? qui paye la nouvelle infrastructure ?

  • L’hyperconvergence ça vient d’où ? 
 Les premières tentatives de convergences ont eut pour initateurs CISCO au milieu de sannées 2000. Grâce à des partenariats / joint-ventures avec les 2 leaders du stockage que sont NETAPP et EMC². avec respectivement le FlexPOD et le vBlock, les premières architectures convergentes sont nées. Les idées derrières ces architectures convergées sont louables :

  • fournir un matériel testé et dimensionné pour le workload demandé,
  • lier le compute, le stockage et le network dans un stack (en général une baie complète),
  • proposer un support unique. Au moins au niveau du point d’entrée,
  • proposer une architecture éprouvée et validée par un éditeur.
Suite à cela, l’approche dite en bundle a fait beaucoup de bruit fin des années 2000
Seulement cela ne répond pas au besoin. Cela permettait de prévoir plus simplement une charge mais cela ne permettait pas de prendre en compte  l’évolution de cette charge. Le coût d’un tel package avec une brique de base de l’ordre de la baie complète est tout sauf anodin ! sans parler de la complexité qui n’était pas si simplement gérée que cela.

  • Pourquoi l’hyperconvergence ?
Comme on l’a vu, la virtualisation et l’accélération du delivery qu’elle a imposée aux équipes IT est un élément de réponse. Cependant cela n’explique pas tout selon  moi. Une explication qui me semble très pertinente selon moi vient de S.Poitras (ou du moins c’est sur son blog que j’en a pris conscience pour la première fois).
La latence.

nutanixBible_IO_latency
Figure 1 : les différentes latences temps de traitement induits par des IO. (Nutanixbible.com)

Quand on regarde ce comparatif sur les différents temps moyens pris par les contrôleurs / HDD / SSD pour réaliser une action type que voit-on ?
Jusqu’à l’avènement de la consommation de masse du disque SSD, la latence disque était due pour une bonne part aux disques eux mêmes. Lorsque l’on réalisait le design d’une architecture, il fallait soigner particulièrement le nombre d’axes, les types de raid, le cache des contrôleurs, les QueueDepth des différents composants… bref le stockage était un bottleneck critique, dont le point central était le disque. D’autant plus qu’il représentait un gros investissement et un scaleout proche de zéro.
Le SSD a finalement mis la pression sur les contrôleurs des baies ainsi les contrôleurs réseaux/fabric FC qui deviennent les points de contention, le débit et la latence ayant été grandement augmentée.
L’hyperconvergence est donc apparue pour répondre à un besoin de simplification, de scaleout ET de performance (le stockage au plus proche du compute).

  • Au final quels sont les bénéfice de l’hyperconvergence pour une IT ?
Si l’on reprend les différents points évoqués, c’est une véritable simplification de l’architecture doublée d’un scaleout prévisible et avec des paliers faible.

Pour reprendre l’exemple précédent : Si le manager de l’IT peut prédire avec l’équipe projet métier les besoins en terme d’infrastructure pour son projet et d’évaluer rapidement ce que cela va impliquer. S’il peut même commander le matériel en avance de phase (1, 2, 10 blocs), l’installer en quelques jours / semaines. Et au final si le projet peut monter en puissance sans impacter l’infrastructure et que l’infrastructure peut évoluer sans impacter les machines. N’est-ce pas le rêve pour le métier, le client et l’IT ?

En conclusion :

Dans ce billet j’ai pû introduire le sujet de l’hyperconvergence en douceur. Par la suite on va descendre petit à petit et plonger au coeur de la technique. Il ne me semble pas approprié de confronter les technologies sur leur performances pures. D’abord, les services marketing de ces sociétés font cela bien mieux que moi. Ensuite, il me semble plus pertinent regarder les différentes approches techniques, leur roadmap, la vision que j’en ai et leur intégration aux IT que je côtoie au quotidien depuis maintenant plus de 15 ans. Cette série d’article sera donc focalisée sur ces points :

  • les potentialités,
  • ce qu’il y a en dessous,
  • Comment cela s’intègre aux autres éléments de l’ecosystème
  • Comment cela s’intègre à une IT

 

Stay Tuned !

 

@virttom

MEET THE CHAD – EMC ROCKS

CHAD2

Mon premier article se présente sous la forme d’un interview. Invité par EMC pour rencontrer CHAD SAKAC, Senior VP EMC monde, ça ne se refuse pas ! cet article / interview s’interessera donc au stockage, et la vision si particulière de CHAD. Ceci n’est pas une retranscription de l’interview qui dura plus de 2h mais plutôt une synthèse via les 2 grosses questions qui lui ont été posées. Les propos de CHAD exprimés ici n’engagent donc que l’auteur de cet article. J’espère néanmoins rester fidèle à l’esprit de ses paroles :

Quelle sont les tendences 2013 pour EMC ?

pour CHAD, la stratégie EMC est clairement identifiée, elle est constante depuis 2012 et ne va pas changer pour l’instant : Cloud, Trust et BigData.

Ces 3 concepts se tiennent mutuellement, le BigDATA étant au centre du besoin client, TrustedIT et le cloud computing permettant de le mettre en place. CHAD nous remonte que ces sujets ont maturés depuis l’année dernière et ses clients sont passé de

« – You do What ??? » en 2012,

à

« -Oh BigData it’s cool ! » en 2013 !

Pour lui le gros challenge restera le TRUST (trustedIT) qui est le point central dont tout découlera. Il a même inventé un mot pour souligner son propos : 2012 a été une année transformationnelle pour le concept du TRUST. Il faut que les entreprises n’aient pas peur du cloud pour qu’il se propage à l’échelle mondiale. Le contexte international étant tendu, TRUST doit rassurer les clients. Ce concept lui a permis de nous raconter quelques anecdotes et en particulier celle-ci :

 Récemment, alors qu’il se trouvait en europe, il a souhaité offrir un voyage à toute sa famille (l’europe et notamment la france est un pays cher à son coeur !). Il a donc contacté AMEX Travel par téléphone qui l’a tout de suite renvoyé sur le service des contentieux qui lui a dit qu’il y avait des manipulations criminelles sur son compte. La personne de chez AMEX se confond d’excuses car sa carte doit être annulée et CHAD réplique,
« – mais non ! tu ne dois pas t’excuser de faire ton travail, merci ! MERCI !
la personne en face est heureuse
– Nous avons effectivement un système qui détecte ce genre de malversations et coupe automatiquement les carte non sécurisés… Merci d’être un client de AMEX,
chad répond :
« – merci d’être un client de EMC »

Chad insiste beaucoup sur ce fait qui pour lui ainsi que pour EMC est essentiel. EMC a d’ailleurs réalisé de gros investissement en NetWitness, analyse de log, jusqu’à la récente acquisition de Silver Tail. Un vaste sujet que je vais creuser.

Que pensez-vous du SDDC ?

Le software defined datacenter fait beaucoup de bruits, génère beaucoup de buz autour de lui cette année. Cependant de quoi parle-t-on ?

[NDLA] de ce que j’en comprends, il s’agit d’une suite de brique logiques permettant de piloter un Data Center complet. On pourrait ajouter que cela fait référence à 3 briques primaires : le stockage, le réseau et les serveurs. 

Chad s’est logiquement concentré sur la partie stockage, expliquant que la stratégie VMware est clairement de converger vers le SDDC, ou du moins le composant serveur (même si la convergence vers le Network est aussi bien amorcé avec le rachat de NICIRA ainsi que les avancées avec CISCO).

Alors que les nouvelles sur le rachat de VIRSTO, la rumeur gronde sur le net, aussi Chad a tout de suite voulu désamorcer la polémique : il n’y a pas de conflit entre VMware et EMC sur le stockage. La solution VIRSTO est bonne,cependant elle se concentre surtout sur le Data Path pour l’optimiser vis à vis de la virtualisation. EMC traite certes du Data Path, cependant ce n’est qu’un des composant, un autre composant majeur étant le Data Control.

Il a passé une grosse demi-heure à nous donner sa vision du stockage en définissant 3 classes de stockage par rapport au chemin emprunté par la donnée et aux mécanismes de contrôle sous-jacents : STORAGE coupling

La classe dite standard ou Tightly Coupled Architecture (comprenant notamment les VNX, NetAPP FAS, Nexenta par exemple).

Elle comprend un faible nombre de « cerveaux » liés entre-eux : les contrôleurs de baie mis en cluster. Typiquement il s’agit de 2 controleurs en cluster même si des variations cosmétiques peuvent survenir (actif actif / actif passif / les contrôleurs ne voient pas tout les volumes). De même, que ce soit du software rajouté sur du harware ou directement le hardware piloté en « boite noire ». Matériellement ils seront identiques.

Par exemple, si on veut déployer un NEXENTA en HA, il faudra utiliser une connectivité SAN / réseau identique à une architecture pure VNX, des disques dual port avec autorisation d’accès pour pour les storage processor…

La principale qualité de cette technologie est sa relative simplicité (le PATH d’une IO est le plus direct : 2000 ligne de code compilé pour rendre une IO persistante) qui permet de développer rapidement des fonctions / dataservices (HA par exemple) tout en limitant les coûts.

Son principal défaut étant qu’elle manque d’agilité une fois déployée. Le « scale out » va complexifier rapidement l’infrastructure et nécessiter beaucoup de travail pour le réaliser. Le CAPEX va alors être contrebalancer par l’OPEX et le maintient en condition opérationnel d’application critique relativement difficile à gérer.

Pour finir, Chad nous explique que la logique d’EMC est de considérer que le scale out doit être inclu directement dans le controleur lui même. Voila pourquoi EMC n’investit pas, contrairement à d’autres sociétés, sur le SCALE OUT de cette classe mais préfère développer d’autres architecture.

La classe dite faiblement couplée ou loosly coupled Architecture (VMAX, 3 PAR, HDS, Isilon, ExtremeIO par exemple).

Dans ces architectures, le lien est léger (pas ephémère mais faible). La donnée peut donc être servie indifféremment par un pool de « cerveaux ». Chad insiste à ce moment sur ce point qui pour lui est fondateur : la manière de concevoir le DATA PATH détermine le type de classe. En l’occurrence  la donnée, une IO va parcourir 10 fois voir 50 fois plus de lignes de code compilées dans une VMax que pour une VNX.

Le scale out est possible (64 est théoriquement atteignable mais difficile à réaliser pour l’instant) cependant le nombre d’IOPs pouvant être géré par noeuds (à taille d’IO constante) est limité par la capacité transactionnelle de l’architecture. De même la latence augmente proportionnellement aussi. Cette classe n’est par contre pas aussi figée que la classe standard (le degré de maturité n’est pas non plus le même dans la plupart des cas) et il y a des variations entre les produits. Plus le produit va tendre vers du Tighly Coupled, plus la latence va diminuer et le transactionnel va être efficace, au détriment du scale out.

La classe non couplée (Centerra, ATMOS, Swift). 

Ici, les noeuds sont totalement découplés. Il n’y a pas de dépendance persistante entre les noeuds. Le gros avantage est donc que l’on peut les gérer à une échelle énorme. Un autre avantage étant bien sur qu’il n’y a pas d’adhérence forte au matériel et tout type de matériel peut être utilisé. Bien évidemment, 2 points contrebalancent ces avantages :

  • La performance est directement dépendante du matériel utilisé : le fait de masquer les difficultés de présentation ne résoud pas magiquement la problématique de performance.
  • Le fait de ne pas avoir d’adherence forte implique une communication entre les différents noeuds et par ce fait une perte de performance, une augmentation de la latence.
Il y a clairement des efforts à réaliser dans ce domaine pour arriver à maturité.

Et finalement le SDDC :

Voilà donc au final le SDDC ? nous (EMC et Chad) pensons que le SDDC est un objectif fondamental de VMware. Toute la stratégie (NDLA : hormis le VDI ?) de VMware tend vers ce but. Donc la stratégie de EMC suit aussi ! cependant le SDDC en stockage, c’est uniquement du type 3, de la classe non couplée de stockage. Cependant est-ce que le modèle de présentation objet permet de répondre à tout ? Chad formule son point de vue, forcément pas suffisamment marketing pour être exprimé directement sous la forme d’une interogation, d’un Haiku :

Si tu penses que tous les types de workload différents, d’architectures différentes peuvent trouver leur réponse dans un stockage de type 3 tout en maintenant un coût pour le Go alors oui tu peux faire du SDDC. 

Il ajoute il y aura bien sur de la commoditisation du stockage cependant le SDDC en stockage, ce n’est pas pour tout de suite. Retrouvons nous dans 3 ans et nous ferons le pari il y aura toujours du type 1 et type 2. Il ajoute même dans 20 ans !

Conclusion : 

Cet article m’a pris un peu de temps pour être rédigé. Entre-temps, de nombreuses annonces tombent chaque jour sur le stockage ! comme le nouveau cloud VMAX dont on reparlera certainement très rapidement. Attendez-vous à quelques articles de ma part sur le stockage. Car c’est décidé, 2013 pour moi, c’est l’année du stockage ! et du capacity management mais ça c’est une autre histoire.

VirtTom