Mon Datacenter est-il vivant ? 1ère partie

biologicalSDDC

FIG1 : Une cellule stockant de l’information binaire. (source inconnue)

 

Dans cette série d’articles, je vais développer quelques uns des concepts qui m’apparaissent tellement résonner avec ce que j’appellerais le début de l’ère du SDDC.
Cela me donnera l’occasion de me présenter, et me donne l’opportunité d’introduire mon blog qui parlera bien évidement des datacenters, de la virtualisation, de l’EUC et de biologie.
Dans une vie antérieure, j’ai reçu une formation en biologie cellulaire et en chimie organique avec une spécialisation en génétique. Il me semble que nous sommes toujours constitué de ce que nous avons été et de ce que nous voulons devenir. Ainsi, même si je suis ingénieur système depuis plus de 15 ans, même si je travailles sur la virtualisation depuis 10 ans, je suis toujours intéressé par des sujets comme la biologie du vivant, l’homéostasie, d’alimentation humaine, de biologie du sport et tout un tas de sujets aussi excitants les uns que les autres.
En tant que spécialiste de la Virtualisation, je dois maintenant faire face au dilemme de notre job. La connaissance du stack entier de la virtualisation, n’est plus la fondation sur laquelle je peux m’assoir et construire mon datacenter. L’information dans notre petit milieu est passé du filet d’eau (bon un gros filet en ce qui concerne les KB / best practices) de l’ère pré-vSphere à la rivière vSphere pour finalement passer au dessus de la digue et tout envahir. C’est excellent ! Je dirais même j’adore ça. Ca me rappelle mes études où les professeurs (surtout en biologie cellulaire…) nous racontais que la science était une bête sauvage qu’il fallait savoir chevaucher pour voir où elle nous menait.  Et vous savez quoi ? plus je pense à cela, plus je trouve des analogies avec la biologie. C’est quoi un backbone sinon une colonne vertebrale, le feedback, le cycle de vie, la réplication, un heartbeat, le greenIT, un grand nombre de concepts en biologie font sens si on essaye de les appliquer à l’informatique… et c’est bien normal ! l’informatique devient de plus en plus intelligente et les progrès en ingénierie robotique et médicale préfigurent une forme de convergence des 2 mondes.
L’analogie entre le SDDC (centre de donnée défini par logiciel ? beurk restons sur SDDC) et un organisme multicellulaire est pour moi une évidence. Un SDDC c’est juste une manière de concevoir le Datacenter comme un ensemble complexe de hardware automatisés et pilotés par un logiciel. Son but ? faire « vivre » des applications dans les meilleures conditions possibles tout en étant économiquement viable. A mon sens cela reste proche de la définition d’un organisme : un organisme est viable dans le temps s’il est écologiquement viable : soit il a le temps de se reproduire soit il ne peut pas. L’écologie n’est pas un monde de bisounours vert, globalement l’écologie est la sience qui étudie les chaines alimentaires dans un écosystème donné… pas très éloigné de l’économie en somme.
Dans le prochain article, nous aborderons les différents composants d’un datacenter automatisé en continuant l’analogie avec la biologie :

  • l’énergie,
  • l’intelligence,
  • l’adn,

tout en rentrant plus dans les détails cette fois.

covert_cell_cover2

Fig2 : modèle informatique d’une cellule (http://blog.threestory.com/wordpress/tag/cell)

A très vite !
VirtTom

Publicités

MEET THE CHAD – EMC ROCKS

CHAD2

Mon premier article se présente sous la forme d’un interview. Invité par EMC pour rencontrer CHAD SAKAC, Senior VP EMC monde, ça ne se refuse pas ! cet article / interview s’interessera donc au stockage, et la vision si particulière de CHAD. Ceci n’est pas une retranscription de l’interview qui dura plus de 2h mais plutôt une synthèse via les 2 grosses questions qui lui ont été posées. Les propos de CHAD exprimés ici n’engagent donc que l’auteur de cet article. J’espère néanmoins rester fidèle à l’esprit de ses paroles :

Quelle sont les tendences 2013 pour EMC ?

pour CHAD, la stratégie EMC est clairement identifiée, elle est constante depuis 2012 et ne va pas changer pour l’instant : Cloud, Trust et BigData.

Ces 3 concepts se tiennent mutuellement, le BigDATA étant au centre du besoin client, TrustedIT et le cloud computing permettant de le mettre en place. CHAD nous remonte que ces sujets ont maturés depuis l’année dernière et ses clients sont passé de

« – You do What ??? » en 2012,

à

« -Oh BigData it’s cool ! » en 2013 !

Pour lui le gros challenge restera le TRUST (trustedIT) qui est le point central dont tout découlera. Il a même inventé un mot pour souligner son propos : 2012 a été une année transformationnelle pour le concept du TRUST. Il faut que les entreprises n’aient pas peur du cloud pour qu’il se propage à l’échelle mondiale. Le contexte international étant tendu, TRUST doit rassurer les clients. Ce concept lui a permis de nous raconter quelques anecdotes et en particulier celle-ci :

 Récemment, alors qu’il se trouvait en europe, il a souhaité offrir un voyage à toute sa famille (l’europe et notamment la france est un pays cher à son coeur !). Il a donc contacté AMEX Travel par téléphone qui l’a tout de suite renvoyé sur le service des contentieux qui lui a dit qu’il y avait des manipulations criminelles sur son compte. La personne de chez AMEX se confond d’excuses car sa carte doit être annulée et CHAD réplique,
« – mais non ! tu ne dois pas t’excuser de faire ton travail, merci ! MERCI !
la personne en face est heureuse
– Nous avons effectivement un système qui détecte ce genre de malversations et coupe automatiquement les carte non sécurisés… Merci d’être un client de AMEX,
chad répond :
« – merci d’être un client de EMC »

Chad insiste beaucoup sur ce fait qui pour lui ainsi que pour EMC est essentiel. EMC a d’ailleurs réalisé de gros investissement en NetWitness, analyse de log, jusqu’à la récente acquisition de Silver Tail. Un vaste sujet que je vais creuser.

Que pensez-vous du SDDC ?

Le software defined datacenter fait beaucoup de bruits, génère beaucoup de buz autour de lui cette année. Cependant de quoi parle-t-on ?

[NDLA] de ce que j’en comprends, il s’agit d’une suite de brique logiques permettant de piloter un Data Center complet. On pourrait ajouter que cela fait référence à 3 briques primaires : le stockage, le réseau et les serveurs. 

Chad s’est logiquement concentré sur la partie stockage, expliquant que la stratégie VMware est clairement de converger vers le SDDC, ou du moins le composant serveur (même si la convergence vers le Network est aussi bien amorcé avec le rachat de NICIRA ainsi que les avancées avec CISCO).

Alors que les nouvelles sur le rachat de VIRSTO, la rumeur gronde sur le net, aussi Chad a tout de suite voulu désamorcer la polémique : il n’y a pas de conflit entre VMware et EMC sur le stockage. La solution VIRSTO est bonne,cependant elle se concentre surtout sur le Data Path pour l’optimiser vis à vis de la virtualisation. EMC traite certes du Data Path, cependant ce n’est qu’un des composant, un autre composant majeur étant le Data Control.

Il a passé une grosse demi-heure à nous donner sa vision du stockage en définissant 3 classes de stockage par rapport au chemin emprunté par la donnée et aux mécanismes de contrôle sous-jacents : STORAGE coupling

La classe dite standard ou Tightly Coupled Architecture (comprenant notamment les VNX, NetAPP FAS, Nexenta par exemple).

Elle comprend un faible nombre de « cerveaux » liés entre-eux : les contrôleurs de baie mis en cluster. Typiquement il s’agit de 2 controleurs en cluster même si des variations cosmétiques peuvent survenir (actif actif / actif passif / les contrôleurs ne voient pas tout les volumes). De même, que ce soit du software rajouté sur du harware ou directement le hardware piloté en « boite noire ». Matériellement ils seront identiques.

Par exemple, si on veut déployer un NEXENTA en HA, il faudra utiliser une connectivité SAN / réseau identique à une architecture pure VNX, des disques dual port avec autorisation d’accès pour pour les storage processor…

La principale qualité de cette technologie est sa relative simplicité (le PATH d’une IO est le plus direct : 2000 ligne de code compilé pour rendre une IO persistante) qui permet de développer rapidement des fonctions / dataservices (HA par exemple) tout en limitant les coûts.

Son principal défaut étant qu’elle manque d’agilité une fois déployée. Le « scale out » va complexifier rapidement l’infrastructure et nécessiter beaucoup de travail pour le réaliser. Le CAPEX va alors être contrebalancer par l’OPEX et le maintient en condition opérationnel d’application critique relativement difficile à gérer.

Pour finir, Chad nous explique que la logique d’EMC est de considérer que le scale out doit être inclu directement dans le controleur lui même. Voila pourquoi EMC n’investit pas, contrairement à d’autres sociétés, sur le SCALE OUT de cette classe mais préfère développer d’autres architecture.

La classe dite faiblement couplée ou loosly coupled Architecture (VMAX, 3 PAR, HDS, Isilon, ExtremeIO par exemple).

Dans ces architectures, le lien est léger (pas ephémère mais faible). La donnée peut donc être servie indifféremment par un pool de « cerveaux ». Chad insiste à ce moment sur ce point qui pour lui est fondateur : la manière de concevoir le DATA PATH détermine le type de classe. En l’occurrence  la donnée, une IO va parcourir 10 fois voir 50 fois plus de lignes de code compilées dans une VMax que pour une VNX.

Le scale out est possible (64 est théoriquement atteignable mais difficile à réaliser pour l’instant) cependant le nombre d’IOPs pouvant être géré par noeuds (à taille d’IO constante) est limité par la capacité transactionnelle de l’architecture. De même la latence augmente proportionnellement aussi. Cette classe n’est par contre pas aussi figée que la classe standard (le degré de maturité n’est pas non plus le même dans la plupart des cas) et il y a des variations entre les produits. Plus le produit va tendre vers du Tighly Coupled, plus la latence va diminuer et le transactionnel va être efficace, au détriment du scale out.

La classe non couplée (Centerra, ATMOS, Swift). 

Ici, les noeuds sont totalement découplés. Il n’y a pas de dépendance persistante entre les noeuds. Le gros avantage est donc que l’on peut les gérer à une échelle énorme. Un autre avantage étant bien sur qu’il n’y a pas d’adhérence forte au matériel et tout type de matériel peut être utilisé. Bien évidemment, 2 points contrebalancent ces avantages :

  • La performance est directement dépendante du matériel utilisé : le fait de masquer les difficultés de présentation ne résoud pas magiquement la problématique de performance.
  • Le fait de ne pas avoir d’adherence forte implique une communication entre les différents noeuds et par ce fait une perte de performance, une augmentation de la latence.
Il y a clairement des efforts à réaliser dans ce domaine pour arriver à maturité.

Et finalement le SDDC :

Voilà donc au final le SDDC ? nous (EMC et Chad) pensons que le SDDC est un objectif fondamental de VMware. Toute la stratégie (NDLA : hormis le VDI ?) de VMware tend vers ce but. Donc la stratégie de EMC suit aussi ! cependant le SDDC en stockage, c’est uniquement du type 3, de la classe non couplée de stockage. Cependant est-ce que le modèle de présentation objet permet de répondre à tout ? Chad formule son point de vue, forcément pas suffisamment marketing pour être exprimé directement sous la forme d’une interogation, d’un Haiku :

Si tu penses que tous les types de workload différents, d’architectures différentes peuvent trouver leur réponse dans un stockage de type 3 tout en maintenant un coût pour le Go alors oui tu peux faire du SDDC. 

Il ajoute il y aura bien sur de la commoditisation du stockage cependant le SDDC en stockage, ce n’est pas pour tout de suite. Retrouvons nous dans 3 ans et nous ferons le pari il y aura toujours du type 1 et type 2. Il ajoute même dans 20 ans !

Conclusion : 

Cet article m’a pris un peu de temps pour être rédigé. Entre-temps, de nombreuses annonces tombent chaque jour sur le stockage ! comme le nouveau cloud VMAX dont on reparlera certainement très rapidement. Attendez-vous à quelques articles de ma part sur le stockage. Car c’est décidé, 2013 pour moi, c’est l’année du stockage ! et du capacity management mais ça c’est une autre histoire.

VirtTom