X

Retrouvez toute l'actualité autour des technologies émergentes et leur impact sur le marché et la société.

Le DBA est mort, vive le DBA !

Veronique Prevost
Head of Corporate Communications, Oracle France


Point de vue de Christian Bilien,  Head of Global Data Infrastructure, Société Générale

 

" Le DBA est mort" n'est pas une prophétie. Mais la perception de l'obsolescence du métier de DBA est une réalité.

Le DBA est une figure familière, qu'il soit un Chubaka sympathique et incompréhensible ou un Luke Skywalker, super héro de la résolution d'incidents.

Il faut constater une érosion de la perception de sa valeur, voire la négation par certains de l'utilité même de son existence. Quand cela a t-il commencé ? Dans mon environnement, 2014 a été marquée par une avalanche de concepts en provenance des GAFA (Google/Amazon/Facebook/ Apple).

Il a fallu placer les RDBMS face aux technologies Big Data, et les positionner dans l'Agile, le Devops, le Lean, le NoSql, L'IT As A Service, le Cloud, l'IT bi-modale, l'Open Source (assimilé au "gratuit") et j'en oublie certainement.

Essayons de classer les sujets:

1. DevOps, Agile, Lean, Cloud, IT Bi-modale

J’ai entendu à plusieurs reprises que "Le DBA n'est d'aucune utilité dans le DevOps". Dans un monde cloudifié, on pourrait d'ailleurs dire de même des ingénieurs réseaux, systèmes, stockage et middleware. Qu'en est-il ?

Commençons par le cloud pour bases de données, une forme de PaaS ("Platform As A Service") nommée "Data Base As A Service" (DBaaS). En pratique, le DBaaS est essentiellement 1) un self service sous forme d'API et de portail et 2) une exposition par les mêmes moyens du monitoring et des métriques. On peut soi même développer un DBaaS, mais il existe également des produits commerciaux comme l’Oracle Cloud Management pack. Ces APIs ont vocation a être intégrées dans les chaînes DevOps.

Dans ce monde automatisé, le rôle du DBA est 1) d’assurer les services « régaliens » de sécurité, de performance, de design d’architectures, de résilience, de monitoring, etc. et 2) de créer et de maintenir la chaîne automatisée. La finalité du métier reste la même, seules les modalités changent.

2. Big Data, NoSql

Quelques réflexions de quelques VIP du data management :

Nick Heudecker, Data & Analytics, Gartner Group: « dans le monde NoSql, les DBA sont absents des conversations». L’auteur de ces lignes le déplore et relève d’ailleurs que cela posera rapidement des problèmes de gestion des données dans les entreprises.

Guy Harrison (1), établit la filiation entre les plateformes relationnelles et leurs compléments NoSql et Hadoop.

Merv Adrian, lui aussi du Gartner Group :

  • Les 3 distributions Hadoop sont dans le  « Magic Quadrant » Datawarehouse.
  • Hadoop étend le champ traditionnel des Datawarehouses à l’analytique, le machine learning, la data science, etc.

Michael Stonebraker (2), qui a reçu la « Turing Award » (l’équivalent de la médaille Fields, ou d’un prix Nobel de l’informatique) en 2014

  • Les mondes Hadoop et Datawarehouse traditionnels vont fusionner
  • Les mondes NoSql et RDBMS feront de même
  • SQL va supplanter tous les autres langages historiques du monde Big Data

Deux bloggers Oracle très influents, sur le thème de la pénétration d’Hadoop : Tanel Poder (« le monde hybride est là ») et Kerry Osborne (« all the cool kids are in it »)

Un monde d'opportunités, basées sur des technologies nouvelles s’ouvre donc pour les DBAs. Ce tableau ne serait pas complet si on ignorait les possibilités qu'offrent les nouveaux métiers d'analyses de données.  On dit que le job le plus cool du 21ème siècle est celui de Data Scientist: la demande est croissante, les salaires sont élevés. Le DBA est bien armé pour explorer ces nouveaux territoires. Il s’agit de revoir ses cours de statistiques (les réseaux neuronaux reviennent au gout du jour après une période d’oubli), de les mettre à jour (sur le « machine learning » principalement), et d’y ajouter des langages comme R ou Python. Stephen O’Grady théorise d’ailleurs dans « The New Kingmakers » la baisse de la valeur du logiciel (« le logiciel n’est pas un différentiateur ») pour mettre en avant l’augmentation de la valeur des données.

3. Open Source

Open source et réduction de coûts vont de pair dans les esprits. On entend que « l'open source est gratuit ». Ajoutez-y une pincée de Cloud et « la gestion des données ne coûte  plus rien » ! L'Open Source (OSS) est le modèle commercial aujourd'hui prévalant chez les vendeurs des nouvelles technologies de bases de données.  A l’exception d’Hortonworks, les éditeurs proposent généralement une version OSS bridée et une version commerciale.  7 milliards de dollars ont été investis en 2015 dans les sociétés adossées à l’OSS. Les 5 sociétés qui ont le plus bénéficié de cette manne sont les leaders du NoSql et d’Hadoop :

Il faudrait être bien naïf pour croire que le milliard de dollars investi dans Cloudera est un don à une cause charitable. Le modèle commercial de ces sociétés est différent de celui de la vente de licences, mais il n'en est pas forcément moins onéreux (en tenant compte d’un existant de gros volume, et à niveau de support similaire, l’OSS pour les BDD a d’ailleurs en général un TCO plus important à l’instance). Quand à l'idée de se passer d'un gestionnaire de données, essayez donc d'opérer du Hadoop même « as a service » sans spécialiste.  Un DBA, ou un spécialiste qui fait un travail de DBA devra vite faire face à la complexité des outils de sécurité, de la gestion des performances et de la résilience.

En conclusion, le DBA devra à mon avis évoluer ou lentement glisser dans l'obsolescence. Quatre éléments doivent à mon sens guider cette évolution :

  • Automatiser : dans un monde cloudifié, les taches manuelles de 1er niveau, même offshorées,  n’ont pas de valeur.
  • Changer d’échelle, passer du To au Po. Les besoins en gestion de données issues de l’IOT,  des logs et des données électroniques sont immenses.
  • Adoption des nouvelles technologies : Les nouvelles technologies de bases de données sont en phase de maturation. Il faut accepter d'utiliser des outils rudimentaires pour les administrer.
  • S’adapter aux nouvelles façons de travailler : les pratiques de DevOps, du  « as a service », des modes agiles et l'écosystème Cloud prennent toujours plus d'ampleur.  Le DBA doit s'adapter à ces méthodes.

Les slides correspondants à ce post sont sur http://www.slideshare.net/cbilien/the-dba-is-dead-again-long-live-the-dba

(1) Guy Harrison est l’auteur de « Next Generation Data Bases » chez Apress

(2) Michael Stonebraker est l’un des auteurs d’Ingres, de PostGreSQL, de Vertica et d’autres BDD. Il a été CTO d’Informix et est aujourd’hui professeur au MIT.
 

Ressources :

Comment les machines impactent l’équilibre du business piloté par la donnée

Les cinq domaines clés où l’IA et l’automatisation pourraient avoir le plus grand impact sur les entreprises

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.