X

Retrouvez toute l'actualité autour des technologies émergentes et leur impact sur le marché et la société.

Qu’est-ce que la DataOps ?

Le terme DataOps et les concepts connexes n'en sont qu'au stade initial de la prise de conscience et de l'adoption, de sorte qu'il existe aujourd'hui de nombreuses définitions pratiques. Les leaders de la recherche, comme le Gartner et le MIT, ont axé leurs définitions sur l'amélioration de la communication entre toutes les équipes gérant les données d’une entreprise et la mise en œuvre de l'automatisation.

DataOps : définition

Le concept de DataOps, ou Opérations de Données, fait référence à l’orchestration des personnes, des processus et des technologies exploitées pour fournir rapidement des données fiables et de haute qualité. Cette pratique s’applique à l'ensemble du cycle de vie des données, de la préparation des données à l'établissement des rapports. Elle se concentre donc sur une collaboration rapide et facile entre les équipes d’analyse des données et des opérations IT dont les tâches sont interconnectées.

C’est pourquoi la DataOps intègre la méthodologie Agile pour raccourcir la durée du cycle de développement analytique en fonction des objectifs commerciaux. Elle emprunte cette méthode au DevOps qui fusionne le développement de logiciels et des opérations informatiques pour améliorer la vitesse, la qualité, la prévisibilité et l'échelle de l'ingénierie et du déploiement de logiciels.

La DataOps met ainsi l'accent sur la communication, la collaboration, l'intégration, l'automatisation, la mesure et la coopération entre les scientifiques, les analystes, les ingénieurs en données/ETL (extraction, transformation, chargement), l’IT et l'assurance qualité/gouvernance. Il vise à aider les organisations à produire rapidement des informations, à transformer ces informations en outils opérationnels et à améliorer continuellement les opérations et les performances analytiques.

Une meilleure gestion des données conduit à des données de meilleure qualité - et davantage disponibles. Des données plus nombreuses et de meilleure qualité permettent une meilleure analyse, ce qui se traduit par de meilleures connaissances, des stratégies commerciales et une meilleure rentabilité.

Comment appliquer la DataOps ?

Toph Whitmore, de Blue Hill Research, propose les principes de leadership suivants en matière de DataOps pour le département de l’IT :

  • Établir des mesures de progrès et de performance à chaque étape du flux de données
  • Définir des règles pour que tout le monde "parle le même langage" et s'accorde sur ce que sont et ne sont pas les données (et métadonnées).
  • Inclure des boucles de rétroaction axées sur l'amélioration continue, de manière à ce que les consommateurs puissent faire confiance aux données, sachant que cela ne peut se faire qu'avec une validation progressive.
  • Automatiser le plus grand nombre possible d'étapes du flux de données, y compris la BI, la datascience et l'analyse.
  • À l'aide d'informations sur les performances, identifier les goulets d'étranglement et les optimiser.
  • Établir une discipline de gouvernance des données.
  • Concevoir un processus de croissance et d'extensibilité. Le modèle de flux de données doit être conçu pour s'adapter au volume et à la variété des données.

Il n'existe pas d'approche unique pour mettre en oeuvre une DataOps au sein d’une entreprise. Cependant, il existe quelques domaines clés à instaurer, comme :

  • Démocratiser les données : L'accès aux données est essentiel pour innover, notamment pour les applications de Machine Learning et de Deep Learning qui nécessitent constamment de nouvelles données pour apprendre et s'améliorer.
  • Exploiter les plates-formes et les outils open source que les équipes connaissent déjà
  • Automatiser les étapes qui nécessitent des efforts manuels routiniers pour gagner en productivité.
  • Gouverner avec prudence
  • Cassez les silos de données pour que les outils et les plateformes adoptés soient accessibles à toutes les équipes de manière à exploiter les données plus efficacement, que ce soit pour les analyser, les visualiser ou les partager.

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.