X

Retrouvez toute l'actualité autour des technologies émergentes et leur impact sur le marché et la société.

Qu’est-ce que la Data Viz ?

Dans un monde régi par le Big Data, les outils et technologies de visualisation des données sont essentiels pour analyser des quantités massives d'informations et prendre des décisions fondées sur les données.

data viz

Data Viz : définition

La Data Viz, ou Data Vizualisation est la représentation de données en un format visuel, tel qu’un graphique ou un tableau. Les relations entre les données sont exprimées sous forme d’images grâce à des techniques qui les encodent sous forme de points, de lignes ou de barres. L'analyse des données ayant pour but d'obtenir des informations, les données ont beaucoup plus de valeur lorsqu'elles sont visualisées. Même si un analyste de données peut tirer des enseignements des données sans les visualiser, il sera plus difficile d'en communiquer le sens sans visualisation.

L’objectif de la Data Vizualisation est de mettre en valeur les informations en les rendant faciles d’accès et ainsi, permettre de repérer et comprendre rapidement des tendances, les modèles, les valeurs aberrantes et les schémas des données. Une visualisation efficace rend les données complexes plus accessibles, compréhensibles et utilisables. Elle doit permettre aux utilisateurs de réaliser des tâches analytiques particulières, telles que faire des comparaisons ou comprendre la causalité. Les tableaux sont généralement utilisés lorsque les utilisateurs recherchent une mesure spécifique, tandis que les graphiques de différents types sont utilisés pour montrer des modèles ou des relations dans les données pour une ou plusieurs variables.

La Data Viz est l'une des étapes, cruciale, de l'analyse des données ou de la science des données. Au cours du nouveau millénaire, la visualisation des données est devenue un domaine actif de recherche, d'enseignement et de développement.

Comment représenter les données ?

Une bonne visualisation permet de “raconter une histoire”, en supprimant le bruit des données et en mettant en évidence les informations utiles.

Cependant, il ne suffit pas d'habiller un graphique pour qu'il soit plus lisible ou de taper sur la partie "info" d'un infographique. La visualisation efficace des données est un exercice d'équilibre délicat entre la forme et la fonction. Le graphique le plus simple peut être trop ennuyeux pour attirer l'attention ou faire ressortir un point important ; la visualisation la plus étonnante peut ne pas transmettre le bon message ou en dire long.

Dans son livre de 1983, The Visual Display of Quantitative Information, Edward Tufte définit les "affichages graphiques" et les principes d'un affichage graphique efficace dans le passage suivant : "L'excellence des graphiques statistiques consiste en des idées complexes communiquées avec clarté, précision et efficacité.” Les affichages graphiques devraient :

  • montrer les données;
  • inciter le spectateur à réfléchir au fond plutôt qu'à la méthodologie, à la conception graphique, à la technologie de production graphique ou à autre chose;
  • éviter de déformer le contenu des données;
  • présenter de nombreux chiffres dans un espace réduit;
  • rendre cohérents les grands ensembles de données;
  • encourager l'œil à comparer différentes données;
  • révéler les données à plusieurs niveaux de détail, depuis une vue d'ensemble jusqu'à la structure approfondie;
  • servir un objectif raisonnablement clair : description, exploration, tabulation ou décoration;
  • être étroitement intégré aux descriptions statistiques et verbales d'un ensemble de données.

La non-application de ces principes peut entraîner des graphiques trompeurs, qui déforment le message ou soutiennent une conclusion erronée.

Il existe tout un choix de méthodes de visualisation pour présenter les données de manière efficace et intéressante, parmi lesquels :

  • le graphique linéaire qui illustre les changements au fil du temps,
  • le graphique de zone
  • le diagramme à barre qui facilite la comparaison des données en fonction du temps
  • l’histogramme qui a tendance à mesurer la fréquence plutôt que les tendances dans le temps
  • le diagramme de dispersion pour trouver des corrélations
  • le diagramme à bulle
  • le diagramme circulaire pour illustrer les pourcentages
  • la jauge pour illustrer la distance entre les intervalles
  • la carte pour ajouter les éléments de localisation des données
  • la carte thermique
  • le diagramme-cadre pour montrer la structure des relations hiérarchiques.

Pourquoi représenter les données ? Cas d’utilisation de Data Viz

La visualisation de données n'est pas seulement importante pour les scientifiques et les analystes de données, il est nécessaire de comprendre les données dans toute carrière, que ce soit la finance, le marketing, la technologie, le design, l'histoire, etc. La Data Viz est utilisée, par exemple, pour :

  • l’évolution dans le temps : une étape souvent préalable à de nombreux analyses de données.
  • déterminer la fréquence, en lien avec l’évolution dans le temps des données
  • déterminer les corrélations : non seulement il est difficile de déterminer la relation entre deux variables sans visualisation mais cette représentation est précieuse dans la visualisation des données
  • examiner un réseau, lors d’une étude de marché par exemple afin d’identifier le public ciblé
  • planifier un calendrier ou un échéancier pour un projet complexe,
  • analyser la valeur et les risques afin de visualiser les opportunités qui ont de la valeur et celles risquées.

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.