Dans un monde régi par le Big Data, les outils et technologies de visualisation des données sont essentiels pour analyser des quantités massives d'informations et prendre des décisions fondées sur les données.
La Data Viz, ou Data Vizualisation est la représentation de données en un format visuel, tel qu’un graphique ou un tableau. Les relations entre les données sont exprimées sous forme d’images grâce à des techniques qui les encodent sous forme de points, de lignes ou de barres. L'analyse des données ayant pour but d'obtenir des informations, les données ont beaucoup plus de valeur lorsqu'elles sont visualisées. Même si un analyste de données peut tirer des enseignements des données sans les visualiser, il sera plus difficile d'en communiquer le sens sans visualisation.
L’objectif de la Data Vizualisation est de mettre en valeur les informations en les rendant faciles d’accès et ainsi, permettre de repérer et comprendre rapidement des tendances, les modèles, les valeurs aberrantes et les schémas des données. Une visualisation efficace rend les données complexes plus accessibles, compréhensibles et utilisables. Elle doit permettre aux utilisateurs de réaliser des tâches analytiques particulières, telles que faire des comparaisons ou comprendre la causalité. Les tableaux sont généralement utilisés lorsque les utilisateurs recherchent une mesure spécifique, tandis que les graphiques de différents types sont utilisés pour montrer des modèles ou des relations dans les données pour une ou plusieurs variables.
La Data Viz est l'une des étapes, cruciale, de l'analyse des données ou de la science des données. Au cours du nouveau millénaire, la visualisation des données est devenue un domaine actif de recherche, d'enseignement et de développement.
Une bonne visualisation permet de “raconter une histoire”, en supprimant le bruit des données et en mettant en évidence les informations utiles.
Cependant, il ne suffit pas d'habiller un graphique pour qu'il soit plus lisible ou de taper sur la partie "info" d'un infographique. La visualisation efficace des données est un exercice d'équilibre délicat entre la forme et la fonction. Le graphique le plus simple peut être trop ennuyeux pour attirer l'attention ou faire ressortir un point important ; la visualisation la plus étonnante peut ne pas transmettre le bon message ou en dire long.
Dans son livre de 1983, The Visual Display of Quantitative Information, Edward Tufte définit les "affichages graphiques" et les principes d'un affichage graphique efficace dans le passage suivant : "L'excellence des graphiques statistiques consiste en des idées complexes communiquées avec clarté, précision et efficacité.” Les affichages graphiques devraient :
La non-application de ces principes peut entraîner des graphiques trompeurs, qui déforment le message ou soutiennent une conclusion erronée.
Il existe tout un choix de méthodes de visualisation pour présenter les données de manière efficace et intéressante, parmi lesquels :
La visualisation de données n'est pas seulement importante pour les scientifiques et les analystes de données, il est nécessaire de comprendre les données dans toute carrière, que ce soit la finance, le marketing, la technologie, le design, l'histoire, etc. La Data Viz est utilisée, par exemple, pour :