1La Dataviz ou « visualisation d’information » est devenue très populaire sur Internet ; de nombreuses infographies sont présentées en ligne mais aussi en posters, impressionnants par leurs couleurs et leur esthétique. Plusieurs années de recherche sont à l’origine de cette tendance et continuent à la faire progresser. Bien que la visualisation soit très liée au design graphique, elle repose sur des bases liées à la perception visuelle et à la cognition humaine. Ces bases laissent un espace de créativité aux graphistes mais leur imposent des contraintes fortes, insuffisamment enseignées dans les formations d’arts graphiques.

2La recherche en visualisation d’information étudie l’utilisation de l’informatique graphique et interactive pour faciliter la compréhension de données abstraites. Cette compréhension mène généralement à des prises de décision, parfois importantes, pour lesquelles une erreur d’interprétation peut avoir des conséquences graves. L’interprétation des visualisations doit donc être fiable et, si possible, rapide.

Perception visuelle et cognition

3Pour comprendre la visualisation, il faut s’intéresser au fonctionnement de la perception visuelle et de la cognition. Ce sont des questions étudiées par la psychologie cognitive tandis que la visualisation est traditionnellement un domaine de recherche de l’informatique, des statistiques et de la cartographie.

4Représenter graphiquement des données quantitatives se fait depuis des centaines d’années, mais c’est le cartographe Jacques Bertin qui, au début des années 70, a posé les bases de la construction graphique de la visualisation : toute visualisation est composée de marques disposées sur un plan dont l’apparence visuelle est régie par des variables visuelles. Les marques peuvent prendre trois formes : les points, les lignes et les surfaces. Pour Bertin, six variables visuelles sont utiles : la taille, l’intensité, la densité de texture, la couleur, l’orientation et la forme. Mais s’il donne des règles d’utilisation du système qu’il appelle « la graphique » [1][1]Jacques BERTIN. Sémiologie graphique. Les diagrammes - Les…, il n’explique pas pourquoi et comment son système fonctionne du point de vue de la perception.

L’apport des psychologues

5L’informatique a automatisé la transformation de données en visualisations en suivant les règles de Bertin et d’autres références en statistiques et design graphique. En 1985, une psychologue américaine, Anne Triesman, a mis en évidence la raison d’une visualisation efficace. Elle a découvert que des caractéristiques visuelles particulières pouvaient être perçues par un œil humain très rapidement (< 200 ms), inconsciemment et sans effort : ces caractéristiques sont dites pré-attentives. Ainsi, en regardant des points dessinés sur une feuille de papier ou un écran, il est très facile, lorsque la plupart des points sont bleus, de voir un ou deux points rouges. Que l’on regarde 10, 100 ou 10 000 points bleus, la présence d’un point rouge « saute aux yeux ».

6Triesman a montré que la couleur était pré-attentive pour certaines questions (ou tâches dans le langage des psychologues). Le rayon de courbure étant aussi pré-attentif, on peut aisément détecter un point carré parmi des points ronds, à condition qu’ils soient assez gros. Le fait qu’une représentation graphique réponde à des questions de manière pré-attentive (en moins de 200 ms, sans effort et attention particulière) est un atout remarquable car il devient possible de raisonner sur une grande quantité de données très rapidement et pratiquement indépendamment du nombre de ces données. Inversement, si une représentation n’est pas pré-attentive, le temps d’acquisition mentale de ces données devient proportionnel à leur nombre. C’est le cas pour une liste de noms de ville ou de personnes sans ordre particulier. Pour savoir s’il y a un Dupont dans une liste, il faut lire tous les noms alors qu’y voir un point rouge est immédiat [2][2]Voir la page web de Christopher HEALEY,….

7Une bonne visualisation utilise des caractéristiques graphiques pré-attentives. Mais le problème n’est pas réglé pour autant. Les caractéristiques pré-attentives ont des limites et il faut parfois montrer des données de manière non pré-attentives. S’il est facile de discerner les couleurs bleu et rouge, on ne peut pas chercher des couleurs de manière pré-attentive au-delà de 7 couleurs. Que faire alors lorsqu’il faut distinguer plus de 7 catégories ? Toutes les caractéristiques pré-attentives ont des limites et, de plus, elles interfèrent entre elles ; on ne peut pas en utiliser plus d’une à la fois (sauf exception). En outre, lorsqu’on affiche des points représentant des personnes ou des villes, il est d’usage d’afficher le nom près du point, mais la lecture du nom n’est pas pré-attentive et n’aidera pas la recherche visuelle.

Le rôle de la recherche

8La recherche en visualisation a pour objectif d’automatiser le choix des types de visualisation ou l’optimisation de l’utilisation des caractéristiques pré-attentives pour permettre à des humains d’explorer des données quantitatives parfois volumineuses. L’interaction est nécessaire pour faciliter l’exploration de données, car une seule représentation visuelle ne révélera pas toujours toutes les facettes d’un jeu de données de manière pré-attentive. Enfin, les changements de visualisation pour explorer plusieurs facettes des données doivent être animés et continus pour que les humains puissent comprendre la transition et suivre les données qui les intéressent. Les questions liées à la perception des transitions animées, par exemple, restent difficile pour les psychologues. Ils ont étudié les animations de la vie ordinaire mais pas celles qui permettent de lier deux visualisations. Le débat est ouvert sur les capacités humaines à percevoir et celles des informaticiens à créer des transitions animées facilitant la perception, des questions un peu hors du champ traditionnel des psychologues.

9Avec l’arrivée des données massives, la recherche s’intéresse à la visualisation de grandes quantités de données. Les problèmes sont liés à la fois à l’infrastructure informatique nécessaire pour stocker et traiter ces données (le Big data) et aux méthodes de réduction de la complexité des données pour les rendre assimilables visuellement, car nos yeux ont une résolution dont la limite est bien inférieure à la taille des données visualisables. Le fait de rendre visible les données ne suffit pas à les rendre compréhensibles, et des travaux s’imposent encore pour comprendre les meilleures façons de présenter des données afin que notre cerveau puisse en tirer la « substantifique moelle ».

Littératie en visualisation de données

La visualisation se déploie aujourd’hui massivement comme un nouveau médium de communication. Dans certains articles de presse en ligne (dont ceux du New York Times), elle se substitue même au texte. Pourtant, malgré cette avancée, il n’est pas évident de savoir si les lecteurs de ces sites sont habitués à ce nouveau langage. Alors que l’illettrisme - un manque d’éducation en littératie « textuelle » - est un problème bien connu, celui du manque de littératie en visualisation l’est beaucoup moins.
Une visualisation n’est pas une image « gratuite » ou purement illustrative : elle utilise des codes graphiques spécifiques qu’un lecteur doit savoir interpréter. Alors que détecter un point rouge au milieu d’un groupe de points bleus peut être très rapide, une visualisation n’est réellement efficace que si le lecteur comprend à quoi fait référence ce point rouge au niveau des données. À défaut, l’information que présente la visualisation ne sera pas communiquée.
La littératie en visualisation se définit donc comme la capacité qu’a un individu de traduire des questions posées au niveau visuel en questions relatives aux données, et de traduire des questions relatives aux données en « requêtes » visuelles. Il est à noter que cette définition sous-entend la littératie comme une compétence « passerelle ». Pour faire une analogie avec l’alphabétisation, cette compétence passerelle est celle qui permet d’interpréter des chaînes de caractères typographiques comme un ensemble de mots, de phrases et de paragraphes. Ce n’est que lorsque cette compétence est « activée » qu’il devient possible d’extraire le sens d’un texte et d’en faire l’analyse ou la critique.
La compréhension de la littératie en visualisation n’en est qu’à ses balbutiements. Elle représente un grand enjeu pour l’avenir de la recherche en visualisation : en effet, comprendre à quel point différentes audiences peuvent interpréter des graphiques aura des implications pour le design, pour l’éducation et même, potentiellement, pour de futurs agendas politiques comme c’est déjà le cas pour l’alphabétisation.
Jeremy BOY

Notes

Mis en ligne sur Cairn.info le 07/07/2015
https://doi.org/10.3917/i2d.152.0032