ANALYSIS OF BEHAVIOR AND SITUATION FOR MENTAL REPRESENTATION ASSESSMENT AND COGNITIVE ACTIVITY MODELLING
Le projet ABSTRACT est un projet de recherche en sciences cognitives qui couvre à la fois les champs de l’ergonomie cognitive et de l’informatique.
Nous nous adressons aux personnes qui cherchent des moyens de mieux comprendre une activité humaine à partir d’un enregistrement informatisé de cette activité.
Nos objectifs sont des objectifs d’ergonomie, dans le sens général d'une «science de l’activité humaine». Les buts peuvent être multiples: faciliter l'activité, prédire l'activité, prévenir certaines actions indésirables, etc. Pour cela nous développons une méthodologie et des outils facilitant la «découverte de connaissances à partir de traces d’activité».
Du point de vue des sciences humaines, nous nous reconnaissons dans le champ de recherche que Penelope Sanderson et Carolanne Fischer nomment «Exploratory Sequential Data Analysis (ESDA)» dans leur article de 1994: «Exploratory Sequential Data Analysis : Fondations».
Cet article définit les objectifs de l’ESDA ainsi: “Analyzing sequential data with a quest for their meaning in relation to some research or design question”. Il s’agit d’une démarche exploratoire qui vise à “Looking at data to see what it seems to say” plutôt que d’une démarche de confirmation d’hypothèse qui viserait leur validation ou invalidation statistique.
Du point de vue de l’informatique et de l’ingéniérie des connaissances, nous nous reconnaissons dans le domaine du « Knowledge Discovery » tel que Usama Fayyad le présente dans son article de 1996: «From Data Mining to Knowledge Discovery in Database».
Au-delà du problème de «pattern finding» et de l’apprentissage automatique par des algorithmes de «data mining», le «Knowledge Discovery» interroge la question épistémologique de la signification des «patterns» découverts.
Nous insistons sur la nécessité de « garder l’homme dans la boucle » du cycle de «knowlege discovery» tel que Fayyad le présente figure 1. Nous proposons une approche par niveaux successifs d’abstraction, continuellement confrontés à l’interprétation de l’ergonome. La connaissance ne se trouve pas construite dans l’outil informatique mais « dans la tête » de l’ergonome en interaction avec l’outil. Au fur et à mesure de cette interaction, la connaissance est cependant capitalisée dans l’outil sous forme d’une amélioration progressive des règles d’inférence et de visualisation des données.
Nous débutons par une observation de l’activité qui peut prendre des formes multiples: directement par l’ergonome, par des caméras vidéo ou microphones, par des capteurs qui enregistrent des données numériques, par des «logs» de programmes informatiques, etc.
Dans notre travail les données sont collectées avec un véhicule instrumenté lors d'expérimentation de conduite automobile. Les données sont obtenues par des caméras, des capteurs (vitesse, angle volant, enfoncement des pédales, télémètre, position GPS, oculomètre), et par interview du conducteur.
Dans tous les cas l'observation doit produire un ensemble de données datées, c'est-à-dire que chaque élément d’information est rattaché à un instant de l’activité repéré par un « Time-Code ».
Ces données datées constituent nos données brutes. Leur choix et leur forme ne sont pas neutres, elles se basent sur notre connaissance initiale de l’activité étudiée et sur nos objectifs de recherche.
Cette étape de pré-processing inclut les traitements de bas niveau tels que la calibration des capteurs, le filtrage du « bruit », l’élimination des variables non intéressantes.
La trace collectée est le résultat d’une «discrétisation» des données. Par exemple nous extrayons les points remarquables des courbes analogiques (Seuils, Mins et Max locaux, Points d'inflexion) (figure2); ou des événements de déclenchement de zones d’intérêt d’un oculomètre (figure 3); ou encore nous convertissons des «logs» bruts d'applications informatiques en des événements significatifs.
Cette discrétisation produit une suite d’événements auxquels sont rattachés des propriétés numériques ou textuelles. Nous appelons cette suite d’événements la « trace collectée ». Elle constitue le point de départ des différentes traces symboliques que nous produisons.
Cette trace collectée doit être validée par l’ergonome afin de s’assurer que les événements qu'elle contient soient significatifs. Le réglage des différents paramètres qui permettent de la générer est une étape importante. Pour permettre cette validation, nous avons développé un outil qui permet de la visualiser sous Excel de manière synchrone avec la vidéo. Lorsque l’ergonome joue la vidéo, la trace est automatiquement scrollée dans Excel (figure 4). Chaque ligne représente un événement; la colonne 1 contient son Time-Code en secondes, la colonne 4 contient son type, les colonnes suivantes contiennent ses propriétés.
La vidéo n’est pas entièrement transcodée symboliquement et reste exploitée par l'ergonome en parallèle avec les traces symboliques.
La trace collectée est ensuite convertie en graphe RDF de façon à pouvoir être enrichie par des symboles plus abstraits (figure 5). Les ronds représentent les événements de la trace collectée, les triangles et les carrés représentent les événements plus abstraits, et les flèches représentent les relations d'inférence.
Les règles d'inférence sont écrites sous forme de requêtes SPARQL. L'outil ABSTRACT permet de générer ces requêtes de manière semi-graphique, c'est-à-dire que l'ergonome produit interactivement des squelettes de requêtes, qu'il doit compléter manuellement.
En parallèle à la création des requêtes, l'ergonome définit les symboles qu'il crée dans une ontologie. Nous mettons à sa disposition l'éditeur d'ontologie Protégé pour lui permettre de définir les propriétés sémantiques et visuelles de ses symboles. Cette ontologie est exploitée par le moteur d'inférence SPARQL et par les modules de visualisation graphique des traces.
La Figure 6 montre une copie d'écran de l'interface autilisateur.
Cette interface offre les fonctionnalités suivantes: (1,6) choisir une trace, (2) voir les informations générales des cette trace, (3) visualiser la trace sous différent formats, (4) transformer la traces par l'application de règles de transformation, (5) définir les symboles dans une ontologie, (7) choisir différents modules de visualisation, (8) atteindre un time code particulier.
Le module de visualisation (10) montre la trace complète avec les symboles de haut niveau, le module (9) montre un zoom sur un interval de 10 secondes. Un click sur les symboles permet d'afficher une fênetre d'information (11). L'utilisateur peut fare glicer la trace horizontalement et la synchroniser avec une vidéo (12).
La figure 7 est une représentation graphique d'une séquence typique de dépassement sur autoroute, telle qu'elle est produite par ABSTRACT; à laquelle les libellés ont été rajoutés.
Dans cette visualisation, l'abscisse des événements représente leur time-code, et leur ordonnée différentie leurs niveaux d'abstraction. La forme des symboles et leur ordonnée est définie par l'ergonome dans l'ontologie. Dans cette figure, les symboles de bas niveau sont les cercles en bas de la figure. Les symboles de niveau d'abstractuion intermédiaire sont placés autour de l'axe central. Ce qui concerne la gauche du véhicule est placé au dessus de l'axe central, et ce qui concerne la droite en dessous. Les triangles orientés vers la droite represente quelquechose "vers l'avant" (par exemple: "Look ahead"). Les triangles ortientés ver la gauche représentent quelquechose "vers l'arrière" (par exemple: "Left mirror glance"). Les lignes représentent les relations d'inférence allant de symboles de bas niveau vers des symboles de plus haut niveau. La partie la plus haute de l'affichage représente les symboles de plus haut niveau d'abstraction. Par exemple, la "Decision" de changer de voie est inféré à partir d'une cooccurence d'une accélération et d'un regarde vers le retroviseur gauche.
La figure 8 montre l'activité terroriste en République Irlandaise entre 1970 et 2007. Les données proviennent de la Global Terrorism Database (GTD).
La visualisation du haut représente un zoom sur un interval de 100 jours. La visualisation du bas représente les 37 années.
Dans ces visualisations, l'icone principale est associéee au champ "WEAPON_TYPE". Les trois principaux types d'armes sont représentés: "Firearms" (pistolet), "Explosive" (étoile) et "Incendiary" (flamme). Une deuxième icone représentant les contours d'un corps est ajoutée quand le champ "ATTACK" vaut "assassination".
L'ordonnée est associée au champ "PERPETRATOR", c'est à dire que les principaux groupes terroristes sont représentés chacun sur une ligne distincte. Les groupes loyalistes (protestants) sont représentés au dessus de l'axe central, les groupes républicains (catholiques) sont représentés en dessous de l'axe central.
Dans cet exemple, l'ontologie est hébergée en ligne sous forme d'un Semantic-Media-Wiki. La fenêtre info-bulle d'un évenement fournit les liens vers les différentes classes définies dans l'ontologie. Le champ "GTD_ID" fournit un lien vers la description de l'événement dans la Global Terrorism Database.
L'utilisateur d'ABSTRACT définit la visualisation dans une feuille de style XSL qui exploite des paramètres définis dans l'ontologie.
Une version simplifiée d'ABSTRACT est disponible gratuitement en ligne. Cette version s'appelle ABSTRACT-LITE. Une documentation est également fournie.
ABSTRACT est disponible au téléchargement depuis le serveur SVN du Liris à cette addresse. Il est en lecture seule. Si vous voulez contribuer au développement, merci de contacter les auteurs.
Supporting Activity Modeling from Activity Traces. Olivier L. Georgeon, Alain Mille, Thierry Bellet, Benoit Mathern, Frank E. Ritter (2012). Expert Systems, 29 (3), 261-275. doi: 10.1111/j.1468-0394.2011.00584.x.
Early-Stage Vision of Composite Scenes for Spatial Learning and Navigation. In the proceedings of the First Joint IEEE Conference on Development and Learning and on Epigenetic Robotics (ICDL-EPIROB 2011). Olivier L. Georgeon, James B. Marshall, Pierre-Yves R. Ronot. Frankfurt (24-27 August 2011).
A Comparative study of Exploratory Sequential Data Analysis tools. 2010. Sowmyalatha Srinivasmurthy. Technical report. The Pennsylvania State University.
Other publications on CiteUlike.