Virapic : Quand Histoire et technologie unissent leur force contre la désinformation
Gaël Lejeune, informaticien, et Mathieu Marly, historien, unissent leurs expertises à travers le projet Virapic.
Entretien croisé
Gaël Lejeune est maître de conférences en informatique à la faculté des Lettres, et Mathieu Marly, historien et responsable éditorial de l’Encyclopédie d’histoire numérique de l’Europe.
À l’heure des manipulations visuelles et des contenus générés par intelligence artificielle, ce projet offre des outils pour mieux armer les élèves et les étudiants face aux défis posés par la désinformation.
Pouvez-vous vous présenter et nous raconter les origines du projet Virapic ?
Mathieu Marly : En tant que professeur agrégé et chercheur associé à Sorbonne Université et responsable éditorial de l'Encyclopédie d'histoire numérique de l'Europe (EHNE), je travaille à rapprocher recherche historique et formation aussi bien dans l’enseignement supérieur que dans le secondaire.
Site agréé par l’Éducation nationale, l’EHNE propose aujourd’hui 1 200 notices et articles scientifiques en lien avec les programmes scolaires, et touche entre 5 000 et 10 000 lecteurs quotidiens. Dans le cadre de l’EHNE, nous avons également déjà travaillé sur des projets autour de la photographie, comme le projet Colbert, qui utilisait l’intelligence artificielle pour analyser des fonds photographiques anciens, ou le projet Chambre noire, visant à enrichir des photographies par des commentaires et des méthodes historiques.
En recherchant, pour l’EHNE, des images pédagogiques, utilisables comme documents historiques par des étudiants et des élèves, j’ai constaté qu’un grand nombre de photographies publiées sur le web restent décontextualisées, sans légendes ni commentaires. Ce constat, combiné à mes recherches personnelles sur les archives photographiques, m’ont incité à développer un projet permettant de mieux contextualiser et valoriser ces images. C’est ainsi que l’idée de Virapic est née.
Gaël Lejeune : Virapic s’inscrit également dans la dynamique du Centre d’expérimentation en méthodes numériques pour les recherches en Sciences Humaines et Sociales (CERES), une unité créée en 2021 au sein de la faculté des Lettres pour soutenir la recherche en humanités numériques à travers du conseil, de la formation, et du développement d’outils informatiques. Enseignant en informatique à l’UFR de sociologie et d’informatique pour les sciences humaines, j’en suis le directeur adjoint et mes recherches portent sur le traitement automatique des langues et, depuis peu, des images.
Quels sont les objectifs de ce projet ?
M. M. : Le projet Virapic s’articule autour de trois axes. Tout d’abord, il vise à analyser la circulation en ligne des photographies liées à des événements historiques complexes, comme les guerres mondiales, les luttes politiques et sociales, les génocides ou encore la colonisation. L’objectif est de comprendre pourquoi et comment ces images deviennent virales et ce que leur diffusion dit des mémoires contemporaines de ces évènements.
Le deuxième objectif du projet est de réinjecter du contenu académique dans les archives photographiques en mobilisant des historiens pour contextualiser ces images. Cette approche valorise le travail des chercheurs et montre comment ils abordent les archives photographiques tout en fournissant aux internautes un accès à un contenu académique fiable et rigoureux.
G. L. : Le dernier objectif est d’agir directement sur les pratiques des internautes en exploitant les audiences conséquentes du site de l’EHNE. Grâce au bon référencement du site ehne.fr sur les moteurs de recherche, les photographies mises en avant sur ce site peuvent apparaître parmi les premiers résultats proposés aux internautes. Cela permet de faire remonter des contenus vérifiés avant que des images ne soient mal interprétées ou partagées hors de leur contexte.
Pourquoi est-il essentiel de sensibiliser les élèves aux archives photographiques ?
M. M. : Le projet Virapic s’adresse aussi bien aux étudiants en histoire qu’aux élèves du secondaire. Les jeunes générations ont grandi avec les outils numériques, mais cette familiarité ne s’accompagne pas toujours d’un recul critique suffisant. Avec l’ère numérique, on est passé d’une culture de la photographie comme outil de conservation à une photographie à vocation conversationnelle, notamment sur des plateformes comme TikTok ou Snapchat. Cette transformation influence profondément la manière dont élèves et étudiants perçoivent les images, souvent sans questionner leur fiabilité ni leur contexte.
En tant qu’historiens et enseignants, il est crucial de les amener à réfléchir sur le fait qu’une photographie ne dit pas la vérité de façon intrinsèque, n’est pas une preuve en soi, et doit être soumise à un examen critique, incluant une analyse méthodique et rigoureuse des documents.
G. L. : Nos étudiants sont les enseignants de demain, mais également des citoyens qui auront à pratiquer, diffuser, et transmettre ces connaissances. Virapic permet de les former à naviguer dans un environnement numérique complexe, où les algorithmes des moteurs de recherche influencent fortement la visibilité des contenus. Il vise à questionner les mécanismes de référencement et à discerner les contenus fiables des contenus manipulés.
Et cela est d’autant plus important à l’heure des deepfakes, n’est-ce pas ?
M. M. : Absolument. Le ministère de l’Éducation nationale, avec qui nous travaillons, est très attentif à la question des contenus générés par l’intelligence artificielle (IA). La progression récente de ces technologies est exponentielle. Alors que les fausses photographies créées par IA étaient faciles à identifier il y a trois ans, aujourd’hui, elles sont bien plus réalistes, et d’ici quelques années, elles pourraient devenir quasiment indétectables. Cela pose un risque majeur, notamment en ce qui concerne les relectures complotistes du passé ou les manipulations de la mémoire collective. Prenons l’exemple d’une puissance comme la Russie, qui pourrait vouloir justifier historiquement l’idée d’une appartenance de l’Ukraine. En inondant le web de ce type d’images, ces contenus finiraient par tenir lieu de discours pseudo-historique, influençant les perceptions et brouillant la frontière entre le vrai et le faux. Les photographies, plus encore que les textes, ont ce pouvoir d’ancrer une idée dans l’esprit du public en apparaissant comme des preuves visuelles.
G. L. : Avec Virapic, nous ne faisons pas de simple débunkage en déclarant ce qui est "vrai" ou "faux". L’objectif de notre projet est plutôt d’initier les élèves et les étudiants à la méthode historique : apprendre à commenter des archives, comprendre le fonctionnement des IA et de la viralité numérique. Ces compétences sont essentielles dans un monde où la transmission de l’histoire doit impérativement intégrer les réalités numériques des élèves et des étudiants.
Nous pensons que fournir des outils méthodologiques est bien plus efficace que de simplement décréter si une information est correcte ou non. Cela encourage une réflexion critique, au lieu d’imposer une vérité de manière autoritaire.
Par ailleurs, si l’IA multiplie les interprétations possibles, parfois jusqu’à la manipulation, elle peut également être une solution face à certaines dérives. Dans la formation, nous essayons de montrer cette dualité : tout outil possède des aspects positifs et des risques. Notre objectif est d’apprendre à tirer parti des potentialités des outils numériques tout en restant conscients de leurs limites et des dangers associés.
Comment choisissez-vous les photographies utilisées dans le projet ?
M. M. : La première approche repose sur le travail des historiens. Nous réunissons des spécialistes pour repérer des photographies problématiques croisées sur le web. Par exemple, nous avons travaillé avec des historiens sur une photographie de 1933 montrant l’arrivée d’Hitler au pouvoir, une image de propagande souvent reprise, y compris par des sites réputés comme Radio France.
G. L. : La seconde s’appuie sur les équipes du CERES qui réalisent une veille en ligne basée sur des mots-clés liés à des événements historiques. Ces recherches permettent d’identifier les images qui reviennent fréquemment dans les résultats, d’en analyser les raisons, et de compléter l’identification des photographies problématiques en détectant celles qui deviennent virales. Ces deux démarches se croisent pour constituer un corpus pertinent à analyser et contextualiser.
Comment envisagez-vous l’avenir de Virapic ?
G. L. : Après avoir décroché l’appel à projets Émergence en 2022, nous avons commencé à travailler concrètement en 2023, et le projet se poursuivra jusqu’en 2025. À ce stade, nous avons posé toutes les bases. L’objectif est désormais de pérenniser le projet et d’élargir sa portée en intégrant de nouvelles ressources et en élargissant nos collaborations. Cela permettrait d’intégrer non seulement d’autres informaticiens, mais aussi des chercheurs d’autres disciplines que l’histoire. Par exemple, dans le domaine de l’information et de la communication ou de la sociologie.