Essor de l'IA générative et institutions patrimoniales : retours d'expérience et état des lieux des adaptations appliquées
sciencesconf.org:jdev26:726783
Jeanne Nicolas 1, 2, @
1 : Centre de recherche interuniversitaire sur les humanités numériques
2 : Héritage et Création dans le Texte et l'Image
Université de Bretagne Sud, Université de Brest, Institut Brestois des Sciences de l'Homme et de la Société
Les numérisations constituent aujourd'hui un mode d'accès prévalant au patrimoine : il suffit aujourd'hui d'un poste informatique et d'une connexion internet pour que les communautés de recherche et étudiante y accèdent de chez elles. Nos objets de recherche sont accessibles directement en ligne, sur des plateformes comme Gallica, et servent de support au même titre, voire à une fréquence plus importante, que leurs originaux. L'entraînement très fréquent des grands modèles de langue (LLM) sur ces données patrimoniales appuie lui aussi l'importance du respect de ces critères, pour favoriser une transmission correcte des informations qu'elles contiennent.
Ce même entraînement entraîne un phénomène qui touche l'ensemble des institutions patrimoniales, celui de la mise à mal des serveurs par les robots de scraping. Face à l'ampleur de la situation, certaines mettent en place diverses mesures – limites de requêtes, API, bloqueurs d'IP – en l'absence de solution réelle. L'accessibilité des documents patrimoniaux en ligne étant affectée, c'est l'accès à la matière première de certains champs de recherche qui est perturbé, voire rendu impossible. Ces données collectées sont ensuite utilisées pour entraîner les modèles, par lesquels de plus en plus d'utilisateurs obtiennent les informations qu'ils recherchent. Passant de moins en moins par les moteurs de recherche, la collecte d'informations se fait désormais grâce aux réponses fournies par les agents conversationnels et pose elle aussi des questions de reproductibilité et de propriété intellectuelle qui inquiètent les professionnels du patrimoine. L'élan que cela peut inférer vers une fermeture ou une restriction de l'accès aux connaissances, dans une forme de recul vis-à-vis de la science ouverte, questionne bibliothécaires, archivistes et conservateurs.
Cette présentation propose un retour sur l'expérience des institutions patrimoniales face à l'essor de l'intelligence artificielle. Il s'agit ici de faire un état des lieux des problèmes qui sont apparus ou ont été décuplés par l'avènement des IA génératives et de créer un espace pour penser aux solutions qu'il reste encore à envisager collectivement.
Type : : Présentation
Thématiques : Intelligence Artificielle
Mots-Clés : Impact sociétal ; Gestion des données