CCFI

Pillage de données, usurpation d’identité… : le monde du livre appelle à encadrer l’IA

L’industrie s’inquiète des conséquences potentielles de l’intelligence artificielle générative dont les premiers effets négatifs se sont fait ressentir ces derniers mois.

« L’UE doit agir maintenant afin de garantir que l’IA générative soit plus transparente en vue de protéger la chaîne du livre. » C’est l’appel conjoint lancé, jeudi, par plusieurs associations européennes du secteur (FEP, EWC, EIBF), représentant écrivains, librairies et éditeurs, à la Foire du livre de Francfort. Une prise de parole qui intervient alors que l’IA devient une réalité de plus en plus palpable au sein de l’industrie.

Mi-septembre, Amazon a annoncé que de nouvelles règles allaient s’appliquer sur sa plateforme d’autoédition en ligne, Kindle Direct Publishing. Désormais, celle-ci demande aux utilisateurs d’indiquer lorsque leurs contenus s’appuient sur de l’IA à la publication d’un nouveau livre ou lors de la republication d’un ouvrage déjà en ligne. En parallèle, le groupe limite les publications de livres à trois par jour. Une réponse timide aux contenus découlant de l’IA générative qui se sont multipliés sur la plateforme.

« Les bots IA ont cassé Amazon », avait ainsi écrit l’autrice Caitlyn Lynch, fin juin, sur X (anciennement Twitter) qui faisait valoir que des livres produits par l’IA générative trustaient les premières places des meilleures ventes dans la catégorie « young adults ».

« C’est vertigineux »

Quelques semaines plus tard, Amazon a été contraint de retirer de sa plateforme des ouvrages rédigés par une IA et relatifs aux champignons et à leur comestibilité. La raison ? Leurs inexactitudes…

« S’il vous plaît, n’achetez que des livres d’auteurs et cueilleurs connus, cela peut littéralement être une question de vie ou de mort », a ainsi alerté la Société mycologique de New York. En septembre, plusieurs auteurs ont aussi fait savoir que leur identité avait été usurpée ; des livres signés de leurs noms mais produits par une IA ont été mis à la vente sur Amazon. Une contrefaçon bien réelle et en rien artificielle.

« Ces affaires sont un cocktail de plusieurs éléments : il y a l’aspect du contenu autogénéré, mais aussi le très grand nombre d’avis positifs générés par IA faisant remonter les ouvrages dans les résultats de recherches et permettant de nourrir leurs ventes, souligne Renaud Lefebvre, directeur général du SNE. Et ces oeuvres parasites créent une concurrence déloyale pour les auteurs écrivant sur ces mêmes thématiques. »

« La littérature de genre […] est la plus menacée »

Reste que le danger n’est pas de la même teneur pour toutes les catégories. « La littérature de genre, comme les « feel-good books » ou les « dark romance », est la plus menacée car ces ouvrages répondent à des codes et des fils conducteurs très précis, fait valoir Muriel Beyer, membre du directoire d’Humensis. L’IA ne remplacera jamais les écrivains ou les essayistes. Elle peut, peut-être, écrire à la manière de Michel Houellebecq ou Victor Hugo sans leur génie. Mais elle ne peut écrire le livre de demain car il n’est pas encore sorti et qu’elle ne peut donc pas s’en nourrir. »

Ce dernier aspect n’en demeure pas moins problématique. « La vraie crainte, c’est le pillage des données », souligne Julien Papelier, directeur général adjoint chez Media-Participations. Jonathan Franzen, Elena Ferrante, Margaret Atwood, Stephen King… : des grands auteurs(rices) ont vu certains de leurs ouvrages être utilisés par OpenAI (ChatGPT) et/ou Meta (Llama) et/ou Bloomberg (BloombergGPT) pour entraîner leurs IA, d’après « The Atlantic », selon qui plusieurs centaines de milliers de livres sont concernés.

Du « data scraping » effectué sans l’accord des ayants droit – sans compter que cela inclut des bases de données (intitulées Books3 ou Books2) constituées d’ouvrages provenant de sites pirates. Une multitude d’affaires de cet acabit se sont multipliées ces derniers mois. Résultat : plusieurs auteurs, parfois rassemblés en action collective, ont traîné en justice les firmes derrière les agents conversationnels pour violation du droit d’auteur.

« Protéger les fondements du droit d’auteur »

« C’est notre principal combat avec l’IA : imposer des obligations de transparence à ceux qui les entraînent, qui doivent garder la trace de ce qu’ils utilisent comme contenus et protéger les fondements du droit d’auteur », expose Renaud Lefebvre. Adoptée en 2019, la directive européenne sur le droit d’auteur a débouché sur une exception à ce dernier en autorisant la fouille de textes et de données (TDM). Y compris à des fins commerciales.

Une brèche dans laquelle se sont engouffrés les propriétaires d’IA, même si les éditeurs peuvent s’opposer à cette utilisation (opt-out). Mais tous sont loin de l’avoir fait. « Comme dans beaucoup de secteurs, la prise de conscience sur les potentialités de l’IA est récente », note un expert du secteur. Fin septembre, 75 organismes professionnels des industries de la création ont signé une tribune appelant à l’instauration d’un cadre européen plus strict et précis, alors que l’IA Act est actuellement en négociations à Bruxelles.

 

Lire : Les Echos du 20 octobre

 

Jean-Philippe Behr

Nos partenaires

Demande d’adhésion à la CCFI

Archives

Connexion

Vous n'êtes pas connecté.

Demande d’adhésion à la CCFI