Le Syndicat national de l’édition, la Société des gens de lettres et le Syndicat national des auteurs et des compositeurs ont conjointement assigné le géant américain devant la troisième chambre du tribunal judiciaire de Paris.
Une nouvelle fois dans sa longue histoire, l’industrie française du livre fait front pour défendre le droit d’auteur. Ce mercredi, le Syndicat national de l’édition (SNE) la Société des gens de lettres (SGDL) et le Syndicat national des auteurs et des compositeurs (SNAC) ont annoncé qu’ils avaient conjointement assigné le géant américain Meta (Facebook, Instagram, WhatsApp) devant la troisième chambre du tribunal judiciaire de Paris pour contrefaçon de droit d’auteur, ainsi que parasitisme économique.
« Les échanges avec Meta ont tourné court, et il nous a paru nécessaire d’aller sur le terrain judiciaire, a expliqué Renaud Lefebvre, le directeur général du SNE, lors d’une conférence de presse. C’est une procédure qui a valeur d’exemple. » Dans le détail, ces trois organisations représentant les éditeurs, auteurs et ayants droit reprochent à la firme de Menlo Park une utilisation massive d’œuvres sous droits sans autorisation, en vue d’entraîner son modèle d’intelligence artificielle (IA) générative, Llama.
Du « data scraping » de masse
« Pendant des années, les opérateurs d’IA générative ont procédé à une moisson débridée des données protégées, et il faut même plutôt parler de pillage », a asséné Christophe Hardy, président de la SGDL. « Il s’agit du plus gros pillage depuis qu’Internet existe », a abondé Maïa Bensimon, déléguée générale du SNAC.
Si les trois organisations syndicales n’ont pas souhaité détailler la masse d’oeuvres auxquelles aurait eu accès de manière illégale Meta, selon leurs dires, en France, cette problématique est déjà depuis belle lurette au coeur des préoccupations de l’industrie du livre à l’échelle internationale.
Jonathan Franzen, Elena Ferrante, Margaret Atwood, Stephen King… des grands auteurs ont ainsi vu certains de leurs ouvrages être utilisés par OpenAI (ChatGPT), Meta (Llama) ou encore Bloomberg (BloombergGPT) pour entraîner leurs IA, d’après une enquête parue en 2023 de « The Atlantic », selon qui plusieurs centaines de milliers de livres étaient concernés. Du « data scraping » de masse effectué sans l’accord des ayants droit et incluant également des bases de données (intitulées Books3 ou Books2) constituées d’oeuvres de sites pirates.
Le précédent Google
« Le Far West a mis un certain temps à se réguler, et il faut saluer ce que l’Europe a su faire rapidement, a abondé Vincent Montagne, président du SNE, en référence à la régulation mise récemment en place par Bruxelles concernant l’IA générative. Il faut maintenant que cela se traduise dans les faits. On parle de plusieurs centaines de milliards de dollars d’investissements dans l’IA, et il n’y a aucune raison que ne soit pas rémunérée la création. »
Au mitan des années 2000, l’industrie du livre s’était déjà dressée contre Google qui avait alors la volonté de numériser le catalogue des éditeurs français. « A l’époque, Google nous avait proposé une indemnisation élevée, et nous avions refusé, rappelle Vincent Montagne. La situation est un peu la même aujourd’hui. »
« Nous ne sommes pas sur une approche technophobe et rétrograde. Nous demandons juste que le droit soit respecté, et qu’il y ait de la sécurité juridique pour tous les acteurs du secteur, précise Renaud Lefebvre. L’idée n’est pas d’interdire pour l’éternité aux opérateurs d’IA générative de faire appel au corpus d’ouvrages protégés, mais qu’il cesse de le faire dans l’illégalité. »