Rouges d’exaspération, les éditeurs britanniques : la moutarde leur est montée une fois de plus au nez, suite à la parution d’un article de The Atlantic. Ce dernier met en cause l’usage d’oeuvres illégalement diffusées sur LibGen, et dont Meta (maison-mère de Facebook) s’est servi pour alimenter son IA. Encore. Conclusion, la so british Publishers Association fustige ces exaspérantes méthodes de pirates.
Meta, en développant son modèle d’intelligence artificielle Llama 3, a pris une décision douteuse : utiliser la base de données piratée Library Genesis (LibGen) pour entraîner son IA. Des échanges internes, rendus publics dans le cadre d’un procès pour violation du droit d’auteur, révèlent que l’équipe de Llama jugeait « vraiment important […] d’obtenir des livres au plus vite ». De fait, « les livres représentent en réalité un apport plus significatif que les données issues du web », estimaient les ingénieurs.
Quand Mark Zuckerberg valide le piratage
Exploiter les ouvrages via des licences légales fut envisagé, mais les propositions des éditeurs étaient jugées « déraisonnablement coûteuses » et leur mise en place « incroyablement lentes ». Un directeur technique soulignait aussi une limite stratégique : « Si on place un seul livre sous licence, s’appuyer sur la stratégie du fair use sera rendu caduc. »…