Trois principales associations françaises du monde de l’édition – le Syndicat national de l’édition (SNE), la Société des gens de lettres (SGDL) et le Syndicat national des auteurs et des compositeurs (SNAC) – ont déposé plainte contre Meta devant le tribunal judiciaire de Paris le 12 mars 2025. Elles accusent le géant californien d’avoir utilisé près de 200 000 livres pour entraîner son modèle de langage Llama sans respecter le droit d’auteur.
Christophe Hardy, président de la SGDL, explique que cette action vise à « faire naître une volonté sérieuse des IA de respecter la création et son cadre juridique ». Le président du SNAC, quant à lui, met en garde contre la création de « faux livres » à partir d’œuvres protégées.
Les plaignants exigent le retrait des répertoires de données créés sans autorisation et utilisés pour entraîner les IA. La question du respect du droit d’auteur dans le domaine de l’IA générative est devenue cruciale depuis l’émergence de ChatGPT en 2023. Les modèles d’IA sont souvent entraînés sur des données massives issues du web, incluant inévitablement des contenus protégés.
OpenAI a reconnu qu’il serait impossible d’entraîner les meilleurs modèles d’IA sans utiliser des documents protégés par le droit d’auteur. Depuis 2023, de nombreuses plaintes ont été déposées contre des entreprises d’IA pour l’utilisation de contenus protégés.
L’AI Act européen impose aux fournisseurs d’IA générative de respecter le droit d’auteur et d’assurer la transparence sur les sources utilisées pour développer leurs modèles. Cette action en justice s’inscrit dans ce contexte de régulation européenne.