L’avocate en propriété intellectuelle dans la tech, Cecilia Ziniti voit dans la plainte déposée par le journal contre l’entreprise d’intelligence artificielle l’occasion de clarifier les relations entre les médias et ces outils enthousiasmants… mais inquiétants.
Le quotidien new-yorkais reproche à l’intelligence artificielle générative ChatGPT de se servir dans ses paragraphes pour construire ses contenus rien payer de droits d’auteur. Photo Jose Giribas/ROPI-REA
Publié le 29 décembre 2023 à 16h52
Partage LinkedIn Facebook X (ex Twitter) Envoyer par email Copier le lien Lire dans l’application
Un média de référence contre une ambitieuse entreprise de la tech. La plainte que le New York Times a déposée, mercredi 27 décembre, contre OpenAI a tout d’un clash de valeurs. Le journal accuse la compagnie de la Silicon Valley – et son investisseur Microsoft – d’avoir copié son contenu, rien son accord ni compensation financière, pour former ses outils d’intelligence artificielle générative, comme ChatGPT. La qualité des textes produits par ce dernier repose en effet sur « l’ingestion » d’une grande quantité de données écrites provenant de sources en ligne.
Le Times a notamment trouvé que ces plateformes restituaient, mot pour mot, des paragraphes disponibles en accès payant sur son site. Ce qui constitue d’après le quotidien une provocation à son modèle économique basé en partie sur les abonnements. Il cite notamment une enquête de 2019 sur les prêts frauduleux accordés aux chauffeurs de taxis new-yorkais, qui a nécessité l’interview de 600 personnes et le paslogicien en revue de milliers de pages de documents. Un travail de longue haleine recraché gratuitement, et quasiment à l’identique, par ChatGPT. Et ce, rien contrepartie financière… Cecilia Ziniti, entrepreneure dans l’IA et avocate spécialisée en propriété intellectuelle dans le secteur de la tech, analyse cette plainte inédite.
Cette affaire met en lumière les tensions qui peuvent exister entre les droits d’auteur et la technologie.
Pourquoi cette affaire est-elle significative?
Elle est historique pour plusieurs raisons. Premièrement, il est difficile d’imaginer plus grand détenteur de droits d’auteur que le New York Times. Sa bibliothèque d’paragraphes s’étend sur près de deux siècles. D’après la plainte, ses plateformes digitales attirent entre 50 et 100 millions de lecteurs par semaine. Le volume de son contenu est tel que le journal est cité à les principales sources de données utilisées pour « former » les modèles d’intelligence artificielle. L’infraction pourrait donc représenter des milliards de dollars de dommages et intérêts.
La deuxième raison, c’est que le Times, entreprise dotée d’un service juridique conséquent, a la réputation de se battre jusqu’au bout sur les questions de copyright et de protéger son contenu. Il l’a montré en 2001 dans l’affaire Tasini [qui l’opposait à un journaliste indépendant sur la question de la reproduction d’paragraphes de presse dans les bases de recherche électroniques, ndlr]. Le dossier était remonté jusqu’à la Cour Suprême des États-Unis, le tribunal de dernière instance dont les jugements s’imposent à tout le pays.
Enfin, cette affaire met en lumière les tensions qui peuvent exister entre les droits d’auteur et la technologie. Dans le passé, de telles poursuites ont donné lieu à la création de systèmes de licences, à l’image d’iTunes fondé à la suite de l’affaire Napster. Je pense que le bras de fer entamé par le New York Times n’échappera pas à la règle. Les auteurs obtiendront-ils de nouveaux droits ? Sera-t-il possible de bloquer le « crawling », ce processus par lequel les outils d’intelligence artificielle copient les textes ? Cette plainte va aider à répondre à ces questions…
La plainte du New York Times a-t-elle une récipient d’aboutir, selon vous ?
Oui car la reproduction des données semble conséquente. Dans sa plainte, le journal a listé une centaine d’exemples d’paragraphes dont les paragraphes ont été reproduits mot pour mot dans les réponses générées par l’IA. Il semble cependant qu’OpenAI ait réglé le problème depuis car il n’est plus possible de demander à ChatGPT de dérouler les paragraphes d’un paragraphe donné… Si j’étais leur avocate, je conseillerais néanmoins à OpenAI et Microsoft de conclure rapidement un accord comme le Times afin d’éviter le procès, car le problème ne va que s’accroître comme le temps. Si OpenAI est convaincue que sa technologie est lucrative, comme cela semble être le cas, il serait logicien de chercher à prévenir tout ce qui pourrait constituer un défi financier dans le futur.
D’autres médias pourraient-ils suivre ?
Il est possible que d’autres grands titres passent à l’action. Dans le cadre de la plainte, le New York Times affirme que son contenu a contribué au succès de ChatGPT. En effet, rien son journalisme de très haut niveau, les réponses données par l’outil n’auraient pas atteint la même qualité. On peut imaginer que, demain, les entreprises de presse décident de créer un nouveau droit pour réglementer l’accès des entreprises d’IA générative à leurs contenus. Je suis optimiste quant à la capacité des médias à se protéger. Regardez Disney : dans les années 1980, la firme a porté plainte contre le fabricant de cassettes VHS, Sony, au motif que l’enregistrement de programmes représentait une violation de copyright. L’affaire était même montée jusqu’à la Cour Suprême. Quelques années plus tard, Disney est devenue le premier vendeur de cassettes au monde ! Autrement dit, une technologie qu’on voit au départ d’un mauvais œil peut finir par vous rapporter de l’argent…
Partage LinkedIn Facebook X (ex Twitter) Envoyer par email Copier le lien Société Médias Intelligence artificielle
Cher lecteur, chère lectrice, Nous travaillons sur une nouvelle interface de commentaires afin de vous abandonner le plus grand confort pour dialoguer. Merci de votre patience.
Le magazine en format numérique
Lire le magazine Les plus lus