Tentative de rattrapage dans le domaine du droit d’auteur
La technologie d’IA générative devance la loi. En réponse, des organes de presse ont intenté une action en justice pour protéger le contenu qu’ils produisent, et par le fait même, jette de la lumière sur une zone grise de la loi
Dans une affaire qui pourrait aider le système juridique à combler le retard dans une course où la technologie devance la loi, six entreprises médiatiques canadiennes ont intenté une poursuite conjointe contre OpenAI, le créateur de ChatGPT, pour violation du droit d’auteur.
Les médias en question, soit CBC/Radio-Canada, La Presse canadienne, The Globe and Mail, Postmedia, The Toronto Star et Metroland, ont déposé leur déclaration devant la Cour supérieure de justice de l’Ontario la semaine dernière.
L’exposé allègue qu’OpenAI a pris des parties importantes de contenu d’actualité pour ses données de formation sans tenir compte des droits d’auteur ou de conditions d’utilisation, ce qui a entraîné des conséquences pour les médias impliqués dans la poursuite et des avantages pour OpenAI, dont la valeur est actuellement évaluée à quelque 157 milliards de dollars.
« OpenAI a tiré profit du succès commercial de ses modèles GPT, en construisant une série de produits et de services basés sur GPT et en amassant des capitaux importants, le tout sans obtenir de licence valide de la part de l’une ou l’autre des sociétés de médias d’information », a soumis par courriel Sana Halwani, associée chez Lenczner Slaght LLP et avocate principale de la requête.
Les entreprises médiatiques canadiennes réclament des dommages-intérêts punitifs et tout profit tiré de l’utilisation du contenu protégé par le droit d’auteur.
« [Les organes de presse] veulent simplement être indemnisés pour ce qu’OpenAI a pris et l’empêcher de continuer à prendre leur contenu sans autorisation », a ajouté Me Halwani.
Cette affaire représente le plus récent développement d’une série de poursuites judiciaires alors que les médias, ainsi que d’autres fournisseurs de contenu du Canada et d’ailleurs, tentent de se situer dans le vaste domaine encore inexploré de l’IA générative.
À l’heure actuelle, la loi canadienne sur le droit d’auteur ne traite pas explicitement de l’intelligence artificielle. Les éditeurs et les créateurs ont critiqué à maintes reprises l’utilisation non autorisée de leur contenu pour former des systèmes d’IA générative et ont exhorté le gouvernement à agir. Bien qu’il y ait eu des consultations publiques sur la question de savoir si la loi sur le droit d’auteur devrait être modifiée pour remédier à la situation, à ce jour aucun changement n’a été apporté.
Cela ne veut pas dire que la loi n’est pas pertinente dans cette poursuite, affirme Jay Kerr-Wilson, associé chez Fasken à Ottawa et chef du groupe de pratique du droit d’auteur du cabinet. Au-delà du droit de reproduction exclusive, les parties pertinentes de la législation comprennent des dispositions relatives aux reproductions temporaires à des fins technologiques, ainsi qu’à la copie non autorisée dans le cadre d’une utilisation équitable à des fins particulières.
Dans certains cas, l’utilisation de contenu pour des données de formation peut violer les droits d’auteur si les données de sortie sont une copie directe d’une partie du contenu utilisé dans la formation, dit Me Kerr-Wilson. Ce type de copie a été cité dans le procès intenté par le New York Times contre OpenAI à la fin de 2023. Cette plainte comprenait des exemples où le robot conversationnel avait produit des extraits presque textuels de nouvelles du journal (OpenAI a répondu par une déclaration qualifiant cela de « régurgitation » et a dit travailler sur ce dossier).
Me Kerr-Wilson croit que cela devient plus délicat dans les situations où les données de sortie sont fortement influencées par le contenu utilisé dans la formation sans constituer une copie exacte. Cela semble être le cas dans la poursuite canadienne, puisque la revendication ne comprend pas d’exemples de copie textuelle. La revendication affirme que le contenu de nouvelles a été utilisé dans des données de formation, bien qu’elle indique que les détails complets font partie des connaissances d’OpenAI, et non des organes de presse.
Dans une déclaration fournie à ABC National, OpenAI a soutenu que ses modèles sont formés à partir de données accessibles au public et qu’ils « se fondent sur l’utilisation équitable et sur des principes internationaux du droit d’auteur qui sont justes pour les créateurs et qui favorisent l’innovation ».
Michael Duboff, avocat spécialisé dans le droit du divertissement chez Edwards Creative Law, dit que les gens confondent parfois utilisation loyale (qui s’applique aux États-Unis) et utilisation équitable. Le fait qu’il s’agisse d’une poursuite au Canada est important, car l’utilisation équitable est un principe beaucoup plus restrictif que l’utilisation loyale. Aux États-Unis, la liste des provisions est illustrative, mais la contrepartie canadienne — qui comprend la recherche, l’éducation, la critique et les reportages — est exhaustive.
« C’est un système beaucoup plus rigide où l’utilisation doit entrer dans l’une de ces catégories définies pour ne pas constituer une violation du droit d’auteur, dit-il. Cela peut finir par avoir un grand rôle à jouer dans la façon dont cette poursuite se déroule et, si elle se rend au jugement, dans la façon dont la décision sera exprimée. »
Cela dit, ce qui compte comme une utilisation équitable au Canada n’est pas clair. Certains spécialistes juridiques font valoir que l’utilisation de contenu par OpenAI pour générer un profit finit par l’exclure de l’utilisation équitable. Me Duboff fait remarquer qu’un des facteurs qui permet de déterminer l’utilisation équitable est la mesure dans laquelle cette utilisation est préjudiciable pour l’œuvre originale.
Il s’agirait « d’un aspect assez fondamental dans ces cas, car OpenAI et ChatGPT sont à but lucratif », dit-il.
Cependant, le simple fait qu’une entreprise en tire profit ne signifie pas nécessairement que faire une copie — par exemple, à des fins de recherche — est interdit, souligne Robert Diab, professeur de droit à l’Université Thompson Rivers, qui écrit sur la technologie.
« Pour décider si certains comportements tombent sous le coup de l’une des exceptions prévues par la loi en matière d’utilisation équitable, le tribunal utilise un ensemble de facteurs. »
Il mentionne une affaire intentée en 2004 contre le Barreau du Haut-Canada par des éditeurs juridiques. La question en litige était la photocopie de recueils de jurisprudence par le l’ordre juridique à la demande de cabinets. Même si les fins des cabinets étaient commerciales, la Cour suprême a conclu que la copie était une sorte de recherche qui comptait comme une utilisation équitable.
Le tribunal devra essentiellement trancher deux questions, selon Me Diab. Premièrement, la question de savoir si l’extraction de données constitue une copie — par opposition à la lecture, comme une personne pourrait le faire — et deuxièmement, si cette copie relève de l’utilisation équitable.
« Si je visite votre site Web et que je fais du copier-coller avec du contenu pour former mon modèle linguistique, est-ce que j’en fais une utilisation non autorisée? Il ne s’agit pas d’une question que des tribunaux de common law de partout au monde ont traitée directement », dit-il.
L’aspect trouble des grands modèles de langage eux-mêmes est à la base de cette difficulté. Lorsque même les créateurs ne comprennent pas pleinement le fonctionnement de leurs modèles, établir le degré d’influence légalement défendable et déterminer la mesure dans laquelle du travail peut être orienté par d’autre contenu avant qu’il ne devienne une copie est bien difficile, dit Me Kerr-Wilson.
« L’IA va remettre en question de nombreuses notions du droit d’auteur. »
Me Diab est d’avis que les médias font face à un combat ardu dans ce domaine. Compte tenu de la pression financière qu’ils subissent, il y a une incitation à trouver un règlement, comme l’ont fait des organes de presse aux États-Unis.
« Ils auront à prouver d’une part que leur matériel a été extrait dans le cadre d’un processus de création de différents modèles de langage et, d’autre part, la proportion des profits qu’OpenAI a réalisés qui peut y être attribuée. C’est très complexe. »
Malgré cela, il y a toujours de bonnes raisons pour les médias de chercher à obtenir un jugement. Leur cas n’est que l’un des nombreux cas en cours à l’heure actuelle. En plus de la poursuite du Times, d’autres plaintes ont été déposées par des artistes visuels, des éditeurs et des maisons de disques. Il y a aussi une cause type qui demande à la Cour fédérale du Canada de déterminer si l’IA peut être considérée comme un auteur en vertu de la loi canadienne sur le droit d’auteur. Au sud de la frontière, les tribunaux ont déjà statué que ce n’est pas le cas.
Sans décisions dans ces causes, Me Duboff croit que nous errons dans une zone grise, sans réponse claire sur la façon dont la loi sur le droit d’auteur s’applique dans chaque territoire de compétence. La technologie a dépassé de loin les lois censées protéger les médias et d’autres sources humaines d’art et d’information.
« Ces procès sont le mécanisme qui permet de rattraper le retard de la loi. »