Aujourd’hui, on parle de droit d’auteur, de littérature, et bien sûr, de nos amis les algorithmes. Attrapez donc votre café, asseyez-vous, et laissez-moi vous présenter le sujet du jour : le dilemme juridique dans lequel OpenAI se trouve suite à l’entraînement de son modèle de langage, ChatGPT, sur des livres, des centaines de milliers…
Les racines du problème : Une technologie pilleuse de bibliothèques
Il s’avère que Sarah Silverman, la comédienne et écrivaine, ainsi que d’autres auteurs, ont décidé de traîner OpenAI en justice. Pourquoi ? Parce que ChatGPT a eu la “brillante idée” d’être entraîné sur des données issues de bibliothèques numériques pas très catholiques, comme Z-Library et Bibliotik (des librairies pirates de millions d’ouvrages). Imaginez cela comme aspirer des livres entiers, par centaines de milliers, sans même un petit “s’il vous plaît” ou “merci.”
Selon les statistiques fournies dans la plainte, ChatGPT ne se contente pas de paraphraser ; il peut résumer des livres entiers lorsqu’on lui demande. Et ça, c’est un problème. Pas de crédit aux auteurs, pas de gestion des droits d’auteur. Bref, on touche là à des questions d’éthique et de légalité qui ne sont pas des moindres.
Quand la Tech joue avec les limites de la loi
À vrai dire, ce n’est pas la première fois qu’une entreprise de technologie flirte avec des questions juridiques. Mais ce qui est fascinant ici, c’est le carrefour entre la technologie, la loi, et l’éthique.
Certains experts, comme Lisa R. Lifshitz, avocate spécialisée dans le droit des technologies, affirment que ces affaires pourraient créer des précédents importants dans le domaine du droit d’auteur.
Maintenant, réfléchissons un peu. OpenAI a peut-être pensé qu’en traitant des volumes massifs de texte, les problèmes de droits d’auteur deviendraient négligeables, se diluant dans l’océan des données. Mais ce n’est pas si simple. Lorsqu’on parle d’éthique et de droit, les détails comptent.
Le futur des modèles IA : un océan de dilemmes Éthiques
La situation actuelle dévoile un futur truffé de dilemmes éthiques pour les modèles IA. Prenez, par exemple, Getty Images qui a poursuivi Stability AI pour avoir formé son modèle sur des “millions d’images protégées par le droit d’auteur.” On voit ici que l’appétit vorace de l’IA pour les données peut entrer en collision frontale avec les droits de propriété intellectuelle.
Les auteurs demandent des dommages et intérêts. Alors, comment quantifier le préjudice ? C’est là toute la complexité. D’autant plus que ces modèles d’apprentissage machine sont formés sur des ensembles de données gigantesques, dont la provenance peut être difficile à traquer.
Alors, à qui appartiennent les mots ?
Au final, toute cette histoire nous amène à une question brûlante : si un algorithme est capable de produire des textes qui ressemblent à des œuvres protégées par le droit d’auteur, à qui appartiennent ses mots ?
C’est un sujet de débat que je suis sûr va susciter de nombreuses discussions. Alors, que pensez-vous de cette zone grise entre le génie de l’IA et le sanctuaire du droit d’auteur ? Faudra-t-il que la politique change le droit d’auteur pour engager l’avènement des machines intelligentes ? Ou aurons-nous toujours des machines bridées pour respecter le génie humain avant tout ?
Pour ceux parmi vous, rédacteurs web, désireux d’explorer plus avant ces intersections entre rédaction et technologie, inscrivez-vous à notre mini-formation gratuite “Rédaction Web & IA : Explorez Le Potentiel De ChatGPT” pour en savoir un peu plus sur cet outil et son potentiel.
Cet article est intéressant ?
On veut tout savoir !
Note actuelle 5 / 5. Nombre de Vote : 1
Pas de notes pour l'instant. C'est à vous de jouer !
Fondateur du Cercle des Rédacteurs, Formateur, accompagnateur et podcasteur. vous n’avez pas fini de m’entendre !