Le New York Times en a marre des intelligences artificielles qui pillent son contenu. Pour se protéger des robots qui arpentent le web pour alimenter les grand modèles de langages, le célèbre quotidien américain a mis ses conditions d’utilisation à jour.
Le New York Times utilise l’outil d’IA de Google qui pourrait écrire cet article, dans le même temps il empêche les intelligences artificielles d’utiliser son contenu pour s’entraîner. Repéré par Adweek, le très respecté quotidien américain a mis à jour ses conditions d’utilisation le 3 août, afin d’interdire l’utilisation de son contenu.
Les entreprises de la tech ne pourront plus y récupérer ni texte, ni photos, ni vidéo ou audio dans le développement de “tout logiciel, y compris, mais sans s’y limiter, l’entraînement d’un système d’apprentissage automatique ou d’intelligence artificielle (IA)“. Le média aurait pu s’arrêter à la première phrase, mais préfère désigner explicitement les IA.
Le New York Times veut protéger son contenu des bots
Les conditions mises à jour précisent également que les robots d’indexation de sites web, conçus pour utiliser ces contenus ne peuvent être utilisés sans l’autorisation écrite de la publication. Des agrégateurs de contenus comme Yahoo News ou Feedly ne peuvent ainsi plus accéder à ses contenus sans l’autorisation du quotidien.
À lire > Netflix se fiche de la grève d’Hollywood et dépense à tout va dans l’intelligence artificielle
Le New York Times indique que le refus de se conformer à ces nouvelles restrictions pourrait entraîner des amendes ou des “pénalités“. On suppose qu’il attaquera donc en justice. Pourtant, le célèbre journal n’a pas modifié son fichier robots.txt, qui indique aux robots d’indexation des moteurs de recherche quelles URL peuvent être consultées. Une manière de tendre un piège aux entreprises de la tech pour leur coller un juteux procès ?
Le New York Times exploite aussi l’intelligence artificielle
Comme mentionné en début d’article, le New York Times explore les possibilités offertes par l’IA, tout en lui interdisant son contenu. Ainsi, le célèbre quotidien américain joue sur les deux tableaux pour sortir toujours vainqueur. Une stratégie du passager clandestin qui pourrait s’avérer payante, alors que le métier de journaliste est bien haut dans le classement des métiers les plus menacés par ChatGPT.
Récemment, Google révélait collecter des données publiques sur le web pour former ses IA, tels que le chatbot Bard. De même, de nombreux grands modèles de langage alimentant des services tels que ChatGPT sont formés sur de vastes ensembles de données. Ceux-ci contiennent notamment des documents protégés par le droit d’auteur, récupérés sur le web sans l’autorisation du créateur d’origine. Voilà peut-être pourquoi le New York Times prend des mesures de rétorsion.
Source : Adweek