Les contenus créés à l’aide de l’IA générative apparaissent partout, inquiétant certains artistes et créateurs de contenu. Ils craignent que leur propriété intellectuelle ne soit menacée si des outils d’IA sont créés pour collecter et générer des données et des images à partir d’Internet, avec ou sans autorisation.
Certains artistes et créateurs de contenu expérimentent désormais de nouvelles façons de contrecarrer l’IA afin de l’empêcher de détruire leur travail par ce que l’on appelle l’empoisonnement des données.
Dans cet épisode du podcast The Conversation Weekly, nous discutons du fonctionnement de l’empoisonnement des données, de son impact et de l’éthique plus large au cœur de l’informatique que les problèmes d’empoisonnement des données cherchent à résoudre. Nous discutons avec les informaticiens des raisons pour lesquelles ils pensent. cela fait partie du problème. Science.
Dan Angus aime jouer avec l’IA générative. Informaticien de formation, il est actuellement professeur de communications numériques à l’Université de technologie du Queensland, en Australie, et est un profond penseur de l’IA, de l’automatisation et de son impact sur la société. Il s’inquiète de ce que les nouveaux outils d’IA générative signifieront pour les créateurs.
Nous devons être conscients de la manière dont ils peuvent infiltrer l’ensemble de l’écosystème de propriété intellectuelle et financier qui soutient l’art et les artistes.
Ces dernières années, un certain nombre de cas de violation du droit d’auteur ont fait surface, dans lesquels des artistes accusent de grandes entreprises technologiques de voler leurs œuvres.
Lorsqu’Angus a parlé à Conversation Weekly, il a inspiré le populaire générateur d’images texte IA pour créer une série d’images. Il s’agit d’une image d’une personne chevauchant un taureau spatial dans un environnement martien, dans le style de Van Gogh. Les images qu’il crée sont reconnaissables, quoique plutôt bizarres.
Image créée via une invite vers Midjourney. Capture d’écran prise par The Conversation. Fourni par l’auteur (ne peut pas être réutilisé)
Mais si le générateur d’images était construit à partir de données « empoisonnées », les images produites pourraient être encore plus étranges. Par exemple, un cheval pourrait être utilisé à la place d’un taureau, ou cela pourrait ne pas ressembler du tout à un environnement martien.
Angus a expliqué que les artistes qui choisissent de contaminer leurs données de cette manière peuvent insérer de minuscules pixels dans l’image numérique qui sont invisibles à l’œil nu, mais que l’IA générative peut ne plus fonctionner. Cela peut « complètement fausser la formation d’un modèle dans une certaine direction », a-t-il déclaré, ajoutant qu’« il n’en faut pas beaucoup pour entrer dans le système et faire des ravages ».
L’un de ces outils, appelé Nightshade, a été publié en janvier 2024 par une équipe de l’Université de Chicago. L’équipe de l’université a déclaré à The Conversation que l’outil avait été téléchargé 250 000 fois au cours de la première semaine de sortie. D’autres outils sont également disponibles et peuvent être utilisés pour créer de l’audio et de la vidéo.
Angus ne pense pas que ce type d’empoisonnement des données aura un impact majeur sur les sociétés d’IA générative les plus populaires, principalement en raison de leur taille limitée. Mais il s’inquiète du fait que la culture informatique axée sur la fin plutôt que sur les moyens signifie que les droits de propriété intellectuelle sont souvent ignorés.
Cela crée une certaine attitude envers les données selon lesquelles les données trouvées leur appartiennent. Si vous pouvez le trouver en ligne et le télécharger, c’est un jeu équitable et vous pouvez l’utiliser pour entraîner votre algorithme. Ce n’est pas grave, car généralement la fin justifie les moyens.
Il estime que « des problèmes culturels très profonds » dans la façon dont les informaticiens et les développeurs traitent les données et génèrent des ensembles de données pourraient conduire à des problèmes plus importants à l’avenir.
Écoutez l’interview complète de Dan Angus sur le podcast The Conversation Weekly. Le podcast présente également Eric Smalley, rédacteur scientifique et technologique chez The Conversation aux États-Unis.
Une transcription de cet épisode sera bientôt disponible.
Cet épisode de The Conversation Weekly a été écrit par Katie Flood avec l’aide de Mend Mariwany à la production. Gemma Ware sera la productrice exécutive. La conception sonore a été réalisée par Eloise Stevens et le thème musical par Neeta Sarl. Stephen Khan est le rédacteur en chef mondial, Alice Mason gère les médias sociaux et Soraya Nandy s’occupe de la transcription.
Vous pouvez nous trouver sur Instagram à theconversationdotcom ou par email. Vous pouvez également vous abonner au courrier électronique quotidien gratuit de The Conversation ici.
Écoutez The Conversation Weekly en utilisant l’une des applications ci-dessus, téléchargez-la directement depuis notre flux RSS ou découvrez comment l’écouter ici.