Libérer la puissance de l’IA générative – Des données annotées à la nouvelle Joconde :

Le battage médiatique autour de l’IA générative est bien réel. Vous vous demandez peut-être ce que ce terme compliqué et futuriste signifie réellement, mais aussi comment cela fonctionne.

Pour ceux qui (comme moi) ne connaissent rien à ce sujet, il fait référence aux algorithmes d’apprentissage automatique non supervisés et semi-supervisés qui permettent aux appareils d’utiliser du contenu existant tel que des images, de l’audio, du texte, des vidéos, voire du code, pour créer de nouveaux contenus. L’idée principale est de générer des artefacts originaux qui paraîtraient réels, et tout cela grâce aux données.

Vous êtes toujours confus ? Permettez-moi de vous donner un exemple simple pour mieux comprendre : J’ai essayé de générer du contenu sur une plateforme d’IA générative (le célèbre Dall-E-2) en saisissant les mots « citrons » et « support client ». J’ai attendu quelques secondes et me voici en train de faire défiler des images et des vidéos générées de citrons portant des casques ou répondant au téléphone.

Cependant, cela n’est pas aussi simple qu’il n’y paraît.

Les algorithmes d’IA générative nécessitent une énorme quantité de données d’entraînement pour effectuer des tâches, car ils combinent du contenu qu’ils connaissent déjà, principalement grâce à l’annotation des données. L’annotation des données est un processus essentiel de marquage des données pour les rendre utilisables par les systèmes d’intelligence artificielle.

Sans les annotateurs de données, l’intelligence artificielle n’existerait tout simplement pas.

Ce que je veux aussi souligner, c’est qu’il n’y a pas encore de conscience artificielle. L’IA générative ne crée pas une œuvre d’art parce qu’elle sait qu’elle est jolie ou à cause des jolies couleurs, non, elle crée simplement du contenu en se basant sur les données qu’elle comprend, en établissant des connexions entre ces concepts. Et tout cela est rendu possible grâce à l’annotation.

Néanmoins, voici les risques qui se posent.

Quels sont les risques liés à l’IA générative ?

Avez-vous déjà entendu parler du « saumon nageant dans la rivière » ? Ou peut-être avez-vous déjà vu l’image ci-dessous sur les plateformes de médias sociaux :

Sur cette image, vous pouvez sans aucun doute observer un saumon « nageant » dans la rivière. Cependant, l’état de ce pauvre saumon n’a pas clairement été compris par l’IA générative. Vous pouvez donc voir un appétissant morceau de saumon flotter dans une rivière.

Alors, devons-nous vraiment faire confiance à l’IA générative ? Peut-elle être fiable ?

Il ne suffit pas de mener une annotation superficielle et d’attendre que l’IA générative se développe et devienne plus efficace. Non, une annotation de qualité nourrit une IA générative de qualité. Ainsi, avec plus de données, l’incident du « saumon » pourrait être évité. Voici l’importance d’une annotation de qualité.

En fait, les réseaux neuronaux ont le pouvoir de réaliser des choses incroyablement importantes.

Salmon swimming generative AI and data annotation
Source: Reddit

Prenons l’exemple du jour où une armée a utilisé des réseaux neuronaux pour distinguer les chars camouflés des forêts ordinaires. Elles ont été confrontées à un problème. Les images des chars avaient été prises les jours nuageux, tandis que les images des forêts les jours ensoleillés. Le réseau neuronal était capable de distinguer les jours ensoleillés des jours nuageux au lieu de la présence ou non des chars. Il avait appris la mauvaise méthode pour différencier les deux.

Néanmoins, malgré les erreurs, il ne peut être contesté que l’IA générative a des applications dans de nombreux domaines, notamment le marketing, l’éducation, les soins de santé et le divertissement.

Quels sont les cas dans lesquels on utilise l’IA générative ?

Santé

Vous avez encore des doutes quant au pouvoir de l’IA générative ? Et si je vous disais qu’elle peut désormais détecter précocement la cécité chez les patients diabétiques ?

Les diabétiques peuvent subir plusieurs effets indésirables à long terme, notamment la rétinopathie. Il s’agit de l’obstruction progressive de la rétine d’un patient au point d’entraîner une altération de la vision. Les applications basées sur l’IA générative peuvent évaluer des millions d’images de patients atteints de rétinopathie avant de générer de nouveaux ensembles de données couvrant tous les scénarios. Ces ensembles de données montrent également à quoi ressemble la rétinopathie à un stade précoce chez les patients. Une fois cela accompli, les ophtalmologistes peuvent prendre des mesures préventives pour traiter la rétinopathie diabétique chez les patients, voire l’éradiquer.

La technologie de l’IA générative, telle qu’observée dans le domaine de la santé, peut générer une grande variété de résultats grâce aux données qui lui sont fournies. Cette fonctionnalité est essentielle pour les soins de santé. Les corps humains et animaux présentent plusieurs complexités qui nécessitent l’utilisation de données existantes pour en créer de nouvelles.

Vous avez peut-être réalisé que les algorithmes d’apprentissage automatique ont besoin de dizaines de milliers d’ensembles de données pour effectuer différentes tâches. Ils ont également besoin d’annotations de données précises. À quel point serait-il dangereux de commettre des erreurs dans le domaine de la santé, par exemple ?

Art

Generative AI natural history
Source: V7

Comme on peut le voir, l’IA générative peut être utilisée dans divers domaines, y compris les arts. Le projet « Artificial Natural History » (2020), qui examine la vie artificielle spéculative à travers le prisme d’un « livre d’histoire naturelle qui n’a jamais existé » de Sofia Crespo, est un exemple intrigant de l’utilisation de l’IA moderne pour créer de l’art.

L’auteur a créé des séries déformées de créatures aux caractéristiques imaginées qui nécessitent de nouveaux ensembles de classifications biologiques.

Ci-dessous, vous pouvez trouver des exemples de créatures générées par l’IA dans « Artificial Natural History ».

Musique

Lorsqu’un chanteur décède, les fans spéculent toujours sur la musique qu’il aurait pu créer s’il avait vécu. Parfois, de nouvelles chansons apparaissent même après la mort d’un chanteur, comme « Face it Alone » (2022) de Queen, qui présente des enregistrements inédits de Freddie Mercury, 31 ans après sa mort.

Et si nous pouvions entendre leur voix, peu importe l’année, avec de véritables nouvelles chansons ?

Et si c’était réellement possible ? Non… et si cela s’était déjà produit ?

Une organisation a créé une « nouvelle » chanson de Nirvana intitulée « Drowned in the Sun ». Ils ont utilisé un logiciel d’intelligence artificielle pour approximer l’écriture de chansons du chanteur-guitariste. Mis à part les voix, interprétées par Eric Hogan, le chanteur d’un groupe hommage à Nirvana, les créateurs de la chanson admettent que tout le reste de la chanson est le travail d’un ordinateur.
« Lost Tapes of the 27 Club » est un projet qui présente des chansons écrites et interprétées par des machines. Ils sont inspirées par des musiciens décédés à l’âge de 27 ans : Jimi Hendrix, Amy Winehouse, Jim Morrison, etc. Chaque chanson est le résultat d’une machine analysant 30 chansons de chaque chanteur et étudiant toutes leurs facettes afin de deviner à quoi ressembleraient leurs nouvelles compositions.

Vous trouverez ci-dessous quelques exemples de chansons crées par des IA :

Pour plus d’informations, visitez ce site.

Il existe plusieurs cas d’utilisation de l’IA générative. Elle peut créer du contenu totalement nouveau en utilisant des ensembles de données existantes, ouvrant ainsi dans le futur la voie à l’apprentissage automatique.

D’autres estiment que la plus grande opportunité dans l’IA générative réside dans le domaine du langage :

Dans les années à venir, la génération de textes par l’IA créera beaucoup plus de valeur que la génération d’images par l’IA. La capacité des machines à générer du langage (écrire et parler) s’avérera bien plus transformatrice que leur capacité à générer du contenu visuel.

Acteurs de l’industrie de l’IA générative

La gamme d’applications de l’IA générative continue de s’étendre, avec un taux de croissance annuel composé (TCAC) prévu de 19,8% de 2022 à 2027 (Imarc, 2022). De nouveaux acteurs construisant l’avenir de l’IA générative émergent constamment grâce à la disponibilité d’outils open-source et d’API qui leur permettent de gérer tous les types de contenu. Par exemple, dans le paysage ci-dessous présenté par Sonya Huang, associée générale chez Sequoia Capital, qui a également publié un rapport détaillé sur le sujet.

Source: Twitter Post

Limites à la propriété intellectuelle

L’IA générative peut créer n’importe quel contenu. Cependant, il est important de discuter des « zones grises ». Aujourd’hui, les humains et les machines ne rivalisent pas dans le même domaine. Les humains ont de petites poches subconscientes qui contiennent leurs expériences limitées de la vie. Les systèmes d’IA, eux, ont des réservoirs massifs de connaissances. Ils détiennent les connaissances et les données de milliards d’êtres humains, ce qui crée une inégalité de connaissances.

Il pourrait être facile de dire que le contenu créé par une IA générative peut être séparé du travail créé par un humain, mais ce n’est pas toujours le cas. Les êtres humains sont désormais capables de produire une partie de leur travail ou de le peaufiner avec l’aide de l’IA. Cela nous ramène à la « zone grise ». Le contenu a-t-il été créé par un humain ou par une machine ?

Plusieurs entreprises travaillent à la conception de systèmes pouvant être utilisés pour traiter les zones grises et la désinformation. L’objectif est de garantir que les créateurs soient reconnus pour leur travail et que les gens puissent comprendre l’origine et les méthodes utilisées pour produire le contenu.

Ainsi, le terme « IA responsable » est né. Des systèmes mis en place permettent à quiconque de savoir d’où provient chaque pièce de contenu digital et si une IA générative a été utilisée ou non.

Les artistes resteront des artistes, peu importe le développement de l’IA générative. Il reste encore beaucoup de chemin à parcourir avant que les machines ne prennent le contrôle de notre créativité et de nos émotions (espérons-le) !

Alors, comment The Nest peut-elle aider l‘IA générative à donner le meilleur d’elle-même ?

Nous annotons, étiquetons, segmentons et enrichissons vos données afin de construire et entraîner vos solutions d’intelligence artificielle :

  • Annotation de tous les types de données, y compris le texte, les images, la vidéo, la 3D et le LiDAR, l’audio, etc
  • Classification des données, analyse des sentiments, annotation spécialisée
  • Annotateurs de données, utilisant la vision par ordinateur et le traitement du langage naturel
  • Processus robustes et normes de qualité
Contactez-nous