IA générative - L'intelligence artificielle qui renouvelle l'ancien contenu d'une manière différente

Publié: 2022-04-20

La nouvelle ère technologique à venir est prête à nous apporter une technologie qui non seulement peut observer le modèle sous-jacent des anciens contenus, mais peut également produire de nouveaux contenus similaires à sa base mais différents dans le frontal.
L'« IA générative » est cette technologie qui permet aux ordinateurs de comprendre le modèle sous-jacent associé à une entrée, puis de générer un matériau comparable basé sur ce modèle.

Qu'est-ce que l'IA générative ?

L'IA générative est un algorithme d'intelligence artificielle qui permet la création de nouveau matériel crédible à partir de contenu existant tel que du texte, des enregistrements audio ou des photographies. En d'autres termes, il permet aux ordinateurs d'abstraire le modèle sous-jacent associé à l'entrée, puis de l'utiliser pour générer un matériau similaire.

Pour créer un nouveau contenu en utilisant du texte, des fichiers audio ou des images existants, diverses techniques sont utilisées :

Réseaux antagonistes génératifs (GAN) :

Les GAN sont des modèles génératifs dans lesquels deux réseaux de neurones, un générateur et un discriminateur, sont engagés l'un contre l'autre. Le générateur, également appelé réseau génératif, est un réseau de neurones qui génère de nouvelles données ou du contenu similaire aux données source. Le discriminateur, également appelé réseau discriminatif, est un réseau de neurones qui fait la distinction entre les données source et générées.

Ces deux réseaux de neurones sont formés en cycles alternés, le générateur apprenant à produire des données plus réalistes et le discriminateur apprenant à distinguer les fausses données des vraies.

Comme une relation entre un voleur et un policier, chacun apprenant de son côté de nouvelles façons d'exercer ses fonctions. Le voleur essaie de trouver de nouvelles façons de voler des choses et l'officier parallèlement pour réduire les actes de vol. Chacun d'eux améliore progressivement l'autre côté grâce à ses efforts.

GAN mettant en œuvre les données MNIST — *GAN implémentant les données MNIST (Crédit : Thalles Silva)*

Transformateurs :

Les transformateurs sont un type particulier d'architecture de réseau neuronal. En résumé, les réseaux de neurones sont un outil puissant pour évaluer des types de données complexes tels que des photos, des vidéos, de l'audio et du texte.

En termes simples, ils peuvent même reproduire ou même réécrire des modèles écrits à la main par des humains.

Des transformateurs comme GPT-3, LaMDA et Wu-Dao reproduisent l'attention cognitive en mesurant la pertinence des données d'entrée de différentes manières. Ils apprennent à reconnaître le langage ou l'image, à effectuer certaines tâches de classification et à générer des textes ou des images à partir de grands ensembles de données.

*Schéma du transformateur de l'article original*

Auto-encodeurs variationnels :

L'encodeur convertit les données en code compressé, que le décodeur décode et reproduit les données d'origine.
Cette représentation compressée stocke la distribution des données d'entrée dans une représentation dimensionnelle considérablement réduite si elle est choisie et entraînée correctement.

Implémentation et applications de l'IA générative

Reproduction de photographies réelles :

L'IA générative peut reproduire des répliques du monde réel avec quelques variations dans les photographies. Tout ce qui est une image peut être reproduit dans une base similaire mais semble différent de l'original en fonction de l'entrée que nous fournissons.

La mise en œuvre de GAN pour créer de nouveaux échantillons de données pour l'ensemble de données de chiffres manuscrits du MNIST, l'ensemble de données d'images de petits objets CIFAR-10 et la base de données de visages de Toronto a été discutée dans l'article de Ian Goodfellow "Generative Adversarial Networks" publié en 2014.

Ils peuvent faire des chiffres qui semblent être écrits à la main et des visages qui ressemblent à de vraies personnes.

*Image : Croissance progressive des GAN pour une qualité, une stabilité et une variation améliorées, 2017*

Tero Karras a démontré la production d'images réalistes de visages humains dans son travail "Progressive Growing of GANs for Improved Quality, Stability, and Variation" publié en 2017. Les générations de visages ont été éduquées sur des exemples célèbres, ce qui signifie que certains visages ont certaines caractéristiques de célébrités et paraissent ainsi familiers.

Reconversion d'images

*Synthèse de texte en image photoréaliste à l'aide de réseaux antagonistes génératifs empilés (StackGAN)*

Génération de vue de face — **Face View Generation** : *Profil à gauche, le synthétisé au milieu, la face frontale vérité terrain à droite*

Image vers Avatar

*Des applications vieillissantes recréant de jeunes images*

Dans le monde du divertissement : lorsqu'elle est déclenchée par l'impression 3D, CRISPR et d'autres technologies, l'IA générative peut également être utilisée pour créer des produits à partir de zéro.

La technologie Deep Fake est utilisée pour localiser (doublage et filtrage) le matériel tout en le distribuant dans le monde entier. La voix de l'artiste/de l'acteur original peut être associée à une synchronisation labiale utilisant la synthèse faciale et le clonage de la voix.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

Avantages et bénéfices

L'IA générative présente de nombreux avantages, notamment la capacité d'assurer le développement de résultats de meilleure qualité grâce à l'auto-apprentissage à partir de chaque ensemble de données.
-Déplacer les aléas d'un projet à un niveau inférieur
-Renforcer les modèles d'apprentissage automatique pour les rendre moins biaisés
-Prédiction profonde sans avoir besoin de capteurs
-Utilisation de deepfakes pour permettre la localisation et la régionalisation du contenu
- Permettre aux robots de comprendre des concepts plus abstraits à la fois dans la simulation et dans la vie réelle.

Ce qui est bénéfique dans

Protection de l'identité : les personnes qui ne souhaitent pas révéler leur identité lors d'un entretien ou d'un travail peuvent utiliser des avatars d'IA générative pour masquer leur identité.
Contrôle robotique : la modélisation générative aide les modèles d'apprentissage automatique de renforcement à comprendre des concepts plus abstraits dans la simulation et dans le monde réel.
Santé : l'IA générative permet la détection précoce de malveillance potentielle et le développement de thérapies efficaces. Les GAN, par exemple, calculent plusieurs angles d'une image radiographique pour visualiser l'expansion potentielle de la tumeur.

Quelques défis

Sécurité : certaines personnes peuvent utiliser l'IA générative pour des motifs néfastes, comme frauder les autres.
Surestimation des capacités : pour accomplir des tâches, les algorithmes d'IA générative nécessitent une quantité massive de données d'entraînement. Les GAN, en revanche, sont incapables de générer des images ou des phrases entièrement nouvelles. Ils mettent simplement ce qu'ils savent ensemble de différentes manières.
Résultats inattendus : il est difficile de contrôler le comportement de certains modèles d'IA générative, tels que les GAN. Ils se comportent de manière erratique et fournissent un résultat inattendu.
Confidentialité des données : la confidentialité des données au niveau individuel est un problème dans les applications liées à la santé.