AI generativă – Inteligență artificială care reînnoiește conținutul vechi într-un mod diferit

Publicat: 2022-04-20

Noua eră viitoare a tehnologiei este gata să ne aducă o tehnologie care nu numai că poate observa tiparul de bază al conținutului vechi, ci poate și produce conținut nou similar cu baza sa, dar diferit la început.
„Generative AI” este acea tehnologie care permite computerelor să înțeleagă modelul de bază asociat cu o intrare și apoi să genereze material comparabil pe baza acelui model.

Ce este AI generativ?

Generative AI este un algoritm de inteligență artificială care permite crearea de noi materiale credibile din conținutul existent, cum ar fi text, înregistrări audio sau fotografii. Cu alte cuvinte, permite computerelor să abstragă modelul de bază asociat intrării și apoi îl folosește pentru a genera material similar.

Pentru a crea conținut nou utilizând text, fișiere audio sau imagini existente, diferite tehnici utilizate, care sunt:

Rețele adverse generative (GAN) :

GAN-urile sunt modele generative în care două rețele neuronale, un generator și un discriminator, sunt angajate una împotriva celeilalte. Generatorul, cunoscut și ca o rețea generativă, este o rețea neuronală care generează date sau conținut noi care este similar cu datele sursă. Discriminatorul, cunoscut și ca o rețea discriminativă, este o rețea neuronală care distinge între sursă și datele generate.

Ambele rețele neuronale sunt antrenate în cicluri alternante, generatorul învățând să producă date mai realiste, iar discriminatorul învățând să facă distincția între datele false și cele reale.

Ca o relație între un hoț și un ofițer de poliție, amândoi care învață de la sine noi moduri de a-și pune în aplicare îndatoririle. Thief încearcă să găsească noi modalități de a jefui lucruri și ofițer în paralel pentru a reduce actele de furt. Fiecare dintre ei îmbunătățește treptat cealaltă parte ca urmare a eforturilor lor.

GAN implementează datele MNIST
GAN implementează datele MNIST (Credit: Thalles Silva)

Transformatoare :

Transformatoarele sunt un tip particular de arhitectură de rețele neuronale. Pentru a rezuma, rețelele neuronale sunt un instrument puternic pentru evaluarea tipurilor de date complexe, cum ar fi fotografii, videoclipuri, audio și text.

Cu cuvinte simple, ele pot chiar replica sau chiar rescrie modele scrise de mână umană.

Transformatori precum GPT-3, LaMDA și Wu-Dao reproduce atenția cognitivă prin măsurarea relevanței pieselor de date de intrare în moduri diferite. Aceștia sunt învățați să recunoască limba sau imaginea, să facă unele sarcini de clasificare și să genereze texte sau imagini din seturi mari de date.

Schema transformatorului din hartia originala
Schema transformatorului din hartia originala

Auto-codificatoare variaționale :

Codificatorul convertește datele în cod comprimat, pe care decodorul îl decodifică și reproduce datele originale.
Această reprezentare comprimată stochează distribuția datelor de intrare într-o reprezentare dimensională considerabil redusă dacă este aleasă și antrenată corect.

Implementarea și aplicațiile AI generative

Reproducerea fotografiilor reale:

AI generativ poate reproduce replica din lumea reală cu unele variații în fotografii. Orice lucru care este o imagine poate fi replicat într-o bază similară, dar arată diferit de cea originală, în funcție de intrarea pe care o oferim.

implementarea GAN-urilor pentru a crea noi mostre de date
Implementarea GAN-urilor pentru a crea noi eșantioane de date pentru setul de date cu cifre scrise de mână MNIST, setul de date de imagini cu obiecte mici CIFAR-10 și baza de date Toronto Face a fost discutată în lucrarea lui Ian Goodfellow „Generative Adversarial Networks” publicată în 2014.

Ei pot crea cifre care par a fi scrise de mână și chipuri care seamănă cu oameni reali.

Creșterea progresivă a GAN-urilor pentru îmbunătățirea calității, stabilității și variației
Imagine: Creșterea progresivă a GAN-urilor pentru o calitate, stabilitate și variație îmbunătățite, 2017

Tero Karras a demonstrat producția de imagini realiste ale fețelor umane în lucrarea sa „Progressive Growing of GANs for Improved Quality, Stability, and Variation” publicată în 2017. Generațiile de fețe au fost educate pe exemple celebre, ceea ce înseamnă că unele fețe au anumite trăsături de celebritate. și astfel par familiare.

Reconversia imaginilor

Conversia zi la noapte
Conversia zi la noapte
Vedere prin satelit la vedere simplă
Vedere prin satelit la vedere simplă
Pictură la variații
Pictură la variații
Sinteză text în imagini foto-realiste folosind rețele adversare generative stivuite

Sinteză text în imagini foto-realiste utilizând rețele adverse generative stivuite (StackGAN)
Raw To Real și invers
Raw To Real și invers
Schiță la real
Schiță la real
Face View Generation
Face View Generation : Profil în stânga, cel sintetizat în mijloc, fața frontală a adevărului la sol în dreapta
Imagine pentru Avatar
Imagine pentru Avatar
Aging Apps care recreează imagini tinere
Aging Apps care recreează imagini tinere

În lumea divertismentului : atunci când este declanșată de imprimarea 3D, CRISPR și alte tehnologii, AI generativă poate fi folosită și pentru a crea produse de la zero.

Tehnologia deep fake este folosită pentru a localiza (dublare și filtrare) materialul în timp ce îl distribuie în întreaga lume. Vocea artistului/actorului original poate fi asociată cu o sincronizare a buzelor folosind sinteza feței și clonarea vocii.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed.

Avantaje și Beneficii

IA generativă are numeroase avantaje, inclusiv capacitatea de a asigura dezvoltarea unor rezultate de calitate superioară prin auto-învățare din fiecare set de date.
- Mutarea pericolelor unui proiect la un nivel inferior
- Consolidarea modelelor de învățare automată pentru a le face mai puțin părtinitoare
-Predicție profundă fără a fi nevoie de senzori
-Utilizarea deepfakes pentru a permite localizarea și regionalizarea conținutului
-Permite roboților să înțeleagă concepte mai abstracte atât în ​​simulare, cât și în viața reală.

Ceea ce este benefic în

  • Protecția identității: Oamenii care nu doresc să-și dezvăluie identitatea atunci când intervievează sau lucrează pot folosi avatarurile AI generative pentru a-și ascunde identitățile.
  • Controlul roboticii: modelarea generativă ajută la consolidarea modelelor de învățare automată în înțelegerea unor concepte mai abstracte în simulare și în lumea reală.
  • Asistență medicală: IA generativă permite detectarea precoce a potențialului răutate și dezvoltarea de terapii eficiente. GAN-urile, de exemplu, calculează mai multe unghiuri ale unei imagini cu raze X pentru a vizualiza expansiunea potențială a tumorii.

Câteva Provocări

  • Securitate: Unele persoane pot folosi AI generativ pentru motive nefaste, cum ar fi fraudarea altora.
  • Supraestimarea capacităților: pentru a îndeplini sarcinile, algoritmii generativi de inteligență artificială necesită o cantitate masivă de date de antrenament. GAN-urile, pe de altă parte, nu pot genera imagini sau fraze complet noi. Pur și simplu pun împreună ceea ce știu în moduri diferite.
  • Rezultate neașteptate: este dificil de controlat comportamentul unor modele de IA generativă, cum ar fi GAN-urile. Se comportă neregulat și oferă un rezultat neașteptat.
  • Confidențialitatea datelor: confidențialitatea datelor la nivel individual este o problemă în aplicațiile legate de sănătate.