Generative AI – Intelligenza Artificiale che rinnova i vecchi contenuti in un modo diverso

Pubblicato: 2022-04-20

La nuova era della tecnologia in arrivo è pronta a portarci una tecnologia che non solo può osservare lo schema sottostante dei vecchi contenuti, ma può anche produrre nuovi contenuti simili alla sua base ma diversi nel front-end.
"AI generativa" è quella tecnologia che consente ai computer di comprendere il modello sottostante associato a un input e quindi generare materiale comparabile basato su quel modello.

Cos'è l'IA generativa?

L'IA generativa è un algoritmo di intelligenza artificiale che consente la creazione di nuovo materiale credibile da contenuti esistenti come testo, registrazioni audio o fotografie. In altre parole, consente ai computer di astrarre il modello sottostante associato all'input e quindi lo utilizza per generare materiale simile.

Per creare nuovi contenuti utilizzando testo, file audio o immagini esistenti, vengono utilizzate varie tecniche che sono:

Reti generative contraddittorio (GAN) :

I GAN sono modelli generativi in cui due reti neurali, un generatore e un discriminatore, sono coinvolti l'uno contro l'altro. Il generatore, noto anche come rete generativa, è una rete neurale che genera nuovi dati o contenuti simili ai dati di origine. Il discriminatore, noto anche come rete discriminativa, è una rete neurale che distingue tra dati di origine e generati.

Entrambe queste reti neurali vengono addestrate a cicli alternati, con il generatore che impara a produrre dati più realistici e il discriminatore che impara a distinguere tra dati falsi e reali.

Come una relazione tra un ladro e un agente di polizia che imparano entrambi per conto proprio nuovi modi di svolgere i propri compiti. Thief cerca di scoprire nuovi modi di rapinare cose e agenti parallelamente per ridurre gli atti di furto. Ognuno di loro migliora gradualmente l'altro lato come risultato dei loro sforzi.

GAN che implementa i dati MNIST — *GAN implementa i dati MNIST (Credit: Thalles Silva)*

Trasformatori :

I trasformatori sono un particolare tipo di architettura di rete neurale. Per riassumere, le reti neurali sono un potente strumento per valutare tipi di dati complessi come foto, video, audio e testo.

In parole semplici, possono persino replicare o persino riscrivere schemi scritti a mano da umani.

Transformers come GPT-3, LaMDA e Wu-Dao replicano l'attenzione cognitiva misurando la rilevanza dei dati di input in modi diversi. Viene insegnato loro a riconoscere la lingua o l'immagine, eseguire alcune attività di classificazione e generare testi o immagini da grandi set di dati.

*Diagramma del trasformatore dalla carta originale*

Autocodificatori variazionali :

Il codificatore converte i dati in codice compresso, che il decoder decodifica e riproduce i dati originali.
Questa rappresentazione compressa memorizza la distribuzione dei dati di input in una rappresentazione dimensionale notevolmente ridotta se viene scelta e addestrata correttamente.

Implementazione e applicazioni dell'IA generativa

Riproduzione di fotografie reali:

L'IA generativa può riprodurre repliche del mondo reale con alcune variazioni nelle fotografie. Tutto ciò che è un'immagine può essere replicato in una base simile ma ha un aspetto diverso da quello originale in base all'input che forniamo.

L'implementazione di GAN per creare nuovi campioni di dati per il set di dati di cifre scritte a mano MNIST, il set di dati di immagini di piccoli oggetti CIFAR-10 e il Toronto Face Database è stata discussa nel documento di Ian Goodfellow "Generative Adversarial Networks" pubblicato nel 2014.

Possono creare cifre che sembrano scritte a mano e volti che assomigliano a persone reali.

Crescita progressiva dei GAN per una migliore qualità, stabilità e variazione — *Immagine: crescita progressiva dei GAN per una migliore qualità, stabilità e variazione, 2017*

Tero Karras ha dimostrato la produzione di immagini realistiche di volti umani nel suo lavoro "Progressive Growing of GANs for Improved Quality, Stability, and Variation" pubblicato nel 2017. Le generazioni di volti sono state educate su esempi famosi, il che significa che alcuni volti hanno determinate caratteristiche di celebrità e quindi appaiono familiari.

Riconversione di immagini

*Dalla vista satellitare alla vista normale*

*Sintesi di immagini fotorealistiche da testo a fotorealistiche utilizzando reti contraddittorie generative impilate (StackGAN)*

Generazione vista frontale — **Face View Generation** : *Profilo a sinistra, il sintetizzato al centro, la faccia frontale della verità a terra a destra*

Immagine per Avatar

*App di invecchiamento che ricreano immagini giovani*

Nel mondo dell'intrattenimento : quando attivata dalla stampa 3D, CRISPR e altre tecnologie, l'IA generativa può essere utilizzata anche per creare prodotti da zero.

La tecnologia deep fake viene utilizzata per localizzare (doppiaggio e filtraggio) il materiale distribuendolo in tutto il mondo. La voce dell'artista/attore originale può essere abbinata a una sincronizzazione labiale utilizzando la sintesi facciale e la clonazione della voce.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed.

Vantaggi e benefici

L'IA generativa presenta numerosi vantaggi, inclusa la capacità di garantire lo sviluppo di output di qualità superiore mediante l'autoapprendimento da ogni set di dati.
-Spostare i rischi di un progetto a un livello inferiore
-Rafforzare i modelli di apprendimento automatico per renderli meno distorti
-Previsione profonda senza bisogno di sensori
-Utilizzo di deepfake per abilitare la localizzazione e la regionalizzazione dei contenuti
-Consentire ai robot di comprendere concetti più astratti sia nella simulazione che nella vita reale.

Che è vantaggioso

Protezione dell'identità: le persone che non desiderano rivelare la propria identità durante il colloquio o il lavoro possono utilizzare gli avatar dell'IA generativa per nascondere la propria identità.
Controllo robotico: la modellazione generativa aiuta i modelli di apprendimento automatico di rinforzo a comprendere concetti più astratti nella simulazione e nel mondo reale.
Sanità: l'IA generativa consente la diagnosi precoce di potenziali malizia e lo sviluppo di terapie efficaci. I GAN, ad esempio, calcolano diversi angoli di un'immagine a raggi X per visualizzare la potenziale espansione del tumore.

Alcune sfide

Sicurezza: alcune persone possono utilizzare l'IA generativa per motivi nefasti, come frodare gli altri.
Sovrastima delle capacità: per portare a termine le attività, gli algoritmi di IA generativa richiedono un'enorme quantità di dati di addestramento. I GAN, d'altra parte, non sono in grado di generare immagini o frasi completamente nuove. Mettono semplicemente insieme ciò che sanno in modi diversi.
Risultati imprevisti: è difficile controllare il comportamento di alcuni modelli di IA generativa, come i GAN. Si comportano in modo irregolare e forniscono un risultato inaspettato.
Privacy dei dati: la privacy dei dati a livello individuale è un problema nelle applicazioni relative alla salute.