Generacyjna sztuczna inteligencja – sztuczna inteligencja, która odnawia stare treści w inny sposób

Opublikowany: 2022-04-20

Nowa, nadchodząca era technologii jest gotowa, aby przynieść nam technologię, która nie tylko może zaobserwować leżący u podstaw wzór starych treści, ale także może tworzyć nowe treści podobne do swojej bazy, ale inne w interfejsie.
„Generatywna sztuczna inteligencja” to technologia, która pozwala komputerom zrozumieć podstawowy wzorzec związany z danymi wejściowymi, a następnie wygenerować porównywalny materiał w oparciu o ten wzorzec.

Co to jest generatywna sztuczna inteligencja?

Generacyjna sztuczna inteligencja to algorytm sztucznej inteligencji, który umożliwia tworzenie nowego wiarygodnego materiału z istniejących treści, takich jak tekst, nagrania dźwiękowe lub zdjęcia. Innymi słowy, umożliwia komputerom wyabstrahowanie wzorca skojarzonego z danymi wejściowymi, a następnie wykorzystanie go do wygenerowania podobnego materiału.

Aby utworzyć nową zawartość, wykorzystując istniejący tekst, pliki audio lub obrazy, stosuje się różne techniki, takie jak:

Sieci generatywnych przeciwników (GAN) :

GAN to modele generatywne, w których dwie sieci neuronowe, generator i dyskryminator, są ze sobą sprzężone. Generator, znany również jako sieć generatywna, to sieć neuronowa, która generuje nowe dane lub treści, które są podobne do danych źródłowych. Dyskryminator, znany również jako sieć dyskryminacyjna, to sieć neuronowa, która rozróżnia dane źródłowe i generowane.

Obie te sieci neuronowe są trenowane w naprzemiennych cyklach, przy czym generator uczy się tworzyć bardziej realistyczne dane, a dyskryminator uczy się odróżniać dane fałszywe od rzeczywistych.

Jak relacja między złodziejem a policjantem, którzy sami uczą się nowych sposobów wykonywania swoich obowiązków. Złodziej próbuje znaleźć nowe sposoby równoczesnego rabowania rzeczy i oficera, aby ograniczyć kradzieże. Każdy z nich w wyniku swoich wysiłków stopniowo poprawia drugą stronę.

GAN wdrażający dane MNIST
GAN wdrażający dane MNIST (kredyt: Thalles Silva)

Transformatory :

Transformatory to szczególny rodzaj architektury sieci neuronowej. Podsumowując, sieci neuronowe są potężnym narzędziem do oceny złożonych typów danych, takich jak zdjęcia, filmy, dźwięk i tekst.

W prostych słowach mogą nawet powielać, a nawet przepisywać ludzkie, odręcznie pisane wzory.

Transformatory, takie jak GPT-3, LaMDA i Wu-Dao, replikują uwagę poznawczą, mierząc istotność fragmentów danych wejściowych na różne sposoby. Uczą się rozpoznawania języka lub obrazu, wykonywania niektórych zadań klasyfikacyjnych i generowania tekstów lub obrazów z dużych zbiorów danych.

Schemat transformatora z oryginalnego papieru
Schemat transformatora z oryginalnego papieru

Automatyczne kodery wariacyjne :

Koder konwertuje dane na skompresowany kod, który dekoder dekoduje i odtwarza oryginalne dane.
Ta skompresowana reprezentacja przechowuje rozkład danych wejściowych w znacznie zredukowanej reprezentacji wymiarowej, jeśli jest wybrana i prawidłowo wyszkolona.

Implementacja i zastosowania generatywnej AI

Odwzorowanie prawdziwych fotografii:

Generacyjna sztuczna inteligencja może odtworzyć replikę ze świata rzeczywistego z pewnymi odmianami zdjęć. Wszystko, co jest obrazem, może zostać zreplikowane w podobnej bazie, ale wygląda inaczej niż oryginalna na podstawie danych wejściowych, które dostarczamy.

implementacja GAN do tworzenia nowych próbek danych
Wdrożenie GAN do tworzenia nowych próbek danych dla odręcznie pisanego zestawu danych cyfrowych MNIST, zestawu danych obrazu małych obiektów CIFAR-10 oraz bazy danych Toronto Face zostało omówione w artykule Iana Goodfellowa „Generative Adversarial Networks” opublikowanym w 2014 roku.

Mogą tworzyć cyfry, które wydają się być napisane odręcznie, a twarze przypominają prawdziwych ludzi.

Progresywny wzrost GAN w celu poprawy jakości, stabilności i zmienności
Zdjęcie: Progresywny wzrost GAN w celu poprawy jakości, stabilności i zmienności, 2017

Tero Karras zademonstrował wytwarzanie realistycznych obrazów ludzkich twarzy w swojej pracy „Progressive Growing of GANs for Improved Quality, Stability and Variation” opublikowanej w 2017 roku. i dlatego wydają się znajome.

Rekonwersja obrazów

Konwersja z dnia na noc
Konwersja z dnia na noc
Widok satelitarny na zwykły widok
Widok satelitarny na zwykły widok
Malowanie do wariacji
Malowanie do wariacji
Synteza tekstu do fotorealistycznego obrazu za pomocą skumulowanych generatywnych sieci przeciwnych

Synteza tekstu do fotorealistycznego obrazu przy użyciu ułożonych generatywnych sieci przeciwnych (StackGAN)
Raw To Real i vice versa
Raw To Real i vice versa
Szkic do rzeczywistości
Szkic do rzeczywistości
Generowanie widoku twarzy
Generowanie widoku twarzy : profil po lewej stronie, zsyntetyzowany pośrodku, przednia twarz naziemna po prawej stronie
Obraz do awatara
Obraz do awatara
Starzejące się aplikacje odtwarzające młode obrazy
Starzejące się aplikacje odtwarzające młode obrazy

W świecie rozrywki : po uruchomieniu przez drukowanie 3D, CRISPR i inne technologie, generatywna sztuczna inteligencja może być również wykorzystywana do tworzenia produktów od podstaw.

Technologia Deep Fake służy do lokalizacji (dubbingowania i filtrowania) materiału podczas jego dystrybucji na całym świecie. Głos artysty/oryginalnego aktora można dopasować do synchronizacji ust za pomocą syntezy twarzy i klonowania głosu.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

Zalety i korzyści

Generacyjna sztuczna inteligencja ma wiele zalet, w tym możliwość zapewnienia rozwoju wyników o wyższej jakości poprzez samouczenie się z każdego zestawu danych.
-Przeniesienie zagrożeń projektu na niższy poziom
-Wzmocnienie modeli uczenia maszynowego, aby były mniej stronnicze
-Głębokie przewidywanie bez konieczności stosowania czujników
-Korzystanie z deepfake'ów, aby umożliwić lokalizację i regionalizację treści
-Umożliwienie robotom zrozumienia bardziej abstrakcyjnych pojęć zarówno w symulacji, jak i w prawdziwym życiu.

Co jest korzystne w

  • Ochrona tożsamości: Osoby, które nie chcą ujawniać swojej tożsamości podczas rozmów kwalifikacyjnych lub pracy, mogą używać awatarów generatywnej sztucznej inteligencji, aby ukryć swoją tożsamość.
  • Sterowanie robotyką: Modelowanie generatywne pomaga wzmocnić modele uczenia maszynowego w zrozumieniu bardziej abstrakcyjnych pojęć w symulacji i w świecie rzeczywistym.
  • Opieka zdrowotna: generatywna sztuczna inteligencja pozwala na wczesne wykrycie potencjalnej złośliwości i opracowanie skutecznych terapii. Na przykład GAN obliczają kilka kątów obrazu rentgenowskiego, aby zobrazować potencjalną ekspansję guza.

Niektóre wyzwania

  • Bezpieczeństwo: Niektóre osoby mogą wykorzystywać generatywną sztuczną inteligencję do nikczemnych pobudek, takich jak oszukiwanie innych.
  • Przeszacowanie możliwości: Aby wykonać zadania, generatywne algorytmy AI wymagają ogromnej ilości danych treningowych. Z drugiej strony GAN nie są w stanie wygenerować całkowicie nowych obrazów lub fraz. Po prostu łączą to, co wiedzą, na różne sposoby.
  • Nieoczekiwane wyniki: Trudno jest kontrolować zachowanie niektórych modeli generatywnej sztucznej inteligencji, takich jak GAN. Zachowują się chaotycznie i dają nieoczekiwany rezultat.
  • Prywatność danych: prywatność danych na poziomie indywidualnym jest problemem w aplikacjach związanych ze zdrowiem.