Generative AI – Künstliche Intelligenz, die alte Inhalte anders erneuert

Veröffentlicht: 2022-04-20

Die neue kommende Ära der Technologie ist bereit, uns eine Technologie zu bringen, die nicht nur das zugrunde liegende Muster alter Inhalte beobachten kann, sondern auch neue Inhalte erzeugen kann, die ihrer Basis ähnlich sind, sich aber im Frontend unterscheiden.
„Generative KI“ ist die Technologie, die es Computern ermöglicht, das zugrunde liegende Muster zu verstehen, das mit einer Eingabe verbunden ist, und dann basierend auf diesem Muster vergleichbares Material zu generieren.

Was ist generative KI?

Generative KI ist ein Algorithmus der künstlichen Intelligenz, der es ermöglicht, aus bestehenden Inhalten wie Texten, Audioaufnahmen oder Fotos neues glaubwürdiges Material zu erstellen. Anders ausgedrückt ermöglicht es Computern, das zugrunde liegende Muster zu abstrahieren, das mit der Eingabe verbunden ist, und verwendet dieses dann, um ähnliches Material zu generieren.

Um neue Inhalte zu erstellen, indem vorhandene Texte, Audiodateien oder Bilder verwendet werden, werden verschiedene Techniken verwendet, die sind:

Generative Adversarial Networks (GANs) :

GANs sind generative Modelle, bei denen zwei neuronale Netze, ein Generator und ein Diskriminator, gegeneinander antreten. Der Generator, auch generatives Netzwerk genannt, ist ein neuronales Netzwerk, das neue Daten oder Inhalte generiert, die den Quelldaten ähneln. Der Diskriminator, auch bekannt als diskriminatives Netzwerk, ist ein neuronales Netzwerk, das zwischen Quell- und generierten Daten unterscheidet.

Beide dieser neuronalen Netze werden in abwechselnden Zyklen trainiert, wobei der Generator lernt, realistischere Daten zu erzeugen, und der Diskriminator lernt, zwischen gefälschten und echten Daten zu unterscheiden.

Wie eine Beziehung zwischen einem Dieb und einem Polizisten, die beide an ihrem eigenen Ende neue Wege zur Erfüllung ihrer Pflichten lernen. Thief versucht, neue Wege zu finden, Sachen und Offiziere gleichzeitig zu stehlen, um Diebstähle zu reduzieren. Jeder von ihnen verbessert nach und nach die andere Seite als Ergebnis seiner Bemühungen.

GAN implementiert MNIST-Daten
GAN implementiert MNIST-Daten (Credit: Thalles Silva)

Transformatoren :

Transformatoren sind eine besondere Art von neuronaler Netzwerkarchitektur. Zusammenfassend sind neuronale Netze ein mächtiges Werkzeug, um komplexe Datentypen wie Fotos, Videos, Audio und Text auszuwerten.

Mit einfachen Worten, sie können sogar menschliche handgeschriebene Muster replizieren oder sogar umschreiben.

Transformer wie GPT-3, LaMDA und Wu-Dao replizieren die kognitive Aufmerksamkeit, indem sie die Relevanz von Eingabedatenstücken auf unterschiedliche Weise messen. Sie lernen, die Sprache oder das Bild zu erkennen, einige Klassifizierungsaufgaben zu erledigen und Texte oder Bilder aus großen Datensätzen zu generieren.

Transformatordiagramm aus dem Originalpapier
Transformatordiagramm aus dem Originalpapier

Variationale Auto-Encoder :

Der Codierer wandelt die Daten in einen komprimierten Code um, den der Decodierer decodiert und die Originaldaten reproduziert.
Diese komprimierte Darstellung speichert die Eingangsdatenverteilung in einer erheblich reduzierten dimensionalen Darstellung, wenn sie richtig ausgewählt und trainiert wird.

Implementierung und Anwendungen der generativen KI

Echte Fotografien reproduzieren:

Generative KI kann reale Nachbildungen mit einigen Variationen in Fotos reproduzieren. Alles, was ein Bild ist, kann in einer ähnlichen Basis repliziert werden, sieht aber basierend auf den von uns bereitgestellten Eingaben anders aus als das Original.

Implementierung von GANs zur Erstellung neuer Datenproben
Die Implementierung von GANs zur Erstellung neuer Datenproben für den MNIST-Datensatz mit handgeschriebenen Ziffern, den CIFAR-10-Datensatz für kleine Objektbilder und die Toronto Face Database wurde in Ian Goodfellows 2014 veröffentlichtem Artikel „Generative Adversarial Networks“ diskutiert.

Sie können Ziffern erstellen, die handschriftlich erscheinen, und Gesichter, die echten Menschen ähneln.

Progressives Wachstum von GANs für verbesserte Qualität, Stabilität und Variation
Bild: Progressives Wachstum von GANs für verbesserte Qualität, Stabilität und Variation, 2017

Tero Karras demonstrierte in seiner 2017 veröffentlichten Arbeit „Progressive Growing of GANs for Improved Quality, Stability, and Variation“ die Herstellung realistischer Bilder menschlicher Gesichter. Gesichtsgenerationen wurden anhand berühmter Beispiele ausgebildet, was bedeutet, dass einige Gesichter bestimmte Promi-Merkmale aufweisen und dadurch vertraut erscheinen.

Rückwandlung von Bildern

Umstellung von Tag auf Nacht
Umstellung von Tag auf Nacht
Satellitenansicht zur einfachen Ansicht
Satellitenansicht zur einfachen Ansicht
Malen nach Variationen
Malen nach Variationen
Text zu fotorealistischer Bildsynthese unter Verwendung von gestapelten generativen kontradiktorischen Netzwerken

Text zu fotorealistischer Bildsynthese mit Stacked Generative Adversarial Networks (StackGAN)
Von Roh zu Echt und umgekehrt
Von Roh zu Echt und umgekehrt
Skizze zur Wirklichkeit
Skizze zur Wirklichkeit
Face-View-Generierung
Face View Generation : Links das Profil, in der Mitte das synthetisierte, rechts das Ground-Truth-Frontalgesicht
Bild zum Avatar
Bild zum Avatar
Alternde Apps, die junge Bilder neu erstellen
Alternde Apps, die junge Bilder neu erstellen

In der Welt der Unterhaltung : Wenn durch 3D-Druck, CRISPR und andere Technologien ausgelöst, kann generative KI auch verwendet werden, um Produkte von Grund auf neu zu erstellen.

Deep-Fake-Technologie wird verwendet, um Material zu lokalisieren (zu synchronisieren und zu filtern), während es auf der ganzen Welt verbreitet wird. Die Stimme des Künstlers/Originalschauspielers kann mithilfe von Gesichtssynthese und Stimmklonen mit einer Lippensynchronisation abgeglichen werden.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

Vorteile und Nutzen

Die generative KI hat zahlreiche Vorteile, einschließlich der Fähigkeit, die Entwicklung qualitativ hochwertigerer Ergebnisse durch Selbstlernen aus jedem Datensatz sicherzustellen.
- Verschieben der Gefahren eines Projekts auf eine niedrigere Ebene
-Verstärkung von Modellen für maschinelles Lernen, um sie weniger voreingenommen zu machen
-Tiefe Vorhersage ohne die Notwendigkeit von Sensoren
- Verwendung von Deepfakes zur Lokalisierung und Regionalisierung von Inhalten
-Befähigung von Robotern, abstraktere Konzepte sowohl in der Simulation als auch im wirklichen Leben zu verstehen.

Was von Vorteil ist

  • Identitätsschutz: Personen, die ihre Identität bei Vorstellungsgesprächen oder bei der Arbeit nicht preisgeben möchten, können generative KI-Avatare verwenden, um ihre Identität zu verbergen.
  • Robotiksteuerung: Die generative Modellierung hilft Modellen des verstärkenden maschinellen Lernens, abstraktere Konzepte in der Simulation und in der realen Welt zu verstehen.
  • Gesundheitswesen: Generative KI ermöglicht die frühzeitige Erkennung potenzieller Bosheit und die Entwicklung wirksamer Therapien. GANs berechnen beispielsweise mehrere Winkel eines Röntgenbildes, um die potenzielle Ausdehnung des Tumors zu visualisieren.

Einige Herausforderungen

  • Sicherheit: Einige Personen können die generative KI aus schändlichen Motiven verwenden, z. B. um andere zu betrügen.
  • Überschätzung der Fähigkeiten: Um Aufgaben zu erfüllen, benötigen generative KI-Algorithmen eine riesige Menge an Trainingsdaten. GANs hingegen sind nicht in der Lage, völlig neue Bilder oder Phrasen zu erzeugen. Sie setzen einfach das, was sie wissen, auf unterschiedliche Weise zusammen.
  • Unerwartete Ergebnisse: Es ist schwierig, das Verhalten einiger generativer KI-Modelle wie GANs zu steuern. Sie verhalten sich unberechenbar und liefern ein unerwartetes Ergebnis.
  • Datenschutz: Der Datenschutz auf individueller Ebene ist ein Thema bei gesundheitsbezogenen Anwendungen.