AI Generatif – Kecerdasan Buatan yang Memperbarui Konten Lama Dengan Cara Berbeda

Diterbitkan: 2022-04-20

Era teknologi baru yang akan datang siap menghadirkan teknologi yang tidak hanya dapat mengamati pola dasar konten lama, tetapi juga dapat menghasilkan konten baru yang serupa dengan dasarnya tetapi berbeda di bagian depan.
"AI Generatif" adalah teknologi yang memungkinkan komputer memahami pola dasar yang terkait dengan input dan kemudian menghasilkan materi yang sebanding berdasarkan pola itu.

Apa itu AI Generatif?

Generatif AI adalah algoritma Kecerdasan Buatan yang memungkinkan pembuatan materi baru yang dapat dipercaya dari konten yang ada seperti teks, rekaman audio, atau foto. Dengan kata lain, ini memungkinkan komputer untuk mengabstraksi pola dasar yang terkait dengan input dan kemudian menggunakannya untuk menghasilkan materi serupa.

Untuk membuat konten baru dengan memanfaatkan teks, file audio, atau gambar yang ada, berbagai teknik yang digunakan adalah:

Jaringan permusuhan generatif (GAN) :

GAN adalah model generatif di mana dua jaringan saraf, generator, dan diskriminator, terlibat satu sama lain. Generator, juga dikenal sebagai jaringan generatif, adalah jaringan saraf yang menghasilkan data atau konten baru yang mirip dengan data sumber. Diskriminator, juga dikenal sebagai jaringan diskriminatif, adalah jaringan saraf yang membedakan antara sumber dan data yang dihasilkan.

Kedua jaringan saraf ini dilatih dalam siklus bolak-balik, dengan generator belajar untuk menghasilkan data yang lebih realistis dan diskriminator belajar membedakan antara data palsu dan nyata.

Seperti hubungan antara pencuri dan polisi yang sama-sama belajar cara baru dalam melaksanakan tugas mereka. Pencuri mencoba mencari cara baru merampok barang dan petugas secara paralel untuk mengurangi tindakan pencurian. Masing-masing dari mereka secara bertahap meningkatkan sisi lain sebagai hasil dari upaya mereka.

GAN mengimplementasikan Data MNIST
GAN mengimplementasikan Data MNIST (Sumber: Thalles Silva)

Transformer :

Transformer adalah jenis arsitektur jaringan saraf tertentu. Singkatnya, jaringan saraf adalah alat yang ampuh untuk mengevaluasi tipe data yang kompleks seperti foto, video, audio, dan teks.

Dengan kata sederhana, mereka bahkan dapat meniru atau bahkan menulis ulang pola tulisan tangan manusia.

Transformer seperti GPT-3, LaMDA, dan Wu-Dao mereplikasi perhatian kognitif dengan mengukur relevansi potongan data input dengan cara yang berbeda. Mereka diajarkan untuk mengenali bahasa atau gambar, melakukan beberapa tugas klasifikasi, dan menghasilkan teks atau gambar dari kumpulan data yang besar.

Diagram transformator dari kertas asli
Diagram transformator dari kertas asli

Auto-encoder variasi :

Encoder mengubah data menjadi kode terkompresi, yang diterjemahkan oleh dekoder dan mereproduksi data asli.
Representasi terkompresi ini menyimpan distribusi data input dalam representasi dimensi yang jauh berkurang jika dipilih dan dilatih dengan benar.

Implementasi dan aplikasi Generatif AI

Mereproduksi foto asli:

AI generatif dapat mereproduksi replika dunia nyata dengan beberapa variasi dalam foto. Apa pun yang merupakan gambar dapat direplikasi dalam basis yang sama tetapi terlihat berbeda dari yang asli berdasarkan input yang kami berikan.

implementasi GAN untuk membuat sampel data baru
Implementasi GAN untuk membuat sampel data baru untuk kumpulan data digit tulisan tangan MNIST, kumpulan data gambar objek kecil CIFAR-10, dan Toronto Face Database telah dibahas dalam makalah Ian Goodfellow “Generative Adversarial Networks” yang diterbitkan pada tahun 2014.

Mereka dapat membuat angka yang tampak seperti tulisan tangan dan wajah yang menyerupai orang sungguhan.

Pertumbuhan Progresif GAN untuk Peningkatan Kualitas, Stabilitas, dan Variasi
Gambar: Pertumbuhan Progresif GAN untuk Peningkatan Kualitas, Stabilitas, dan Variasi, 2017

Tero Karras mendemonstrasikan produksi gambar wajah manusia yang realistis dalam karyanya “Progressive Growing of GANs for Improved Quality, Stability, and Variation” yang diterbitkan pada tahun 2017. Generasi wajah telah dididik tentang contoh-contoh terkenal, yang berarti bahwa beberapa wajah memiliki fitur selebriti tertentu dan dengan demikian tampak akrab.

Konversi Gambar

Konversi siang ke malam
Konversi siang ke malam
Tampilan satelit ke tampilan biasa
Tampilan satelit ke tampilan biasa
Lukisan untuk variasi
Lukisan untuk variasi
Teks ke Sintesis Gambar Foto-realistis Menggunakan Jaringan Adversarial Generatif Bertumpuk

Teks ke Sintesis Gambar Foto-realistis Menggunakan Stacked Generative Adversarial Networks (StackGAN)
Raw To Real dan sebaliknya
Raw To Real dan sebaliknya
Sketsa menjadi nyata
Sketsa menjadi nyata
Generasi Tampilan Wajah
Generasi Tampilan Wajah : Profil di sebelah kiri, yang disintesis di tengah, wajah frontal kebenaran dasar di sebelah kanan
Gambar ke Avatar
Gambar ke Avatar
Aplikasi Penuaan menciptakan gambar muda
Aplikasi Penuaan menciptakan gambar muda

Di Dunia Hiburan : Ketika dipicu oleh pencetakan 3D, CRISPR, dan teknologi lainnya, AI generatif juga dapat digunakan untuk membuat produk dari awal.

Teknologi deep fake digunakan untuk melokalisasi (dubbing dan filtering) materi saat mendistribusikannya ke seluruh dunia. Suara artis/aktor asli dapat dicocokkan dengan sinkronisasi bibir menggunakan face synthesis dan voice cloning.https://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

Keuntungan dan Manfaat

AI generatif memiliki banyak keunggulan, termasuk kemampuan untuk memastikan pengembangan output berkualitas lebih tinggi dengan belajar mandiri dari setiap kumpulan data.
-Memindahkan bahaya proyek ke tingkat yang lebih rendah
-Memperkuat model pembelajaran mesin agar tidak terlalu bias
-Prediksi mendalam tanpa perlu sensor
-Menggunakan deepfake untuk mengaktifkan pelokalan dan regionalisasi konten
-Memungkinkan robot untuk memahami konsep yang lebih abstrak baik dalam simulasi maupun kehidupan nyata.

Yang Bermanfaat di

  • Perlindungan Identitas: Orang yang tidak ingin mengungkapkan identitas mereka saat wawancara atau bekerja dapat menggunakan avatar AI Generatif untuk menyembunyikan identitas mereka.
  • Kontrol robotika: Pemodelan generatif membantu penguatan model pembelajaran mesin dalam memahami konsep yang lebih abstrak dalam simulasi dan di dunia nyata.
  • Perawatan Kesehatan: AI Generatif memungkinkan deteksi dini potensi kedengkian dan pengembangan terapi yang efektif. GAN, misalnya, menghitung beberapa sudut gambar sinar-x untuk memvisualisasikan potensi ekspansi tumor.

Beberapa Tantangan

  • Keamanan: Beberapa orang mungkin menggunakan AI Generatif untuk motif jahat, seperti menipu orang lain.
  • Melebih-lebihkan kemampuan: Untuk menyelesaikan tugas, algoritme AI generatif memerlukan sejumlah besar data pelatihan. GAN, di sisi lain, tidak dapat menghasilkan gambar atau frasa yang sepenuhnya baru. Mereka hanya menempatkan apa yang mereka ketahui bersama dengan cara yang berbeda.
  • Hasil tak terduga: Sulit untuk mengontrol perilaku beberapa model AI Generatif, seperti GAN. Mereka berperilaku tidak menentu dan memberikan hasil yang tidak terduga.
  • Privasi data: Privasi data tingkat individu merupakan masalah dalam aplikasi yang berhubungan dengan kesehatan.