Generative AI – ปัญญาประดิษฐ์ที่ต่ออายุเนื้อหาเก่าด้วยวิธีที่แตกต่าง

เผยแพร่แล้ว: 2022-04-20

ยุคใหม่ของเทคโนโลยีที่กำลังจะเกิดขึ้นพร้อมที่จะนำเทคโนโลยีที่ไม่เพียงแต่สามารถสังเกตรูปแบบพื้นฐานของเนื้อหาเก่าเท่านั้น แต่ยังสามารถผลิตเนื้อหาใหม่ที่คล้ายกับฐาน แต่แตกต่างกันในส่วนหน้า
“Generative AI” คือเทคโนโลยีที่ช่วยให้คอมพิวเตอร์เข้าใจรูปแบบพื้นฐานที่เกี่ยวข้องกับอินพุต และสร้างวัสดุที่เปรียบเทียบได้โดยใช้รูปแบบนั้น

เจเนอเรทีฟ AI คืออะไร?

Generative AI เป็นอัลกอริธึมปัญญาประดิษฐ์ที่ช่วยให้สามารถสร้างวัสดุใหม่ที่น่าเชื่อถือจากเนื้อหาที่มีอยู่ เช่น ข้อความ การบันทึกเสียง หรือภาพถ่าย กล่าวอีกนัยหนึ่งคือช่วยให้คอมพิวเตอร์สามารถสรุปรูปแบบพื้นฐานที่เกี่ยวข้องกับอินพุตแล้วใช้เพื่อสร้างวัสดุที่คล้ายคลึงกัน

ในการสร้างเนื้อหาใหม่โดยใช้ข้อความ ไฟล์เสียง หรือรูปภาพที่มีอยู่ เทคนิคต่างๆ ที่ใช้ ได้แก่ :

เครือข่ายฝ่ายตรงข้ามกำเนิด (GAN) :

GAN เป็นแบบจำลองกำเนิดซึ่งโครงข่ายประสาทเทียมสองโครงข่าย ตัวกำเนิด และตัวแบ่งแยก เชื่อมโยงซึ่งกันและกัน เครื่องกำเนิดหรือที่เรียกว่าเครือข่ายกำเนิดคือโครงข่ายประสาทเทียมที่สร้างข้อมูลใหม่หรือเนื้อหาที่คล้ายกับข้อมูลต้นทาง discriminator หรือที่เรียกว่า discriminative network เป็นโครงข่ายประสาทเทียมที่แยกความแตกต่างระหว่างแหล่งที่มาและข้อมูลที่สร้างขึ้น

โครงข่ายประสาทเทียมทั้งสองนี้ได้รับการฝึกฝนในวงจรสลับกัน โดยตัวสร้างจะเรียนรู้เพื่อสร้างข้อมูลที่สมจริงยิ่งขึ้น และผู้แยกแยะเรียนรู้ที่จะแยกแยะระหว่างข้อมูลปลอมกับข้อมูลจริง

เปรียบเสมือนความสัมพันธ์ระหว่างโจรกับเจ้าหน้าที่ตำรวจ ทั้งคู่ต่างเรียนรู้วิธีปฏิบัติภารกิจใหม่ด้วยตนเอง โจรพยายามหาวิธีใหม่ๆ ในการขโมยของและเจ้าหน้าที่ควบคู่กันไปเพื่อลดการโจรกรรม แต่ละคนค่อย ๆ ปรับปรุงอีกด้านหนึ่งอันเป็นผลมาจากความพยายามของพวกเขา

GAN ใช้งาน MNIST Data — *GAN ใช้ข้อมูล MNIST (เครดิต: Thalles Silva)*

หม้อแปลงไฟฟ้า :

Transformers เป็นสถาปัตยกรรมโครงข่ายประสาทเทียมชนิดหนึ่ง สรุป โครงข่ายประสาทเทียมเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการประเมินประเภทข้อมูลที่ซับซ้อน เช่น รูปภาพ วิดีโอ เสียง และข้อความ

กล่าวง่ายๆ ก็คือ พวกเขาสามารถทำซ้ำหรือเขียนรูปแบบที่เขียนด้วยลายมือของมนุษย์ได้ด้วยซ้ำ

Transformers เช่น GPT-3, LaMDA และ Wu-Dao ทำซ้ำความสนใจทางปัญญาโดยการวัดความเกี่ยวข้องของข้อมูลอินพุตในรูปแบบต่างๆ พวกเขาได้รับการสอนให้รู้จักภาษาหรือภาพ ทำงานเกี่ยวกับการจัดหมวดหมู่ และสร้างข้อความหรือรูปภาพจากชุดข้อมูลขนาดใหญ่

ตัวเข้ารหัสอัตโนมัติแบบต่างๆ :

ตัวเข้ารหัสจะแปลงข้อมูลเป็นรหัสบีบอัด ซึ่งตัวถอดรหัสจะถอดรหัสและทำซ้ำข้อมูลดั้งเดิม
การแสดงข้อมูลที่บีบอัดนี้จัดเก็บการกระจายข้อมูลอินพุตในการแสดงมิติที่ลดลงอย่างมากหากเลือกและฝึกฝนอย่างถูกต้อง

การใช้งานและการใช้งานของ Generative AI

การทำสำเนาภาพถ่ายจริง :

Generative AI สามารถสร้างแบบจำลองในโลกแห่งความเป็นจริงด้วยรูปแบบต่างๆ ของภาพถ่าย สิ่งใดก็ตามที่เป็นรูปภาพสามารถจำลองแบบในฐานที่คล้ายกันได้ แต่จะดูแตกต่างไปจากเดิมตามข้อมูลที่เรามีให้

การนำ GAN ไปใช้เพื่อสร้างตัวอย่างข้อมูลใหม่ — การใช้งาน GAN เพื่อสร้างตัวอย่างข้อมูลใหม่สำหรับชุดข้อมูลตัวเลขที่เขียนด้วยลายมือของ MNIST ชุดข้อมูลภาพวัตถุขนาดเล็ก CIFAR-10 และฐานข้อมูล Toronto Face ได้รับการกล่าวถึงในบทความเรื่อง “Generative Adversarial Networks” ของ Ian Goodfellow ซึ่งตีพิมพ์ในปี 2014

พวกเขาสามารถสร้างตัวเลขที่ดูเหมือนเขียนด้วยลายมือและใบหน้าที่คล้ายกับคนจริง

การเติบโตของ GAN ที่ก้าวหน้าเพื่อคุณภาพ ความเสถียร และการเปลี่ยนแปลงที่ดีขึ้น — รูปภาพ: การเติบโตแบบก้าวหน้าของ GAN เพื่อคุณภาพ ความเสถียร และการเปลี่ยนแปลงที่ดีขึ้น 2017

Tero Karras ได้สาธิตการสร้างภาพที่เหมือนจริงของใบหน้ามนุษย์ในผลงาน “Progressive Growing of GANs for Improved Quality, Stability, and Variation” ที่ตีพิมพ์ในปี 2017 ใบหน้ารุ่นต่างๆ ได้รับการศึกษาเกี่ยวกับตัวอย่างที่มีชื่อเสียง ซึ่งหมายความว่าใบหน้าบางส่วนมีลักษณะเฉพาะของคนดัง และทำให้ดูคุ้นเคย

การแปลงรูปภาพ

การสังเคราะห์ข้อความเป็นรูปภาพที่เหมือนจริงโดยใช้เครือข่ายฝ่ายตรงข้ามที่สร้างซ้อนกัน — *การสังเคราะห์ข้อความเป็นรูปภาพเสมือนจริงโดยใช้ Stacked Generative Adversarial Networks (StackGAN)*

**Face View Generation** : โปรไฟล์ด้านซ้าย, สังเคราะห์อยู่ตรงกลาง, พื้นดินจริง หน้าผากหน้าผากด้านขวา

ในโลกแห่งความบันเทิง : เมื่อถูกกระตุ้นโดยการพิมพ์ 3 มิติ, CRISPR และเทคโนโลยีอื่น ๆ AI กำเนิดยังสามารถนำมาใช้เพื่อสร้างผลิตภัณฑ์ตั้งแต่เริ่มต้น

เทคโนโลยี Deep fake ใช้เพื่อแปลเนื้อหา (พากย์และกรอง) ในขณะที่เผยแพร่ไปทั่วโลก สามารถจับคู่เสียงของศิลปิน/นักแสดงต้นฉบับกับการลิปซิงค์ได้โดยใช้การสังเคราะห์ใบหน้าและการโคลนเสียงhttps://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed

ข้อดีและประโยชน์

Generative AI มีข้อดีมากมาย รวมถึงความสามารถในการรับรองการพัฒนาผลลัพธ์คุณภาพสูงขึ้นโดยการเรียนรู้ด้วยตนเองจากข้อมูลแต่ละชุด
-การย้ายอันตรายของโครงการไปสู่ระดับที่ต่ำกว่า
-เสริมโมเดลการเรียนรู้ของเครื่องเพื่อให้มีอคติน้อยลง
- การทำนายเชิงลึกโดยไม่ต้องใช้เซ็นเซอร์
- การใช้ deepfakes เพื่อเปิดใช้งานการโลคัลไลซ์เซชั่นเนื้อหาและการปรับภูมิภาค
-ทำให้หุ่นยนต์เข้าใจแนวคิดที่เป็นนามธรรมมากขึ้นทั้งในการจำลองและในชีวิตจริง

ซึ่งเป็นประโยชน์ใน

การปกป้องข้อมูลประจำตัว: ผู้ที่ไม่ต้องการเปิดเผยตัวตนเมื่อสัมภาษณ์หรือทำงาน สามารถใช้อวาตาร์ Generative AI เพื่อซ่อนตัวตนได้
การควบคุมด้วยวิทยาการหุ่นยนต์: การสร้างแบบจำลองทั่วไปช่วยเสริมแบบจำลองการเรียนรู้ของเครื่องในการทำความเข้าใจแนวคิดที่เป็นนามธรรมมากขึ้นในการจำลองและในโลกแห่งความเป็นจริง
การดูแลสุขภาพ: Generative AI ช่วยให้สามารถตรวจจับความอาฆาตพยาบาทได้ตั้งแต่เนิ่นๆ และการพัฒนาวิธีการรักษาที่มีประสิทธิภาพ ตัวอย่างเช่น GAN คำนวณหลายมุมของภาพเอ็กซ์เรย์เพื่อให้เห็นภาพการขยายตัวของเนื้องอก

ความท้าทายบางอย่าง

ความปลอดภัย: บางคนอาจใช้ Generative AI สำหรับแรงจูงใจที่ชั่วร้าย เช่น การหลอกลวงผู้อื่น
การประเมินความสามารถสูงเกินไป: เพื่อให้งานสำเร็จลุล่วง อัลกอริทึม AI แบบกำเนิดนั้นต้องการข้อมูลการฝึกอบรมจำนวนมหาศาล ในทางกลับกัน GAN ไม่สามารถสร้างภาพหรือวลีใหม่ทั้งหมดได้ พวกเขาเพียงนำสิ่งที่พวกเขารู้มารวมกันในรูปแบบต่างๆ
ผลลัพธ์ที่ไม่คาดคิด: เป็นการยากที่จะควบคุมพฤติกรรมของโมเดล Generative AI บางรุ่น เช่น GAN พวกเขาทำงานผิดปกติและให้ผลลัพธ์ที่ไม่คาดคิด
ความเป็นส่วนตัวของข้อมูล: ความเป็นส่วนตัวของข้อมูลระดับบุคคลเป็นปัญหาในแอปพลิเคชันที่เกี่ยวข้องกับสุขภาพ