Generative AI – ปัญญาประดิษฐ์ที่ต่ออายุเนื้อหาเก่าด้วยวิธีที่แตกต่าง
เผยแพร่แล้ว: 2022-04-20ยุคใหม่ของเทคโนโลยีที่กำลังจะเกิดขึ้นพร้อมที่จะนำเทคโนโลยีที่ไม่เพียงแต่สามารถสังเกตรูปแบบพื้นฐานของเนื้อหาเก่าเท่านั้น แต่ยังสามารถผลิตเนื้อหาใหม่ที่คล้ายกับฐาน แต่แตกต่างกันในส่วนหน้า
“Generative AI” คือเทคโนโลยีที่ช่วยให้คอมพิวเตอร์เข้าใจรูปแบบพื้นฐานที่เกี่ยวข้องกับอินพุต และสร้างวัสดุที่เปรียบเทียบได้โดยใช้รูปแบบนั้น
เจเนอเรทีฟ AI คืออะไร?
Generative AI เป็นอัลกอริธึมปัญญาประดิษฐ์ที่ช่วยให้สามารถสร้างวัสดุใหม่ที่น่าเชื่อถือจากเนื้อหาที่มีอยู่ เช่น ข้อความ การบันทึกเสียง หรือภาพถ่าย กล่าวอีกนัยหนึ่งคือช่วยให้คอมพิวเตอร์สามารถสรุปรูปแบบพื้นฐานที่เกี่ยวข้องกับอินพุตแล้วใช้เพื่อสร้างวัสดุที่คล้ายคลึงกัน
ในการสร้างเนื้อหาใหม่โดยใช้ข้อความ ไฟล์เสียง หรือรูปภาพที่มีอยู่ เทคนิคต่างๆ ที่ใช้ ได้แก่ :
เครือข่ายฝ่ายตรงข้ามกำเนิด (GAN) :
GAN เป็นแบบจำลองกำเนิดซึ่งโครงข่ายประสาทเทียมสองโครงข่าย ตัวกำเนิด และตัวแบ่งแยก เชื่อมโยงซึ่งกันและกัน เครื่องกำเนิดหรือที่เรียกว่าเครือข่ายกำเนิดคือโครงข่ายประสาทเทียมที่สร้างข้อมูลใหม่หรือเนื้อหาที่คล้ายกับข้อมูลต้นทาง discriminator หรือที่เรียกว่า discriminative network เป็นโครงข่ายประสาทเทียมที่แยกความแตกต่างระหว่างแหล่งที่มาและข้อมูลที่สร้างขึ้น
โครงข่ายประสาทเทียมทั้งสองนี้ได้รับการฝึกฝนในวงจรสลับกัน โดยตัวสร้างจะเรียนรู้เพื่อสร้างข้อมูลที่สมจริงยิ่งขึ้น และผู้แยกแยะเรียนรู้ที่จะแยกแยะระหว่างข้อมูลปลอมกับข้อมูลจริง
เปรียบเสมือนความสัมพันธ์ระหว่างโจรกับเจ้าหน้าที่ตำรวจ ทั้งคู่ต่างเรียนรู้วิธีปฏิบัติภารกิจใหม่ด้วยตนเอง โจรพยายามหาวิธีใหม่ๆ ในการขโมยของและเจ้าหน้าที่ควบคู่กันไปเพื่อลดการโจรกรรม แต่ละคนค่อย ๆ ปรับปรุงอีกด้านหนึ่งอันเป็นผลมาจากความพยายามของพวกเขา
![GAN ใช้งาน MNIST Data](/uploads/article/2851/3FFwpFLMcCFLSEMF.png)
หม้อแปลงไฟฟ้า :
Transformers เป็นสถาปัตยกรรมโครงข่ายประสาทเทียมชนิดหนึ่ง สรุป โครงข่ายประสาทเทียมเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการประเมินประเภทข้อมูลที่ซับซ้อน เช่น รูปภาพ วิดีโอ เสียง และข้อความ
กล่าวง่ายๆ ก็คือ พวกเขาสามารถทำซ้ำหรือเขียนรูปแบบที่เขียนด้วยลายมือของมนุษย์ได้ด้วยซ้ำ
Transformers เช่น GPT-3, LaMDA และ Wu-Dao ทำซ้ำความสนใจทางปัญญาโดยการวัดความเกี่ยวข้องของข้อมูลอินพุตในรูปแบบต่างๆ พวกเขาได้รับการสอนให้รู้จักภาษาหรือภาพ ทำงานเกี่ยวกับการจัดหมวดหมู่ และสร้างข้อความหรือรูปภาพจากชุดข้อมูลขนาดใหญ่
![แผนภาพหม้อแปลงจากกระดาษต้นฉบับ](/uploads/article/2851/V95VKAgyGslsZPhN.png)
ตัวเข้ารหัสอัตโนมัติแบบต่างๆ :
ตัวเข้ารหัสจะแปลงข้อมูลเป็นรหัสบีบอัด ซึ่งตัวถอดรหัสจะถอดรหัสและทำซ้ำข้อมูลดั้งเดิม
การแสดงข้อมูลที่บีบอัดนี้จัดเก็บการกระจายข้อมูลอินพุตในการแสดงมิติที่ลดลงอย่างมากหากเลือกและฝึกฝนอย่างถูกต้อง
การใช้งานและการใช้งานของ Generative AI
การทำสำเนาภาพถ่ายจริง :
Generative AI สามารถสร้างแบบจำลองในโลกแห่งความเป็นจริงด้วยรูปแบบต่างๆ ของภาพถ่าย สิ่งใดก็ตามที่เป็นรูปภาพสามารถจำลองแบบในฐานที่คล้ายกันได้ แต่จะดูแตกต่างไปจากเดิมตามข้อมูลที่เรามีให้
![การนำ GAN ไปใช้เพื่อสร้างตัวอย่างข้อมูลใหม่](/uploads/article/2851/auhLHbR0p6VLxHLj.png)
พวกเขาสามารถสร้างตัวเลขที่ดูเหมือนเขียนด้วยลายมือและใบหน้าที่คล้ายกับคนจริง
![การเติบโตของ GAN ที่ก้าวหน้าเพื่อคุณภาพ ความเสถียร และการเปลี่ยนแปลงที่ดีขึ้น](/uploads/article/2851/IYHlqEB7Ue9mjIb0.jpg)
Tero Karras ได้สาธิตการสร้างภาพที่เหมือนจริงของใบหน้ามนุษย์ในผลงาน “Progressive Growing of GANs for Improved Quality, Stability, and Variation” ที่ตีพิมพ์ในปี 2017 ใบหน้ารุ่นต่างๆ ได้รับการศึกษาเกี่ยวกับตัวอย่างที่มีชื่อเสียง ซึ่งหมายความว่าใบหน้าบางส่วนมีลักษณะเฉพาะของคนดัง และทำให้ดูคุ้นเคย
การแปลงรูปภาพ
![การแปลงวันเป็นคืน](/uploads/article/2851/M0DzXg36Ob6LpU9u.png)
![มุมมองดาวเทียมสู่มุมมองธรรมดา](/uploads/article/2851/zwOiP10LDjyIpDMU.png)
![การวาดภาพเพื่อความหลากหลาย](/uploads/article/2851/guIAvlhBIGuQDYM1.png)
![การสังเคราะห์ข้อความเป็นรูปภาพที่เหมือนจริงโดยใช้เครือข่ายฝ่ายตรงข้ามที่สร้างซ้อนกัน](/uploads/article/2851/o2XZYmoSwsFaHiAC.png)
การสังเคราะห์ข้อความเป็นรูปภาพเสมือนจริงโดยใช้ Stacked Generative Adversarial Networks (StackGAN)
![Raw To Real และในทางกลับกัน](/uploads/article/2851/9f0gVQJ7IpfyyrvH.png)
![ร่างให้เป็นจริง](/uploads/article/2851/tnAKtSMO4Nb54KPz.png)
![Face View Generation](/uploads/article/2851/vv7ySlmVzqo5nF6T.png)
![รูปภาพสำหรับอวตาร](/uploads/article/2851/sMh13tfsShm1cBgE.png)
![แอพผู้สูงอายุสร้างภาพเด็ก](/uploads/article/2851/NPAAelp5WhbGxdUn.png)
ในโลกแห่งความบันเทิง : เมื่อถูกกระตุ้นโดยการพิมพ์ 3 มิติ, CRISPR และเทคโนโลยีอื่น ๆ AI กำเนิดยังสามารถนำมาใช้เพื่อสร้างผลิตภัณฑ์ตั้งแต่เริ่มต้น
![](https://s.stat888.com/img/bg.png)
เทคโนโลยี Deep fake ใช้เพื่อแปลเนื้อหา (พากย์และกรอง) ในขณะที่เผยแพร่ไปทั่วโลก สามารถจับคู่เสียงของศิลปิน/นักแสดงต้นฉบับกับการลิปซิงค์ได้โดยใช้การสังเคราะห์ใบหน้าและการโคลนเสียงhttps://www.youtube.com/embed/QiiSAvKJIHo?feature=oembed
ข้อดีและประโยชน์
Generative AI มีข้อดีมากมาย รวมถึงความสามารถในการรับรองการพัฒนาผลลัพธ์คุณภาพสูงขึ้นโดยการเรียนรู้ด้วยตนเองจากข้อมูลแต่ละชุด
-การย้ายอันตรายของโครงการไปสู่ระดับที่ต่ำกว่า
-เสริมโมเดลการเรียนรู้ของเครื่องเพื่อให้มีอคติน้อยลง
- การทำนายเชิงลึกโดยไม่ต้องใช้เซ็นเซอร์
- การใช้ deepfakes เพื่อเปิดใช้งานการโลคัลไลซ์เซชั่นเนื้อหาและการปรับภูมิภาค
-ทำให้หุ่นยนต์เข้าใจแนวคิดที่เป็นนามธรรมมากขึ้นทั้งในการจำลองและในชีวิตจริง
ซึ่งเป็นประโยชน์ใน
- การปกป้องข้อมูลประจำตัว: ผู้ที่ไม่ต้องการเปิดเผยตัวตนเมื่อสัมภาษณ์หรือทำงาน สามารถใช้อวาตาร์ Generative AI เพื่อซ่อนตัวตนได้
- การควบคุมด้วยวิทยาการหุ่นยนต์: การสร้างแบบจำลองทั่วไปช่วยเสริมแบบจำลองการเรียนรู้ของเครื่องในการทำความเข้าใจแนวคิดที่เป็นนามธรรมมากขึ้นในการจำลองและในโลกแห่งความเป็นจริง
- การดูแลสุขภาพ: Generative AI ช่วยให้สามารถตรวจจับความอาฆาตพยาบาทได้ตั้งแต่เนิ่นๆ และการพัฒนาวิธีการรักษาที่มีประสิทธิภาพ ตัวอย่างเช่น GAN คำนวณหลายมุมของภาพเอ็กซ์เรย์เพื่อให้เห็นภาพการขยายตัวของเนื้องอก
ความท้าทายบางอย่าง
- ความปลอดภัย: บางคนอาจใช้ Generative AI สำหรับแรงจูงใจที่ชั่วร้าย เช่น การหลอกลวงผู้อื่น
- การประเมินความสามารถสูงเกินไป: เพื่อให้งานสำเร็จลุล่วง อัลกอริทึม AI แบบกำเนิดนั้นต้องการข้อมูลการฝึกอบรมจำนวนมหาศาล ในทางกลับกัน GAN ไม่สามารถสร้างภาพหรือวลีใหม่ทั้งหมดได้ พวกเขาเพียงนำสิ่งที่พวกเขารู้มารวมกันในรูปแบบต่างๆ
- ผลลัพธ์ที่ไม่คาดคิด: เป็นการยากที่จะควบคุมพฤติกรรมของโมเดล Generative AI บางรุ่น เช่น GAN พวกเขาทำงานผิดปกติและให้ผลลัพธ์ที่ไม่คาดคิด
- ความเป็นส่วนตัวของข้อมูล: ความเป็นส่วนตัวของข้อมูลระดับบุคคลเป็นปัญหาในแอปพลิเคชันที่เกี่ยวข้องกับสุขภาพ