วิธีระบุข้อความและภาพที่ AI สร้างขึ้น [+ เครื่องมือตรวจจับ]
เผยแพร่แล้ว: 2023-04-11เนื้อหาที่สร้างโดย AI เป็นการพัฒนาที่น่าสนใจ และเราเห็นบทความ เรื่องราว และรูปภาพที่สร้างโดยเครื่องมือ AI มากขึ้นเรื่อยๆ (ขอบคุณ AI สำหรับประโยคแนะนำ)
แต่การเพิ่มขึ้นของเครื่องมือสร้าง AI ขั้นสูงได้เปิดเผยปัญหาที่อาจเกิดขึ้น ตั้งแต่ผู้คนไม่สามารถตรวจจับความแตกต่างระหว่าง AI และมนุษย์ ไปจนถึงการคาดการณ์และการวิเคราะห์ของ AI ที่ผิดพลาดโดยสิ้นเชิง
นี่คือที่มาของการตรวจจับ AI เนื่องจากเป็นวิธีที่ผู้คนสามารถค้นพบเมื่อข้อความ รูปภาพ และแม้แต่วิดีโอถูกสร้างขึ้นโดยคอมพิวเตอร์ ดังนั้นพวกเขาจึงสามารถตัดสินใจได้อย่างชาญฉลาดเกี่ยวกับเนื้อหาที่พวกเขาบริโภค ในโพสต์นี้ เราจะกล่าวถึง:
การตรวจจับ AI คืออะไร?
การตรวจจับ AI กำลังค้นหาว่าเนื้อหาเป็น AI หรือมนุษย์สร้างขึ้น โดยปกติแล้วจะใช้ความช่วยเหลือของเครื่องมือตรวจจับ AI ที่ใช้การเรียนรู้ของเครื่องและการประมวลผลภาษาธรรมชาติเพื่อระบุรูปแบบ หากเนื้อหาเป็นไปตามรูปแบบที่คาดเดาได้มากขึ้น เครื่องมือน่าจะจัดประเภทเนื้อหานั้นสร้างโดย AI
เครื่องมือตรวจจับ AI ไม่รู้ความหมายของคำและใช้บริบทเพื่อวิเคราะห์ข้อความ เพื่อให้ได้เทคนิคมากขึ้น เครื่องมือต่างๆ จะใช้บริบทของสิ่งที่ อยู่ทางซ้าย ของคำต่อไปนี้เพื่อทำนายความเป็นไปได้ของคำที่อยู่ทางขวา
ยิ่งคำทางด้านขวาคาดเดาได้มากเท่าใด ข้อความนั้นจะถูกสร้างโดย AI มากเท่านั้น ในทางกลับกัน ประโยคที่มนุษย์เขียนขึ้นนั้นแตกต่างจากรูปแบบที่คาดเดาได้และมีความคิดสร้างสรรค์มากกว่า
หากคุณเป็นเหมือนฉัน ตัวอย่างพื้นฐานอาจเป็นประโยชน์ในการทำความเข้าใจเรื่องนี้ มาทำลายมันกันเถอะ
สมมติว่ามีคนป้อนประโยคว่า "กระต่ายขนฟูมาก"
เครื่องมือนี้ใช้ข้อมูลที่เรียนรู้และบริบทของคำทาง ด้านซ้าย ของคำว่า "ปุย" เพื่อทำนายว่า "ปุย" มีแนวโน้มที่จะตามมามากกว่าคำว่า "น่ารัก" หรือ "นุ่ม"
เนื่องจากประโยคเป็นไปตามรูปแบบที่คาดการณ์ได้สูง เครื่องมือจึงน่าจะจำแนกข้อความว่าสร้างโดย AI
เครื่องมือตรวจจับ AI ทำงานในระดับที่ใหญ่กว่ามากโดยมีประโยคและย่อหน้าที่ซับซ้อนกว่า "กระต่ายขนปุกปุย" มาก เพื่อทำการคาดคะเนและจัดประเภท แต่นี่เป็นเพียงตัวอย่างพื้นฐานและแสดงให้เห็นว่ากระบวนการทำงานอย่างไร
เครื่องมือตรวจจับบางอย่างจะวิเคราะห์รูปภาพและวิดีโอ และใช้ความผิดปกติของพิกเซลเพื่อระบุว่ามีบางสิ่งที่ AI สร้างขึ้นหรือไม่
วิธีตรวจหาข้อความที่สร้างโดย AI
ไม่มีกฎหรือแนวทางที่กำหนดไว้สำหรับการระบุข้อความที่สร้างโดย AI แต่ต่อไปนี้เป็นสิ่งที่ควรระวัง:
- คำและวลีซ้ำ: AI รู้ว่ากำลังพูดถึงอะไร แต่ไม่ถึงขนาดที่ผู้เชี่ยวชาญของมนุษย์รู้ ผลลัพธ์ของมันอาจใช้คำหลักและวลีเดียวกันซ้ำกันโดยมีการเปลี่ยนแปลงเล็กน้อยเมื่อพูดถึงหัวข้อหนึ่งๆ
- ขาดความลึกซึ้ง: เครื่องมือสร้างขาดความลึกซึ้งและไม่สามารถไปไกลกว่าข้อเท็จจริงพื้นฐานเพื่อวิเคราะห์หัวข้อและพัฒนาข้อมูลเชิงลึกที่ไม่เหมือนใคร ข้อความที่สร้างโดย AI อาจอ่านแบบโรบ็อตและอธิบายมากกว่าโฆษณาและมีโทนเสียงทั่วไป
- ข้อมูลที่ไม่ถูกต้องและล้าสมัย: ข้อเท็จจริงที่เครื่องมือสร้างเนื้อหามีโดยทั่วไปนั้นถูกต้อง แต่เนื่องจากเครื่องมือสร้างการคาดการณ์ ผลลัพธ์ที่ได้จึงอาจไม่ถูกต้องหรือไม่เกี่ยวข้องกับข้อเท็จจริงที่แท้จริง นอกจากนี้ ข้อมูลอาจล้าสมัย เช่น วิธีที่ ChatGPT จำกัดข้อมูลก่อนเดือนกันยายน 2021
- รูปแบบและโครงสร้าง: เครื่องมือสร้างใช้โครงสร้างประโยคเดียวกับมนุษย์ แต่ประโยคอาจสั้นกว่าและไม่มีความซับซ้อน ความคิดสร้างสรรค์ และโครงสร้างประโยคที่หลากหลายซึ่งมนุษย์สร้างขึ้น เนื้อหาสามารถปรับปรุงและเหมือนกันได้โดยมีการเปลี่ยนแปลงเล็กน้อย
ข้อความที่เขียนโดยมนุษย์ยังมีแนวโน้มที่จะพิมพ์ผิดและใช้ภาษาที่ไม่เป็นทางการและไม่เป็นทางการและตะกรัน
Roft.io เป็นเกมที่สนุกที่จะทดสอบทักษะการตรวจจับของคุณและดูว่าคุณสามารถคาดเดาได้ดีเพียงใดเมื่อข้อความถูกสร้างโดย AI
วิธีตรวจหารูปภาพและวิดีโอที่สร้างโดย AI
การระบุรูปภาพและวิดีโอที่สร้างโดย AI อาจทำได้ยากกว่าการตรวจจับข้อความเล็กน้อย บางส่วนที่กล่าวถึงกันทั่วไปคือ:
- พื้นหลังที่มีพื้นผิว รูปภาพที่ดูพู่กัน จังหวะแปรงแบบสุ่มทั่วทั้งภาพ
- ความคมชัดของภาพโดยรวมหรือบางส่วนของภาพที่พร่ามัวในขณะที่บางส่วนมีความชัดเจนมากขึ้น
- ข้อความที่เห็นได้ชัดเจนในพื้นหลังของภาพ
- ความไม่สมดุลของใบหน้า ฟัน และมือของมนุษย์
- สัญญาณของลายน้ำศิลปินหรือลายเซ็น (เครื่องมือ AI ได้รับการฝึกฝนจากงานศิลปะที่มีอยู่)
เครื่องมือเช่น DALL-E 2 จะวางลายน้ำบนเอาต์พุตภาพ แต่อาจมองเห็นได้ไม่ง่ายนัก OpenAI ยังอนุญาตให้ผู้คนลบลายน้ำได้ คุณยังสามารถย้อนกลับการค้นหารูปภาพเพื่อดูว่ามีร่องรอยของรูปภาพบนเว็บหรือไม่
ความท้าทายในการตรวจจับรูปภาพและวิดีโอ AI คือสาเหตุที่การปลอมแปลงอย่างลึกล้ำนั้นอันตรายมาก เนื่องจากวิดีโอและรูปภาพที่ดูเหมือนมีชีวิตมากพอสามารถแพร่กระจายข้อมูลที่ผิดได้อย่างรวดเร็ว
เครื่องมือตรวจจับ AI
ในขณะนี้ อาจง่ายกว่าที่จะบอกได้ว่ามีบางสิ่งที่ AI สร้างขึ้นหรือไม่ เนื่องจากฟังดูคล้ายหุ่นยนต์ หรือมีมือของใครบางคนขาดสองนิ้วในภาพ หากเครื่องมือสร้างมีความซับซ้อนมากขึ้น มนุษย์อาจค้นหาความแตกต่างของคีย์ได้ยากขึ้น
โดยไม่คำนึงถึงความก้าวหน้าในอนาคต เครื่องมือตรวจจับจะมีประโยชน์มากกว่าความสามารถในการหักลบของเราเองในการจำแนกเนื้อหาที่สร้างโดย AI และมีตัวเลือกมากมายให้เลือกใช้
ด้านล่างนี้เราจะพูดถึงบางส่วนและให้คะแนนประสิทธิภาพโดยใช้ย่อหน้าที่สร้างขึ้นโดย AI จากผู้ช่วยเนื้อหาของ HubSpot (ซึ่งใช้ GPT) นี่คือสิ่งที่มันให้ฉันเมื่อฉันขอให้เขียนย่อหน้าเกี่ยวกับสุนัข:
“สุนัขเป็นสัตว์ที่น่าทึ่ง พวกเขาซื่อสัตย์ รัก และให้ความบันเทิงไม่รู้จบ ไม่ว่าคุณจะต้องการเพื่อนขนปุกปุยไว้กอดบนโซฟาหรือเพื่อนที่ซื่อสัตย์เพื่อสำรวจโลกกว้างด้วยกัน สุนัขพร้อมเสมอสำหรับงานนี้ พวกมันมาในรูปร่างและขนาดต่าง ๆ ตั้งแต่ชิวาวาถ้วยชาเล็ก ๆ ไปจนถึงเกรทเดนผู้สง่างาม แต่สุนัขทุกตัวมีสิ่งหนึ่งที่เหมือนกัน นั่นคือความสามารถที่ไร้ขอบเขตสำหรับความรักและความเสน่หา ไม่ว่าคุณจะเป็นคนรักสุนัขมาตลอดชีวิตหรือเพิ่งเข้ามาสู่โลกแห่งมิตรภาพสุนัข ไม่เคยมีเวลาไหนที่จะดีไปกว่านี้อีกแล้วในการค้นพบความสุขในชีวิตกับเพื่อนขนปุกปุยที่อยู่เคียงข้างคุณ”
โปรดทราบว่าการเขียนโดยมนุษย์ยังสามารถเรียกใช้เครื่องมือได้หากเป็นไปตามรูปแบบที่คาดเดาได้
1. ศูนย์ GPT
- ราคา: ฟรีหรือติดต่อสำหรับ API ที่กำหนดเอง
- ทดสอบสำหรับ: ChatGPT และ Google Bard
อัลกอริทึมของ ZeroGPT ได้รับการฝึกอบรมในบทความและข้อความกว่า 10 ล้านรายการเพื่อให้มีอัตราความแม่นยำในการตรวจจับที่ 98% รองรับข้อความหลายภาษาและตรวจจับโปรแกรมสร้างภาษายอดนิยม เช่น Chat GPT, GPT-4 และ Google Bard เอาต์พุตเน้นประโยคที่ AI เขียนมากที่สุด
ฉันป้อนย่อหน้าที่ AI สร้างขึ้นเกี่ยวกับสุนัข และคาดการณ์ว่าข้อความนั้นสร้างโดย AI/GPT 88.57%
ดีที่สุดสำหรับ: ZeroGPT สร้างขึ้นเพื่อให้นักการศึกษาทดสอบเนื้อหาที่สร้างโดย AI แต่ใช้ได้กับทุกคนที่ต้องการตรวจหาเนื้อหา AI
2. ห้องทดสอบโมเดลภาษายักษ์
- ราคา: ฟรี
- การทดสอบสำหรับ : พัฒนาขึ้นในปี 2019 สำหรับข้อความ GPT-2 อาจไม่น่าเชื่อถือในโปรแกรมสร้างอื่นๆ
ห้องปฏิบัติการ AI ของ MIT-IBM Watson และกลุ่ม Harvard NLP ได้สร้างห้องทดสอบโมเดลภาษายักษ์เพื่อตรวจหาข้อความที่สร้างขึ้นโดย AI โดยจะวิเคราะห์อินพุตตามโอกาสที่แต่ละคำจะปรากฏโดยอิงจากคำที่อยู่ทางซ้ายทันที ยิ่งคำนั้นสามารถคาดเดาได้มากเท่าใด ข้อความนั้นจะถูกเขียนโดย AI มากขึ้นเท่านั้น
เครื่องมือนี้ไม่ได้ให้เปอร์เซ็นต์ แต่ให้รหัสสีคำตามความสามารถในการคาดเดา โดยสีเขียวหมายความว่าคำนั้นเป็นส่วนหนึ่งของคำที่คาดเดาได้มากที่สุด 10 อันดับแรก
ย่อหน้าส่วนใหญ่ของฉันถูกเน้นด้วยสีเขียว ดังนั้นคำเหล่านี้จึงเป็นส่วนหนึ่งของ 10 อันดับแรกที่คาดเดาได้มากที่สุด (ตามบริบท) และมีแนวโน้มที่จะสร้างโดย AI มากกว่า
ดีที่สุดสำหรับ: การทดสอบ GPT-2 และเรียนรู้เพิ่มเติมเกี่ยวกับการเขียนที่คาดเดาได้ผ่านการวิเคราะห์ความน่าจะเป็นเชิงลึก
3. ความคิดริเริ่ม AI
- ราคา: ทดลองใช้ฟรี 50 เครดิต จากนั้น $0.01/100 คำ (1 เครดิตสแกนได้ 100 คำ)
- การทดสอบสำหรับ: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J
Originality.AI Chrome Extension สร้างขึ้นโดยผู้เชี่ยวชาญด้านการตลาดเนื้อหา ตรวจจับ GPT หลายเวอร์ชันด้วยความแม่นยำ 94% มันให้คะแนนข้อความในระดับ 0-100 โดยคะแนนที่สูงกว่านั้นมีความเป็นไปได้สูงที่ AI จะผลิตออกมา คุณยังสามารถใช้เครื่องมือนี้เพื่อสแกนหาการลอกเลียนแบบ (เป็นประโยชน์สำหรับนักการศึกษา) แม่นยำที่สุดด้วยคำศัพท์มากกว่า 50 คำ
จากการทดสอบของฉัน มันบอกว่าย่อหน้านั้นมีความเป็นไปได้ 99% ที่จะถูกเขียนโดย AI
ดีที่สุดสำหรับ: ส่วนขยาย Chrome ทำให้สมบูรณ์แบบสำหรับทุกคนที่มองหากระบวนการตรวจจับที่ราบรื่นและรวดเร็วเมื่อเขียนและอ่านออนไลน์ นักเขียน นักการตลาดเนื้อหา และผู้เผยแพร่เว็บสามารถใช้ประโยชน์จากเครื่องมือนี้ได้ ไม่ใช่สำหรับนักวิชาการ
4. เนื้อหาตามขนาด
- ราคา: เวอร์ชันฟรี หรือติดต่อสอบถามราคา API
- การทดสอบสำหรับ: GPT
เนื้อหาที่ AI Detector ของ Scale ใช้เครื่องมือ AI 3 ตัวและการประมวลผลภาษาธรรมชาติเพื่อตรวจจับ ChatGPT, GPT ทุกเวอร์ชัน และตัวกำเนิดอื่นๆ คุณสามารถใช้เพื่อทดสอบ SEO เนื้อหาด้านการศึกษาและการตลาด เครื่องมือนี้ต้องการอย่างน้อย 25 คำเพื่อให้ได้ผลลัพธ์ที่เชื่อถือได้ และคุณสามารถป้อนอักขระได้สูงสุด 25,000 ตัว
ผลการทดสอบของฉันยังไม่สามารถสรุปได้เนื่องจากเครื่องมือไม่สามารถพูดได้อย่างแน่นอนว่าย่อหน้านั้นสร้างโดย AI หรือไม่ มันให้คะแนนเนื้อหามนุษย์ 51% พร้อมความสามารถในการคาดเดา 17%
มันพูดด้วยความมั่นใจว่าประโยคสุดท้ายนั้นสร้างโดย AI
ดีที่สุดสำหรับ: SEO และผู้สร้างเนื้อหาที่มุ่งเน้นด้านการตลาดเพื่อรับการแจกแจงข้อความแบบบรรทัดต่อบรรทัดและวิเคราะห์เนื้อหาที่ยาวขึ้น (สูงสุด 25,000 อักขระ)
5. นักเขียน AI
- ราคา: รุ่นฟรีหรือติดต่อสำหรับราคา API
- การทดสอบสำหรับ: ChatGPT และตัวสร้างอื่นๆ
เครื่องมือตรวจสอบเนื้อหาของ Writer AI จะประมาณจำนวนข้อความที่ AI สร้างขึ้น เวอร์ชันฟรีและแบบชำระเงินมีขีดจำกัด 300 คำ (1,500 อักขระ) และผลลัพธ์จะให้เปอร์เซ็นต์การคาดคะเนว่าข้อความนั้นเป็นเนื้อหาที่มนุษย์สร้างขึ้นมากน้อยเพียงใด
มันให้คะแนนย่อหน้าของฉันเป็น 87% ที่มนุษย์สร้างขึ้น พร้อมคำแนะนำให้แก้ไขข้อความจนกว่าจะมีเนื้อหา AI ที่ตรวจจับได้น้อยลง
ดีที่สุดสำหรับ: B2B และองค์กรและหน่วยงานที่ต้องการวิเคราะห์และแก้ไขเนื้อหาก่อนเผยแพร่
6. เครื่องมือตรวจจับ AI ของ Hive
- ราคา: สาธิตฟรี ติดต่อฝ่ายขายเพื่อสอบถามราคา API
- การทดสอบสำหรับ: ChatGPT, GPT-3, DALL-E, Midjourney, Stable Diffusion
Hive นำเสนอชุดเครื่องมือตรวจจับ AI สำหรับรูปภาพ ข้อความ และ Deepfakes
เครื่องมือตรวจจับข้อความจะให้คะแนนความมั่นใจว่าบางสิ่งน่าจะสร้างโดย AI และประเมินว่าส่วนใดสามารถคาดเดาได้มากที่สุด นอกจากนี้ยังประเมินว่าส่วนใดของข้อความมีแนวโน้มที่จะสร้างโดย AI ใช้งานได้โดยเริ่มต้นที่ 750 อักขระโดยมีความยาวที่แนะนำ 1,500 อักขระ
ฉันต้องป้อนคำเพิ่มเติมเพื่อให้ถึงจำนวนอักขระสูงสุด และคาดการณ์ว่าย่อหน้านี้น่าจะมีเนื้อหาที่สร้างโดย AI ถึง 99.99%
เครื่องมือรู้จำสื่อจะระบุสื่อที่สร้างโดย AI จำแนกประเภท (สร้างโดย AI หรือไม่) คะแนนความเชื่อมั่น (≤ 1) และแหล่งที่มาของการสร้างภาพ (เช่น DALL-E) (เอกสารประกอบหน้าเครื่องมือ)
เครื่องมือตรวจจับ Deepfake จะทดสอบว่ารูปภาพหรือวิดีโอเป็นของปลอมหรือไม่ผ่านการจำแนกใบหน้า (เอกสารประกอบ)
ดีที่สุดสำหรับ: งานคัดกรองเพื่อตรวจหาเนื้อหา AI หรือสำหรับเว็บไซต์เพื่อตรวจหาและกลั่นกรองรูปภาพและข้อความที่สร้างโดย AI
7. โบนัส: ตัวแยกประเภทข้อความของ OpenAI
- ราคา: ฟรี (ต้องมีบัญชี)
- การทดสอบสำหรับ: GPT ทุกรุ่น
Text Classifier ของ OpenAI สามารถแยกความแตกต่างระหว่างข้อความที่สร้างโดย AI และข้อความที่มนุษย์เขียน ใช้งานได้ดีที่สุดกับตัวอักษรและข้อความภาษาอังกฤษมากกว่า 1,000 ตัว
OpenAI สังเกตว่ามันไม่น่าเชื่อถือทั้งหมดและระบุข้อความ AI ได้อย่างถูกต้องเพียง 26% และติดป้ายกำกับข้อความที่มนุษย์เขียนอย่างไม่ถูกต้องว่าเป็น AI 9% ของเวลาทั้งหมด แต่ความน่าเชื่อถือจะเพิ่มขึ้นสำหรับข้อความที่ยาวขึ้น แนะนำให้ใช้ลักษณนามเป็นส่วนเสริมของวิธีการทดสอบอื่นๆ
ดีที่สุดสำหรับ: การตรวจจับ GPT
เครื่องมือตรวจจับ AI ที่ดีที่สุดคืออะไร
ฉันได้สรุปคะแนนการทดสอบของแต่ละเครื่องมือไว้ด้านบนแล้ว แต่นี่คือตารางเปรียบเทียบคะแนน
เครื่องมือ | คะแนน |
ศูนย์ GPT | เนื้อหา AI 88.57% |
ห้องทดสอบโมเดลภาษายักษ์ | ความน่าจะเป็นเท่านั้น |
ความคิดริเริ่ม AI | เนื้อหา AI 99% |
เนื้อหาในระดับ | เนื้อหา AI 49% |
นักเขียนไอ | เนื้อหา AI 13% |
รังผึ้ง | เนื้อหา AI 99.99% |
จากการจัดอันดับเหล่านี้
- ที่หนึ่งเป็นการเสมอกัน ระหว่าง Originality.AI, GLTR และ Hive AI
- อันดับที่สอง คือ ZeroGPT
- อันดับที่ 3 คือ Writer AI
- อันดับที่สี่ คือเนื้อหาตามขนาด
ไปยังคุณ
การตรวจจับด้วย AI ช่วยให้แยกความแตกต่างระหว่างข้อความที่เครื่องคอมพิวเตอร์และข้อความที่มนุษย์สร้างขึ้นได้ง่ายขึ้นมาก เมื่อเครื่องมือ AI มีความแม่นยำมากขึ้นเรื่อยๆ การตรวจจับของ AI จะยังคงมีความสำคัญในการช่วยผู้คนในการพิจารณาความถูกต้องของเนื้อหาที่พวกเขาบริโภค