Cara Menentukan Teks dan Gambar yang Dihasilkan AI [+ Alat Deteksi]
Diterbitkan: 2023-04-11Konten yang dihasilkan oleh AI adalah perkembangan yang menarik, dan kami melihat semakin banyak artikel, cerita, dan gambar yang dibuat oleh alat AI. (Terima kasih, AI, untuk kalimat intronya.)
Namun, munculnya alat generasi AI yang canggih telah mengungkap potensi masalah, mulai dari orang yang tidak dapat mendeteksi perbedaan antara AI dan generasi manusia hingga prediksi dan analisis AI yang salah.
Di sinilah deteksi AI berperan, karena ini adalah cara bagi orang untuk mengetahui kapan teks, gambar, dan bahkan video dibuat oleh mesin, sehingga mereka dapat membuat keputusan berdasarkan informasi tentang konten yang mereka konsumsi. Dalam posting ini, kita akan membahas:
Apa itu deteksi AI?
Deteksi AI mencari tahu apakah konten itu buatan AI atau manusia, biasanya dengan bantuan alat deteksi AI yang menggunakan pembelajaran mesin dan pemrosesan bahasa alami untuk mengidentifikasi pola. Jika konten mengikuti pola yang lebih dapat diprediksi, alat kemungkinan akan mengklasifikasikannya sebagai buatan AI.
Alat deteksi AI tidak mengetahui arti kata dan menggunakan konteks untuk menganalisis teks. Untuk lebih teknis, alat menggunakan konteks di sebelah kiri kata berikut untuk memprediksi kemungkinan kata di sebelah kanan.
Semakin mudah diprediksi kata di sebelah kanan, semakin besar kemungkinan teks dihasilkan oleh AI. Di sisi lain, kalimat yang ditulis manusia bervariasi dari pola yang dapat diprediksi dan lebih kreatif.
Jika Anda seperti saya, contoh dasar mungkin bisa membantu untuk memahami ini. Mari kita hancurkan.
Katakanlah seseorang memasukkan kalimat, "Kelinci sangat lembut."
Alat ini menggunakan data yang dipelajari dan konteks kata di sebelah kiri "halus" untuk memprediksi bahwa "halus" lebih mungkin muncul berikutnya, lebih dari kata-kata seperti "imut" atau "lembut".
Karena kalimat mengikuti pola yang sangat mudah ditebak, alat tersebut kemungkinan akan mengklasifikasikan teks sebagai buatan AI.
Alat pendeteksi AI bekerja pada skala yang jauh lebih besar dengan kalimat dan paragraf yang lebih kompleks daripada "Kelinci sangat halus" untuk membuat prediksi dan klasifikasi, tetapi ini adalah contoh dasar dan menunjukkan cara kerja proses.
Beberapa alat deteksi menganalisis gambar dan video dan menggunakan anomali piksel untuk menentukan apakah ada sesuatu yang dihasilkan AI.
Cara Mendeteksi Teks yang Dihasilkan AI
Tidak ada aturan atau pedoman yang ditetapkan untuk mengidentifikasi teks yang dihasilkan AI, tetapi berikut adalah beberapa hal yang harus diperhatikan:
- Pengulangan kata dan frasa: AI tahu apa yang dibicarakannya, tetapi tidak sejauh yang dilakukan oleh pakar manusia. Keluarannya mungkin mengulangi kata kunci dan frasa yang sama dengan sedikit variasi saat membahas suatu topik.
- Kurangnya kedalaman: Alat pembuatan kurang mendalam dan tidak dapat melampaui fakta dasar untuk benar-benar menganalisis suatu topik dan mengembangkan wawasan yang unik. Teks yang dihasilkan AI mungkin terbaca lebih robotik dan preskriptif daripada kreatif dan memiliki nada umum.
- Informasi yang tidak akurat dan kedaluwarsa: Fakta yang dimiliki alat pembuat konten biasanya benar, tetapi karena alat membuat prediksi, hasilnya bisa salah atau tidak terkait dengan fakta sebenarnya. Selain itu, informasi dapat menjadi usang, seperti bagaimana ChatGPT terbatas pada informasi sebelum September 2021.
- Format dan struktur: Alat pembangkitan mengikuti struktur kalimat yang sama dengan manusia, tetapi kalimat bisa lebih pendek dan tidak memiliki kerumitan, kreativitas, dan variasi struktur kalimat yang dihasilkan manusia. Konten dapat disederhanakan dan seragam dengan sedikit variasi.
Teks yang ditulis manusia juga lebih cenderung memiliki kesalahan ketik dan menggunakan bahasa dan slag yang informal dan santai.
Roft.io adalah gim seru untuk menguji kemampuan pendeteksian Anda dan melihat seberapa baik Anda dalam memprediksi kapan teks dihasilkan oleh AI.
Cara Mendeteksi Gambar dan Video yang Dihasilkan AI
Mengidentifikasi gambar dan video yang dihasilkan AI bisa sedikit lebih menantang daripada mendeteksi teks. Beberapa tell yang biasa dibahas adalah:
- Latar belakang bertekstur, gambar yang terlihat seperti airbrush, sapuan kuas acak di seluruh gambar
- Ketajaman gambar secara keseluruhan, atau bagian gambar yang buram sementara yang lain lebih jelas
- Teks yang terlihat di latar belakang gambar
- Asimetri pada wajah, gigi, dan tangan manusia
- Tanda tanda air atau tanda tangan artis (alat AI dilatih dari karya seni yang ada)
Alat seperti DALL-E 2 memberi tanda air pada keluaran gambar, tetapi mungkin tidak mudah dikenali. OpenAI juga memungkinkan orang untuk menghapus tanda air. Anda juga dapat membalikkan pencarian gambar untuk melihat apakah ada jejak gambar di web.
Tantangan untuk mendeteksi gambar dan video AI adalah mengapa deepfake sangat berbahaya, karena video dan gambar yang tampak cukup nyata dapat dengan cepat menyebarkan informasi yang salah.
Alat Deteksi AI
Saat ini, mungkin lebih mudah untuk mengetahui apakah sesuatu dihasilkan oleh AI karena terdengar seperti robot, atau tangan seseorang kehilangan dua jari dalam sebuah gambar. Jika alat generasi menjadi lebih canggih, mungkin akan lebih sulit bagi manusia untuk menemukan perbedaan utama.
Terlepas dari perkembangan di masa mendatang, alat pendeteksi dapat lebih membantu daripada kemampuan deduksi kami sendiri dalam mengklasifikasikan konten yang dihasilkan AI, dan ada berbagai opsi yang tersedia.
Di bawah ini kami akan membahas beberapa di antaranya dan menilai keefektifannya menggunakan paragraf buatan AI dari Content Assistant HubSpot (yang menggunakan GPT). Inilah yang diberikannya kepada saya ketika saya memintanya untuk menulis paragraf tentang anjing:
“Anjing adalah makhluk yang luar biasa. Mereka setia, penuh kasih, dan menghibur tanpa henti. Apakah Anda membutuhkan teman berbulu untuk dipeluk di sofa atau teman setia untuk menjelajahi alam bebas bersama, anjing selalu siap untuk tugas itu. Mereka datang dalam berbagai bentuk dan ukuran, dari Chihuahua cangkir teh kecil hingga Great Dane yang agung, tetapi semua anjing memiliki satu kesamaan: kapasitas cinta dan kasih sayang yang tak terbatas. Apakah Anda seorang pecinta anjing seumur hidup atau pendatang baru di dunia persahabatan anjing, tidak pernah ada waktu yang lebih baik untuk menemukan kegembiraan hidup dengan teman berbulu di sisi Anda.
Perhatikan bahwa tulisan manusia masih dapat memicu alat jika mengikuti pola yang dapat diprediksi.
1.ZeroGPT
- Harga: Gratis atau hubungi untuk API khusus
- Tes untuk: ChatGPT dan Google Bard
Algoritme ZeroGPT dilatih pada 10 juta+ artikel dan teks untuk memiliki tingkat akurasi deteksi 98%. Ini mendukung teks multibahasa dan mendeteksi generator bahasa populer seperti Chat GPT, GPT-4, dan Google Bard. Output menyoroti kalimat yang paling mungkin ditulis oleh AI.
Saya memasuki paragraf yang dihasilkan AI tentang anjing, dan teks tersebut diperkirakan 88,57% dihasilkan AI/GPT.
Terbaik untuk: ZeroGPT dibangun untuk pendidik untuk menguji konten yang dihasilkan AI, tetapi ini berfungsi untuk siapa saja yang ingin mendeteksi konten AI.
2. Ruang Tes Model Bahasa Raksasa
- Harga: Gratis
- Pengujian untuk : Dikembangkan pada 2019 untuk teks GPT-2, mungkin tidak dapat diandalkan di generator lain
Laboratorium AI MIT-IBM Watson dan grup NLP Harvard menciptakan Ruang Uji Model Bahasa Raksasa untuk mendeteksi teks yang dihasilkan AI. Ini menganalisis input berdasarkan seberapa besar kemungkinan setiap kata muncul berdasarkan kata tepat di sebelah kiri. Semakin mudah diprediksi kata tersebut, semakin besar kemungkinan teks tersebut ditulis oleh AI.
Alat ini tidak memberikan persentase tetapi kode warna kata-kata berdasarkan prediktabilitasnya, dengan warna hijau artinya kata tersebut termasuk dalam 10 besar kata yang paling mudah diprediksi.
Sebagian besar paragraf saya disorot dengan warna hijau, jadi kata-kata tersebut adalah bagian dari 10 teratas yang paling dapat diprediksi (berdasarkan konteks) dan lebih mungkin dihasilkan oleh AI.
Terbaik untuk: Menguji GPT-2 dan mempelajari lebih lanjut tentang penulisan yang dapat diprediksi melalui analisis probabilitas mendalam.
3. Orisinalitas.AI
- Harga: Uji coba 50 kredit gratis, lalu $0,01/100 kata (1 kredit memindai 100 kata)
- Tes untuk: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J
Originality.AI Chrome Extension, dibuat oleh pakar pemasaran konten, mendeteksi beberapa versi GPT dengan akurasi 94%. Ini menilai teks pada skala 0-100, dengan skor yang lebih tinggi berarti kemungkinan lebih tinggi untuk diproduksi oleh AI. Anda juga dapat menggunakan alat ini untuk memindai plagiarisme (bermanfaat bagi pendidik). Ini yang paling akurat dengan lebih dari 50 kata.
Dengan pengujian saya, dikatakan bahwa paragraf tersebut 99% kemungkinan ditulis oleh AI.
Terbaik untuk: Ekstensi Chrome membuatnya sempurna bagi siapa saja yang mencari proses deteksi yang mulus dan cepat saat menulis dan membaca online. Penulis, pemasar konten, dan penerbit web sama-sama dapat memanfaatkan alat ini; bukan untuk akademisi.
4. Konten Sesuai Skala
- Harga: Versi gratis, atau hubungi untuk harga API
- Tes untuk: GPT
Content at Scale's AI Detector menggunakan 3 mesin AI dan pemrosesan bahasa alami untuk mendeteksi ChatGPT, semua versi GPT, dan generator lainnya. Anda dapat menggunakannya untuk menguji konten SEO, pendidikan, dan pemasaran. Alat ini membutuhkan setidaknya 25 kata untuk hasil yang andal, dan Anda dapat memasukkan hingga 25.000 karakter.
Hasil pengujian saya tidak meyakinkan karena alat tersebut tidak dapat mengatakan dengan pasti apakah paragraf tersebut dihasilkan oleh AI. Itu memberi skor konten manusia 51% dengan prediktabilitas 17%.
Dikatakan dengan pasti bahwa kalimat terakhir dihasilkan oleh AI.
Terbaik untuk: SEO dan pembuat konten yang berfokus pada pemasaran untuk mendapatkan perincian teks baris demi baris dan menganalisis potongan konten yang lebih panjang (hingga 25.000 karakter).
5. Penulis AI
- Harga: Versi gratis atau kontak untuk harga API
- Tes untuk: ChatGPT dan generator lainnya
Detektor konten Writer AI memperkirakan berapa banyak teks yang dihasilkan AI. Versi gratis dan berbayar memiliki batas 300 kata (1.500 karakter), dan hasilnya memberikan persentase prediksi berapa banyak teks yang merupakan konten buatan manusia.
Itu menilai paragraf saya sebagai 87% buatan manusia, dengan rekomendasi untuk mengedit teks sampai ada konten AI yang kurang terdeteksi.
Cocok untuk: B2B dan perusahaan serta agensi yang ingin menganalisis dan mengedit konten sebelum dipublikasikan.
6. Alat Deteksi AI Hive
- Harga: Demo gratis, hubungi penjualan untuk mengetahui harga API
- Pengujian untuk: ChatGPT, GPT-3, DALL-E, Midjourney, Difusi Stabil
Hive menawarkan seperangkat alat deteksi AI untuk gambar, teks, dan deepfake.
Alat pendeteksi teks memberikan skor kepercayaan untuk seberapa besar kemungkinan sesuatu dihasilkan oleh AI, dan memperkirakan bagian mana yang paling dapat diprediksi. Ini juga memperkirakan bagian teks mana yang lebih mungkin dihasilkan oleh AI. Ini berfungsi mulai dari 750 karakter dengan panjang yang disarankan 1500 karakter.
Saya harus memasukkan kata tambahan untuk mencapai batas karakter, dan diperkirakan paragraf tersebut 99,99% kemungkinan berisi konten buatan AI.
Alat pengenalan media mengidentifikasi media yang dihasilkan AI, memberikan klasifikasi (dihasilkan AI atau tidak), skor kepercayaan (≤ 1), dan sumber pembuatan gambar (seperti DALL-E). (Dokumentasi, halaman alat)
Alat deteksi deepfake menguji apakah gambar atau video adalah deepfake melalui klasifikasi wajah. (Dokumentasi)
Terbaik untuk: Pekerjaan penyaringan untuk mendeteksi konten AI atau untuk situs web untuk mendeteksi dan memoderasi gambar dan teks yang dihasilkan AI.
7. Bonus: Pengklasifikasi Teks OpenAI
- Harga: Gratis (memerlukan akun)
- Pengujian untuk: Semua versi GPT
Pengklasifikasi Teks OpenAI dapat membedakan antara teks yang dihasilkan AI dan teks yang ditulis manusia. Ini berfungsi paling baik dengan lebih dari 1.000 karakter dan teks bahasa Inggris.
OpenAI mencatat bahwa itu tidak sepenuhnya dapat diandalkan dan hanya mengidentifikasi dengan benar 26% teks AI dan salah memberi label teks yang ditulis manusia sebagai AI 9% dari waktu, tetapi keandalan meningkat untuk teks yang lebih panjang. Ini merekomendasikan penggunaan classifier sebagai pelengkap metode pengujian lainnya.
Terbaik untuk: Mendeteksi GPT
Apa alat pendeteksi AI terbaik?
Saya menguraikan skor tes individu masing-masing alat di atas, tetapi di sini ada tabel yang membandingkan skor.
Alat | skor |
ZeroGPT | 88,57% konten AI |
Ruang Tes Model Bahasa Raksasa | Probabilitas saja |
Orisinalitas.AI | 99% konten AI |
Konten dalam Skala Besar | 49% konten AI |
Penulis AI | 13% konten AI |
Sarang lebah | 99,99% konten AI |
Berdasarkan peringkat tersebut,
- Tempat pertama adalah seri antara Originality.AI, GLTR, dan Hive AI
- Tempat kedua adalah ZeroGPT
- Tempat ketiga adalah Writer AI
- Tempat keempat adalah Konten Sesuai Skala
Ke Anda
Deteksi AI membuatnya jauh lebih mudah untuk membedakan antara mesin dan teks yang dihasilkan manusia. Karena alat AI menjadi semakin akurat, deteksi AI akan tetap penting dalam membantu orang menentukan keabsahan konten yang mereka konsumsi.