Cum să identificați textul și imaginile generate de AI [+ Instrumente de detectare]
Publicat: 2023-04-11Conținutul generat de AI este o dezvoltare fascinantă și vedem din ce în ce mai multe articole, povești și imagini create de instrumente AI. (Mulțumesc, AI, pentru propoziția introductivă.)
Însă, creșterea instrumentelor avansate de generare a AI a expus probleme potențiale, de la oamenii care nu sunt în măsură să detecteze diferența dintre AI și generațiile umane până la predicțiile și analizele AI care sunt complet greșite.
Aici intervine detectarea AI, deoarece este o modalitate prin care oamenii să descopere când textul, imaginile și chiar videoclipurile sunt generate de mașină, astfel încât să poată lua decizii informate cu privire la conținutul pe care îl consumă. În această postare, vom acoperi:
Ce este detectarea AI?
Detectarea AI este să descopere dacă conținutul este AI sau generat de oameni, de obicei cu ajutorul unui instrument de detectare AI care utilizează învățarea automată și procesarea limbajului natural pentru a identifica tipare. Dacă conținutul urmează un model mai previzibil, un instrument îl va clasifica probabil ca fiind generat de AI.
Instrumentele de detectare AI nu cunosc semnificația cuvintelor și folosesc contextul pentru a analiza textul. Pentru a deveni mai tehnic, instrumentele folosesc contextul a ceea ce este în stânga următorului cuvânt pentru a prezice probabilitatea cuvântului din dreapta.
Cu cât cuvântul din dreapta este mai previzibil, cu atât este mai probabil ca textul să fie generat de inteligență artificială. Pe de altă parte, propozițiile scrise de oameni diferă de tiparele previzibile și sunt mai creative.
Dacă sunteți ca mine, un exemplu de bază ar putea fi util pentru a înțelege acest lucru. Să-l descompunem.
Spuneți că cineva introduce propoziția „Iepurașii sunt atât de pufosi”.
Instrumentul folosește datele învățate și contextul cuvintelor din stânga „pufos” pentru a prezice că „pufos” este mai probabil să urmeze, mai mult decât cuvinte precum „drăguț” sau „moale”.
Deoarece propoziția urmează un model foarte previzibil, instrumentul va clasifica probabil textul ca fiind generat de AI.
Instrumentele de detectare AI funcționează la o scară mult mai mare, cu propoziții și paragrafe mai complexe decât „Iepurașii sunt atât de pufosi” pentru a face predicții și clasificări, dar acesta este un exemplu de bază și arată cum funcționează procesul.
Unele instrumente de detectare analizează imagini și videoclipuri și folosesc anomalii ale pixelilor pentru a determina dacă ceva este generat de AI.
Cum să detectați textul generat de AI
Nu există reguli sau linii directoare stabilite pentru identificarea textului generat de inteligență artificială, dar iată câteva lucruri la care trebuie să țineți cont:
- Repetarea cuvintelor și a frazelor: AI știe despre ce vorbește, dar nu în măsura în care experții umani o cunosc. Rezultatele sale pot repeta aceleași cuvinte cheie și expresii cu mici variații atunci când discutați un subiect.
- Lipsa de profunzime: instrumentele de generare sunt lipsite de profunzime și nu pot depăși faptele de bază pentru a analiza cu adevărat un subiect și a dezvolta o perspectivă unică. Textul generat de inteligență artificială poate citi mai mult robotic și prescriptiv decât creativ și poate avea un ton generic.
- Informații inexacte și învechite: faptele pe care le au instrumentele de generare de conținut sunt de obicei corecte, dar, deoarece instrumentele fac predicții, rezultatele pot fi incorecte sau fără legătură cu faptele adevărate. În plus, informațiile pot fi învechite, cum ar fi modul în care ChatGPT este limitat la informațiile dinainte de septembrie 2021.
- Format și structură: instrumentele de generare urmează aceeași structură de propoziție ca și oamenii, dar propozițiile pot fi mai scurte și nu au complexitatea, creativitatea și structura variată a propozițiilor pe care oamenii le produc. Conținutul poate fi simplificat și uniform, cu mici variații.
De asemenea, este mai probabil ca textul scris de oameni să aibă greșeli de scriere și să folosească un limbaj informal și obișnuit și zgură.
Roft.io este un joc distractiv pentru a-ți testa abilitățile de detectare și pentru a vedea cât de bun ești în a prezice când textul este generat de AI.
Cum să detectați imaginile și videoclipurile generate de AI
Identificarea imaginilor și videoclipurilor generate de AI poate fi puțin mai dificilă decât detectarea textului. Câteva spunuri discutate frecvent sunt:
- Fundaluri texturate, imagini care arată aerograf, mișcări aleatorii ale pensulei în imagini
- Claritatea generală a imaginii sau părți ale imaginilor care sunt neclare, în timp ce altele sunt mai clare
- Text vizibil în fundalul imaginilor
- Asimetrie pe fețele umane, dinții și mâinile
- Semne ale filigranelor sau semnăturilor artistului (instrumentele AI sunt antrenate din lucrări de artă existente)
Instrumente precum DALL-E 2 plasează un filigran pe ieșirile de imagine, dar s-ar putea să nu fie ușor de identificat. OpenAI permite, de asemenea, oamenilor să elimine un filigran. De asemenea, puteți inversa căutarea imaginilor pentru a vedea dacă există urme ale unei imagini pe web.
Provocarea detectării imaginilor și videoclipurilor AI este motivul pentru care deepfake-urile sunt atât de periculoase, deoarece videoclipurile și imaginile care par suficient de realiste pot răspândi rapid dezinformarea.
Instrumente de detectare AI
În acest moment, ar putea fi mai ușor de spus dacă ceva este generat de inteligență artificială, deoarece sună robotizat, sau mâinii cuiva îi lipsesc două degete dintr-o imagine. Dacă instrumentele de generație devin mai sofisticate, ar putea fi mai greu pentru oameni să găsească discrepanțele cheie.
Indiferent de evoluțiile viitoare, instrumentele de detectare pot fi mai utile decât propriile noastre abilități de deducere în clasificarea conținutului generat de AI și există diferite opțiuni disponibile.
Mai jos, vom trece peste unele dintre ele și le vom evalua eficacitatea utilizând un paragraf generat de AI din Asistentul de conținut HubSpot (care folosește GPT). Iată ce mi-a dat când i-am cerut să scriu un paragraf despre câini:
„Câinii sunt pur și simplu creaturi uimitoare. Sunt loiali, iubitoare și distractive la nesfârșit. Indiferent dacă aveți nevoie de un prieten blănos cu care să vă îmbrățișați pe canapea sau de un însoțitor loial cu care să explorați în aer liber, câinii sunt întotdeauna pregătiți pentru sarcină. Ei vin în toate formele și dimensiunile, de la micii Chihuahua la ceașcă de ceai până la măreții mari danezi, dar toți câinii au un lucru în comun: o capacitate nemărginită de dragoste și afecțiune. Indiferent dacă ești un iubitor de câini de o viață sau un nou venit în lumea companiei canine, nu a existat niciodată un moment mai bun pentru a descoperi bucuriile vieții alături de un prieten blănos.”
Rețineți că scrierea umană poate încă declanșa un instrument dacă urmează un model previzibil.
1. ZeroGPT
- Preț: gratuit sau contactați pentru API personalizat
- Teste pentru: ChatGPT și Google Bard
Algoritmul ZeroGPT este antrenat pe peste 10 milioane de articole și text pentru a avea o rată de acuratețe a detectării de 98%. Acceptă text multilingv și detectează generatoare de limbi populare precum Chat GPT, GPT-4 și Google Bard. Ieșirile evidențiază propozițiile cel mai probabil să fie scrise de AI.
Am introdus paragraful generat de AI despre câini și a prezis că textul este generat în proporție de 88,57% AI/GPT.
Cel mai bun pentru: ZeroGPT a fost creat pentru ca educatorii să testeze conținutul generat de AI, dar funcționează pentru oricine caută să detecteze conținutul AI.
2. Sala de testare a modelului gigant de limbaj
- Pret: Gratuit
- Teste pentru : Dezvoltat în 2019 pentru text GPT-2, ar putea fi nesigur pe alți generatori
Laboratorul MIT-IBM Watson AI și grupul Harvard NLP au creat Camera de testare a modelului Giant Language pentru a detecta textul generat de AI. Analizează intrările în funcție de cât de probabil este să apară fiecare cuvânt pe baza cuvântului imediat din stânga. Cu cât cuvântul este mai previzibil, cu atât este mai probabil ca textul să fie scris de AI.
Acest instrument nu oferă un procent, ci codifică culorile cuvintelor în funcție de predictibilitatea lor, iar verdele înseamnă că cuvântul face parte din primele 10 cuvinte cele mai previzibile.
Majoritatea paragrafului meu este evidențiat în verde, astfel încât cuvintele fac parte din primele 10 cele mai previzibile (pe baza contextului) și sunt mai probabil să fie generate de IA.
Cel mai bun pentru: testarea GPT-2 și aflarea mai multe despre scrierea previzibilă printr-o analiză aprofundată a probabilității.
3. Originalitate.AI
- Preț: Probă gratuită de 50 de credite, apoi 0,01 USD/100 de cuvinte (1 credit scanează 100 de cuvinte)
- Teste pentru: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J
Extensia Chrome Originality.AI, creată de experți în marketing de conținut, detectează mai multe versiuni de GPT cu o acuratețe de 94%. Acesta punctează textul pe o scară de la 0 la 100, un scor mai mare fiind o probabilitate mai mare de a fi produs de AI. De asemenea, puteți utiliza instrumentul pentru a scana pentru plagiat (beneficios pentru educatori). Este cel mai precis cu mai mult de 50 de cuvinte.
Cu testul meu, s-a spus că paragraful era probabil de 99% să fi fost scris de AI.
Cel mai bun pentru: extensia Chrome o face perfectă pentru oricine caută un proces de detectare fără întreruperi și imediată atunci când scrie și citește online. Scriitorii, marketerii de conținut și editorii web deopotrivă pot folosi acest instrument; nu pentru academicieni.
4. Conținut la scară
- Preț: versiune gratuită sau contactați pentru prețul API
- Teste pentru: GPT
Conținutul AI Detector de la Scale utilizează 3 motoare AI și procesarea limbajului natural pentru a detecta ChatGPT, toate versiunile GPT și alte generatoare. Îl puteți folosi pentru a testa conținut SEO, educațional și de marketing. Instrumentul are nevoie de cel puțin 25 de cuvinte pentru rezultate fiabile și puteți introduce până la 25.000 de caractere.
Rezultatele testelor mele au fost neconcludente, deoarece instrumentul nu a putut spune cu certitudine dacă paragraful a fost generat de AI. A dat un scor de conținut uman de 51%, cu o predictibilitate de 17%.
S-a spus cu certitudine că ultima propoziție este generată de inteligență artificială.
Cel mai bun pentru: creatorii de conținut orientați spre SEO și marketing pentru a obține defalcări ale textului rând cu rând și pentru a analiza bucăți mai lungi de conținut (până la 25.000 de caractere).
5. Scriitor AI
- Preț: versiune gratuită sau contactați pentru prețul API
- Teste pentru: ChatGPT și alte generatoare
Detectorul de conținut al Writer AI estimează cât de mult text este generat de AI. Versiunile gratuite și plătite au o limită de 300 de cuvinte (1.500 de caractere), iar rezultatele oferă un procent de predicție pentru cât de mult text este conținut generat de oameni.
A punctat paragraful meu ca fiind 87% generat de oameni, cu o recomandare de a edita textul până când există mai puțin conținut AI detectabil.
Cel mai bun pentru: B2B și întreprinderi și agenții care doresc să analizeze și să editeze conținut înainte de publicare.
6. Instrumentele de detectare AI de la Hive
- Preț: demonstrație gratuită, contactați vânzările pentru prețurile API
- Teste pentru: ChatGPT, GPT-3, DALL-E, Midjourney, Stable Diffusion
Hive oferă o suită de instrumente de detectare AI pentru imagini, text și deepfake.
Instrumentul de detectare a textului oferă un scor de încredere pentru cât de probabil ceva este generat de AI și estimează care secțiuni sunt cele mai previzibile. De asemenea, estimează ce secțiuni de text au mai multe șanse să fie generate de IA. Funcționează începând de la 750 de caractere cu o lungime recomandată de 1500 de caractere.
A trebuit să introduc cuvinte suplimentare pentru a atinge limita de caractere și a prezis că paragraful avea o probabilitate de 99,99% să conțină conținut generat de AI.
Instrumentul de recunoaștere media identifică mediile generate de AI, oferă o clasificare (generată de AI sau nu), scor de încredere (≤ 1) și sursa de generare a imaginii (cum ar fi DALL-E). (Documentație, pagină instrument)
Instrumentul de detectare a deepfake-ului testează dacă imaginile sau videoclipurile sunt deepfake prin clasificarea facială. (Documentație)
Cel mai bun pentru: munca de screening pentru a detecta conținutul AI sau pentru site-urile web pentru a detecta și modera imaginile și textul generate de AI.
7. Bonus: Clasificatorul de text al OpenAI
- Preț: gratuit (necesită cont)
- Teste pentru: Toate versiunile de GPT
Clasificatorul de text al OpenAI poate face distincția între textul generat de AI și textul scris de om. Funcționează cel mai bine cu mai mult de 1.000 de caractere și text în limba engleză.
OpenAI observă că nu este în întregime fiabil și identifică corect doar 26% din textul AI și etichetează incorect textul scris de oameni ca fiind AI 9% din timp, dar fiabilitatea crește pentru textul mai lung. Se recomandă utilizarea clasificatorului ca o completare a altor metode de testare.
Cel mai bun pentru: Detectarea GPT
Care este cel mai bun instrument de detectare AI?
Am subliniat mai sus scorul individual al fiecărui instrument, dar iată un tabel care compară scorurile.
Instrument | Scor |
ZeroGPT | 88,57% conținut AI |
Sala gigantică de testare a modelelor lingvistice | Numai probabilitate |
Originalitate.AI | 99% conținut AI |
Conținut la scară | 49% conținut AI |
Scriitor AI | 13% conținut AI |
Stup | 99,99% conținut AI |
Pe baza acestor clasamente,
- Primul loc este o egalitate între Originality.AI, GLTR și Hive AI
- Locul al doilea este ZeroGPT
- Locul al treilea este Writer AI
- Locul al patrulea este Conținut la scară
Este randul tau
Detectarea AI face mult mai ușoară distingerea dintre textul generat de mașină și cel generat de oameni. Pe măsură ce instrumentele AI devin din ce în ce mai precise, detectarea AI va rămâne importantă pentru a ajuta oamenii să determine legitimitatea conținutului pe care îl consumă.