Come individuare testo e immagini generati dall'intelligenza artificiale [+ strumenti di rilevamento]
Pubblicato: 2023-04-11I contenuti generati dall'intelligenza artificiale sono uno sviluppo affascinante e stiamo vedendo sempre più articoli, storie e immagini creati da strumenti di intelligenza artificiale. (Grazie, AI, per la frase introduttiva.)
Tuttavia, l'ascesa di strumenti avanzati di generazione di intelligenza artificiale ha messo in luce potenziali problemi, dall'incapacità delle persone di rilevare la differenza tra intelligenza artificiale e generazioni umane a previsioni e analisi dell'IA completamente sbagliate.
È qui che entra in gioco il rilevamento dell'intelligenza artificiale, in quanto è un modo per le persone di scoprire quando testo, immagini e persino video sono generati dalla macchina, in modo che possano prendere decisioni informate sui contenuti che consumano. In questo post tratteremo:
Che cos'è il rilevamento AI?
Il rilevamento dell'intelligenza artificiale sta cercando di capire se il contenuto è generato dall'intelligenza artificiale o dall'uomo, di solito con l'aiuto di uno strumento di rilevamento dell'intelligenza artificiale che utilizza l'apprendimento automatico e l'elaborazione del linguaggio naturale per identificare i modelli. Se il contenuto segue uno schema più prevedibile, uno strumento probabilmente lo classificherà come generato dall'intelligenza artificiale.
Gli strumenti di rilevamento AI non conoscono il significato delle parole e usano il contesto per analizzare il testo. Per essere più tecnici, gli strumenti usano il contesto di cosa c'è a sinistra della parola seguente per prevedere la verosimiglianza della parola a destra.
Più prevedibile è la parola a destra, più è probabile che il testo sia generato dall'intelligenza artificiale. D'altra parte, le frasi scritte dall'uomo variano da schemi prevedibili e sono più creative.
Se sei come me, un esempio di base potrebbe essere utile per capirlo. Analizziamolo.
Supponiamo che qualcuno inserisca la frase "I coniglietti sono così soffici".
Lo strumento utilizza i dati appresi e il contesto delle parole a sinistra di "soffice" per prevedere che "soffice" è più probabile che venga dopo, più di parole come "carino" o "morbido".
Poiché la frase segue uno schema altamente prevedibile, lo strumento probabilmente classificherà il testo come generato dall'intelligenza artificiale.
Gli strumenti di rilevamento dell'intelligenza artificiale funzionano su una scala molto più ampia con frasi e paragrafi più complessi rispetto a "I coniglietti sono così soffici" per fare previsioni e classificazioni, ma questo è un esempio di base e mostra come funziona il processo.
Alcuni strumenti di rilevamento analizzano immagini e video e utilizzano le anomalie dei pixel per determinare se qualcosa è generato dall'intelligenza artificiale.
Come rilevare il testo generato dall'intelligenza artificiale
Non ci sono regole o linee guida fisse per identificare il testo generato dall'intelligenza artificiale, ma ecco alcune cose a cui prestare attenzione:
- Ripetizione di parole e frasi: l'intelligenza artificiale sa di cosa sta parlando, ma non nella misura in cui lo sanno gli esperti umani. I suoi risultati potrebbero ripetere le stesse parole chiave e frasi con poche variazioni quando si discute di un argomento.
- Mancanza di profondità: gli strumenti di generazione mancano di profondità e non possono andare oltre i fatti di base per analizzare veramente un argomento e sviluppare una visione unica. Il testo generato dall'intelligenza artificiale potrebbe essere più robotico e prescrittivo che creativo e avere un tono generico.
- Informazioni imprecise e obsolete: i fatti forniti dagli strumenti di generazione di contenuti sono in genere corretti, ma poiché gli strumenti effettuano previsioni, i risultati possono essere errati o non correlati a fatti reali. Inoltre, le informazioni possono essere obsolete, ad esempio il modo in cui ChatGPT è limitato alle informazioni precedenti a settembre 2021.
- Formato e struttura: gli strumenti di generazione seguono la stessa struttura delle frasi degli esseri umani, ma le frasi possono essere più brevi e prive della complessità, della creatività e della variegata struttura delle frasi prodotte dagli esseri umani. Il contenuto può essere semplificato e uniforme con poche variazioni.
È anche più probabile che il testo scritto dall'uomo contenga errori di battitura e utilizzi un linguaggio e scorie informali e casuali.
Roft.io è un gioco divertente per testare le tue capacità di rilevamento e vedere quanto sei bravo a prevedere quando il testo viene generato dall'IA.
Come rilevare immagini e video generati dall'intelligenza artificiale
Identificare immagini e video generati dall'intelligenza artificiale può essere un po' più impegnativo rispetto al rilevamento del testo. Alcuni tell comunemente discussi sono:
- Sfondi testurizzati, immagini che sembrano aerografate, pennellate casuali in tutte le immagini
- Nitidezza complessiva dell'immagine o parti di immagini sfocate mentre altre sono più nitide
- Testo visibile sullo sfondo delle immagini
- Asimmetria nei volti umani, nei denti e nelle mani
- Segni di filigrane o firme dell'artista (gli strumenti di intelligenza artificiale vengono addestrati da opere d'arte esistenti)
Strumenti come DALL-E 2 inseriscono una filigrana sugli output delle immagini, ma potrebbero non essere facili da individuare. OpenAI consente inoltre alle persone di rimuovere una filigrana. Puoi anche invertire la ricerca delle immagini per vedere se ci sono tracce di un'immagine sul web.
La sfida di rilevare immagini e video AI è il motivo per cui i deepfake sono così pericolosi, poiché video e immagini che sembrano abbastanza realistici possono diffondere rapidamente disinformazione.
Strumenti di rilevamento AI
Al momento, potrebbe essere più facile dire se qualcosa è generato dall'intelligenza artificiale perché sembra robotico o se alla mano di qualcuno mancano due dita in un'immagine. Se gli strumenti di generazione diventano più sofisticati, potrebbe essere più difficile per gli esseri umani trovare le principali discrepanze.
Indipendentemente dai progressi futuri, gli strumenti di rilevamento possono essere più utili delle nostre stesse capacità di deduzione nella classificazione dei contenuti generati dall'intelligenza artificiale e sono disponibili varie opzioni.
Di seguito ne esamineremo alcuni e valuteremo la loro efficacia utilizzando un paragrafo generato dall'intelligenza artificiale dall'Assistente contenuto di HubSpot (che utilizza GPT). Ecco cosa mi ha dato quando gli ho chiesto di scrivere un paragrafo sui cani:
“I cani sono creature semplicemente fantastiche. Sono leali, amorevoli e infinitamente divertenti. Che tu abbia bisogno di un amico peloso con cui coccolarti sul divano o di un fedele compagno con cui esplorare i grandi spazi aperti, i cani sono sempre all'altezza del compito. Ce ne sono di tutte le forme e dimensioni, dai minuscoli chihuahua da tè ai maestosi alani, ma tutti i cani condividono una cosa in comune: una capacità illimitata di amore e affetto. Che tu sia un amante dei cani per tutta la vita o un nuovo arrivato nel mondo della compagnia canina, non c'è mai stato un momento migliore per scoprire le gioie della vita con un amico peloso al tuo fianco.
Nota che la scrittura umana può ancora attivare uno strumento se segue uno schema prevedibile.
1. Zero GPT
- Prezzo: gratuito o contatto per API personalizzate
- Test per: ChatGPT e Google Bard
L'algoritmo di ZeroGPT è addestrato su oltre 10 milioni di articoli e testo per avere un tasso di precisione di rilevamento del 98%. Supporta il testo multilingue e rileva i generatori di lingue popolari come Chat GPT, GPT-4 e Google Bard. Gli output evidenziano le frasi che hanno più probabilità di essere scritte dall'IA.
Ho inserito il paragrafo sui cani generato dall'intelligenza artificiale e prevedeva che il testo fosse generato per l'88,57% da AI/GPT.
Ideale per: ZeroGPT è stato creato per gli educatori per testare i contenuti generati dall'IA, ma funziona per chiunque cerchi di rilevare i contenuti AI.
2. Sala test modello Giant Language
- Prezzo: gratuito
- Test per : Sviluppato nel 2019 per il testo GPT-2, potrebbe essere inaffidabile su altri generatori
Il laboratorio MIT-IBM Watson AI e il gruppo Harvard NLP hanno creato la Giant Language Model Test Room per rilevare il testo generato dall'IA. Analizza gli input in base alla probabilità che ciascuna parola appaia in base alla parola immediatamente a sinistra. Più prevedibile è la parola, più è probabile che il testo sia scritto dall'intelligenza artificiale.
Questo strumento non fornisce una percentuale ma codifica a colori le parole in base alla loro prevedibilità, con il verde che significa che la parola fa parte delle prime 10 parole più prevedibili.
La maggior parte del mio paragrafo è evidenziata in verde, quindi le parole fanno parte delle prime 10 più prevedibili (in base al contesto) e hanno maggiori probabilità di essere generate dall'IA.
Ideale per: testare GPT-2 e imparare di più sulla scrittura prevedibile attraverso un'approfondita analisi delle probabilità.
3. Originalità.AI
- Prezzo: prova gratuita di 50 crediti, quindi $ 0,01/100 parole (1 credito esegue la scansione di 100 parole)
- Test per: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J
Originality.AI Chrome Extension, creata da esperti di content marketing, rileva più versioni di GPT con una precisione del 94%. Assegna un punteggio al testo su una scala da 0 a 100, dove un punteggio più alto rappresenta una maggiore probabilità di essere prodotto dall'intelligenza artificiale. Puoi anche utilizzare lo strumento per cercare plagio (utile per gli educatori). È il più preciso con più di 50 parole.
Con il mio test, ha affermato che il paragrafo aveva una probabilità del 99% di essere stato scritto da AI.
Ideale per: l'estensione di Chrome lo rende perfetto per chiunque cerchi un processo di rilevamento immediato e senza soluzione di continuità durante la scrittura e la lettura online. Scrittori, marketer di contenuti ed editori web possono sfruttare questo strumento allo stesso modo; non per gli accademici.
4. Contenuto su larga scala
- Prezzo: versione gratuita o contatto per i prezzi dell'API
- Test per: GPT
Content at Scale's AI Detector utilizza 3 motori AI e l'elaborazione del linguaggio naturale per rilevare ChatGPT, tutte le versioni di GPT e altri generatori. Puoi usarlo per testare contenuti SEO, educativi e di marketing. Lo strumento richiede almeno 25 parole per risultati affidabili e puoi inserire fino a 25.000 caratteri.
I risultati del mio test sono stati inconcludenti perché lo strumento non poteva dire con certezza se il paragrafo fosse stato generato dall'intelligenza artificiale. Ha dato un punteggio di contenuto umano del 51% con una prevedibilità del 17%.
Ha detto con certezza che l'ultima frase è generata dall'intelligenza artificiale.
Ideale per: creatori di contenuti incentrati sulla SEO e sul marketing per ottenere suddivisioni del testo riga per riga e analizzare parti di contenuto più lunghe (fino a 25.000 caratteri).
5. IA dello scrittore
- Prezzo: versione gratuita o contatto per i prezzi dell'API
- Test per: ChatGPT e altri generatori
Il rilevatore di contenuto di Writer AI stima la quantità di testo generata dall'IA. Le versioni gratuite ea pagamento hanno un limite di 300 parole (1.500 caratteri) e i risultati forniscono una percentuale di previsione per quanto del testo è contenuto generato dall'uomo.
Ha valutato il mio paragrafo come 87% generato dall'uomo, con la raccomandazione di modificare il testo fino a quando non ci saranno contenuti AI meno rilevabili.
Ideale per: B2B, aziende e agenzie che desiderano analizzare e modificare i contenuti prima della pubblicazione.
6. Strumenti di rilevamento AI di Hive
- Prezzo: demo gratuita, contatta il reparto vendite per i prezzi dell'API
- Test per: ChatGPT, GPT-3, DALL-E, Midjourney, diffusione stabile
Hive offre una suite di strumenti di rilevamento AI per immagini, testo e deepfake.
Lo strumento di rilevamento del testo fornisce un punteggio di affidabilità sulla probabilità che qualcosa sia generato dall'intelligenza artificiale e stima quali sezioni sono più prevedibili. Stima inoltre quali sezioni di testo hanno maggiori probabilità di essere generate dall'intelligenza artificiale. Funziona a partire da 750 caratteri con una lunghezza consigliata di 1500 caratteri.
Ho dovuto inserire parole extra per raggiungere il limite di caratteri e prevedeva che il paragrafo avesse una probabilità del 99,99% di contenere contenuti generati dall'intelligenza artificiale.
Lo strumento di riconoscimento multimediale identifica i media generati dall'intelligenza artificiale, fornisce una classificazione (generata dall'IA o meno), un punteggio di affidabilità (≤ 1) e una fonte di generazione dell'immagine (come DALL-E). (Documentazione, pagina degli strumenti)
Lo strumento di rilevamento deepfake verifica se le immagini o i video sono deepfake attraverso la classificazione facciale. (Documentazione)
Ideale per: lavoro di screening per rilevare contenuti AI o siti Web per rilevare e moderare immagini e testo generati da AI.
7. Bonus: classificatore di testo di OpenAI
- Prezzo: Gratuito (richiede account)
- Test per: tutte le versioni di GPT
Il classificatore di testo di OpenAI è in grado di distinguere tra testo generato dall'intelligenza artificiale e testo scritto dall'uomo. Funziona meglio con più di 1.000 caratteri e testo in inglese.
OpenAI nota che non è del tutto affidabile e identifica correttamente solo il 26% del testo AI ed etichetta erroneamente il testo scritto dall'uomo come AI il 9% delle volte, ma l'affidabilità aumenta per il testo più lungo. Raccomanda di utilizzare il classificatore come complemento ad altri metodi di test.
Ideale per: rilevamento di GPT
Qual è il miglior strumento di rilevamento AI?
Ho delineato il punteggio del test individuale di ogni strumento sopra, ma ecco una tabella che confronta i punteggi.
Attrezzo | punto |
Zero GPT | 88,57% di contenuto AI |
Sala di prova del modello linguistico gigante | Solo probabilità |
Originalità.AI | Contenuto AI al 99%. |
Contenuto su scala | 49% di contenuto AI |
Scrittore AI | 13% di contenuti AI |
Alveare | Contenuto AI al 99,99%. |
Sulla base di queste classifiche,
- Il primo posto è un pareggio tra Originality.AI, GLTR e Hive AI
- Il secondo posto è ZeroGPT
- Il terzo posto è Writer AI
- Il quarto posto è Content at Scale
A voi
Il rilevamento AI rende molto più facile distinguere tra testo generato dalla macchina e generato dall'uomo. Man mano che gli strumenti di intelligenza artificiale diventano sempre più accurati, il rilevamento dell'IA rimarrà importante per aiutare le persone a determinare la legittimità dei contenuti che consumano.