So lokalisieren Sie KI-generierten Text und Bilder [+ Erkennungstools]
Veröffentlicht: 2023-04-11KI-generierte Inhalte sind eine faszinierende Entwicklung, und wir sehen immer mehr Artikel, Geschichten und Bilder, die von KI-Tools erstellt wurden. (Danke, AI, für den Einleitungssatz.)
Aber der Aufstieg fortschrittlicher Tools zur KI-Generierung hat potenzielle Probleme aufgedeckt, von Menschen, die den Unterschied zwischen KI und menschlichen Generationen nicht erkennen können, bis hin zu KI-Vorhersagen und -Analysen, die absolut falsch sind.
Hier kommt die KI-Erkennung ins Spiel, da die Menschen auf diese Weise erkennen können, wann Text, Bilder und sogar Videos maschinell generiert wurden, damit sie fundierte Entscheidungen über die von ihnen konsumierten Inhalte treffen können. In diesem Beitrag behandeln wir:
Was ist KI-Erkennung?
Bei der KI-Erkennung wird festgestellt, ob Inhalte KI- oder menschengeneriert sind, normalerweise mit Hilfe eines KI-Erkennungstools, das maschinelles Lernen und die Verarbeitung natürlicher Sprache verwendet, um Muster zu erkennen. Wenn Inhalte einem vorhersehbareren Muster folgen, wird ein Tool sie wahrscheinlich als KI-generiert klassifizieren.
KI-Erkennungstools kennen die Bedeutung von Wörtern nicht und verwenden den Kontext, um Text zu analysieren. Um technischer zu werden, verwenden Tools den Kontext dessen, was links vom folgenden Wort steht, um die Wahrscheinlichkeit des Wortes rechts vorherzusagen.
Je vorhersehbarer das Wort rechts ist, desto wahrscheinlicher ist der Text KI-generiert. Andererseits weichen von Menschen geschriebene Sätze von vorhersagbaren Mustern ab und sind kreativer.
Wenn Sie so etwas wie ich sind, könnte ein einfaches Beispiel hilfreich sein, um dies zu verstehen. Lass es uns aufschlüsseln.
Angenommen, jemand gibt den Satz ein: „Hasen sind so flauschig.“
Das Tool verwendet erlernte Daten und den Kontext von Wörtern links von „flauschig“, um vorherzusagen, dass „flauschig“ eher als nächstes kommt als Wörter wie „süß“ oder „weich“.
Da der Satz einem sehr vorhersehbaren Muster folgt, wird das Tool den Text wahrscheinlich als KI-generiert klassifizieren.
KI-Erkennungstools arbeiten in einem viel größeren Maßstab mit komplexeren Sätzen und Absätzen als „Hasen sind so flauschig“, um Vorhersagen und Klassifizierungen zu treffen, aber dies ist ein grundlegendes Beispiel und zeigt, wie der Prozess funktioniert.
Einige Erkennungstools analysieren Bilder und Videos und verwenden Pixelanomalien, um festzustellen, ob etwas von KI generiert wurde.
So erkennen Sie KI-generierten Text
Es gibt keine festgelegten Regeln oder Richtlinien zur Identifizierung von KI-generiertem Text, aber hier sind einige Dinge, auf die Sie achten sollten:
- Wiederholung von Wörtern und Sätzen: KI weiß, wovon sie spricht, aber nicht in dem Maße wie menschliche Experten. Seine Ausgaben können dieselben Schlüsselwörter und Phrasen mit geringer Variation wiederholen, wenn ein Thema diskutiert wird.
- Fehlende Tiefe: Generierungstools haben keine Tiefe und können nicht über grundlegende Fakten hinausgehen, um ein Thema wirklich zu analysieren und einzigartige Erkenntnisse zu gewinnen. KI-generierter Text liest sich möglicherweise eher roboterhaft und präskriptiv als kreativ und hat einen generischen Ton.
- Ungenaue und veraltete Informationen: Die Fakten, die Tools zur Generierung von Inhalten haben, sind normalerweise korrekt, aber da die Tools Vorhersagen treffen, können die Ergebnisse falsch sein oder nichts mit wahren Fakten zu tun haben. Darüber hinaus können Informationen veraltet sein, wie z. B. die Beschränkung von ChatGPT auf Informationen vor September 2021.
- Format und Struktur: Generierungswerkzeuge folgen der gleichen Satzstruktur wie Menschen, aber Sätze können kürzer sein und ihnen fehlt die Komplexität, Kreativität und abwechslungsreiche Satzstruktur, die Menschen produzieren. Der Inhalt kann mit geringen Abweichungen gestrafft und einheitlich gestaltet werden.
Von Menschen geschriebener Text weist auch eher Tippfehler auf und verwendet informelle und beiläufige Sprache und Schlacke.
Roft.io ist ein lustiges Spiel, um Ihre Erkennungsfähigkeiten zu testen und zu sehen, wie gut Sie vorhersagen können, wenn Text von KI generiert wird.
So erkennen Sie KI-generierte Bilder und Videos
Das Identifizieren von KI-generierten Bildern und Videos kann etwas schwieriger sein als das Erkennen von Text. Einige häufig diskutierte Tells sind:
- Strukturierte Hintergründe, Bilder, die wie Airbrush aussehen, zufällige Pinselstriche in allen Bildern
- Gesamtbildschärfe oder Teile von Bildern, die verschwommen sind, während andere klarer sind
- Auffälliger Text im Hintergrund von Bildern
- Asymmetrie in menschlichen Gesichtern, Zähnen und Händen
- Zeichen von Künstlerwasserzeichen oder Unterschriften (KI-Tools werden anhand vorhandener Kunstwerke trainiert)
Tools wie DALL-E 2 platzieren ein Wasserzeichen auf Bildausgaben, aber sie sind möglicherweise nicht leicht zu erkennen. OpenAI erlaubt es auch, ein Wasserzeichen zu entfernen. Sie können die Bildsuche auch umkehren, um zu sehen, ob es Spuren eines Bildes im Internet gibt.
Die Herausforderung, KI-Bilder und -Videos zu erkennen, ist der Grund, warum Deepfakes so gefährlich sind, da Videos und Bilder, die lebensecht genug erscheinen, schnell Fehlinformationen verbreiten können.
KI-Erkennungstools
Im Moment ist es vielleicht einfacher zu sagen, ob etwas KI-generiert ist, weil es roboterhaft klingt, oder ob jemandes Hand auf einem Bild zwei Finger vermisst. Wenn die Generierungswerkzeuge ausgefeilter werden, könnte es für Menschen schwieriger werden, die wichtigsten Diskrepanzen zu finden.
Ungeachtet zukünftiger Fortschritte können Erkennungstools bei der Klassifizierung von KI-generierten Inhalten hilfreicher sein als unsere eigenen Schlussfolgerungsfähigkeiten, und es stehen verschiedene Optionen zur Verfügung.
Im Folgenden gehen wir einige davon durch und bewerten ihre Effektivität anhand eines KI-generierten Absatzes aus dem Inhaltsassistenten von HubSpot (der GPT verwendet). Folgendes gab es mir, als ich es bat, einen Absatz über Hunde zu schreiben:
„Hunde sind einfach erstaunliche Geschöpfe. Sie sind treu, liebevoll und endlos unterhaltsam. Ob Sie einen pelzigen Freund zum Kuscheln auf der Couch oder einen treuen Begleiter zum Erkunden der freien Natur brauchen, Hunde sind immer für die Aufgabe bereit. Es gibt sie in allen Formen und Größen, vom winzigen Teetassen-Chihuahua bis zur majestätischen Deutschen Dogge, aber alle Hunde haben eines gemeinsam: eine grenzenlose Fähigkeit zu Liebe und Zuneigung. Egal, ob Sie ein lebenslanger Hundeliebhaber oder ein Neuling in der Welt der Hundegesellschaft sind, es gab noch nie einen besseren Zeitpunkt, um die Freuden des Lebens mit einem pelzigen Freund an Ihrer Seite zu entdecken.“
Beachten Sie, dass menschliches Schreiben immer noch ein Werkzeug auslösen kann, wenn es einem vorhersehbaren Muster folgt.
1. ZeroGPT
- Preis: Kostenlos oder kontaktieren Sie uns für eine benutzerdefinierte API
- Tests für: ChatGPT und Google Bard
Der Algorithmus von ZeroGPT wurde mit über 10 Millionen Artikeln und Texten trainiert, um eine Erkennungsgenauigkeit von 98 % zu erreichen. Es unterstützt mehrsprachigen Text und erkennt beliebte Sprachgeneratoren wie Chat GPT, GPT-4 und Google Bard. Ausgaben heben Sätze hervor, die am wahrscheinlichsten von KI geschrieben wurden.
Ich habe den KI-generierten Absatz über Hunde eingegeben, und es wurde vorhergesagt, dass der Text zu 88,57 % KI/GPT-generiert ist.
Am besten für: ZeroGPT wurde für Pädagogen entwickelt, um KI-generierte Inhalte zu testen, aber es funktioniert für alle, die KI-Inhalte erkennen möchten.
2. Riesiger Sprachmodell-Testraum
- Preis: Kostenlos
- Tests für : Entwickelt im Jahr 2019 für GPT-2-Text, könnte auf anderen Generatoren unzuverlässig sein
Das MIT-IBM Watson AI Lab und die Harvard NLP Group haben den Giant Language Model Test Room entwickelt, um KI-generierten Text zu erkennen. Es analysiert Eingaben basierend darauf, wie wahrscheinlich es ist, dass jedes Wort basierend auf dem Wort unmittelbar links davon erscheint. Je vorhersehbarer das Wort ist, desto wahrscheinlicher ist der Text von KI geschrieben.
Dieses Tool gibt keinen Prozentsatz an, sondern codiert Wörter basierend auf ihrer Vorhersagbarkeit farblich, wobei Grün bedeutet, dass das Wort zu den Top 10 der am besten vorhersagbaren Wörter gehört.
Der größte Teil meines Absatzes ist grün hervorgehoben, sodass die Wörter zu den Top 10 gehören, die am vorhersehbarsten sind (basierend auf dem Kontext) und mit größerer Wahrscheinlichkeit KI-generiert sind.
Am besten geeignet für: Testen Sie GPT-2 und erfahren Sie mehr über vorhersagbares Schreiben durch eine eingehende Wahrscheinlichkeitsanalyse.
3. Originalität.KI
- Preis: Kostenlose Testversion mit 50 Credits, dann 0,01 USD/100 Wörter (1 Credit scannt 100 Wörter)
- Tests für: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J
Originality.AI Chrome Extension, entwickelt von Content-Marketing-Experten, erkennt mehrere Versionen von GPT mit einer Genauigkeit von 94 %. Es bewertet Text auf einer Skala von 0-100, wobei eine höhere Punktzahl eine höhere Wahrscheinlichkeit bedeutet, dass er von KI erstellt wird. Sie können das Tool auch verwenden, um nach Plagiaten zu suchen (vorteilhaft für Pädagogen). Es ist am genauesten mit mehr als 50 Wörtern.
Bei meinem Test hieß es, dass der Absatz mit 99% Wahrscheinlichkeit von KI geschrieben wurde.
Optimal für: Die Chrome-Erweiterung macht sie perfekt für alle, die nach einem nahtlosen und sofortigen Erkennungsprozess beim Online-Schreiben und -Lesen suchen. Autoren, Content-Vermarkter und Web-Publisher können dieses Tool gleichermaßen nutzen; nicht für Akademiker.
4. Umfangreiche Inhalte
- Preis: Kostenlose Version oder Kontakt für API-Preise
- Tests für: GPT
Der KI-Detektor von Content at Scale verwendet 3 KI-Engines und die Verarbeitung natürlicher Sprache, um ChatGPT, alle Versionen von GPT und andere Generatoren zu erkennen. Sie können damit SEO-, Bildungs- und Marketinginhalte testen. Das Tool benötigt mindestens 25 Wörter für zuverlässige Ergebnisse, und Sie können bis zu 25.000 Zeichen eingeben.
Meine Testergebnisse waren nicht schlüssig, da das Tool nicht mit Sicherheit sagen konnte, ob der Absatz KI-generiert war. Es ergab einen Human Content Score von 51 % mit 17 % Vorhersagbarkeit.
Es wurde mit Sicherheit gesagt, dass der letzte Satz KI-generiert ist.
Am besten geeignet für: Ersteller von Inhalten mit Fokus auf SEO und Marketing, um zeilenweise Textaufschlüsselungen zu erhalten und längere Inhalte (bis zu 25.000 Zeichen) zu analysieren.
5. Schreiber-KI
- Preis: Kostenlose Version oder Kontakt für API-Preise
- Tests für: ChatGPT und andere Generatoren
Der Inhaltsdetektor von Writer AI schätzt, wie viel Text von der KI generiert wird. Die kostenlose und die kostenpflichtige Version haben ein Limit von 300 Wörtern (1.500 Zeichen), und die Ergebnisse geben einen Vorhersageprozentsatz dafür, wie viel des Textes von Menschen erstellte Inhalte sind.
Mein Absatz wurde zu 87 % von Menschen erstellt, mit der Empfehlung, den Text zu bearbeiten, bis weniger erkennbare KI-Inhalte vorhanden sind.
Am besten geeignet für: B2B und Unternehmen sowie Agenturen, die Inhalte vor der Veröffentlichung analysieren und bearbeiten möchten.
6. Die KI-Erkennungstools von Hive
- Preis: Kostenlose Demo, kontaktieren Sie den Vertrieb für API-Preise
- Tests für: ChatGPT, GPT-3, DALL-E, Midjourney, Stable Diffusion
Hive bietet eine Reihe von KI-Erkennungstools für Bilder, Text und Deepfakes.
Das Texterkennungstool gibt einen Konfidenzwert dafür, wie wahrscheinlich es ist, dass etwas von der KI generiert wird, und schätzt, welche Abschnitte am vorhersehbarsten sind. Es schätzt auch, welche Textabschnitte mit größerer Wahrscheinlichkeit KI-generiert sind. Es funktioniert ab 750 Zeichen mit einer empfohlenen Länge von 1500 Zeichen.
Ich musste zusätzliche Wörter eingeben, um die Zeichenbeschränkung zu erreichen, und es wurde vorhergesagt, dass der Absatz mit 99,99-prozentiger Wahrscheinlichkeit KI-generierte Inhalte enthält.
Das Medienerkennungstool identifiziert KI-generierte Medien, gibt eine Klassifizierung (KI-generiert oder nicht), einen Konfidenzwert (≤ 1) und eine Bilderzeugungsquelle (wie DALL-E) an. (Dokumentation, Toolseite)
Das Deepfake-Erkennungstool testet anhand der Gesichtsklassifizierung, ob es sich bei Bildern oder Videos um Deepfakes handelt. (Dokumentation)
Am besten geeignet für: Screening-Arbeiten zur Erkennung von KI-Inhalten oder für Websites zur Erkennung und Moderation von KI-generierten Bildern und Texten.
7. Bonus: Textklassifikator von OpenAI
- Preis: Kostenlos (Konto erforderlich)
- Tests für: Alle Versionen von GPT
Der Textklassifizierer von OpenAI kann zwischen KI-generiertem Text und von Menschen geschriebenem Text unterscheiden. Es funktioniert am besten mit mehr als 1.000 Zeichen und englischem Text.
OpenAI stellt fest, dass es nicht vollständig zuverlässig ist und nur 26 % des KI-Texts korrekt identifiziert und von Menschen geschriebenen Text in 9 % der Fälle fälschlicherweise als KI kennzeichnet, aber die Zuverlässigkeit steigt bei längerem Text. Es empfiehlt, den Klassifikator als Ergänzung zu anderen Testmethoden zu verwenden.
Am besten geeignet für: Erkennung von GPT
Was ist das beste KI-Erkennungstool?
Ich habe oben die einzelnen Testergebnisse jedes Tools skizziert, aber hier ist eine Tabelle, in der die Ergebnisse verglichen werden.
Werkzeug | Punktzahl |
ZeroGPT | 88,57 % KI-Gehalt |
Riesiger Testraum für Sprachmodelle | Nur Wahrscheinlichkeit |
Originalität.KI | 99 % KI-Inhalt |
Inhalt im Maßstab | 49 % KI-Inhalt |
Schriftsteller KI | 13 % KI-Gehalt |
Bienenstock | 99,99 % KI-Inhalt |
Basierend auf diesen Rankings
- Der erste Platz ist ein Unentschieden zwischen Originality.AI, GLTR und Hive AI
- Der zweite Platz ist ZeroGPT
- Dritter Platz ist Writer AI
- Der vierte Platz ist Content at Scale
Zu dir hinüber
Die KI-Erkennung macht es viel einfacher, zwischen maschinell und von Menschen generiertem Text zu unterscheiden. Da KI-Tools immer genauer werden, wird die KI-Erkennung wichtig bleiben, um Menschen dabei zu helfen, die Legitimität der von ihnen konsumierten Inhalte zu bestimmen.