Jak zlokalizować tekst i obrazy generowane przez sztuczną inteligencję [+ narzędzia do wykrywania]
Opublikowany: 2023-04-11Treść generowana przez sztuczną inteligencję to fascynujący rozwój i widzimy coraz więcej artykułów, historii i obrazów tworzonych przez narzędzia sztucznej inteligencji. (Dzięki, AI, za zdanie wprowadzające.)
Jednak rozwój zaawansowanych narzędzi do generowania sztucznej inteligencji ujawnił potencjalne problemy, od ludzi, którzy nie są w stanie wykryć różnicy między sztuczną inteligencją a ludzkimi pokoleniami, po całkowicie błędne prognozy i analizy AI.
W tym miejscu pojawia się wykrywanie AI, ponieważ jest to sposób, w jaki ludzie odkrywają, kiedy tekst, obrazy, a nawet filmy są generowane maszynowo, aby mogli podejmować świadome decyzje dotyczące treści, które konsumują. W tym poście omówimy:
Co to jest wykrywanie AI?
Wykrywanie sztucznej inteligencji polega na ustaleniu, czy treści są generowane przez sztuczną inteligencję, czy przez człowieka, zwykle za pomocą narzędzia do wykrywania sztucznej inteligencji, które wykorzystuje uczenie maszynowe i przetwarzanie języka naturalnego do identyfikowania wzorców. Jeśli treść ma bardziej przewidywalny wzór, narzędzie prawdopodobnie zaklasyfikuje ją jako wygenerowaną przez sztuczną inteligencję.
Narzędzia do wykrywania AI nie znają znaczenia słów i wykorzystują kontekst do analizy tekstu. Aby uzyskać bardziej techniczny charakter, narzędzia wykorzystują kontekst tego, co znajduje się po lewej stronie następującego słowa, aby przewidzieć prawdopodobieństwo wystąpienia słowa po prawej stronie.
Im bardziej przewidywalne jest słowo po prawej stronie, tym bardziej prawdopodobne jest, że tekst został wygenerowany przez sztuczną inteligencję. Z drugiej strony zdania pisane przez ludzi różnią się od przewidywalnych wzorców i są bardziej kreatywne.
Jeśli jesteś podobny do mnie, prosty przykład może być pomocny w zrozumieniu tego. Rozbijmy to.
Załóżmy, że ktoś wprowadza zdanie: „Króliczki są takie puszyste”.
Narzędzie wykorzystuje wyuczone dane i kontekst słów po lewej stronie słowa „puszysty”, aby przewidzieć, że „puszysty” będzie bardziej prawdopodobny niż słowa takie jak „uroczy” czy „miękki”.
Ponieważ zdanie ma wysoce przewidywalny wzorzec, narzędzie prawdopodobnie zaklasyfikuje tekst jako wygenerowany przez sztuczną inteligencję.
Narzędzia do wykrywania AI działają na znacznie większą skalę z bardziej złożonymi zdaniami i akapitami niż „Króliczki są takie puszyste”, aby przewidywać i klasyfikować, ale jest to podstawowy przykład i pokazuje, jak działa ten proces.
Niektóre narzędzia do wykrywania analizują obrazy i filmy oraz wykorzystują anomalie pikseli do określenia, czy coś jest generowane przez sztuczną inteligencję.
Jak wykryć tekst generowany przez sztuczną inteligencję
Nie ma ustalonych zasad ani wskazówek dotyczących identyfikowania tekstu generowanego przez sztuczną inteligencję, ale oto kilka rzeczy, na które należy zwrócić uwagę:
- Powtarzanie słów i zwrotów: sztuczna inteligencja wie, o czym mówi, ale nie w takim stopniu, w jakim wiedzą eksperci. Jego dane wyjściowe mogą powtarzać te same słowa kluczowe i frazy z niewielkimi różnicami podczas omawiania tematu.
- Brak głębi: narzędziom do generowania brakuje głębi i nie mogą wyjść poza podstawowe fakty, aby naprawdę przeanalizować temat i uzyskać unikalny wgląd. Tekst generowany przez sztuczną inteligencję może być czytany bardziej w sposób mechaniczny i nakazowy niż kreatywny i mieć ogólny ton.
- Niedokładne i nieaktualne informacje: Fakty, które mają narzędzia do generowania treści, są zazwyczaj prawidłowe, ale ponieważ narzędzia dokonują prognoz, wyniki mogą być nieprawidłowe lub niezwiązane z prawdziwymi faktami. Ponadto informacje mogą być nieaktualne, na przykład ChatGPT jest ograniczony do informacji sprzed września 2021 r.
- Format i struktura: narzędzia do generowania mają taką samą strukturę zdań jak ludzie, ale zdania mogą być krótsze i brakuje im złożoności, kreatywności i zróżnicowanej struktury zdań, które tworzą ludzie. Treść może być usprawniona i ujednolicona z niewielkimi zmianami.
Tekst napisany przez człowieka jest również bardziej narażony na błędy literowe i używa nieformalnego i swobodnego języka oraz żużla.
Roft.io to fajna gra, w której możesz przetestować swoje umiejętności wykrywania i zobaczyć, jak dobrze potrafisz przewidzieć, kiedy tekst jest generowany przez sztuczną inteligencję.
Jak wykrywać obrazy i filmy generowane przez sztuczną inteligencję
Identyfikacja obrazów i filmów generowanych przez sztuczną inteligencję może być nieco trudniejsza niż wykrywanie tekstu. Niektóre często omawiane instrukcje to:
- Teksturowane tła, obrazy wyglądające jak namalowane aerografem, przypadkowe pociągnięcia pędzlem na obrazach
- Ogólna ostrość obrazu lub części obrazów, które są rozmyte, a inne są wyraźniejsze
- Wyraźny tekst w tle obrazów
- Asymetria ludzkich twarzy, zębów i dłoni
- Znaki znaków wodnych lub podpisów artystów (narzędzia sztucznej inteligencji są szkolone na podstawie istniejących dzieł sztuki)
Narzędzia takie jak DALL-E 2 umieszczają znak wodny na wyjściowych obrazach, ale mogą one nie być łatwe do wykrycia. OpenAI pozwala również ludziom usuwać znak wodny. Możesz także odwrócić wyszukiwanie obrazu, aby sprawdzić, czy w Internecie są jakieś ślady obrazu.
Wyzwanie związane z wykrywaniem obrazów i filmów AI jest powodem, dla którego deepfakes są tak niebezpieczne, ponieważ filmy i obrazy, które wydają się wystarczająco realistyczne, mogą szybko rozprzestrzeniać dezinformację.
Narzędzia do wykrywania AI
W tej chwili może być łatwiej stwierdzić, czy coś jest generowane przez sztuczną inteligencję, ponieważ brzmi jak robot, czy też czyjejś dłoni brakuje dwóch palców na obrazie. Jeśli narzędzia do generowania staną się bardziej wyrafinowane, ludziom może być trudniej znaleźć kluczowe rozbieżności.
Niezależnie od przyszłych postępów narzędzia do wykrywania mogą być bardziej pomocne niż nasze własne zdolności dedukcyjne w klasyfikowaniu treści generowanych przez sztuczną inteligencję, a dostępne są różne opcje.
Poniżej omówimy niektóre z nich i ocenimy ich skuteczność na podstawie akapitu wygenerowanego przez sztuczną inteligencję z Content Assistant HubSpot (który korzysta z GPT). Oto, co mi dał, gdy poprosiłem go o napisanie akapitu o psach:
„Psy to po prostu niesamowite stworzenia. Są lojalni, kochający i nieskończenie zabawni. Niezależnie od tego, czy potrzebujesz futrzastego przyjaciela do przytulania się na kanapie, czy lojalnego towarzysza do odkrywania wspaniałych miejsc na świeżym powietrzu, psy zawsze są gotowe do wykonania zadania. Są we wszystkich kształtach i rozmiarach, od maleńkich filiżanek Chihuahua po majestatyczne dogi niemieckie, ale wszystkie psy mają jedną wspólną cechę: nieograniczoną zdolność do miłości i przywiązania. Niezależnie od tego, czy jesteś wieloletnim miłośnikiem psów, czy nowicjuszem w świecie psiego towarzystwa, nigdy nie było lepszego czasu na odkrywanie radości życia z futrzanym przyjacielem u boku.
Pamiętaj, że pismo ludzkie nadal może uruchomić narzędzie, jeśli jest zgodne z przewidywalnym wzorcem.
1. ZeroGPT
- Cena: bezpłatnie lub kontakt w sprawie niestandardowego interfejsu API
- Testy dla: ChatGPT i Google Bard
Algorytm ZeroGPT jest szkolony na ponad 10 milionach artykułów i tekstów, aby uzyskać wskaźnik dokładności wykrywania na poziomie 98%. Obsługuje wielojęzyczny tekst i wykrywa popularne generatory języków, takie jak Chat GPT, GPT-4 i Google Bard. Wyniki wyróżniają zdania, które najprawdopodobniej zostaną napisane przez sztuczną inteligencję.
Wszedłem do wygenerowanego przez sztuczną inteligencję akapitu o psach i okazało się, że tekst jest w 88,57% wygenerowany przez sztuczną inteligencję/GPT.
Najlepszy dla: ZeroGPT został stworzony dla nauczycieli do testowania treści generowanych przez AI, ale działa dla każdego, kto chce wykrywać treści AI.
2. Giant Language Model Test Room
- Cena: bezpłatna
- Testy dla : Opracowane w 2019 roku dla tekstu GPT-2, mogą być niewiarygodne na innych generatorach
Laboratorium MIT-IBM Watson AI i grupa Harvard NLP stworzyły model Giant Language Test Room do wykrywania tekstu generowanego przez AI. Analizuje dane wejściowe na podstawie prawdopodobieństwa pojawienia się każdego słowa na podstawie słowa znajdującego się bezpośrednio po lewej stronie. Im bardziej przewidywalne jest słowo, tym bardziej prawdopodobne jest, że tekst został napisany przez sztuczną inteligencję.
To narzędzie nie podaje wartości procentowej, ale koloruje słowa na podstawie ich przewidywalności, przy czym kolor zielony oznacza, że słowo należy do 10 najbardziej przewidywalnych słów.
Większość mojego akapitu jest podświetlona na zielono, więc słowa należą do 10 najbardziej przewidywalnych (na podstawie kontekstu) i z większym prawdopodobieństwem generowanych przez sztuczną inteligencję.
Najlepsze do: testowania GPT-2 i zdobywania wiedzy na temat przewidywalnego pisania poprzez dogłębną analizę prawdopodobieństwa.
3. Oryginalność.AI
- Cena: bezpłatna wersja próbna 50 kredytów, a następnie 0,01 USD/100 słów (1 kredyt skanuje 100 słów)
- Testy dla: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J
Rozszerzenie Originality.AI Chrome, stworzone przez ekspertów ds. marketingu treści, wykrywa wiele wersji GPT z 94% dokładnością. Ocenia tekst w skali od 0 do 100, przy czym wyższy wynik oznacza większe prawdopodobieństwo, że zostanie wyprodukowany przez sztuczną inteligencję. Możesz także użyć narzędzia do skanowania pod kątem plagiatu (korzystne dla nauczycieli). Jest najdokładniejszy z ponad 50 słowami.
W moim teście stwierdzono, że akapit na 99% został napisany przez sztuczną inteligencję.
Najlepsze dla: rozszerzenie Chrome sprawia, że jest to idealne rozwiązanie dla każdego, kto szuka płynnego i natychmiastowego procesu wykrywania podczas pisania i czytania online. Z tego narzędzia mogą korzystać zarówno pisarze, marketerzy treści, jak i wydawcy internetowi; nie dla naukowców.
4. Zawartość w skali
- Cena: Darmowa wersja lub kontakt w sprawie wyceny API
- Testy dla: GPT
Zawartość w narzędziu Scale's AI Detector wykorzystuje 3 silniki AI i przetwarzanie języka naturalnego do wykrywania ChatGPT, wszystkich wersji GPT i innych generatorów. Możesz go używać do testowania treści SEO, edukacyjnych i marketingowych. Aby uzyskać wiarygodne wyniki, narzędzie potrzebuje co najmniej 25 słów, a można wprowadzić do 25 000 znaków.
Moje wyniki testów nie były rozstrzygające, ponieważ narzędzie nie było w stanie stwierdzić z całą pewnością, czy akapit został wygenerowany przez sztuczną inteligencję. Dało to wynik dotyczący treści ludzkich na poziomie 51% z przewidywalnością na poziomie 17%.
Powiedział z całą pewnością, że ostatnie zdanie jest generowane przez AI.
Najlepsze dla: twórców treści zorientowanych na SEO i marketing, aby uzyskiwać szczegółowe zestawienia tekstu i analizować dłuższe fragmenty treści (do 25 000 znaków).
5. Sztuczna inteligencja pisarza
- Cena: Darmowa wersja lub kontakt w sprawie wyceny API
- Testy dla: ChatGPT i innych generatorów
Wykrywacz treści Writer AI szacuje, ile tekstu jest generowane przez AI. Wersje bezpłatne i płatne mają limit 300 słów (1500 znaków), a wyniki dają prognozę procentową, jaka część tekstu jest treścią generowaną przez człowieka.
Ocenił mój akapit jako 87% wygenerowany przez człowieka, z zaleceniem edytowania tekstu, dopóki nie będzie mniej wykrywalnych treści AI.
Najlepsze dla: B2B, przedsiębiorstw i agencji, które chcą analizować i edytować treści przed publikacją.
6. Narzędzia do wykrywania sztucznej inteligencji Hive
- Cena: bezpłatna wersja demonstracyjna, skontaktuj się z działem sprzedaży, aby uzyskać wycenę interfejsu API
- Testy dla: ChatGPT, GPT-3, DALL-E, Midjourney, Stabilna dyfuzja
Hive oferuje zestaw narzędzi AI do wykrywania obrazów, tekstu i deepfake'ów.
Narzędzie do wykrywania tekstu podaje ocenę pewności co do prawdopodobieństwa, że coś jest generowane przez sztuczną inteligencję, i szacuje, które sekcje są najbardziej przewidywalne. Oszacowuje również, które sekcje tekstu z większym prawdopodobieństwem zostaną wygenerowane przez sztuczną inteligencję. Działa od 750 znaków przy zalecanej długości 1500 znaków.
Musiałem wprowadzić dodatkowe słowa, aby osiągnąć limit znaków, i przewidywano, że akapit na 99,99% będzie zawierał treści generowane przez sztuczną inteligencję.
Narzędzie do rozpoznawania mediów identyfikuje media generowane przez sztuczną inteligencję, podaje klasyfikację (wygenerowaną przez sztuczną inteligencję lub nie), ocenę pewności (≤ 1) i źródło generowania obrazu (np. DALL-E). (Dokumentacja, strona narzędzia)
Narzędzie do wykrywania deepfake sprawdza, czy obrazy lub filmy są deepfake poprzez klasyfikację twarzy. (Dokumentacja)
Najlepszy dla: Prace przesiewowe w celu wykrycia treści AI lub stron internetowych w celu wykrywania i moderowania obrazów i tekstu generowanych przez AI.
7. Bonus: klasyfikator tekstu OpenAI
- Cena: Bezpłatna (wymaga konta)
- Testy dla: Wszystkie wersje GPT
Klasyfikator tekstu OpenAI potrafi rozróżnić tekst wygenerowany przez AI od tekstu napisanego przez człowieka. Działa najlepiej z ponad 1000 znaków i tekstem w języku angielskim.
OpenAI zauważa, że nie jest całkowicie niezawodny i poprawnie identyfikuje tylko 26% tekstu AI i niepoprawnie oznacza tekst napisany przez człowieka jako AI w 9% przypadków, ale niezawodność wzrasta w przypadku dłuższego tekstu. Zaleca stosowanie klasyfikatora jako uzupełnienia innych metod testowania.
Najlepsze do: Wykrywania GPT
Jakie jest najlepsze narzędzie do wykrywania AI?
Powyżej przedstawiłem indywidualny wynik testu każdego narzędzia, ale tutaj jest tabela porównująca wyniki.
Narzędzie | wynik |
ZeroGPT | 88,57% zawartości sztucznej inteligencji |
Gigantyczny pokój do testowania modeli językowych | Tylko prawdopodobieństwo |
Oryginalność.AI | 99% zawartość AI |
Zawartość w skali | 49% zawartości sztucznej inteligencji |
AI pisarza | 13% zawartości sztucznej inteligencji |
Ul | 99,99% zawartości sztucznej inteligencji |
Na podstawie tych rankingów
- Pierwsze miejsce to remis między Originality.AI, GLTR i Hive AI
- Drugie miejsce to ZeroGPT
- Trzecie miejsce to Writer AI
- Czwarte miejsce to Content at Scale
Do Ciebie
Wykrywanie AI znacznie ułatwia rozróżnienie między tekstem generowanym przez maszynę a tekstem generowanym przez człowieka. Ponieważ narzędzia sztucznej inteligencji stają się coraz dokładniejsze, wykrywanie sztucznej inteligencji pozostanie ważne, pomagając ludziom określić legalność treści, które konsumują.