Porównanie 8 najlepszych detektorów treści AI

Opublikowany: 2023-05-24

Narzędzia sztucznej inteligencji (AI) poczyniły ogromne postępy w ostatnich latach. Wielu właścicieli i autorów stron internetowych eksperymentuje z generatorami treści opartymi na sztucznej inteligencji. W rezultacie detektory treści AI również stały się popularne, praktycznie z dnia na dzień.

Celem tych narzędzi jest pomoc w ustaleniu, jakie treści pochodzą od ludzi, a jakie są generowane maszynowo. W wielu przypadkach nie jest to już widoczne na pierwszy rzut oka, więc tego typu narzędzia mogą być bardzo przydatne, jeśli chcesz, aby publikowane przez Ciebie treści były wolne od sztucznej inteligencji.

W tym artykule porównamy osiem najpopularniejszych detektorów treści AI na rynku, używając tego samego tekstu. Zobaczymy, które detektory wypadną lepiej i przedyskutujemy, czy warto z nich korzystać. Weźmy się za to!

Spis treści :

Detektor zawartości klasyfikatora tekstu AI.

OpenAI stało się jedną z najbardziej znanych firm na świecie wraz z uruchomieniem ChatGPT 3. Large Language Model (LLM) wyprzedza o wiele ligi większość narzędzi AI, które pojawiły się wcześniej, jeśli chodzi o generowanie treści, odpowiadanie na pytania, tworzenie stron internetowych, i ogólnie rozwiązywać problemy.

Od tego czasu OpenAI uruchomiło ChatGPT 4, który jest znacznie ulepszoną wersją. Ta sama firma oferuje również bezpłatne narzędzie o nazwie AI Text Classifier. To pierwszy z detektorów treści AI, którym się przyjrzymy. Pozwala określić, czy dany tekst został utworzony za pomocą narzędzia AI.

Aby przetestować AI Text Classifier, użyliśmy ChatGPT 4 do wygenerowania dwóch podsumowań losowych wydarzeń wartych opublikowania. Oto część jednego z tych tekstów, abyś mógł zorientować się, co potrafi to narzędzie (jeśli jeszcze go nie używałeś):

Społeczność międzynarodowa uważnie śledzi niedawną erupcję wulkanu na małej wyspie Montserrat na Karaibach. Erupcja nastąpiła pod koniec kwietnia, zmuszając tysiące mieszkańców do ewakuacji ze swoich domów, gdy lawa i popiół pokryły wyspę. Naukowcy uważają, że erupcja jest wynikiem wzmożonej aktywności sejsmicznej w regionie, którą obserwowano w ciągu ostatnich kilku miesięcy. Zespoły reagowania kryzysowego z sąsiednich krajów wraz z międzynarodowymi organizacjami pomocowymi niestrudzenie pracują, aby zapewnić wsparcie poszkodowanym mieszkańcom, oferując tymczasowe schronienie, żywność i pomoc medyczną.

Może to łatwo uchodzić za stworzoną przez człowieka aktualizację dotyczącą wydarzenia informacyjnego. Nie jest to najbardziej wciągająca treść, ale jest gramatycznie poprawna i łatwa do zrozumienia. Z naszego doświadczenia w testowaniu generowania treści AI wynika, że to już wiele mówi.

Możesz użyć AI Text Classifier, odwiedzając stronę główną narzędzia i wprowadzając tekst, który chcesz przetestować. W tym przypadku narzędzie sklasyfikowało jeden z naszych tekstów testowych jako „Bardzo mało prawdopodobne, aby został wygenerowany przez sztuczną inteligencję”, a drugi jako „Mało prawdopodobne, aby został wygenerowany przez sztuczną inteligencję”:

Detektory treści AI: test klasyfikatora tekstu AI.

Ten konkretny wynik jest zaskakujący, ponieważ używamy narzędzia OpenAI do sprawdzania tekstu wygenerowanego przez ChatGPT. Warto zauważyć, że użyliśmy kilku przykładowych tekstów o różnej długości, aby dać wykrywaczowi więcej danych do pracy.

Czy AI Text Classifier działa? ️

Nasze testy wykazały, że AI Text Classifier OpenAI nie zapewnia dokładnych wyników wykrywania AI. Każdy tekst, który wygenerowaliśmy za pomocą ChatGPT 4, został oznaczony jako mało prawdopodobny lub bardzo mało prawdopodobny do stworzenia przez sztuczną inteligencję.

Aplikacja Writer umożliwia generowanie treści tekstowych i streszczanie plików audio. Wraz z narzędziami do generowania treści, Writer oferuje również funkcję, która ma pomóc w dostrzeżeniu treści napisanych przez sztuczną inteligencję.

Detektor Writer AI jest łatwy w użyciu. Możesz wkleić tekst o długości do 1500 słów lub wpisać adres URL, a Writer poinformuje Cię, jakie jest prawdopodobieństwo, że ten tekst napisał człowiek. Podczas naszego testu Writer sklasyfikował jeden tekst jako 96% treści generowanych przez ludzi, a drugi jako 83% generowanych przez ludzi:

Cały tekst przesłany podczas obu testów został w 100% wygenerowany przez sztuczną inteligencję. Użycie procentów sprawia, że narzędzie to wydaje się bardziej precyzyjne niż niektóre z jego konkurentów, ale wyniki mówią same za siebie. W większości przypadków Writer nie dorównuje nowoczesnym narzędziom do generowania treści, takim jak ChatGPT.

Czy Writer działa? ️

Ogólnie rzecz biorąc, Writer nie może wykryć treści generowanych przez nowoczesną sztuczną inteligencję. Narzędzie czasami sugeruje edycję tekstu, aby był bardziej „ludzki”, ale nie zawiera konkretnych uwag na temat tego, co należy zmodyfikować.

Copyleaks to firma dostarczająca narzędzia do wykrywania plagiatu, oceniania i wykrywania treści AI. Usługa oferuje rozszerzenie Chrome, które umożliwia testowanie treści w dowolnym miejscu w sieci, aby sprawdzić, czy zostały wygenerowane przez sztuczną inteligencję. Obejmuje również integrację API, dzięki czemu możesz korzystać z jego narzędzi testowych bezpośrednio w swojej witrynie lub na dowolnej platformie, z którą pracujesz.

Pod względem dokładności narzędzie Copyleaks uzyskuje dość wysokie noty. Te same teksty wygenerowane przez sztuczną inteligencję, które zaskoczyły zarówno AI Text Classifier, jak i Writer, zostały oznaczone jako 92,6% i 82,3% prawdopodobnie napisane przez sztuczną inteligencję:

Nie oznacza to, że narzędzie do wykrywania treści Copyleaks AI działa bez problemów. Podczas naszych testów ich detektor AI oznaczał tekst w pełni generowany przez człowieka jako „mało prawdopodobne, aby został napisany przez człowieka”.

Jedną zaletą jest to, że to narzędzie pozwala ręcznie oznaczyć wyniki jako dokładne lub niedokładne. Jeśli programiści wykorzystają te informacje, aby poprawić ich dokładność, z czasem Copyleaks mogą stać się bardziej skuteczne.

Czy Copyleaks działa? ️

Copyleaks jest w większości dokładny, jeśli chodzi o wykrywanie treści AI. Nie jest to w pełni dokładne, ale każdy tekst, który utworzyliśmy za pomocą ChatGPT, został oznaczony jako napisany głównie przez sztuczną inteligencję.

GPTZero jest obecnie prawdopodobnie najpopularniejszą opcją wśród detektorów treści AI. Został zbudowany jako odpowiedź na ChatGPT i ocenia przesłany tekst zarówno pod względem „zakłopotania”, jak i „wybuchu”. Zakłopotanie mierzy losowość użytych słów, podczas gdy wybuchowość mierzy zmienność zakłopotania.

Ludzie mają tendencję do pisania w sposób znacznie bardziej losowy niż sztuczna inteligencja lub LLM, czego można się spodziewać. Podczas naszych testów GPTZero słusznie oceniło, że oba teksty powstały w całości przy użyciu AI:

GPTZero podkreśla również określone frazy, które jego zdaniem są bardziej prawdopodobne, że zostaną napisane przez sztuczną inteligencję. Aby być uczciwym, narzędzie czasami zwraca fałszywe wyniki. Na przykład oznaczyła część amerykańskiej Deklaracji Niepodległości jako sztuczną inteligencję wygenerowaną podczas naszych testów.

Mimo to GPTZero daje ogólnie dokładne wyniki i jest to jedyne narzędzie, które do tej pory sprawdziliśmy, które ostrzega, że może zwracać fałszywe alarmy. Jest to istotna informacja, ponieważ w miarę ciągłego doskonalenia generowania treści AI wykrywacze treści AI będą miały coraz większe trudności z nadrobieniem zaległości i zwracaniem dokładnych ocen.

Czy GPTZero działa? ️

GPTZero świetnie sobie radzi z wykrywaniem treści tworzonych przez ChatGPT. Ostrzega również użytkowników, że nie powinni ślepo ufać wykrywaczom treści AI, co czyni go łatwą rekomendacją.

Content at Scale reklamuje się jako narzędzie do pisania wspomagane przez sztuczną inteligencję, które uwzględnia optymalizację pod kątem wyszukiwarek (SEO). Jednak nie jesteśmy tutaj, aby dzisiaj testować jego możliwości generowania treści.

Oprócz swojej podstawowej usługi, Content at Scale oferuje bezpłatne narzędzie, które sprawdza zawartość generowaną przez sztuczną inteligencję. Podczas naszych testów oznaczono oba przykłady jako wysoce prawdopodobne, że zostały wygenerowane przez sztuczną inteligencję:

Wykrywacze treści AI: Test zawartości w skali.

Content at Scale mierzy tekst za pomocą wielu metryk, w tym przewidywalności doboru słów i tego, czy jest zgodny ze „znanymi” wzorcami. Jest to podobne do modelu używanego przez GPTZero, tylko z innym algorytmem.

Ten wykrywacz treści AI oznacza również określone akapity i frazy, jeśli jest to możliwe, że mogą być generowane przez AI. Teoretycznie może to pomóc w dostrzeżeniu pisania wspomaganego przez sztuczną inteligencję. Jednak podczas naszych testów wykrywacz sztucznej inteligencji oznaczył również część amerykańskiej Deklaracji Niepodległości jako napisaną przez sztuczną inteligencję (jesteśmy prawie pewni, że tak nie jest).

Czy Content at Scale działa? ️

Content at Scale jest dość dokładny w wykrywaniu tekstu generowanego przez AI. Ocenia teksty na podstawie kilku wskaźników (chociaż nie wyjaśnia, co te wskaźniki mierzą) i zaznacza określone akapity i zdania, jeśli uzna je za „podejrzane”. Jednak pomimo ogólnie pozytywnych wyników, niektóre z jego flag mogą być niedokładne.

Sapling oferuje zestaw narzędzi do autouzupełniania stron internetowych, a także produkty do korekty gramatycznej. Jedną z jego ofert jest wykrywacz treści AI z planami darmowymi i premium. Darmowa opcja nie wymaga zakładania konta, ale ogranicza długość tekstu, który możesz sprawdzić.

Samo narzędzie jest przeszkolone w wykrywaniu tekstu utworzonego za pomocą najnowszych modeli GPT. Podczas naszych testów zwrócił wyniki „Fałszywe” na poziomie 100% i 98,8%:

Wyniki te są niezwykle dokładne, biorąc pod uwagę, że oba teksty są w pełni generowane przez sztuczną inteligencję, bez żadnych zmian. Sapling zapewnia również zestawienie wyników i podkreśla fragmenty tekstu, które według niego zostały stworzone przez sztuczną inteligencję.

Sapling oferuje bezpłatne rozszerzenie, za pomocą którego można testować fragmenty tekstu w dowolnym miejscu w sieci. Ta usługa zapewnia również dostęp do interfejsu API z planami premium, których można użyć do zautomatyzowania testowania.

Czy Sapling działa? ️

Sadzonka spisała się podczas testów niemal idealnie. Jedynym minusem tej usługi jest to, że ogranicza długość tekstu, który możesz przetestować, przynajmniej w wersji darmowej. Jednak nie jest to jedyna platforma, która to umożliwia, a darmowa wersja nie wymaga rejestracji konta.

Crossplag oferuje narzędzia do wykrywania plagiatu dla małych firm i instytucji edukacyjnych. Zapewnia również bezpłatne narzędzie, którego można użyć na swojej stronie internetowej, aby sprawdzić zawartość pisaną przez AI. To narzędzie pobiera tekst i podaje wartość procentową wskazującą prawdopodobieństwo wygenerowania go przez sztuczną inteligencję.

Podczas naszego testu Crossplag oznaczył jeden z przykładów jako 84% prawdopodobieństwa sztucznej inteligencji. Jednak drugi przykład zwrócił 4%. To przekłada się na wynik „Ten tekst jest napisany głównie przez człowieka”:

Aby dokładniej przetestować Crossplaga, ponownie zwróciliśmy się do amerykańskiej Deklaracji Niepodległości. Narzędzie oznaczyło część swojego tekstu jako napisaną w 50% przez sztuczną inteligencję.

Na koniec warto zauważyć, że Crossplag ogranicza ilość tekstu, który możesz przetestować bez konta. Podczas naszych eksperymentów mogliśmy przeprowadzić tylko dwa testy, zanim zostaliśmy zmuszeni do założenia darmowego konta.

Czy Crossplag działa? ️

Na podstawie naszych testów Crossplag może czasami dokładnie wykrywać tekst generowany przez sztuczną inteligencję. Jednak konsekwentnie zwraca niedokładne wyniki zarówno w przypadku tekstu generowanego przez sztuczną inteligencję, jak i tekstu w pełni ludzkiego.

Pomimo podobnej nazwy, ZeroGPT jest zupełnie innym narzędziem niż GPTZero. Jest to bezpłatna usługa wykrywania AI oferowana przez firmę, która oferuje inne produkty w przestrzeni AI, w tym taką, która pozwala rozmawiać z ChatGPT przez WhatsApp lub Telegram.

Kiedy testowaliśmy tę ostatnią opcję na naszej liście detektorów treści AI, nasze dwa fragmenty wygenerowane przez ChatGPT zostały oznaczone jako w 100% stworzone przez sztuczną inteligencję:

Pomimo swojej początkowej dokładności, to narzędzie czasami fałszywie oznacza zwykłe treści ludzkie jako generowane przez sztuczną inteligencję. Po raz kolejny Deklaracja Niepodległości potknęła się, uzyskując wynik 68,1% wygenerowany przez sztuczną inteligencję.

Czy ZeroGPT działa? ️

Ogólnie rzecz biorąc, ZeroGPT może dokładnie wykrywać tekst generowany przez sztuczną inteligencję. Jednak regularnie oznacza również treści generowane przez ludzi i może zapewnić wysoki odsetek tworzonych przez sztuczną inteligencję. Utrudnia to ogólne zaufanie do wyników.

Wniosek

Wykrywacze treści AI toczą żmudną bitwę. Ponieważ narzędzia takie jak ChatGPT są wciąż ulepszane, usługi te muszą się dostosować i znaleźć lepsze sposoby wykrywania, czy tekst został wygenerowany przez sztuczną inteligencję, czy nie.

Ważne jest, aby zrozumieć, że większość detektorów treści AI nie jest w pełni dokładna i często może zwracać fałszywe alarmy. To powiedziawszy, GPTZero i Copyleaks były najdokładniejszymi narzędziami, które przetestowaliśmy, jeśli chodzi o wykrywanie treści w pełni generowanych przez sztuczną inteligencję (utworzonych przy użyciu ChatGPT). Jeśli musisz użyć detektora AI, zalecamy użycie jednego z tych dwóch (lub obu, aby zwiększyć swoje szanse na wiarygodne wyniki).

Czy masz jakieś pytania dotyczące detektorów treści AI? Porozmawiajmy o nich w sekcji komentarzy poniżej!