Как точно определить текст и изображения, сгенерированные ИИ [+ Инструменты обнаружения]

Опубликовано: 2023-04-11

Контент, созданный ИИ, — это захватывающая разработка, и мы видим все больше и больше статей, историй и изображений, созданных с помощью инструментов ИИ. (Спасибо, AI, за вступительное предложение.)

Но появление передовых инструментов генерации ИИ выявило потенциальные проблемы: от того, что люди не могут обнаружить разницу между ИИ и человеческим поколением, до абсолютно неверных прогнозов и анализа ИИ.

Именно здесь вступает в действие обнаружение ИИ, поскольку это способ для людей обнаруживать, когда текст, изображения и даже видео генерируются машиной, чтобы они могли принимать обоснованные решения о контенте, который они потребляют. В этом посте мы рассмотрим:

Что такое обнаружение ИИ?

Обнаружение ИИ выясняет, создан ли контент ИИ или человеком, обычно с помощью инструмента обнаружения ИИ, который использует машинное обучение и обработку естественного языка для выявления закономерностей. Если контент следует более предсказуемому шаблону, инструмент, скорее всего, классифицирует его как созданный ИИ.

Инструменты обнаружения ИИ не знают значения слов и используют контекст для анализа текста. Если говорить более технически, инструменты используют контекст того, что находится слева от следующего слова, чтобы предсказать вероятность слова справа.

Чем более предсказуемо слово справа, тем больше вероятность, что текст сгенерирован искусственным интеллектом. С другой стороны, предложения, написанные человеком, отличаются от предсказуемых шаблонов и являются более творческими.

Если вы чем-то похожи на меня, базовый пример может быть полезен для понимания этого. Давайте сломаем это.

Скажем, кто-то вводит предложение «Кролики такие пушистые».

Инструмент использует изученные данные и контекст слов слева от слова «пушистый», чтобы предсказать, что «пушистый» с большей вероятностью будет следующим, чем такие слова, как «милый» или «мягкий».

Поскольку предложение следует очень предсказуемому шаблону, инструмент, скорее всего, классифицирует текст как сгенерированный ИИ.

Инструменты обнаружения ИИ работают в гораздо большем масштабе с более сложными предложениями и абзацами, чем «Зайчики такие пушистые», чтобы делать прогнозы и классификации, но это базовый пример, показывающий, как работает процесс.

Некоторые инструменты обнаружения анализируют изображения и видео и используют пиксельные аномалии, чтобы определить, создано ли что-то искусственным интеллектом.

Как обнаружить текст, сгенерированный ИИ

Не существует установленных правил или рекомендаций для идентификации текста, сгенерированного ИИ, но вот некоторые вещи, на которые следует обратить внимание:

Повторение слов и фраз: ИИ знает, о чем говорит, но не в той мере, в какой это знают люди-эксперты. Его результаты могут повторять одни и те же ключевые слова и фразы с небольшими вариациями при обсуждении темы.

Недостаток глубины: инструментам генерации не хватает глубины, и они не могут выйти за рамки основных фактов, чтобы по-настоящему проанализировать тему и получить уникальное представление. Текст, созданный ИИ, может читаться скорее как роботизированный и предписывающий, чем творческий, и иметь общий тон.

Неточная и устаревшая информация. Факты, которыми располагают инструменты для создания контента, обычно верны, но, поскольку инструменты делают прогнозы, выходные данные могут быть неверными или не иметь отношения к истинным фактам. Кроме того, информация может быть устаревшей, например, как ChatGPT ограничен информацией до сентября 2021 года.

Формат и структура: инструменты генерации следуют той же структуре предложений, что и люди, но предложения могут быть короче и лишены сложности, творчества и разнообразной структуры предложений, которые производят люди. Контент может быть оптимизирован и однороден с небольшими вариациями.

Текст, написанный человеком, также чаще содержит опечатки, использует неформальный и случайный язык и шлак.

Roft.io — это забавная игра, в которой вы можете проверить свои навыки обнаружения и увидеть, насколько хорошо вы предсказываете, когда текст генерируется искусственным интеллектом.

Как обнаружить изображения и видео, созданные искусственным интеллектом

Идентификация изображений и видео, созданных искусственным интеллектом, может быть немного сложнее, чем обнаружение текста. Вот некоторые часто обсуждаемые теллсы:

Текстурированный фон, изображения, которые выглядят аэрографическими, случайные мазки кистью по всему изображению.
Общая резкость изображения или части изображения, которые размыты, в то время как другие более четкие
Заметный текст на фоне изображений
Асимметрия человеческих лиц, зубов и рук
Признаки водяных знаков или подписей художников (инструменты ИИ обучаются на существующих художественных работах)

Такие инструменты, как DALL-E 2, размещают водяные знаки на выходных изображениях, но их бывает нелегко обнаружить. OpenAI также позволяет людям удалять водяные знаки. Вы также можете выполнить обратный поиск изображений, чтобы увидеть, есть ли какие-либо следы изображения в Интернете.

Проблема обнаружения изображений и видео ИИ заключается в том, почему дипфейки так опасны, поскольку видео и изображения, которые кажутся достаточно реалистичными, могут быстро распространять дезинформацию.

Инструменты обнаружения ИИ

На данный момент может быть проще определить, сгенерировано ли что-то искусственным интеллектом, потому что это звучит как робот, или на чьей-то руке не хватает двух пальцев на изображении. Если инструменты генерации станут более изощренными, людям может быть труднее находить ключевые несоответствия.

Независимо от будущего прогресса, инструменты обнаружения могут быть более полезными, чем наши собственные дедуктивные способности, в классификации контента, созданного ИИ, и доступны различные варианты.

Ниже мы рассмотрим некоторые из них и оценим их эффективность, используя сгенерированный ИИ абзац из Content Assistant HubSpot (который использует GPT). Вот что он дал мне, когда я попросил написать абзац о собаках:

«Собаки — просто удивительные существа. Они верные, любящие и бесконечно веселые. Нужен ли вам пушистый друг, с которым можно обниматься на диване, или верный компаньон для прогулок на свежем воздухе, собаки всегда готовы выполнить эту задачу. Они бывают всех форм и размеров, от крошечных чихуахуа до величественных немецких догов, но всех собак объединяет одно: безграничная способность к любви и привязанности. Независимо от того, являетесь ли вы давним любителем собак или новичком в мире общения с собаками, никогда не было лучшего времени, чтобы открыть для себя радости жизни с пушистым другом рядом с вами».

Обратите внимание, что человеческое письмо все еще может активировать инструмент, если оно следует предсказуемой схеме.

1. Нулевой GPT

Цена: бесплатно или свяжитесь для индивидуального API
Тесты для: ChatGPT и Google Bard

Алгоритм ZeroGPT обучен более чем 10 миллионам статей и текстов, что обеспечивает точность обнаружения 98%. Он поддерживает многоязычный текст и обнаруживает популярные языковые генераторы, такие как Chat GPT, GPT-4 и Google Bard. В выходных данных выделяются предложения, которые, скорее всего, будут написаны ИИ.

Я ввел сгенерированный ИИ абзац о собаках, и он предсказал, что текст на 88,57% сгенерирован AI/GPT.

лучшие инструменты обнаружения ИИ: zerogpt

Подходит для: ZeroGPT был создан для преподавателей для тестирования контента, созданного ИИ, но он работает для всех, кто хочет обнаружить контент ИИ.

2. Гигантская тестовая комната языковой модели

Цена: Бесплатно
Тесты для : Разработаны в 2019 году для текста GPT-2, могут быть ненадежными на других генераторах.

Лаборатория искусственного интеллекта MIT-IBM Watson и группа НЛП Гарварда создали тестовую комнату модели Giant Language для обнаружения текста, сгенерированного искусственным интеллектом. Он анализирует входные данные на основе вероятности появления каждого слова на основе слова, расположенного непосредственно слева. Чем предсказуемее слово, тем больше вероятность, что текст написан ИИ.

Этот инструмент не показывает процентное соотношение, а кодирует слова цветом в зависимости от их предсказуемости. Зеленый цвет означает, что слово входит в десятку самых предсказуемых слов.

Большая часть моего абзаца выделена зеленым цветом, поэтому слова входят в десятку самых предсказуемых (в зависимости от контекста) и, скорее всего, будут сгенерированы ИИ.

лучшие инструменты обнаружения ИИ: гигантская тестовая комната языковой модели

Подходит для: тестирования GPT-2 и получения дополнительных сведений о предсказуемом письме с помощью углубленного вероятностного анализа.

3. Оригинальность.ИИ

Цена: бесплатная пробная версия на 50 кредитов, затем 0,01 доллара США за 100 слов (1 кредит сканирует 100 слов).
Тесты для: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J

Расширение Originality.AI для Chrome, созданное экспертами по контент-маркетингу, обнаруживает несколько версий GPT с точностью 94 %. Он оценивает текст по шкале от 0 до 100, причем более высокий балл означает более высокую вероятность того, что он будет создан ИИ. Вы также можете использовать инструмент для поиска плагиата (полезно для преподавателей). Это самый точный с более чем 50 словами.

Мой тест показал, что абзац с вероятностью 99% был написан ИИ.

лучшие инструменты обнаружения ИИ: originality.ai

Подходит для: Расширение Chrome идеально подходит для тех, кто ищет плавный и немедленный процесс обнаружения при написании и чтении в Интернете. Писатели, контент-маркетологи и веб-издатели могут использовать этот инструмент; не для академиков.

4. Контент в масштабе

Цена: бесплатная версия или свяжитесь с нами, чтобы узнать цены на API.
Тесты для: GPT

Детектор ИИ Content at Scale использует 3 механизма ИИ и обработку естественного языка для обнаружения ChatGPT, всех версий GPT и других генераторов. Вы можете использовать его для тестирования SEO, образовательного и маркетингового контента. Инструменту требуется не менее 25 слов для надежных результатов, и вы можете ввести до 25 000 символов.

Результаты моего теста были неубедительны, потому что инструмент не мог с уверенностью сказать, был ли абзац сгенерирован искусственным интеллектом. Он дал оценку человеческого содержания 51% с предсказуемостью 17%.

лучшие инструменты обнаружения искусственного интеллекта: контент в масштабе

Он с уверенностью сказал, что последнее предложение сгенерировано ИИ.

лучшие инструменты обнаружения искусственного интеллекта: контент в масштабе

Подходит для: создателей контента, ориентированных на SEO и маркетинг, для получения построчной разбивки текста и анализа более длинных фрагментов контента (до 25 000 символов).

5. Писатель ИИ

Цена: бесплатная версия или свяжитесь, чтобы узнать цены на API.
Тесты для: ChatGPT и других генераторов

Детектор контента Writer AI оценивает, сколько текста генерируется AI. Бесплатная и платная версии имеют ограничение в 300 слов (1500 символов), а результаты дают процент предсказания того, какая часть текста является контентом, созданным человеком.

Он оценил мой абзац как созданный человеком на 87% с рекомендацией редактировать текст до тех пор, пока содержание ИИ не станет менее обнаруживаемым.

писатель

Подходит для: B2B, предприятий и агентств, которые хотят анализировать и редактировать контент перед публикацией.

6. Инструменты обнаружения ИИ Hive

Цена: бесплатная демоверсия, свяжитесь с отделом продаж, чтобы узнать цены на API.
Тесты для: ChatGPT, GPT-3, DALL-E, Midjourney, Stable Diffusion

Hive предлагает набор инструментов обнаружения ИИ для изображений, текста и дипфейков.

Инструмент обнаружения текста дает оценку достоверности того, насколько вероятно, что что-то сгенерировано ИИ, и оценивает, какие разделы наиболее предсказуемы. Он также оценивает, какие разделы текста с большей вероятностью будут сгенерированы ИИ. Он работает, начиная с 750 символов при рекомендуемой длине 1500 символов.

Мне пришлось вводить дополнительные слова, чтобы достичь предела символов, и он предсказал, что абзац с вероятностью 99,99% будет содержать контент, созданный ИИ.

лучшие инструменты обнаружения ИИ: модерация улья

Инструмент распознавания мультимедиа идентифицирует мультимедиа, созданные ИИ, дает классификацию (созданные ИИ или нет), показатель достоверности (≤ 1) и источник создания изображения (например, DALL-E). (Документация, страница инструментов)

Инструмент обнаружения дипфейков проверяет, являются ли изображения или видео дипфейками с помощью классификации лиц. (Документация)

Подходит для: скрининга для обнаружения контента ИИ или для веб-сайтов для обнаружения и модерации изображений и текста, созданных ИИ.

7. Бонус: классификатор текста OpenAI

Цена: Бесплатно (требуется учетная запись)
Тесты для: всех версий GPT.

Классификатор текста OpenAI может различать текст, сгенерированный ИИ, и текст, написанный человеком. Лучше всего он работает с более чем 1000 символов и текстом на английском языке.

OpenAI отмечает, что он не совсем надежен и правильно идентифицирует только 26% текста AI и неправильно помечает написанный человеком текст как AI в 9% случаев, но надежность увеличивается для более длинного текста. Он рекомендует использовать классификатор в качестве дополнения к другим методам тестирования.

Подходит для: обнаружения GPT

Какой лучший инструмент для обнаружения ИИ?

Выше я описал индивидуальные результаты тестов каждого инструмента, но вот таблица сравнения результатов.

Инструмент	счет
ZeroGPT	88,57% AI-контента
Комната для тестирования гигантской языковой модели	Только вероятность
Оригинальность.ИИ	99% ИИ-контента
Контент в масштабе	49% ИИ-контента
Писатель ИИ	13 % ИИ-контента
Улей	99,99% ИИ-контента

На основании этих рейтингов

Первое место — между Originality.AI, GLTR и Hive AI.
Второе место — ZeroGPT
Третье место — Writer AI
Четвертое место — содержание в масштабе

к вам

Обнаружение ИИ значительно упрощает различие между текстом, созданным машиной, и текстом, созданным человеком. По мере того, как инструменты ИИ становятся все более и более точными, обнаружение ИИ будет оставаться важным, помогая людям определять законность контента, который они потребляют.

Новый призыв к действию