AI 생성 텍스트 및 이미지를 정확히 찾아내는 방법 [+ 탐지 도구]

게시 됨: 2023-04-11

AI로 생성된 콘텐츠는 매력적인 발전이며 AI 도구로 생성된 기사, 스토리 및 이미지가 점점 더 많이 보고 있습니다. (인트로 문장 주셔서 감사합니다, AI.)

그러나 고급 AI 생성 도구의 등장으로 사람들이 AI와 인간 세대의 차이를 감지할 수 없는 것부터 AI 예측 및 분석이 완전히 잘못된 것에 이르기까지 잠재적인 문제가 노출되었습니다.

여기에서 AI 감지가 필요한데, 이는 텍스트, 이미지, 심지어 비디오가 기계에서 생성될 때 사람들이 발견할 수 있는 방법이기 때문에 그들이 소비하는 콘텐츠에 대해 정보에 입각한 결정을 내릴 수 있기 때문입니다. 이 게시물에서는 다음을 다룰 것입니다.

AI 탐지란?

AI 감지는 일반적으로 기계 학습 및 자연어 처리를 사용하여 패턴을 식별하는 AI 감지 도구의 도움을 받아 콘텐츠가 AI인지 사람이 생성한 것인지 파악합니다. 콘텐츠가 보다 예측 가능한 패턴을 따르는 경우 도구는 콘텐츠를 AI 생성으로 분류할 가능성이 높습니다.

AI 감지 도구는 단어의 의미를 모르고 컨텍스트를 사용하여 텍스트를 분석합니다. 더 기술적으로 접근하기 위해 도구는 다음 단어의 왼쪽에 있는 컨텍스트를 사용하여 오른쪽에 있는 단어의 가능성을 예측합니다.

오른쪽에 있는 단어가 예측 가능할수록 AI가 생성한 텍스트일 가능성이 높습니다. 반면에 사람이 쓴 문장은 예측 가능한 패턴과 다르고 더 창의적입니다.

당신이 나와 같은 사람이라면 기본적인 예가 이것을 이해하는 데 도움이 될 수 있습니다. 그것을 분해합시다.

누군가 “토끼는 너무 푹신푹신해”라는 문장을 입력했다고 가정해 봅시다.

이 도구는 학습된 데이터와 "푹신푹신" 왼쪽 에 있는 단어의 컨텍스트를 사용하여 "귀엽다" 또는 "부드럽다"와 같은 단어보다 "푹신푹신"이 다음에 올 가능성이 더 높다고 예측합니다.

문장이 매우 예측 가능한 패턴을 따르기 때문에 도구는 텍스트를 AI 생성으로 분류할 가능성이 높습니다.

AI 감지 도구는 예측 및 분류를 위해 "Bunnies are so fancy"보다 더 복잡한 문장과 단락으로 훨씬 더 큰 규모로 작동하지만 이것은 기본적인 예이며 프로세스가 어떻게 작동하는지 보여줍니다.

일부 감지 도구는 이미지와 비디오를 분석하고 픽셀 이상을 사용하여 무언가가 AI로 생성되었는지 확인합니다.

AI 생성 텍스트를 감지하는 방법

AI가 생성한 텍스트를 식별하기 위한 정해진 규칙이나 지침은 없지만 다음은 주의해야 할 몇 가지 사항입니다.

단어와 구의 반복: AI는 자신이 말하는 내용을 알고 있지만 인간 전문가만큼은 아닙니다. 출력은 주제를 논의할 때 약간의 변형으로 동일한 키워드와 구를 반복할 수 있습니다.

깊이 부족: 생성 도구는 깊이가 부족하고 기본 사실을 넘어 주제를 진정으로 분석하고 고유한 통찰력을 개발할 수 없습니다. AI로 생성된 텍스트는 창의적이라기보다는 기계적이고 규범적이며 일반적인 어조를 가질 수 있습니다.

부정확하고 오래된 정보: 콘텐츠 생성 도구가 가지고 있는 사실은 일반적으로 정확하지만 도구가 예측을 하기 때문에 출력이 정확하지 않거나 실제 사실과 관련이 없을 수 있습니다. 또한 ChatGPT가 2021년 9월 이전 정보로 제한되는 것처럼 정보가 오래되었을 수 있습니다.

형식 및 구조: 생성 도구는 인간과 동일한 문장 구조를 따르지만 문장이 더 짧을 수 있고 인간이 생성하는 복잡성, 창의성 및 다양한 문장 구조가 부족할 수 있습니다. 내용은 약간의 변형으로 간소화되고 균일할 수 있습니다.

사람이 쓴 텍스트는 또한 오타가 있을 가능성이 더 높으며 비공식적이고 일상적인 언어와 슬래그를 사용합니다.

Roft.io는 탐지 기술을 테스트하고 텍스트가 AI로 생성될 때 얼마나 잘 예측하는지 확인할 수 있는 재미있는 게임입니다.

AI 생성 이미지 및 비디오를 감지하는 방법

AI가 생성한 이미지와 비디오를 식별하는 것은 텍스트를 감지하는 것보다 조금 더 어려울 수 있습니다. 일반적으로 논의되는 정보는 다음과 같습니다.

질감이 있는 배경, 에어브러시처럼 보이는 이미지, 이미지 전체에 무작위 브러시 스트로크
전체 이미지 선명도 또는 이미지의 일부가 흐릿하고 다른 이미지는 더 선명한 경우
이미지 배경의 눈에 띄는 텍스트
사람의 얼굴, 치아, 손의 비대칭
아티스트 워터마크 또는 서명의 표시(AI 도구는 기존 아트워크에서 학습됨)

DALL-E 2와 같은 도구는 이미지 출력에 워터마크를 표시하지만 찾기가 쉽지 않을 수 있습니다. OpenAI는 또한 사람들이 워터마크를 제거할 수 있도록 합니다. 이미지 검색을 역으로 수행하여 웹에 이미지의 흔적이 있는지 확인할 수도 있습니다.

AI 이미지와 동영상을 감지하는 문제는 딥페이크가 매우 위험한 이유입니다. 충분히 생생해 보이는 동영상과 이미지가 잘못된 정보를 빠르게 퍼뜨릴 수 있기 때문입니다.

AI 탐지 도구

지금은 로봇처럼 들리거나 이미지에서 누군가의 손에 두 손가락이 없기 때문에 AI가 생성한 것인지 구분하는 것이 더 쉬울 수 있습니다. 생성 도구가 더욱 정교해지면 인간이 주요 불일치를 찾기가 더 어려워질 수 있습니다.

향후 진행 여부와 상관없이 탐지 도구는 AI 생성 콘텐츠를 분류하는 데 자체 추론 능력보다 더 도움이 될 수 있으며 다양한 옵션을 사용할 수 있습니다.

아래에서는 그 중 일부를 살펴보고 HubSpot의 Content Assistant(GPT를 사용함)에서 AI가 생성한 단락을 사용하여 효율성을 평가합니다 . 다음은 개에 대한 단락을 작성하도록 요청했을 때 제공한 내용입니다.

“개는 단순히 놀라운 생물입니다. 그들은 충성스럽고 사랑스럽고 끝없이 즐겁습니다. 소파에서 함께 껴안을 털복숭이 친구가 필요하든, 함께 대자연을 탐험할 충직한 동반자가 필요하든, 개는 항상 그 일을 할 준비가 되어 있습니다. 그들은 작은 찻잔 치와와에서 장엄한 그레이트 데인에 이르기까지 모든 모양과 크기로 나오지만 모든 개는 한 가지 공통점을 공유합니다. 사랑과 애정에 대한 무한한 능력입니다. 당신이 평생 반려견을 사랑하는 사람이든, 반려견의 세계에 처음 온 사람이든, 털복숭이 친구와 함께 인생의 기쁨을 발견할 수 있는 더 좋은 시간은 없습니다.”

사람의 글이 예측 가능한 패턴을 따르는 경우 여전히 도구를 트리거할 수 있습니다.

1. 제로GPT

가격: 무료 또는 맞춤형 API 문의
테스트 대상: ChatGPT 및 Google Bard

ZeroGPT의 알고리즘은 98%의 탐지 정확도를 갖도록 1000만 개 이상의 기사와 텍스트에 대해 훈련되었습니다. 다국어 텍스트를 지원하고 Chat GPT, GPT-4 및 Google Bard와 같은 널리 사용되는 언어 생성기를 감지합니다. 출력은 AI가 작성했을 가능성이 가장 높은 문장을 강조 표시합니다.

개에 대한 AI 생성 단락을 입력했는데 텍스트가 88.57% AI/GPT 생성이라고 예측했습니다.

최고의 AI 감지 도구: zerogpt

최상의 대상: ZeroGPT는 교육자가 AI 생성 콘텐츠를 테스트하기 위해 제작되었지만 AI 콘텐츠를 감지하려는 모든 사람에게 적합합니다.

2. 자이언트 언어모형 테스트룸

가격: 무료
테스트 : GPT-2 텍스트용으로 2019년에 개발되었으며 다른 생성기에서는 신뢰할 수 없을 수 있습니다.

MIT-IBM Watson AI 연구소와 Harvard NLP 그룹은 AI 생성 텍스트를 감지하기 위해 Giant Language 모델 Test Room을 만들었습니다. 바로 왼쪽에 있는 단어를 기준으로 각 단어가 나타날 가능성을 기준으로 입력을 분석합니다. 단어가 예측 가능할수록 텍스트가 AI에 의해 작성될 가능성이 높아집니다.

이 도구는 백분율을 제공하지 않지만 예측 가능성에 따라 단어에 색상 코드를 지정합니다. 녹색은 해당 단어가 가장 예측 가능한 상위 10개 단어의 일부임을 의미합니다.

내 단락의 대부분은 녹색으로 강조 표시되므로 단어는 가장 예측 가능하고(문맥에 따라) AI 생성 가능성이 더 높은 상위 10개 단어에 속합니다.

최고의 AI 감지 도구: 거대한 언어 모델 테스트 룸

최상의 대상: GPT-2를 테스트하고 심층 확률 분석을 통해 예측 가능한 쓰기에 대해 자세히 알아보세요.

3. 독창성.AI

가격: 무료 50크레딧 평가판 후 $0.01/100단어(1크레딧은 100단어 스캔)
테스트: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J

콘텐츠 마케팅 전문가가 제작한 Originality.AI Chrome 확장 프로그램은 94%의 정확도로 여러 버전의 GPT를 감지합니다. 0~100점 척도로 텍스트에 점수를 매기며 점수가 높을수록 AI가 생성할 가능성이 높습니다. 이 도구를 사용하여 표절을 스캔할 수도 있습니다(교육자에게 유용함). 50단어 이상으로 가장 정확합니다.

내 테스트에서 단락은 AI에 의해 작성되었을 가능성이 99%라고 말했습니다.

최고의 AI 감지 도구: originality.ai

최상의 대상: Chrome 확장 프로그램은 온라인에서 글을 쓰고 읽을 때 원활하고 즉각적인 감지 프로세스를 찾는 모든 사람에게 적합합니다. 작가, 콘텐츠 마케팅 담당자 및 웹 게시자 모두 이 도구를 활용할 수 있습니다. 학계를 위한 것이 아닙니다.

4. 대규모 콘텐츠

가격: 무료 버전 또는 API 가격 문의
테스트 대상: GPT

Content at Scale의 AI Detector는 3개의 AI 엔진과 자연어 처리를 사용하여 ChatGPT, 모든 버전의 GPT 및 기타 생성기를 감지합니다. SEO, 교육 및 마케팅 콘텐츠를 테스트하는 데 사용할 수 있습니다. 이 도구는 신뢰할 수 있는 결과를 위해 최소 25단어가 필요하며 최대 25,000자를 입력할 수 있습니다.

단락이 AI로 생성되었는지 도구가 확실하게 말할 수 없었기 때문에 내 테스트 결과는 결정적이지 않았습니다. 17%의 예측 가능성과 함께 51%의 인적 콘텐츠 점수를 부여했습니다.

최고의 AI 감지 도구: 대규모 콘텐츠

마지막 문장은 AI가 생성한 것이라고 확실하게 말했습니다.

최고의 AI 감지 도구: 대규모 콘텐츠

최적 대상: SEO 및 마케팅에 중점을 둔 콘텐츠 제작자는 라인별로 텍스트 분석을 받고 더 긴 콘텐츠(최대 25,000자)를 분석합니다.

5. 작가 AI

가격: 무료 버전 또는 API 가격 문의
테스트 대상: ChatGPT 및 기타 생성기

Writer AI의 콘텐츠 감지기는 AI가 생성한 텍스트의 양을 추정합니다. 무료 및 유료 버전은 300단어 제한(1,500자)이 있으며 결과는 텍스트 중 사람이 생성한 콘텐츠의 비율을 예측합니다.

AI 콘텐츠가 덜 감지될 때까지 텍스트를 편집하라는 권장 사항과 함께 87%가 인간이 생성한 단락으로 점수를 매겼습니다.

적합한 대상: 게시하기 전에 콘텐츠를 분석하고 편집하려는 B2B 및 기업 및 대행사.

6. Hive의 AI 탐지 도구

가격: 무료 데모, API 가격은 영업팀에 문의하세요.
다음에 대한 테스트: ChatGPT, GPT-3, DALL-E, Midjourney, 안정적인 확산

Hive는 이미지, 텍스트 및 딥페이크를 위한 AI 감지 도구 모음을 제공합니다.

텍스트 감지 도구는 AI 생성 가능성에 대한 신뢰도 점수를 제공하고 가장 예측 가능한 섹션을 추정합니다. 또한 AI가 생성할 가능성이 더 높은 텍스트 섹션을 추정합니다. 권장 길이는 1500자로 750자부터 작동합니다.

글자 수 제한에 도달하기 위해 추가 단어를 입력해야 했고, AI가 생성한 콘텐츠를 포함할 가능성이 99.99%인 단락이라고 예측했습니다.

최고의 AI 감지 도구: 하이브 중재

미디어 인식 도구는 AI 생성 미디어를 식별하고 분류(AI 생성 여부), 신뢰 점수(≤ 1) 및 이미지 생성 소스(예: DALL-E)를 제공합니다. (문서, 도구 페이지)

딥페이크 감지 도구는 얼굴 분류를 통해 이미지나 동영상이 딥페이크인지 테스트합니다. (선적 서류 비치)

최적: AI 콘텐츠를 감지하기 위한 스크리닝 작업 또는 AI 생성 이미지 및 텍스트를 감지하고 조정하기 위한 웹사이트.

7. 보너스: OpenAI의 텍스트 분류기

가격: 무료(계정 필요)
테스트 대상: GPT의 모든 버전

OpenAI의 텍스트 분류기는 AI가 생성한 텍스트와 사람이 쓴 텍스트를 구별할 수 있습니다. 1,000자 이상의 영문 텍스트에서 가장 잘 작동합니다.

OpenAI는 완전히 신뢰할 수 있는 것은 아니며 AI 텍스트의 26%만 올바르게 식별하고 시간의 9%는 사람이 쓴 텍스트를 AI로 잘못 표시하지만 더 긴 텍스트의 경우 신뢰도가 증가합니다. 다른 테스트 방법을 보완하기 위해 분류기를 사용하는 것이 좋습니다.

최고: GPT 감지

최고의 AI 탐지 도구는 무엇입니까?

위에서 각 도구의 개별 테스트 점수를 설명했지만 점수를 비교하는 표가 있습니다.

도구	점수
ZeroGPT	AI 콘텐츠 88.57%
거대한 언어 모델 테스트 룸	확률만
독창성.AI	99% AI 콘텐츠
대규모 콘텐츠	AI 콘텐츠 49%
작가 AI	AI 콘텐츠 13%
하이브	99.99% AI 콘텐츠

이러한 순위를 바탕으로

1위는 Originality.AI, GLTR 및 Hive AI 간의 동점입니다.
2위 는 ZeroGPT
3위 는 Writer AI
4위 는 대규모 콘텐츠입니다.

당신에게

AI 감지를 통해 기계와 사람이 생성한 텍스트를 훨씬 쉽게 구별할 수 있습니다. AI 도구가 점점 더 정확해짐에 따라 AI 감지는 사람들이 자신이 소비하는 콘텐츠의 합법성을 판단하는 데 중요한 역할을 할 것입니다.

새로운 클릭 유도 문안