8 de los mejores detectores de contenido de IA comparados
Publicado: 2023-05-24Las herramientas de inteligencia artificial (IA) han dado un gran salto en los últimos años. Muchos propietarios de sitios web y escritores están experimentando con generadores de contenido de IA. Como resultado, los detectores de contenido de IA también se han vuelto populares, prácticamente de la noche a la mañana.
El objetivo de estas herramientas es ayudarlo a descubrir qué contenido proviene de humanos y qué es generado por máquinas. En muchos casos, eso ya no es evidente a simple vista, por lo que este tipo de herramientas pueden ofrecer un gran valor si desea mantener el contenido que publica sin IA.
En este artículo, vamos a comparar ocho de los detectores de contenido de IA más populares del mercado utilizando el mismo texto. Veremos qué detectores funcionan mejor y discutiremos si vale la pena usarlos. ¡Hagámoslo!
Tabla de contenido :
OpenAI se convirtió en una de las empresas más conocidas del mundo con el lanzamiento de ChatGPT 3. El modelo de lenguaje grande (LLM) está muy por delante de la mayoría de las herramientas de inteligencia artificial que se presentaron antes cuando se trata de generar contenido, responder preguntas, crear sitios web, y resolución de problemas en general.
Desde entonces, OpenAI ha ido a lanzar ChatGPT 4, que es una versión muy mejorada. La misma compañía también ofrece una herramienta gratuita llamada AI Text Classifier. Este es el primero de los detectores de contenido de IA que veremos. Le permite determinar si un texto específico se creó utilizando una herramienta de IA.
Para probar AI Text Classifier, usamos ChatGPT 4 para generar dos resúmenes de eventos de interés periodístico aleatorios. Aquí hay parte de uno de esos textos, para que pueda tener una idea de lo que puede hacer la herramienta (en caso de que aún no la haya usado):
La comunidad internacional ha estado siguiendo de cerca la reciente erupción volcánica en la pequeña isla de Montserrat, ubicada en el Caribe. La erupción ocurrió a fines de abril, lo que obligó a miles de residentes a evacuar sus hogares mientras la lava y las cenizas cubrían la isla. Los científicos creen que la erupción es el resultado del aumento de la actividad sísmica en la región, que se ha observado en los últimos meses. Los equipos de respuesta a emergencias de los países vecinos, junto con las organizaciones de ayuda internacional, han estado trabajando incansablemente para brindar apoyo a los residentes afectados, ofreciendo refugio temporal, alimentos y asistencia médica.
Esto podría pasar fácilmente como una actualización creada por humanos sobre un evento de noticias. No es el contenido más atractivo, pero es gramaticalmente sólido y fácil de entender. Según nuestra experiencia probando la generación de contenido de IA, eso ya es decir mucho.
Puede usar AI Text Classifier visitando la página de inicio de la herramienta e ingresando el texto que desea probar. En este caso, la herramienta clasificó uno de nuestros textos de prueba como "Muy poco probable que sea generado por IA", y el segundo como "Improbable que sea generado por IA":
Este resultado en particular es sorprendente, porque estamos usando una herramienta OpenAI para verificar el texto que produjo ChatGPT. Vale la pena señalar que usamos varios ejemplos de textos con diferentes longitudes, para darle al detector más datos con los que trabajar.
¿Funciona AI Text Classifier? ️
Nuestras pruebas mostraron que el clasificador de texto AI de OpenAI no proporciona resultados precisos de detección de AI. Cada texto que generamos usando ChatGPT 4 fue etiquetado como improbable o muy poco probable de ser creado por una IA.
La aplicación Writer le permite generar contenido de texto y resumir archivos de audio. Junto con sus herramientas de generación de contenido, Writer también ofrece una función que se supone que lo ayudará a detectar contenido escrito por IA.
El detector Writer AI es fácil de usar. Puede pegar texto de hasta 1500 palabras o ingresar una URL, y Writer le dirá qué tan probable es que un humano haya escrito ese texto. Durante nuestra prueba, Writer clasificó un texto como 96 % de contenido generado por humanos y el otro como 83 % de contenido generado por humanos:
Todo el texto enviado durante ambas pruebas fue 100% generado por IA. El uso de porcentajes hace que esta herramienta parezca más precisa que algunos de sus competidores, pero los resultados hablan por sí solos. En la mayoría de los casos, Writer no es rival para las herramientas modernas de generación de contenido como ChatGPT.
¿Funciona Writer? ️
En general, Writer no puede detectar contenido moderno generado por IA. La herramienta a veces sugiere editar el texto para que se lea más "como un humano", pero no proporciona notas específicas sobre qué modificar.
Copyleaks es una empresa que proporciona herramientas de detección de plagio, calificación y detección de contenido de IA. El servicio ofrece una extensión de Chrome que le permite probar contenido en cualquier lugar de la web para ver si fue generado por IA. También incluye una integración de API, por lo que puede usar sus herramientas de prueba directamente dentro de su sitio o en cualquier plataforma con la que esté trabajando.
En términos de precisión, la herramienta de Copyleaks obtiene calificaciones bastante altas. Los mismos textos generados por IA que desconcertaron tanto a AI Text Classifier como a Writer se asignaron con un 92,6 % y un 82,3 % de probabilidades de ser escritos por una IA:
Eso no quiere decir que la herramienta de detección de contenido de IA de Copyleaks no tenga problemas. Durante nuestras pruebas, su detector de IA marcó el texto completamente generado por humanos como "improbable que sea escrito por un humano".
Una ventaja es que esta herramienta le permite marcar manualmente sus resultados como precisos o inexactos. Si los desarrolladores usan esa información para mejorar su precisión, Copyleaks puede volverse más efectivo con el tiempo.
¿Funciona Copyleaks? ️
Copyleaks es mayormente preciso cuando se trata de detectar contenido de IA. No es del todo exacto, pero todos los textos que creamos con ChatGPT se marcaron como escritos principalmente por IA.
GPTZero es quizás la opción más popular entre los detectores de contenido de IA en este momento. Fue construido como una respuesta a ChatGPT, y califica el texto que envía tanto en "perplejidad" como en "explosión". La perplejidad mide la aleatoriedad de las palabras utilizadas, mientras que la ráfaga mide la variación de la perplejidad.
Los humanos tienden a escribir de una manera mucho más aleatoria que una IA o un LLM, lo cual es de esperar. Durante nuestras pruebas, GPTZero evaluó correctamente que ambos textos se crearon completamente con IA:
GPTZero también destaca frases específicas que cree que es más probable que sean escritas por una IA. Para ser justos, la herramienta devuelve resultados falsos a veces. Por ejemplo, marcó parte de la Declaración de Independencia de los Estados Unidos como IA generada durante nuestras pruebas.
A pesar de eso, GPTZero generalmente brinda resultados precisos y es la única herramienta que hemos verificado hasta ahora que le advierte que puede arrojar falsos positivos. Esta es información esencial porque a medida que la generación de contenido de IA continúa mejorando, los detectores de contenido de IA tendrán cada vez más dificultades para ponerse al día y devolver evaluaciones precisas.
¿GPTZero funciona? ️
GPTZero hace un gran trabajo al detectar contenido creado por ChatGPT. También advierte a los usuarios que no deben confiar ciegamente en los detectores de contenido de IA, lo que lo convierte en una recomendación fácil.
Content at Scale se comercializa a sí mismo como una herramienta de escritura asistida por IA que tiene en cuenta la optimización de motores de búsqueda (SEO). Sin embargo, no estamos aquí para probar sus capacidades de generación de contenido hoy.
Además de su servicio principal, Content at Scale ofrece una herramienta gratuita que verifica el contenido generado por IA. Durante nuestras pruebas, marcó ambos ejemplos como altamente probables de ser generados por IA:
El contenido a escala mide el texto utilizando múltiples métricas, incluida la previsibilidad de la elección de palabras y si sigue patrones "conocidos". Esto es similar al modelo que usa GPTZero, solo que con un algoritmo diferente.
Este detector de contenido de IA también marca párrafos y frases específicos si es posible que puedan ser generados por IA. En teoría, esto podría ayudarlo a detectar la escritura asistida por IA. Sin embargo, durante nuestras pruebas, el detector de IA también marcó parte de la Declaración de Independencia de los Estados Unidos como escrita por una IA (que estamos bastante seguros de que no lo es).
¿Funciona el contenido a escala? ️
Content at Scale es bastante preciso en la detección de texto generado por IA. Califica textos en varias métricas (aunque no explica qué miden esas métricas), y marca párrafos y oraciones específicos si los considera "sospechosos". Sin embargo, a pesar de los resultados positivos generales, algunas de sus banderas pueden ser inexactas.
Sapling ofrece un conjunto de herramientas de autocompletado para sitios web, así como productos de corrección gramatical. Una de sus ofertas es un detector de contenido de IA con planes gratuitos y premium. La opción gratuita no requiere que se registre para obtener una cuenta, pero limita la longitud del texto que puede consultar.
La herramienta en sí está entrenada para detectar texto creado con los modelos GPT más recientes. Durante nuestras pruebas, arrojó puntajes "falsos" de 100% y 98.8%:
Estos resultados son increíblemente precisos teniendo en cuenta que ambos textos están totalmente generados por IA, sin alteraciones. Sapling también proporciona un desglose de los resultados y destaca las partes del texto que cree que fueron creadas por una IA.
Sapling ofrece una extensión gratuita que puede usar para probar fragmentos de texto en cualquier lugar de la web. Este servicio también brinda acceso a la API con sus planes premium, que puede usar para automatizar las pruebas.
¿Sapling funciona? ️
El retoño se desempeñó casi perfectamente durante las pruebas. El único inconveniente de este servicio es que limita la longitud del texto que puedes probar, al menos en la versión gratuita. Sin embargo, está lejos de ser la única plataforma para hacer esto, y la versión gratuita no requiere que se registre para obtener una cuenta.
Crossplag ofrece herramientas de detección de plagio para pequeñas empresas e instituciones educativas. También proporciona una herramienta gratuita que puede usar en su sitio web para verificar el contenido escrito de AI. Esta herramienta toma texto y le da un porcentaje que indica la probabilidad de que sea generado por IA.
Durante nuestra prueba, Crossplag marcó uno de los ejemplos con un 84 % de probabilidades de ser IA. Sin embargo, el segundo ejemplo arrojó un 4%. Eso se traduce en un resultado de "Este texto está escrito principalmente por un humano":
Para seguir probando Crossplag, recurrimos una vez más a la Declaración de Independencia de los Estados Unidos. La herramienta marcó parte de su texto como 50% escrito por una IA.
Finalmente, vale la pena señalar que Crossplag limita la cantidad de texto que puede probar sin una cuenta. Durante nuestros experimentos, solo pudimos realizar dos pruebas antes de vernos obligados a registrarnos para obtener una cuenta gratuita.
¿Crossplag funciona? ️
Según nuestras pruebas, Crossplag a veces puede detectar con precisión el texto generado por IA. Sin embargo, devuelve constantemente resultados inexactos con texto generado por IA y totalmente humano.
A pesar del nombre similar, ZeroGPT es una herramienta completamente diferente de GPTZero. Este es un servicio gratuito de detección de IA de una empresa que ofrece otros productos en el espacio de IA, incluido uno que le permite hablar con ChatGPT a través de WhatsApp o Telegram.
Cuando probamos esta última opción en nuestra lista de detectores de contenido de IA, nuestros dos fragmentos generados por ChatGPT se marcaron como 100 % creados por IA:
A pesar de su precisión inicial, esta herramienta a veces marca falsamente el contenido humano regular como generado por IA. Una vez más, la Declaración de Independencia hizo tropezar, obteniendo un resultado del 68,1% de IA generada.
¿Funciona ZeroGPT? ️
En términos generales, ZeroGPT puede detectar con precisión el texto generado por IA. Sin embargo, también marca el contenido generado por humanos con regularidad y puede otorgarle un alto porcentaje de creación por parte de una IA. Esto hace que sea difícil confiar en los resultados en general.
Conclusión
Los detectores de contenido de IA están librando una batalla cuesta arriba. A medida que herramientas como ChatGPT continúan mejorando, estos servicios deben adaptarse y descubrir mejores formas de detectar si el texto fue generado por una IA o no.
Es importante comprender que la mayoría de los detectores de contenido de IA no son del todo precisos y pueden arrojar falsos positivos con frecuencia. Habiendo dicho eso, GPTZero y Copyleaks fueron las herramientas más precisas que probamos cuando se trataba de detectar contenido totalmente generado por IA (creado con ChatGPT). Si tiene que usar un detector de IA, le recomendamos que use uno de esos dos (o ambos para mejorar sus posibilidades de obtener resultados confiables).
¿Tiene alguna pregunta sobre los detectores de contenido de IA? ¡Hablemos de ellos en la sección de comentarios a continuación!