NewsGuard lanza una herramienta para detectar webs que publican contenido generado por IA a gran escala
NewsGuard ha lanzado una nueva herramienta para identificar sitios web que publican grandes volúmenes de contenido generado por inteligencia artificial. El proyecto se ha desarrollado en colaboración con la startup de detección de contenido generado por IA Pangram Labs. La solución está diseñada para detectar lo que la compañía denomina AI content farms: páginas que utilizan modelos de lenguaje como ChatGPT, Claude o Gemini para producir contenido automatizado a gran escala que aparenta ser información periodística, según recoge AdWeek.
El sistema combina tecnología de análisis basada en IA con revisión humana. En una primera fase, los modelos desarrollados por Pangram analizan páginas y dominios completos para identificar patrones de contenido potencialmente generado por inteligencia artificial. Posteriormente, cuando se detecta un posible site de este tipo, los analistas de NewsGuard realizan una revisión manual para evaluar el alcance del contenido automatizado, comprobar si existe algún tipo de transparencia sobre el uso de IA, buscar indicios de intervención humana en la redacción y contactar con los responsables del sitio para evitar posibles falsos positivos. NewsGuard clasifica como AI content farm cuando cumple tres criterios principales: que una parte importante del contenido esté generada por IA, que el site no informe de ello de forma explícita y que su apariencia pueda inducir a los usuarios a creer que se trata de contenido producido por personas. En estos casos, el contenido puede resultar poco fiable o incluso considerarse como desinformación o propaganda.
“Si no podemos detectar el contenido generado por IA, todos los espacios de comunicación se verán inundados de contenido falso, barato de producir y difícil, si no imposible, de diferenciar de algo auténtico”, dijo Max Spero, CEO de Pangram, en declaraciones recogidas por AdWeek. Según NewsGuard, la herramienta ha estado en fase de pruebas durante más de seis meses y ya ha permitido identificar alrededor de 3.000 sitios de este tipo, más del doble de los detectados el año anterior mediante procesos manuales, principalmente. Muchos de estos sites utilizan nombres genéricos con apariencia informativa y publican artículos con afirmaciones falsas o engañosas sobre marcas, líderes políticos, famosos o temas de salud pública. Muchos de estos sites pueden clasificarse también como made-for-advertising (MFA), páginas que publican contenido de baja calidad con el único objetivo de generar ingresos publicitarios mediante arbitraje de tráfico. En un periodo de observación de dos meses, NewsGuard identificó anuncios de 141 grandes marcas apareciendo en este tipo de páginas. Según Pangram Labs, cada mes aparecen entre 300 y 500 nuevos sites de este tipo, impulsados por el bajo coste de producir contenido automatizado y por su capacidad para generar ingresos publicitarios.
Para abordar este problema desde el lado publicitario, la empresa permitirá que anunciantes y agencias licencien su base de datos de sitios identificados. Además, la herramienta cuenta con una integración directa con la plataforma de compra programática The Trade Desk, lo que permitirá bloquear estos dominios mediante segmentos pre-bid antes de realizar una puja por inventario publicitario. Como indica AdWeek, NewsGuard también estudia incorporar esta funcionalidad a su extensión de navegador, con el objetivo de que los usuarios puedan identificar cuándo están consumiendo información generada por IA.
Puntos clave:
Análisis con IA y verificación humana: la herramienta utiliza modelos de IA de Pangram Labs para detectar posibles contenidos generados automáticamente y posteriormente los analistas de NewsGuard revisan los resultados para confirmar los casos.
Crecimiento acelerado: el sistema ya ha identificado cerca de 3.000 sitios de este tipo, mientras que entre 300 y 500 nuevas páginas pueden aparecer cada mes.
Impacto publicitario: muchos de estos sites son made-for-advertising (MFA); en dos meses se detectaron anuncios de 141 grandes marcas en estas páginas, que ahora podrán bloquearse vía The Trade Desk.
Este resumen lo ha creado una herramienta de IA basándose en el texto del artículo, y ha sido chequeado por un editor de PROGRAMMATIC SPAIN.
