¿Qué son las audiencias sintéticas?

El término audiencias sintéticas ha empezado a ganar relevancia en este 2025 en las industrias de los medios y la publicidad. Este proceso utiliza IA para replicar los patrones de comportamiento de una audiencia real a partir de los datos de publishers y marcas. Aunque el término "sintético" puede generar inquietud, dado su posible vínculo con la "falsedad" en un contexto marcado por la desinformación generada por IA, esta práctica está ganando terreno. Por ejemplo, The Times ya la están implementando para probar ideas antes del lanzamientos de productos o iniciativas editoriales, mientras que agencias como Dentsu la utilizan para probar la planificación de medios y la segmentación de audiencias, logrando procesos más ágiles y rentables.

¿“Datos sintéticos” e “investigación sintética” es lo mismo que “audiencias sintéticas”?

Al igual que sucede con otros términos que surgen de las nuevas capacidades tecnológicas, existen varias formas de referirse a ello. "Datos sintéticos" o "investigación sintética" es el término general para describir el uso de IA para crear datos que imitan los datos reales que se le proporcionan. Por otra lado, las audiencias sintéticas se refieren específicamente a un panel creado a partir de datos de comportamiento humano, generalmente extraídos de CRM o encuestas realizadas por personas. Las audiencias sintéticas simulan un grupo de audiencia y sus diferentes cohortes, también llamado “digital twinning”.

Normalmente, cuando un publisher o marca quiere realizar una investigación de mercado, debe usar encuestas, focus groups y otros métodos de recopilación de datos. Con la investigación sintética, es posible replicar datos reales de la audiencia para crear un conjunto de datos virtuales y obtener información en tiempo real. Tal y como recoge Digiday, según Cynthia Vega, quien lidera la integración de IA y análisis en Kantar, los sistemas de IA utilizan patrones de inferencia para proporcionar información de estos “panelistas sintéticos”.

No obstante, existen otras formas de investigación sintética, como el “impulso de cohortes”, que permite ampliar un conjunto de datos, comentó Vega. Por ejemplo, si una empresa tiene un focus groupde 50 personas (reales) pero quiere extrapolar esos datos para abarcar un segmento de audiencia mayor, puede usar IA para ampliar ese conjunto de datos y realizar una prueba de mercado con 500 personas (sintéticas).

¿Cómo funciona el proceso?

En el caso de The Times, sus equipos de datos y análisis trabajaron de manera conjunta con los desarrolladores de la plataforma Electric Twin durante varios meses para estudiar y analizar sus conjuntos de datos. La plataforma de Electric Twin no es muy diferente a la experiencia de usuario de ChatGPT: puedes realizar consultas a toda la base de datos de audiencias sintéticas o dirigirte a segmentos específicos para comparar las respuestas de distintos grupos. Además, es posible interactuar con “personas” virtuales modeladas según perfiles específicos. La investigación sintética se basa principalmente en una combinación de datos de audiencia y modelos de IA. Se puede añadir datos de comportamiento adicionales, como datos gubernamentales de acceso público. Las "personas" de las audiencias sintéticas no dependen de la información personal de personas reales, sino que se construyen sobre datos probabilísticos. Según Alex Cooper, CEO y cofundador de Electric Twin, hay tres casos principales de uso para los publishers: probar productos antes de su lanzamiento, probar conceptos y campañas antes de que salgan en vivo, y obtener información más profunda sobre su audiencia. Esto puede significar probar ofertas de suscripción o diferentes mensajes de campaña para ver qué resuena más, explicó. Una vez que se crean estos AI twins, los publishers pueden interactuar con ellos para obtener insights sobre productos en desarrollo, como por qué querrían comprar un producto o si escucharían una idea específica de podcast.

Por ejemplo: imagina un enfoque tradicional de focus group en el que una persona plantea preguntas a un grupo en una sala, como: “¿Cuántas veces a la semana lees las noticias?” o “¿Cuáles son las fuentes de noticias en las que más confías?”. Ahora, este proceso se puede replicar en una experiencia de chatbot. Se pueden plantear las preguntas a todo el grupo o preguntar de manera individual a una persona que represente a un lector de la Generación Z que lee las noticias todos los días y confía en publicaciones de una determinada tendencia, por ejemplo.

“Todo lo que le preguntarías a un ser humano, se lo puedes preguntar a un twin”, explicó Vega. Sin embargo, para que esto funcione correctamente, es esencial contar con datos limpios y de alta calidad.

¿Cuáles son los beneficios de usar audiencias sintéticas sobre las reales?

El uso de audiencias sintéticas puede ser más rápido y más económico. Cuando un publisher o marca está probando una nueva idea de producto, necesita testarla con un grupo de personas y recoger sus opiniones. Este proceso puede ser costoso y llevar tiempo. Sin embargo, al utilizar un grupo sintético, los resultados de la investigación de mercado pueden obtenerse de forma mucho más rápida, según explicó Vega. Usar datos de audiencias sintéticas puede ser "decenas de miles de veces más rápido… Es casi una respuesta instantánea", dijo Cooper. Una encuesta real podría tardar semanas en completarse. Aunque depende de la frecuencia con la que el publisher recurra a la audiencia sintética para obtener información, es “probablemente mil veces más barato” que hacer la misma investigación con audiencias reales, agregó. Los publishers y las marcas también pueden seguir haciendo preguntas a las audiencias sintéticas sin preocuparse por la “fatiga de encuesta” o el “único intento” que tienes para hacer esas preguntas cuando envías una encuesta a los lectores reales, dijo Vega. En plataformas como Electric Twin, por ejemplo, los publishers pagan una tarifa de suscripción, pero pueden hacer preguntas ilimitadas a sus audiencias sintéticas. Es importante señalar que los datos sintéticos son una buena herramienta para realizar pruebas preliminares en la investigación de mercado, pero no deben tomarse como la base para decisiones finales. Son útiles para identificar las mejores opciones entre varias, pero una vez seleccionada una idea, esta debe ser validada con un segmento de audiencia real antes de tomar decisiones definitivas.

¿Qué pueden hacer los publishers una vez que han creado una audiencia sintética?

Los publishers pueden usar audiencias sintéticas para probar productos e ideas de contenido, acelerando su proceso de lanzamiento al mercado. Además, pueden perfeccionar sus estrategias de marketing al crear segmentos específicos dentro de estos datos sintéticos, permitiéndoles probar productos o conceptos dirigidos a audiencias concretas. Por ejemplo, si ciertas áreas de contenido están perdiendo lectores, un publisher podría preguntarle a las audiencias sintéticas por qué creen que eso ocurre, o por qué podrían darse de baja, explicó Vega. The Times ha usado audiencias sintéticas este año para guiar sus planes editoriales, como la creación de un nuevo podcast de negocios, según comentó Tracy Yaverbaun, gerente general de The Times y Sunday Times, durante el Digiday Publishing Summit Europe el mes pasado. También preguntaron a los panelistas sintéticos qué impulsaría un mayor compromiso, añadió

¿Cómo se puede confiar en que las respuestas de estas audiencias sintéticas son correctas?

Nada "sintético" puede reemplazar lo real. Este enfoque no pretende sustituir la investigación de mercado humana, sino complementarla. “La validación humana sigue siendo esencial para obtener resultados precisos y libres de sesgos", señaló Paul Hood, estratega digital independiente. Además, existen casos en los que las respuestas generadas por un conjunto de datos de IA pueden diferir de lo que una persona realmente diría, y no siempre son fiables. Cuando Vega preguntó a un digital twin, “¿Bebes alcohol por la mañana?”, este respondió afirmativamente, lo que le pareció extraño. Entonces, preguntó por qué, y el digital twin respondió que si hubiera una boda o evento de trabajo por la mañana, podría beber en ese contexto. “La respuesta rápida de un humano no incluiría eso. No significa que esté mal. Pero te da una perspectiva distinta a la que tendría una persona”, comenta Vega.

En otro ejemplo, un panelista sintético se negó a proporcionar información que Kantar ya sabía que tenía. Ella descubrió que simplemente estaba imitando el comportamiento humano, saltándose la pregunta de la misma manera que lo haría una persona en una encuesta. La conclusión: es necesario establecer directrices o reglas para asegurar que los panelistas sintéticos se comporten adecuadamente y se obtengan los mejores resultados, explicó Vega. Las audiencias sintéticas tampoco deben usarse para cuestionar el rendimiento del contenido o la publicidad, añadió. En su lugar, es más útil para generar ideas o soluciones. Por último, Vega advirtió que los datos de audiencias sintéticas deben actualizarse con regularidad. No deben usarse de forma continua para la investigación de mercado, ya que las percepciones y actitudes humanas cambian con el tiempo.

En general, la precisión de los insights basados en datos de audiencias sintéticas es bastante alta – un 94% en un caso de uso, dijo Vega. Al analizar siete encuestas diferentes, Electric Twin descubrió que los insights basados en audiencias sintéticas eran igual de precisos que los basados en datos de audiencias reales, según Cooper. También es importante construir una audiencia sintética que refleje las necesidades del publisher, comentó Cooper. “Vemos esto como una forma de complementar, ampliar y mejorar los procesos tradicionales de investigación. En esencia, proporciona otra herramienta para entender mejor a tu audiencia”, añadió Cooper.

Siguiente
Siguiente

¿Qué es el headless browsing? Así funcionan los navegadores invisibles que usan los agentes de IA