Para 2026, los motores de IA como ChatGPT, Perplexity y Gemini envían una parte medible y creciente de visitas de referencia — sin embargo, en una propiedad GA4 por defecto casi nada se etiqueta como tal. El tráfico es real; el reporte está ciego. La mayor parte aterriza en el cubo 'direct' o se mezcla con un canal Organic indiferenciado, así que los equipos a los que la IA cita claramente no pueden probar que una sola sesión vino de ahí.
Esta guía construye las reglas de canales de GA4, los segmentos regex y la estrategia UTM que sacan a la luz el tráfico de ChatGPT, Perplexity, Gemini y Copilot — y es deliberadamente honesta sobre los puntos ciegos, como los AI Overviews, que ningún segmento puede cerrar del todo. Para comprobar lo preparado para la IA y bien medido que está tu contenido hoy, ejecuta nuestra auditoría de contenido gratuita en 5 ejes.
Actualizado el 2026-05-25 con los hostnames de referente de IA actuales, el comportamiento de los canales de GA4 y los límites de medición observados en propiedades de US, UK y Europa.
- El tráfico de IA se esconde en el cubo direct y un canal Organic indiferenciado — los informes por defecto lo pierden. 2. Construye un grupo de canales personalizado con un regex de referentes sobre chatgpt.com, perplexity.ai, gemini.google.com y copilot.microsoft.com. 3. Los AI Overviews son el punto ciego difícil — esos clics siguen leyéndose como google.com y no se pueden aislar limpiamente. 4. Etiqueta con UTM cada enlace que controlas para recuperar sesiones de IA atribuibles desde direct. 5. Informa un suelo, no un total — divulga los puntos ciegos de la aplicación y de los AI Overviews cada vez.
¿Por qué el tráfico de IA y LLM es invisible en los informes por defecto de GA4?
GA4 por defecto fue construido para una web de enlaces, y las superficies de IA rompen dos de sus supuestos fundamentales. El resultado es que las visitas auténticamente impulsadas por la IA se dispersan entre los canales equivocados.
El cubo direct — GA4 archiva una sesión como direct siempre que no puede determinar una fuente. Los asistentes basados en aplicaciones — la aplicación de ChatGPT, un panel de Copilot, un cliente móvil — frecuentemente no envían ninguna cabecera de referente, así que sus clics aterrizan en direct, indistinguibles de alguien que teclea tu URL.
El desenfoque orgánico — Un clic desde un AI Overview de Google sigue siendo un clic desde google.com, así que se lee como Organic Search ordinario. No hay un hostname distinto para separarlo, lo que significa que una porción creciente de tráfico influido por la IA se esconde dentro de un canal que ya tienes.
Sin canal de IA por defecto — GA4 viene con Organic, Paid, Referral y Direct, pero nada para los motores de IA, así que incluso los clics de IA que llevan referente se archivan bajo un Referral genérico. El arreglo empieza por nombrar la superficie tú mismo. Para la estrategia que gana este tráfico en primer lugar, consulta nuestra guía GEO completa.
¿Qué referentes identifican a ChatGPT, Perplexity, Gemini y Copilot?
No puedes segmentar lo que no puedes nombrar. El primer paso es una lista mantenida de los hostnames que cada motor pasa cuando sí envía un referente.
ChatGPT — principalmente chatgpt.com, más el heredado chat.openai.com. Las sesiones web suelen llevar uno de estos; las sesiones de aplicación a menudo no llevan ninguno.
Perplexity — perplexity.ai. Perplexity es uno de los referentes más fiables porque frecuentemente enlaza hacia fuera con la atribución intacta.
Gemini y Copilot — gemini.google.com para Gemini, y copilot.microsoft.com más bing.com para Microsoft Copilot. Añade claude.ai, you.com y poe.com para completar las superficies principales.
Mantén todos estos en una sola expresión regular para que la lista sea fácil de mantener, y revísala cada trimestre — se lanzan nuevos motores y los hostnames cambian. Para el trabajo previo de ganar realmente estas citas, nuestra guía para ser citado por los motores de IA cubre el lado del contenido.
¿Cómo construir un grupo de canales personalizado y un segmento regex?
GA4 te da dos herramientas complementarias: un grupo de canales personalizado para el reporte continuo y un segmento de exploración para el análisis. Construye ambos.
Grupo de canales personalizado — En la Administración, crea un grupo de canales personalizado basado en el predeterminado, luego añade un canal llamado AI / LLM. Define su condición como la fuente de sesión que coincide con un regex de tus hostnames de IA, y ordénalo por encima del canal Referral genérico para que el tráfico de IA no se atribuya mal.
El regex — Une tus hostnames con el operador OR, por ejemplo chatgpt\.com|chat\.openai\.com|perplexity\.ai|gemini\.google\.com|copilot\.microsoft\.com|claude\.ai|you\.com. Escapa los puntos para que el patrón sea preciso.
Segmento de exploración — En Explorar, crea un segmento de sesión sobre la misma condición para analizar las páginas de destino, la interacción y las conversiones de las visitas de IA. Esto muestra el comportamiento, no solo el volumen. Cuando los números se ven extraños, nuestra guía de exploraciones de GA4 profundiza en la construcción de segmentos.
¿Cómo se comportan el tráfico de los AI Overviews y la inflación del 'direct'?
Estos son los dos modos de fallo que ningún regex resuelve del todo, y fingir lo contrario produce un informe que parece completo pero no lo es.
AI Overviews — Un clic desde un AI Overview es un clic desde google.com, así que GA4 registra el mismo referente orgánico de siempre. No hay un hostname ai-overview con el que coincidir, lo que significa que este tráfico se mezcla con Organic Search y no se puede aislar solo por el referente. Puedes inferir movimiento desde las tendencias de página de destino y de consulta de Search Console, pero no puedes trazar una frontera firme en GA4.
Inflación del direct — A medida que los asistentes basados en aplicaciones eliminan los referentes, la porción de visitas de IA auténticas que aterriza en direct crece. Un canal direct en alza sin causa evidente suele ser una señal de actividad de IA que no puedes ver, especialmente si correlaciona con contenido que se sabe que los motores citan.
La lectura honesta — Trata ambos como subconteos estructurales. El segmento capturado es un suelo; la influencia real es mayor. Si un cambio de tráfico parece un artefacto de seguimiento en lugar de un problema de rendimiento, la misma disciplina de separación de nuestra guía de corrección del seguimiento de conversiones se aplica aquí.
¿Cómo usar los UTM allí donde controlas el enlace?
No puedes etiquetar un enlace que un motor de IA escribe por su cuenta, pero puedes etiquetar cada enlace que colocas en el contenido que esos motores leen. Esa es la porción que puedes recuperar de direct.
Etiqueta lo que posees — Aplica UTM a las URL en tu documentación, base de conocimiento, llms.txt, perfiles sociales y publicaciones sindicadas. Cuando un motor saca a la luz uno de esos enlaces, el clic llega atribuido en lugar de anónimo.
Mantén el esquema coherente — Usa una convención utm_source y utm_medium estable para que las colocaciones de IA se agrupen limpiamente. Un etiquetado incoherente fragmenta los datos peor que no etiquetar en absoluto.
Conéctalo con la exposición — Cuanto más legible por las máquinas sea tu contenido, más enlaces controlados existen para etiquetar. Publicar un índice llms.txt, cubierto en nuestra guía de implementación de llms.txt, expone el contenido y crea superficies etiquetables. Construye enlaces rápido con el generador de UTM.
¿Cuáles son los puntos ciegos de medición que hay que divulgar?
Un informe de tráfico de IA fiable nombra sus propios límites. Esconder las brechas hace que el número parezca autoritativo y silenciosamente equivocado.
Clics de aplicación — Las sesiones de las aplicaciones de asistente a menudo no llevan referente y caen en direct. Subcontarás cada motor con una aplicación popular, y no puedes recuperar del todo esas visitas.
AI Overviews — Como se cubrió arriba, se leen como google.com orgánico y no se pueden separar limpiamente. Informa el movimiento orgánico y las señales de Search Console en lugar de un número de AI Overviews de falsa precisión.
Muestreo y eliminación — Algunos referentes son descartados por la configuración de privacidad o muestreados fuera de los informes de alto volumen. Contrasta con los registros de servidor, que ven referentes en bruto que GA4 puede no sacar a la luz.
El marco de reporte — Presenta un mínimo capturado más una lista de puntos ciegos etiquetada, nunca un total único disfrazado de completo. Esta es la misma honestidad intelectual que nuestra guía sobre el impacto de los AI Overviews aplica a las afirmaciones de rendimiento.
Cómo encaja el seguimiento del tráfico de IA en una estrategia GEO más amplia
La medición es el bucle de retroalimentación de la optimización para motores generativos (GEO). No puedes mejorar lo que te niegas a estimar, y no puedes confiar en una estimación que esconde sus brechas.
Medir para dirigir — Un canal de IA mantenido te dice qué contenido gana citas y clics, para que puedas hacer más de lo que funciona. Sin él, el GEO es adivinar.
Combinar ganar con medir — Ganar citas y medir el retorno son las dos mitades del mismo bucle. El lado del contenido vive en nuestra guía para posicionarte en los AI Overviews; el lado de la medición es este artículo.
Cierra el bucle — Audita la calidad del contenido y su preparación para la IA, despliega el canal y el segmento, etiqueta tus enlaces controlados, e informa un suelo con puntos ciegos honestos. Para reunir contenido, estructura y medición, ejecuta la auditoría gratuita en 5 ejes de SteerAds y etiqueta cada enlace controlado con el generador de UTM.
Sources
Fuentes oficiales y primarias consultadas para esta guía:
-
support.google.com — Grupos de canales por defecto de GA4
-
platform.openai.com — Bots y crawlers de OpenAI
-
llmstxt.org — la propuesta llms.txt
-
blog.google — Google Search y los AI Overviews
FAQ
¿Cómo rastreo el tráfico de ChatGPT en GA4?
Construye un segmento basado en el referente o un grupo de canales personalizado que coincida con los hostnames que usa ChatGPT, principalmente chatgpt.com y el antiguo chat.openai.com. En GA4, crea un grupo de canales personalizado, añade un canal con un nombre como AI / LLM, y define su condición como la fuente de sesión que coincide con un regex de esos hostnames. También puedes construir una exploración con un segmento sobre la misma condición para analizar el comportamiento. La trampa es que no todos los clics de ChatGPT llevan un referente — los clics desde las aplicaciones de escritorio y móvil a menudo llegan sin uno, así que caen en direct y nunca alcanzan tu segmento. Trata el número que capturas como un suelo, no un recuento completo.
¿Muestra GA4 el tráfico de los AI Overviews?
En su mayoría no, y este es el punto ciego más difícil. Un clic desde un AI Overview de Google sigue siendo un clic desde google.com, así que GA4 ve el mismo referente de búsqueda orgánica de siempre — no hay un hostname ai-overview distinto sobre el que segmentar. Eso significa que el tráfico de los AI Overviews se mezcla con tu canal Organic Search existente y no se puede aislar limpiamente solo por el referente. Puedes inferir movimiento observando los cambios a nivel de página de destino y de consulta en Search Console junto a las sesiones orgánicas, pero no puedes trazar una línea firme alrededor de los clics de los AI Overviews en GA4 hoy. Sé explícito sobre esa limitación cuando informes.
¿Por qué se cuenta el tráfico de IA como direct en GA4?
Porque falta el referente. GA4 archiva una sesión como direct siempre que no se puede determinar ninguna fuente, y las superficies de IA eliminan u omiten el referente con más frecuencia que los sitios web clásicos. Los asistentes basados en aplicaciones — la aplicación de ChatGPT, un panel de Copilot, un cliente móvil — frecuentemente no envían ninguna cabecera de referente en absoluto, y algunos motores deliberadamente no pasan una. El resultado es que una parte significativa de las visitas auténticamente impulsadas por la IA aterriza en direct y es indistinguible de alguien que teclea tu URL. Etiquetar con UTM los enlaces que controlas es la única forma fiable de sacar parte de ese tráfico del cubo direct.
¿Puedo construir un canal de IA en GA4?
Sí. GA4 te permite crear un grupo de canales personalizado, donde añades un nuevo canal — llámalo AI / LLM — y defines su regla de coincidencia con una expresión regular sobre la fuente de sesión o el referente. Lista los hostnames que te interesan, como chatgpt.com, perplexity.ai, gemini.google.com y copilot.microsoft.com, unidos con el operador OR del regex. Los grupos de canales personalizados se aplican hacia adelante y a parte de los datos históricos según tu configuración, y evitan que el tráfico de IA se atribuya erróneamente a Organic o Referral. Es el paso único más limpio que puedes dar, siempre que aceptes que solo captura las sesiones que realmente llevan uno de esos referentes.
¿Qué precisión tiene el seguimiento del tráfico de IA en GA4?
Parcial, y deberías decirlo en voz alta. Lo que capturas es un suelo fiable — sesiones que genuinamente llevaban un referente de IA — pero el número real es mayor porque los clics de aplicación, los referentes eliminados y los AI Overviews se filtran a direct y organic. Espera subcontar, a veces sustancialmente, y nunca presentes el segmento como una imagen completa. El encuadre correcto en un informe es un mínimo capturado más un conjunto claramente etiquetado de puntos ciegos. Combina el segmento de GA4 con el análisis de registros de servidor y las tendencias de Search Console para triangular, y actualiza tu regex de referentes a medida que aparecen nuevos motores, porque la lista cambia cada trimestre.
¿Qué referentes debería incluir para los motores de IA?
Empieza con las superficies principales y amplía a medida que veas tráfico. La lista básica en 2026 es chatgpt.com y chat.openai.com para ChatGPT, perplexity.ai para Perplexity, gemini.google.com para Gemini, copilot.microsoft.com y bing.com para Microsoft Copilot, y claude.ai para Claude. Añade you.com, poe.com y cualquier asistente vertical relevante para tu mercado. Mantén la lista en un solo regex para que sea fácil de mantener, y revísala trimestralmente porque se lanzan nuevos motores y los hostnames cambian. Recuerda que esto solo captura sesiones que llevan un referente; los puntos ciegos de la aplicación y de los AI Overviews permanecen independientemente de lo completa que sea tu lista de hostnames.
¿Debería usar UTM para el tráfico de IA?
Sí, dondequiera que controles el enlace. No puedes añadir UTM a un enlace que un motor de IA genera por su cuenta, pero puedes etiquetar cada URL que coloques en el contenido que los motores leen — tu documentación, tu base de conocimiento, tu llms.txt, tus perfiles y tus publicaciones sindicadas. Un esquema UTM coherente convierte esas colocaciones controladas de visitas direct anónimas en sesiones atribuibles. Nunca capturará las citas de IA orgánicas, pero recupera la porción que puedes influir, y es el hábito de mayor apalancamiento para medir el tráfico de referencia de IA a lo largo del tiempo.