D'ici 2026, les moteurs d'IA comme ChatGPT, Perplexity et Gemini envoient une part mesurable et croissante de visites de référence — pourtant, dans une propriété GA4 par défaut, presque rien n'est étiqueté comme tel. Le trafic est réel ; le reporting est aveugle. La majeure partie atterrit dans le seau 'direct' ou se fond dans un canal Organic indifférencié, si bien que les équipes clairement citées par l'IA ne peuvent prouver qu'une seule session est venue de là.
Ce guide construit les règles de canaux GA4, les segments regex et la stratégie UTM qui font apparaître le trafic de ChatGPT, Perplexity, Gemini et Copilot — et il est délibérément honnête sur les angles morts, comme les AI Overviews, qu'aucun segment ne peut totalement combler. Pour vérifier à quel point votre contenu est prêt pour l'IA et bien mesuré aujourd'hui, lancez notre audit de contenu gratuit en 5 axes.
Mis à jour le 2026-05-25 avec les hostnames de référents IA actuels, le comportement des canaux GA4 et les limites de mesure observées sur des propriétés aux US, au UK et en Europe.
- Le trafic IA se cache dans le seau direct et un canal Organic indifférencié — les rapports par défaut le ratent. 2. Construisez un groupe de canaux personnalisé avec un regex de référents sur chatgpt.com, perplexity.ai, gemini.google.com et copilot.microsoft.com. 3. Les AI Overviews sont l'angle mort difficile — ces clics se lisent toujours comme google.com et ne peuvent pas être proprement isolés. 4. Balisez en UTM chaque lien que vous maîtrisez pour récupérer des sessions IA attribuables depuis direct. 5. Reportez un plancher, pas un total — divulguez à chaque fois les angles morts de l'application et des AI Overviews.
Pourquoi le trafic IA et LLM est-il invisible dans les rapports GA4 par défaut ?
GA4 par défaut a été construit pour un web de liens, et les surfaces IA brisent deux de ses hypothèses fondamentales. Le résultat est que des visites authentiquement pilotées par l'IA se dispersent dans les mauvais canaux.
Le seau direct — GA4 classe une session comme direct dès qu'il ne peut pas déterminer de source. Les assistants basés sur des applications — l'application ChatGPT, un panneau Copilot, un client mobile — envoient fréquemment aucun en-tête de référent, donc leurs clics atterrissent dans direct, indiscernables de quelqu'un qui tape votre URL.
Le flou organique — Un clic depuis un AI Overview de Google reste un clic depuis google.com, donc il se lit comme du Organic Search ordinaire. Il n'existe aucun hostname distinct pour le séparer, ce qui signifie qu'une tranche croissante de trafic influencé par l'IA se cache dans un canal que vous avez déjà.
Aucun canal IA par défaut — GA4 est livré avec Organic, Paid, Referral et Direct, mais rien pour les moteurs d'IA, donc même les clics IA porteurs de référent sont classés sous un Referral générique. Le correctif commence par nommer la surface vous-même. Pour la stratégie qui gagne ce trafic en premier lieu, voyez notre guide GEO complet.
Quels référents identifient ChatGPT, Perplexity, Gemini et Copilot ?
Vous ne pouvez pas segmenter ce que vous ne pouvez pas nommer. La première étape est une liste maintenue des hostnames que chaque moteur transmet lorsqu'il envoie un référent.
ChatGPT — principalement chatgpt.com, plus l'ancien chat.openai.com. Les sessions web portent généralement l'un de ceux-ci ; les sessions d'application n'en portent souvent aucun.
Perplexity — perplexity.ai. Perplexity est l'un des référents les plus fiables car il établit fréquemment des liens sortants avec l'attribution intacte.
Gemini et Copilot — gemini.google.com pour Gemini, et copilot.microsoft.com plus bing.com pour Microsoft Copilot. Ajoutez claude.ai, you.com et poe.com pour compléter les surfaces principales.
Gardez tous ceux-ci dans une seule expression régulière pour que la liste soit facile à maintenir, et révisez-la chaque trimestre — de nouveaux moteurs se lancent et les hostnames changent. Pour le travail en amont consistant à gagner réellement ces citations, notre guide pour être cité par les moteurs d'IA couvre le volet contenu.
Comment construire un groupe de canaux personnalisé et un segment regex ?
GA4 vous donne deux outils complémentaires : un groupe de canaux personnalisé pour le reporting continu et un segment d'exploration pour l'analyse. Construisez les deux.
Groupe de canaux personnalisé — Dans l'Admin, créez un groupe de canaux personnalisé basé sur le groupe par défaut, puis ajoutez un canal nommé AI / LLM. Définissez sa condition comme la source de session correspondant à un regex de vos hostnames IA, et placez-le au-dessus du canal Referral générique pour que le trafic IA ne soit pas mal attribué.
Le regex — Joignez vos hostnames avec l'opérateur OR, par exemple chatgpt\.com|chat\.openai\.com|perplexity\.ai|gemini\.google\.com|copilot\.microsoft\.com|claude\.ai|you\.com. Échappez les points pour que le motif soit précis.
Segment d'exploration — Dans Explore, créez un segment de session sur la même condition pour analyser les pages de destination, l'engagement et les conversions des visites IA. Cela montre le comportement, pas seulement le volume. Quand les chiffres paraissent étranges, notre guide des explorations GA4 approfondit la construction de segments.
Comment se comportent le trafic des AI Overviews et l'inflation du 'direct' ?
Ce sont les deux modes d'échec qu'aucun regex ne résout totalement, et prétendre le contraire produit un rapport qui paraît complet mais ne l'est pas.
AI Overviews — Un clic depuis un AI Overview est un clic depuis google.com, donc GA4 enregistre le même référent organique qu'il a toujours enregistré. Il n'existe aucun hostname ai-overview à faire correspondre, ce qui signifie que ce trafic se fond dans Organic Search et ne peut pas être isolé par le seul référent. Vous pouvez déduire des mouvements depuis les tendances des pages de destination et des requêtes de Search Console, mais vous ne pouvez pas tracer une frontière nette dans GA4.
Inflation du direct — À mesure que les assistants basés sur des applications suppriment les référents, la part des visites IA authentiques atterrissant dans direct augmente. Un canal direct en hausse sans cause évidente est souvent le signe d'une activité IA que vous ne pouvez pas voir, surtout s'il corrèle avec du contenu que les moteurs sont connus pour citer.
La lecture honnête — Traitez les deux comme des sous-comptes structurels. Le segment capturé est un plancher ; l'influence réelle est plus large. Si une variation de trafic ressemble à un artefact de suivi plutôt qu'à un problème de performance, la même discipline de séparation de notre guide de correction du suivi des conversions s'applique ici.
Comment utiliser les UTM là où vous maîtrisez le lien ?
Vous ne pouvez pas baliser un lien qu'un moteur d'IA écrit de lui-même, mais vous pouvez baliser chaque lien que vous placez dans le contenu que ces moteurs lisent. C'est la tranche que vous pouvez récupérer depuis direct.
Balisez ce que vous possédez — Appliquez des UTM aux URL dans votre documentation, votre base de connaissances, votre llms.txt, vos profils sociaux et vos publications syndiquées. Quand un moteur fait apparaître l'un de ces liens, le clic arrive attribué au lieu d'anonyme.
Gardez le schéma cohérent — Utilisez une convention utm_source et utm_medium stable pour que les placements IA s'agrègent proprement. Un balisage incohérent fragmente les données pire que pas de balisage du tout.
Reliez-le à l'exposition — Plus votre contenu est lisible par les machines, plus il existe de liens maîtrisés à baliser. Publier un index llms.txt, couvert dans notre guide d'implémentation llms.txt, expose à la fois le contenu et crée des surfaces balisables. Construisez des liens rapidement avec le générateur d'UTM.
Quels sont les angles morts de mesure à divulguer ?
Un rapport de trafic IA digne de confiance nomme ses propres limites. Cacher les écarts fait paraître le nombre faisant autorité et silencieusement faux.
Clics d'application — Les sessions issues des applications d'assistant ne portent souvent aucun référent et tombent dans direct. Vous sous-compterez chaque moteur disposant d'une application populaire, et vous ne pouvez pas totalement récupérer ces visites.
AI Overviews — Comme couvert ci-dessus, ils se lisent comme du google.com organique et ne peuvent pas être proprement séparés. Reportez le mouvement organique et les signaux de Search Console plutôt qu'un nombre d'AI Overviews à fausse précision.
Échantillonnage et suppression — Certains référents sont supprimés par les paramètres de confidentialité ou échantillonnés hors des rapports à fort volume. Recoupez avec les journaux serveur, qui voient des référents bruts que GA4 peut ne pas faire apparaître.
Le cadre de reporting — Présentez un minimum capturé plus une liste d'angles morts étiquetée, jamais un total unique habillé en complet. C'est la même honnêteté intellectuelle que notre guide sur l'impact des AI Overviews applique aux affirmations de performance.
Comment le suivi du trafic IA s'intègre à une stratégie GEO plus large
La mesure est la boucle de rétroaction de l'optimisation pour les moteurs génératifs (GEO). Vous ne pouvez pas améliorer ce que vous refusez d'estimer, et vous ne pouvez pas faire confiance à une estimation qui cache ses écarts.
Mesurer pour piloter — Un canal IA maintenu vous dit quel contenu gagne des citations et des clics, pour que vous puissiez faire davantage de ce qui fonctionne. Sans cela, le GEO est de la devinette.
Associer gagner et mesurer — Gagner des citations et mesurer le retour sont les deux moitiés de la même boucle. Le volet contenu vit dans notre guide pour se classer dans les AI Overviews ; le volet mesure est cet article.
Boucler la boucle — Auditez la qualité du contenu et sa préparation à l'IA, déployez le canal et le segment, balisez vos liens maîtrisés, et reportez un plancher avec des angles morts honnêtes. Pour réunir contenu, structure et mesure, lancez l'audit gratuit en 5 axes de SteerAds et balisez chaque lien maîtrisé avec le générateur d'UTM.
Sources
Sources officielles et primaires consultées pour ce guide :
-
support.google.com — Groupes de canaux par défaut de GA4
-
platform.openai.com — Bots et crawlers d'OpenAI
-
llmstxt.org — la proposition llms.txt
-
blog.google — Google Search et les AI Overviews
FAQ
Comment suivre le trafic ChatGPT dans GA4 ?
Construisez un segment basé sur le référent ou un groupe de canaux personnalisé qui correspond aux hostnames utilisés par ChatGPT, principalement chatgpt.com et l'ancien chat.openai.com. Dans GA4, créez un groupe de canaux personnalisé, ajoutez un canal nommé par exemple AI / LLM, et définissez sa condition comme la source de session correspondant à un regex de ces hostnames. Vous pouvez aussi construire une exploration avec un segment sur la même condition pour analyser le comportement. Le piège, c'est que tous les clics ChatGPT ne portent pas un référent — les clics depuis les applications de bureau et mobiles arrivent souvent sans référent, donc ils tombent dans direct et n'atteignent jamais votre segment. Considérez le nombre que vous capturez comme un plancher, pas un décompte complet.
GA4 montre-t-il le trafic des AI Overviews ?
La plupart du temps non, et c'est l'angle mort le plus difficile. Un clic depuis un AI Overview de Google reste un clic depuis google.com, donc GA4 voit le même référent de recherche organique qu'il a toujours vu — il n'existe aucun hostname ai-overview distinct sur lequel segmenter. Cela signifie que le trafic des AI Overviews se fond dans votre canal Organic Search existant et ne peut pas être proprement isolé par le seul référent. Vous pouvez déduire des mouvements en surveillant les variations au niveau des pages de destination et des requêtes dans Search Console en parallèle des sessions organiques, mais vous ne pouvez pas tracer une ligne nette autour des clics des AI Overviews dans GA4 aujourd'hui. Soyez explicite sur cette limite quand vous reportez.
Pourquoi le trafic IA est-il compté comme direct dans GA4 ?
Parce que le référent est manquant. GA4 classe une session comme direct dès qu'aucune source ne peut être déterminée, et les surfaces IA suppriment ou omettent le référent plus souvent que les sites web classiques. Les assistants basés sur des applications — l'application ChatGPT, un panneau Copilot, un client mobile — n'envoient fréquemment aucun en-tête de référent du tout, et certains moteurs n'en transmettent délibérément pas. Le résultat est qu'une part significative des visites authentiquement pilotées par l'IA atterrit dans direct et devient indiscernable de quelqu'un qui tape votre URL. Baliser avec des UTM les liens que vous maîtrisez est le seul moyen fiable de ressortir une partie de ce trafic du seau direct.
Puis-je construire un canal IA dans GA4 ?
Oui. GA4 vous permet de créer un groupe de canaux personnalisé, où vous ajoutez un nouveau canal — appelez-le AI / LLM — et vous définissez sa règle de correspondance avec une expression régulière sur la source de session ou le référent. Listez les hostnames qui vous intéressent, comme chatgpt.com, perplexity.ai, gemini.google.com et copilot.microsoft.com, joints avec l'opérateur OR du regex. Les groupes de canaux personnalisés s'appliquent à l'avenir et à une partie des données historiques selon votre configuration, et ils empêchent le trafic IA d'être mal attribué à Organic ou Referral. C'est l'étape unique la plus propre que vous puissiez faire, à condition d'accepter qu'elle ne capture que les sessions qui portent réellement un de ces référents.
Quelle est la précision du suivi du trafic IA dans GA4 ?
Partielle, et vous devriez le dire à voix haute. Ce que vous capturez est un plancher fiable — des sessions qui portaient véritablement un référent IA — mais le vrai nombre est plus élevé parce que les clics d'application, les référents supprimés et les AI Overviews fuient dans direct et organic. Attendez-vous à sous-compter, parfois substantiellement, et ne présentez jamais le segment comme une image complète. Le bon cadrage dans un rapport est un minimum capturé plus un ensemble clairement étiqueté d'angles morts. Associez le segment GA4 à une analyse des journaux serveur et aux tendances de Search Console pour trianguler, et mettez à jour votre regex de référents à mesure que de nouveaux moteurs apparaissent, car la liste change chaque trimestre.
Quels référents devrais-je inclure pour les moteurs d'IA ?
Commencez par les surfaces principales et étendez à mesure que vous voyez du trafic. La liste de base en 2026 est chatgpt.com et chat.openai.com pour ChatGPT, perplexity.ai pour Perplexity, gemini.google.com pour Gemini, copilot.microsoft.com et bing.com pour Microsoft Copilot, et claude.ai pour Claude. Ajoutez you.com, poe.com et tout assistant vertical pertinent pour votre marché. Gardez la liste dans un seul regex pour qu'elle soit facile à maintenir, et révisez-la chaque trimestre car de nouveaux moteurs se lancent et les hostnames changent. Souvenez-vous que cela ne capture que les sessions portant un référent ; les angles morts de l'application et des AI Overviews demeurent quelle que soit l'exhaustivité de votre liste de hostnames.
Devrais-je utiliser des UTM pour le trafic IA ?
Oui, partout où vous maîtrisez le lien. Vous ne pouvez pas ajouter d'UTM à un lien qu'un moteur d'IA génère de lui-même, mais vous pouvez baliser chaque URL que vous placez dans le contenu que les moteurs lisent — votre documentation, votre base de connaissances, votre llms.txt, vos profils et vos publications syndiquées. Un schéma UTM cohérent transforme ces placements maîtrisés de visites direct anonymes en sessions attribuables. Cela ne capturera jamais les citations IA organiques, mais cela récupère la tranche que vous pouvez influencer, et c'est la seule habitude au plus fort effet de levier pour mesurer le trafic de référence IA dans le temps.