Voyez quels bots IA crawlent et citent votre site.
wheremyflow détecte automatiquement ChatGPT, Claude, Perplexity, Gemini, Mistral, Grok et 12 autres crawlers IA. Pas de cookie posé, pas de configuration. Vous savez exactement quel contenu est repris par les LLMs et à quelle fréquence.
Toute la galaxie IA, déjà reconnue.
Chaque bot IA est identifié à partir de son User-Agent côté serveur, puis tagué
channel='ai' avec le nom du produit. Aucun pixel posé, aucun consentement
nécessaire — un robot n'est pas un visiteur au sens de l'article 82 LIL.
OpenAI
3 user-agents-
GPTBot— entraînement du modèle -
ChatGPT-User— navigation à la demande -
OAI-SearchBot— moteur SearchGPT
Anthropic
3 user-agents-
ClaudeBot— crawler d'indexation Claude -
anthropic-ai— agent ancien Anthropic -
Claude-Web— navigation à la demande
-
Google-Extended— entraînement Gemini / Vertex AI
Perplexity
2 user-agents-
PerplexityBot— crawler d'indexation -
Perplexity-User— navigation à la demande
Mistral 🇫🇷
1 famille-
MistralAI/Mistralbot— crawler Mistral (Le Chat)
Meta
2 user-agents-
FacebookBot— entraînement Llama / Meta AI -
Meta-ExternalAgent— agent externe Meta AI
ByteDance
1 user-agent-
Bytespider— crawler IA ByteDance (Doubao)
xAI
2 user-agents-
Grokbot— crawler d'indexation -
Grok-User— navigation à la demande
Autres LLMs & archives
9 user-agents-
Applebot-Extended— Apple Intelligence -
cohere-ai— entraînement Cohere -
CCBot— archive Common Crawl (sert de base à de nombreux LLMs) -
YouBot— moteur You.com -
DuckAssistBot— DuckDuckGo Assist -
Amazonbot— entraînement Amazon (Alexa+) -
PetalBot— moteur IA Huawei -
DeepSeekBot— crawler DeepSeek (Chine) -
Diffbot— extraction structurée (utilisée par plusieurs LLMs)
Le trafic IA n'est plus négligeable.
En 2025-2026, ChatGPT, Perplexity, Gemini et leurs équivalents sont devenus des moteurs de recherche secondaires. Les utilisateurs leur posent une question et reçoivent une réponse construite à partir de pages web — dont certaines sont citées avec un lien sortant, d'autres juste résumées sans citation.
Sans surveiller le trafic IA, vous ne savez pas si votre contenu est repris ou ignoré. Vous voyez le trafic Google reculer, sans comprendre que les requêtes informationnelles partent en partie sur les LLMs — qui crawlent vos pages mais ne renvoient pas toujours les visiteurs.
Wheremyflow vous donne une visibilité claire : combien de fois chaque bot IA crawle votre site, quelles pages il consulte le plus, à quelle fréquence il revient. Vous gardez la main sur votre stratégie éditoriale — ce que les outils analytics classiques (Plausible, Fathom, Simple Analytics, GA4) ne mesurent pas finement.
Note honnête : nous mesurons la visibilité IA (qui crawle, à quelle fréquence). Nous ne promettons pas un placement dans les réponses de ChatGPT ou Perplexity — ça dépend de l'algorithme du LLM et personne ne le contrôle.
Personne d'autre ne classifie les bots IA aussi finement.
Les outils analytics privacy-first filtrent généralement les bots en bloc, ou les ignorent. Aucun ne les expose comme un canal d'acquisition distinct, par famille.
| Critère | wheremyflow | Plausible | Fathom | Simple Analytics | GA4 |
|---|---|---|---|---|---|
| Détection bots IA dédiée | Oui — 18 bots | Non | Non | Non | Non (filtré) |
| Classification par famille (OpenAI / Anthropic…) | Oui | Non | Non | Non | Non |
| Distinction trafic humain vs IA | Oui — channel='ai' séparé | Non | Non | Non | Partielle |
| Sans cookie, sans consentement | Oui | Oui | Oui | Oui | Non |
| Hébergement et édition en UE | France 🇫🇷 (Clever Cloud) | Estonie | Canada / US | Pays-Bas | États-Unis |
Données vérifiables : la classification IA wheremyflow est définie dans le fichier
source lib/ingest.js. Les concurrents listés ne documentent pas de canal
d'acquisition IA dédié dans leur dashboard public (au 13 mai 2026).
Détection côté serveur, zéro friction.
-
Inspection du User-Agent côté serveur.
Le tracker envoie un événement HTTP à l'endpoint
/api/event. Le serveur lit l'en-têteUser-Agent, le matche contre une whitelist de 18 bots IA connus et tague l'event avecchannel='ai'et le nom du produit. - Aucun cookie posé sur le bot. Wheremyflow est cookieless par construction, pour les humains comme pour les robots. Un crawler IA n'est pas une « personne physique » au sens RGPD, et n'est pas un « utilisateur » au sens de l'article 82 LIL — aucun consentement n'est requis.
- Agrégation et restitution dans l'onglet Provenance. Les hits IA sont comptés par produit (ChatGPT, Claude, Perplexity…) et par page consultée. Vous voyez à la fois le volume brut et la part relative dans votre trafic global.
- Conforme RGPD par construction. Pas de donnée personnelle traitée (un User-Agent de robot n'en est pas une), pas de cookie, hébergement et traitement intégralement en France (Clever Cloud, ISO/IEC 27001:2022). Rien à signer côté DPO.
Commencez à mesurer votre trafic IA dès aujourd'hui.
30 jours d'essai gratuit, sans CB. Ou lancez un audit RGPD gratuit de votre site (résultat instantané, sans inscription).