Google vient de débunker GEO et llms.txt. Voici pourquoi je continue à les utiliser.

Le post Google que personne n’avait vu venir

Le 15 mai 2026, John Mueller publie un billet sur le Google Search Central blog au titre faussement anodin : “A new resource for optimizing for AI features in Search.” Derrière le titre, une bombe pour toute l’industrie qui passe ses semaines à parler d’AEO, de GEO, de llms.txt, de brand mention signals.

Google sort un guide officiel. Et dans ce guide, sa position est nette, presque dédaigneuse : optimiser pour l’IA générative dans Google Search, c’est juste du SEO. Pas un nouveau métier. Pas un nouveau fichier. Pas une nouvelle discipline.

Pendant qu’une partie de l’écosystème SEO vendait des audits GEO à 5 000 euros, Google publie une page de docs qui dit littéralement : “vous n’avez pas besoin de créer de nouveaux fichiers machine-readable, de fichiers AI texte, de markup, ni de Markdown pour apparaître dans la recherche IA générative.”

Je suis assis devant ce guide depuis hier soir. J’ai un llms.txt sur claudehub.fr. J’ai du structured data. J’ai passé des sessions entières à optimiser pour les citations Perplexity et ChatGPT. Et la première chose que je me dis en lisant le post de Mueller, c’est : il a raison sur 80 % des points, et il rate complètement le reste.

Cet article, c’est ma tentative honnête de séparer ce que Google a démonté à juste titre, de ce qu’il oublie de mentionner parce que ce n’est pas son problème.

Ce que Google a effectivement publié

Reprenons d’abord froidement. Le guide officiel, Optimize Your Website for Generative AI Features in Google Search, est structuré en cinq sections :

Le SEO est-il encore pertinent pour la recherche IA générative ?
Appliquer les best practices SEO fondamentales à la recherche IA générative
Mythbusting : ce que vous n’avez pas besoin de faire
Explorer les expériences agentiques
Prochaines étapes : sur quoi se concentrer

Le cœur de la position de Google tient en une phrase de Mueller : “From Google Search’s perspective, optimizing for generative AI search is optimizing for the search experience, and thus still SEO.”

Traduit en termes opérationnels, ça donne la liste de ce qu’il ne sert à rien de faire pour ranker dans AI Overviews ou être cité dans les réponses génératives Google :

Pas besoin de fichier llms.txt, llm.txt, ou autre fichier markdown spécialisé
Pas besoin de markup spécifique “AI-ready”
Pas besoin de chunker votre contenu en passages pré-découpés pour les LLMs
Pas besoin de réécrire vos articles avec un ton ou un format pensé pour les modèles
Pas besoin de poursuivre des “brand mentions” inauthentiques sur le web
Pas besoin de structured data spécifiquement pour la visibilité AI search

Et la liste de ce qui compte vraiment, selon Google :

Contenu unique, fondé sur de l’expertise first-hand, non générique
Pages indexées et éligibles aux snippets standards
Crawlabilité publique
HTML sémantique propre
JS bien servi
Mobile et latence
Duplicate content limité
Pour le commerce et le local : Merchant Center et Google Business Profile bien renseignés

Si vous lisez la liste sans contexte, vous lisez la même chose qu’en 2018, 2022 ou 2024. C’est exactement l’idée que Google veut faire passer.

Pourquoi Google a raison

Ma position de départ, c’est que Mueller n’a pas tort. Et je pense que pas mal de gens dans le SEO/GEO français vont avoir du mal à digérer cette phrase, donc autant être direct sur ce que je trouve juste dans son argumentation.

Premièrement : AI Overviews mange du SERP standard

Quand Google génère une réponse IA dans les résultats de recherche, le système ne va pas chercher dans un index parallèle réservé aux sites “AI-optimized”. Il va piocher dans son index principal. Les pages citées dans AI Overviews sont des pages qui rankent déjà dans la SERP classique, ou qui pourraient ranker.

Donc si votre SEO de base est mauvais, votre AI Overview visibility sera mauvaise. Si votre SEO est bon, votre visibilité IA suit naturellement, du moins sur les requêtes commerciales et informationnelles classiques. Cette continuité est cohérente avec ce que tout le monde a observé depuis le lancement de SGE puis d’AI Overviews.

Deuxièmement : llms.txt n’a aucun statut officiel

Soyons clairs sur ce point parce que c’est là où le marketing GEO a dérapé. llms.txt est une proposition communautaire. Personne ne l’a adopté officiellement. Ni Google, ni OpenAI, ni Anthropic, ni Perplexity. Aucun de ces acteurs n’a publié de documentation engageant son moteur à utiliser le fichier comme signal de ranking ou d’inclusion.

Pendant un an, l’écosystème SEO a vendu llms.txt comme s’il était une norme. Il ne l’est pas. C’est un fichier que vous publiez, que personne n’est obligé de lire, et qui ne change rien à votre visibilité dans aucun produit d’AI search aujourd’hui. Google le dit explicitement. Et il a raison de le dire, parce que la confusion a coûté du temps et de l’argent à beaucoup d’équipes.

Troisièmement : le “chunking pour LLM” est un mythe paresseux

L’idée qu’il faut découper vos articles en passages de 200 mots avec des headings tous les paragraphes, parce que “les LLMs lisent par chunks”, n’a aucun fondement technique sérieux pour le SEO public. Les modèles qui font de la retrieval-augmented generation sur le web utilisent leurs propres pipelines de chunking. Vous ne contrôlez pas comment Perplexity ou ChatGPT découpe votre contenu. Vous contrôlez la qualité de ce contenu, sa structure logique, sa lisibilité humaine. C’est tout.

Écrire de bons paragraphes, des phrases claires, des titres descriptifs : ça marchait avant les LLMs, ça marche avec les LLMs, ça marchera après. Le “AEO chunking” est une obsession qui prend la place d’un travail éditorial honnête.

Quatrièmement : les “brand mentions” obsessionnelles sont contre-productives

Une partie de l’industrie GEO a vendu l’idée qu’il fallait multiplier les mentions de marque sur Reddit, Quora, Hacker News, des blogs payés, pour entraîner les LLMs à associer votre marque à un sujet. Google le dit poliment : “évitez de poursuivre des mentions inauthentiques.”

Traduit : si vous spammez des forums avec des avis générés pour entraîner les modèles, vous risquez plus que de perdre votre temps. Vous risquez d’être détecté, dépriorisé, voire pénalisé sur des canaux où la réputation se construit dans le temps. C’est un mauvais ROI doublé d’un mauvais signal éthique.

Donc oui, sur ces quatre points, Google clarifie utilement le débat. Mueller assainit un terrain qui en avait besoin.

Mais Google répond à la mauvaise question

Voici où je décroche du discours officiel. Le guide de Google répond à une question précise : comment apparaître dans les réponses IA générées par Google Search ? C’est une question légitime, c’est même la question principale pour 99 % des sites e-commerce, des médias, des local businesses.

Ce n’est pas ma question.

Ma question, sur claudehub.fr, est différente. Et je pense que ma question est aussi celle d’un nombre croissant de créateurs de contenu, de builders, et d’experts qui publient sur le web en 2026.

Ma question, c’est : comment fais-je pour que mon contenu soit utilisable par des IA, par des agents, par des assistants, sans qu’ils aient à scraper mon site à chaque interaction ?

Ce n’est pas la même question. Google y répond pas. Google n’a aucune raison d’y répondre, parce que Google vend des espaces publicitaires sur des SERP, pas des protocoles d’interaction entre agents et sites web.

Le vrai usage du GEO en 2026

Quand un utilisateur ouvre Claude, ChatGPT ou Perplexity et tape “explique-moi le concept d’agentic engineering selon Simon Willison”, trois scénarios se produisent :

Scénario 1 : le LLM répond avec ses connaissances internes. Si Claude Hub a déjà été ingéré dans le training set, mon contenu peut influencer la réponse. C’est lent (cycle d’entraînement), opaque (je n’ai aucun contrôle), et ne change pas selon ce que je publie aujourd’hui.

Scénario 2 : le LLM fait un web search live et scrape les premières pages SERP. Là, c’est du SEO classique. Mueller a raison. Si mon article est bien positionné sur Google ou Bing, il sera lu et potentiellement cité. Pas de magie GEO.

Scénario 3 : un agent autonome interagit avec mon site comme une ressource. C’est là que tout change. Un agent qui veut construire une réponse complète sur Claude Code, qui veut comparer plusieurs sources, qui veut suivre des liens internes, qui veut comprendre la structure de mon site, n’opère pas comme un utilisateur Google Search. Il opère comme un consommateur de l’information.

Et c’est dans ce troisième scénario que les fichiers comme llms.txt commencent à avoir un sens. Pas pour ranker. Pour réduire le coût d’usage de votre site par les agents.

llms.txt : pas un ranking factor, un protocole d’accessibilité

Reformulons llms.txt correctement, parce que tout l’argumentaire commercial GEO l’a mal vendu. llms.txt n’est pas un signal de visibilité SEO. C’est un fichier de navigation pour agents.

Quand un agent IA arrive sur claudehub.fr, sans contexte, il doit comprendre :

Qu’est-ce que ce site ?
Quelle est son organisation ?
Quelles sont les pages canoniques sur chaque sujet ?
Comment naviguer efficacement sans tout scraper ?

Si je n’ai rien, l’agent doit faire un crawl complet, comparer des dizaines de pages, deviner quelle URL est l’autoritaire sur tel sujet, gérer les duplicates, suivre la pagination. C’est coûteux en tokens, en temps, en bande passante. Et l’agent peut se tromper, prendre la mauvaise page, citer une URL secondaire au lieu de l’article principal.

Avec un llms.txt bien construit, je résous une partie de ces problèmes :

Liste des sections principales du site
Pointeurs vers les articles canoniques
Description courte de chaque ressource
Hiérarchie claire

Ça n’aide pas le ranking. Ça aide l’accessibilité agentique. C’est très différent.

Le cas Anthropic, GitHub, Stripe

Si vous regardez les sites qui ont implémenté llms.txt ces six derniers mois, vous voyez un pattern. Ce sont massivement des sociétés tech qui ont un intérêt à ce que leur documentation soit utilisable par des assistants IA.

Anthropic publie llms.txt sur docs.anthropic.com. GitHub a un équivalent. Stripe et Cloudflare aussi. Ces équipes ne s’attendent pas à mieux ranker sur Google grâce à ce fichier. Elles construisent une infrastructure pour un monde où les développeurs utilisent Claude et ChatGPT pour chercher dans leurs docs, et où la qualité de la réponse dépend de la capacité de l’agent à trouver le bon endpoint dans la doc.

C’est un usage product-driven, pas SEO-driven. Et il a un sens commercial très net : si Claude répond mieux aux questions sur l’API Anthropic, ça facilite la vie des développeurs qui utilisent l’API. C’est de la conversion par expérience d’usage, pas du trafic SEO.

Le cas concret Claude Hub

Je peux raconter le mien parce qu’il est un peu plus modeste mais représentatif.

Claude Hub publie des articles longs sur Claude Code, l’écosystème Anthropic, les patterns d’usage des LLMs en dev. Mon audience cible inclut massivement des gens qui posent leurs questions directement à Claude, à ChatGPT, à Perplexity. Avant de venir sur mon site. Parfois sans jamais venir sur mon site.

Mon objectif n’est pas seulement de ranker dans Google AI Overviews. C’est que quand quelqu’un demande à Claude “quels sont les bons blogs francophones sur Claude Code”, mon nom sorte. C’est que quand un dev demande à ChatGPT “comment fonctionne le système de mémoire de Claude Code”, mon article sur la mémoire soit cité, idéalement avec un lien.

Pour ça, le travail se découpe en deux briques :

Brique SEO classique. Articles longs, expertise réelle, structured data Article, internal linking propre, mobile rapide, Search Console clean. Google a raison : c’est la base. Si je rate ça, rien ne se passe.

Brique GEO/agentique. llms.txt qui pointe vers mes articles canoniques par thème. URLs stables. Headings explicites qui décrivent le contenu et pas seulement l’accroche éditoriale. Format MDX exportable. Sitemap rigoureuse. Reformulation explicite des questions que mes lecteurs posent.

Cette deuxième brique ne va pas faire monter mon trafic SEO. Elle augmente la probabilité qu’un agent qui passe sur mon site comprenne ma structure, trouve l’article pertinent, et cite la bonne URL plutôt qu’une page de tag ou un duplicate.

Sur le dernier mois, mes stats GA4 confirment quelque chose d’intéressant : les sessions issues de chatgpt.com et claude.ai sont apparues pour la première fois (5 et 2 sessions respectivement). C’est ridicule en volume. C’est massif en signal. Six mois plus tôt, ces sources n’existaient pas dans mon analytics. La page d’origine de ces sessions, dans 100 % des cas observés, est un article que j’ai bien structuré, avec un H1 descriptif et une intro qui répond directement à une question.

Ça ne prouve pas que llms.txt sert à quelque chose. Ça prouve que la structure du contenu compte pour les agents. Et llms.txt est juste une couche supplémentaire de cette structure.

Verdict : SEO first, GEO si vous voulez que les IA bossent avec vous

Je termine par où Google aurait dû commencer, à mon avis. Mueller n’a pas tort de dire que pour AI Overviews, le SEO suffit. Là où son guide est court, c’est qu’il n’évoque les expériences agentiques que dans une section “à explorer”, comme une curiosité future.

Or les expériences agentiques sont déjà là. Elles sont dans Claude, ChatGPT Pro, Perplexity, dans les agents custom que les boîtes déploient en interne pour résumer leur veille, dans les MCP servers qui exposent du contenu à des LLMs.

Si vous êtes une chaîne de magasins de matelas, le guide Google vous suffit. Faites du SEO local, mettez vos produits dans Merchant Center, ignorez le GEO.

Si vous êtes un blog, une plateforme documentaire, un SaaS technique, une newsletter, un média B2B, ou si vous publiez de l’expertise que vos lecteurs vont consommer via une IA avant de venir chez vous, alors :

SEO d’abord, sans concession. Si le SEO est pourri, rien ne marche.
GEO en seconde couche. Pas pour ranker. Pour réduire la friction d’usage de votre contenu par les agents.
llms.txt si vous avez le temps. Honnêtement, c’est une demi-journée de travail. Le ROI est faible mais positif, et c’est trivial à maintenir.
Structured data Article et FAQ. Pas parce que Google les exige pour l’IA, mais parce qu’ils servent au SEO classique ET à l’accessibilité agent.
URLs stables et headings descriptifs. Le truc le plus important et le moins sexy.
Pas de chunking artificiel. Écrivez bien. Point.
Pas de brand mention farming. Construisez une vraie réputation.

La position de Google est utile pour cadrer les attentes. Elle évite à des entreprises de gaspiller 20 % de leur budget marketing sur des “audits GEO” qui n’ont aucune base technique. Mais elle n’épuise pas la question. Elle répond à comment apparaître dans AI Overviews. Elle ne répond pas à comment être un site utile aux agents.

Et ces deux questions vont continuer à diverger. AI Overviews est un produit Google. L’écosystème agentique est en train de se construire en parallèle, avec ses propres dynamiques. Anthropic, OpenAI, Mistral, les acteurs MCP, les builders d’agents internes, n’ont pas la même grille de lecture que Google Search.

Le bon réflexe en 2026, ce n’est pas de choisir entre SEO et GEO. C’est de faire les deux dans le bon ordre, avec les bonnes attentes, et sans payer un consultant 5 000 euros pour un audit GEO qui se résume à “ajoutez un llms.txt”.

Vous pouvez le faire vous-même en une demi-journée. Et si vous le faites, faites-le pour la raison qui compte vraiment : pas pour Google, mais pour les agents qui consommeront votre contenu de plus en plus souvent sans jamais passer par Google.

Pour aller plus loin

Sources : Google Search Central - A new resource for optimizing for AI features · Guide officiel - Optimize Your Website for Generative AI Features in Google Search · Spécification llms.txt - llmstxt.org