GEO & recherche IA· 10 min de lecture

Qu'est-ce qu'un score AI-Readiness ? Rendre votre site lisible par l'IA

L'AI-Readiness mesure si les systèmes IA peuvent accéder à votre site et le lire. Base technique de votre GEO : crawlers, structured data et renderabilité.

Un site web scanné par un rayon de lumière verte, affichant un score de readiness de 98%

Résumé

  • L'AI-Readiness mesure dans quelle mesure les systèmes IA peuvent accéder à votre site, le crawler, le lire et le comprendre. C'est la base technique de votre GEO.
  • Le plus grand angle mort est l'accès : bloquer accidentellement le mauvais bot dans robots.txt vous fait disparaître de la recherche ChatGPT.
  • Les crawlers IA n'exécutent généralement pas le JavaScript, donc le contenu qui n'apparaît que dans le navigateur leur est invisible.
  • La structured data et llms.txt aident, mais ne sont pas des solutions miracles : les recherches montrent peu d'effet direct sur les citations IA.

Vous pouvez rédiger le meilleur contenu de votre secteur, mais si un système IA ne peut pas accéder à votre site, le lire ou le comprendre, vous n'apparaissez nulle part. Beaucoup de marques travaillent leur message et oublient la couche technique en dessous : mon site est-il seulement lisible par l'IA ? C'est ce que mesure un score AI-Readiness. Dans cet article, vous découvrirez ce qu'est l'AI-Readiness, quels facteurs techniques comptent vraiment, et où la plupart des sites restent invisibles pour l'IA.

Qu'est-ce qu'un score AI-Readiness ?

Un score AI-Readiness mesure dans quelle mesure les systèmes IA tels que ChatGPT, Claude, Gemini et Perplexity peuvent accéder à votre site, le crawler, le lire et le comprendre. Ce n'est pas une mesure du fait d'être cité - c'est votre GEO Score - mais de la condition technique préalable. Si l'IA ne peut pas traiter votre site, elle ne peut pas vous citer non plus.

La distinction est importante. Votre GEO Score indique si vous figurez dans les réponses, et comment l'améliorer se lit séparément. Votre score AI-Readiness indique si c'est techniquement possible que vous y figuries. Un AI-Readiness bas est souvent la cause cachée d'un GEO Score faible : votre contenu est excellent, mais l'IA n'y accède pas ou le lit incorrectement. Veesie mesure l'AI-Readiness de votre site sur plusieurs facteurs et les résume en un score de 0 à 100.

L'IA peut-elle accéder à votre site ? Les crawlers IA

La première question est l'accès : votre site laisse-t-il entrer les bons bots IA ? Chaque grand fournisseur IA utilise des crawlers distincts avec des rôles différents, et c'est souvent là que les problèmes surviennent.

Selon la documentation officielle d'OpenAI, quatre bots OpenAI sont actifs, chacun avec une mission propre : GPTBot crawle le contenu pour entraîner les modèles, OAI-SearchBot fait apparaître votre site dans la fonction de recherche de ChatGPT, ChatGPT-User récupère les pages quand un utilisateur le demande activement, et OAI-AdsBot vérifie les pages publicitaires. Anthropic fonctionne de manière similaire avec ClaudeBot (entraînement), Claude-User (questions en temps réel) et Claude-SearchBot (recherche). Perplexity dispose de PerplexityBot pour les résultats de recherche et Perplexity-User pour les réponses.

C'est là que se situe le plus grand angle mort. OpenAI le confirme lui-même : les sites qui bloquent OAI-SearchBot n'apparaissent pas dans les réponses de recherche de ChatGPT. De nombreux sites bloquent les bots IA d'un seul coup pour "lutter contre le scraping", et ferment ainsi accidentellement le crawler de recherche qui les rendrait visibles. La distinction est cruciale :

  • Si vous souhaitez être visible dans les réponses IA, autorisez les crawlers de recherche : OAI-SearchBot, PerplexityBot et les crawlers de recherche des autres fournisseurs.
  • Si vous ne voulez pas que votre contenu entraîne des modèles, bloquez ciblément le crawler d'entraînement (GPTBot via robots.txt), sans sacrifier votre visibilité dans les recherches.

Un robots.txt pour ceux qui souhaitent apparaître dans les réponses IA sans contribuer à l'entraînement ressemble par exemple à ceci :

User-agent: GPTBot
Disallow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

Vous restez ainsi visible dans les fonctions de recherche de ChatGPT et Perplexity, tout en ne cédant pas votre contenu à l'entraînement de modèles. L'inverse, tout bloquer avec une règle générale, est précisément la façon dont les sites se rendent invisibles dans les réponses IA.

Pour Google, c'est un peu différent : Google-Extended n'est pas un crawler distinct mais un token robots.txt qui vous permet de décider si Google utilise votre contenu pour l'entraînement de Gemini. Google confirme explicitement que ce token n'affecte pas votre position dans les résultats de recherche Google ordinaires.

L'IA voit-elle votre contenu, ou seulement une page vide ?

Même si un crawler IA entre sur votre site, la question est de savoir s'il voit vraiment votre contenu. De nombreux crawlers IA n'exécutent pas JavaScript. Selon une analyse de Vercel, les crawlers de ChatGPT et Claude récupèrent bien les fichiers JavaScript, mais ne les exécutent pas. Résultat : le contenu qui n'est construit dans le navigateur qu'avec JavaScript n'existe pas pour ces bots.

C'est un problème silencieux pour les sites modernes. Les boutiques en ligne et les applications qui chargent leurs informations produits, leurs prix ou leurs textes côté client affichent souvent une page presque vide à un crawler IA. La solution est que votre contenu le plus important figure dans le HTML rendu côté serveur, pas seulement après une étape JavaScript. Pour l'AI-Readiness, un test simple suffit : désactivez JavaScript dans votre navigateur et vérifiez si votre contenu essentiel est toujours là. Ce que vous ne voyez plus alors, un modèle IA ne le voit généralement pas non plus.

Une deuxième vérification consiste à "afficher la source de la page" dans votre navigateur. Si votre texte réel, vos titres et vos informations clés figurent bien dans ce HTML, un crawler IA peut les lire. Si vous voyez surtout des conteneurs vides et des scripts, c'est un signal d'alerte pour votre AI-Readiness, quelle que soit la qualité de votre contenu.

La structured data aide-t-elle pour l'IA ?

La structured data aide à rendre votre page lisible par les machines, mais ce n'est pas une solution miracle pour les citations IA. Cette nuance est importante, car beaucoup de fausses promesses circulent à ce sujet.

Ahrefs a étudié 1 885 pages ayant ajouté du schema JSON-LD entre août 2025 et mars 2026, comparées à 4 000 pages de contrôle. Le résultat : le schema n'a produit aucune augmentation significative des citations IA sur aucune plateforme. Les citations dans Google AI Overviews ont même légèrement diminué, tandis que les changements dans Google AI Mode et ChatGPT n'étaient statistiquement pas distinguables de zéro. En d'autres termes : ajouter du schema ne propulse pas une page plus haut dans les réponses IA.

Pourtant, la structured data n'est pas inutile. Comme le note Searchviu, le résultat négatif concerne surtout la récupération directe par les chatbots. Pour les moteurs de recherche, Google AI Overviews et la reconnaissance d'entités, le schema reste précieux : il aide les machines à comprendre qui vous êtes et de quoi parle votre page. Le conseil est donc nuancé : utilisez la structured data pour votre visibilité globale et une machine-leesbaarheid claire, pas comme levier pour les citations IA en soi. Les idées reçues les plus fréquentes sur le schema et l'IA sont développées dans 8 mythes GEO que les marketeurs croient encore.

Qu'en est-il de llms.txt ?

llms.txt est un fichier proposé pour indiquer à l'IA votre contenu le plus important, mais n'en attendez pas grand-chose pour l'instant. L'idée vient de Jeremy Howard (Answer.AI), qui a publié la proposition en septembre 2024 : un fichier markdown à la racine de votre site qui présente vos pages clés aux modèles IA en un seul aperçu.

En pratique, l'adoption stagne. Aucun grand fournisseur IA ne confirme publiquement qu'il lit ou respecte llms.txt. L'avocat de recherche de Google l'a même comparé à la balise meta keywords, un signal que les moteurs de recherche ignorent depuis des années. La conclusion : un llms.txt demande peu d'effort et ne peut pas nuire, mais ce n'est pas un élément de votre AI-Readiness dont vous pouvez espérer une croissance. Consacrez plutôt votre énergie à l'accès et à la renderabilité.

Les quatre piliers de l'AI-Readiness

Veesie mesure l'AI-Readiness selon quatre catégories qui déterminent ensemble si l'IA peut utiliser votre site. Veesie permet ainsi aux marketeurs et agences de voir concrètement où se trouvent les gains techniques.

PilierCe qu'il mesureProblème le plus fréquentPriorité
1. Accessibilité techniqueCrawlers, HTTPS, HTML renderableMauvais bot bloqué dans robots.txtHaute
2. Structured dataSchema.org JSON-LD, lisibilité par les machinesSchema absent ou en conflitMoyenne
3. Signaux de contenuTitres, listes, structure citableLongs paragraphes sans structureMoyenne
4. AutoritéReconnaissance d'entité, mentions externesNom de marque incohérent, peu de sources externesBasse
Pilier1. Accessibilité technique
Ce qu'il mesureCrawlers, HTTPS, HTML renderable
Problème le plus fréquentMauvais bot bloqué dans robots.txt
PrioritéHaute
Pilier2. Structured data
Ce qu'il mesureSchema.org JSON-LD, lisibilité par les machines
Problème le plus fréquentSchema absent ou en conflit
PrioritéMoyenne
Pilier3. Signaux de contenu
Ce qu'il mesureTitres, listes, structure citable
Problème le plus fréquentLongs paragraphes sans structure
PrioritéMoyenne
Pilier4. Autorité
Ce qu'il mesureReconnaissance d'entité, mentions externes
Problème le plus fréquentNom de marque incohérent, peu de sources externes
PrioritéBasse
  1. Accessibilité technique : laissez-vous entrer les bons crawlers IA ? Votre contenu essentiel figure-t-il dans le HTML rendu côté serveur, sans dépendance JavaScript ? Votre site est-il rapide et sur HTTPS ?
  2. Structured data : vos pages sont-elles dotées d'un Schema.org markup correct pour une lisibilité claire par les machines et un contexte pour les moteurs de recherche ?
  3. Signaux de contenu : votre contenu est-il clairement structuré avec des titres, des listes et des définitions, pour qu'un modèle puisse en extraire des passages ?
  4. Autorité : êtes-vous reconnu comme entité via des mentions cohérentes et des sources faisant autorité ?

Un score élevé sur les quatre piliers ne garantit pas automatiquement d'être cité, mais un score bas signifie presque certainement que vous ne le serez pas. L'AI-Readiness est la porte d'entrée : votre GEO Score mesure ce qui y passe.

Améliorer votre AI-Readiness en 5 étapes

Améliorer l'AI-Readiness commence par la suppression des blocages techniques, pas par plus de contenu. Cinq étapes concrètes :

  1. Vérifiez votre robots.txt. Assurez-vous de ne pas bloquer accidentellement les crawlers de recherche (OAI-SearchBot, PerplexityBot). Bloquez uniquement et ciblément ce que vous ne souhaitez vraiment pas, comme les crawlers d'entraînement.
  2. Testez votre renderabilité. Désactivez JavaScript et vérifiez si votre contenu essentiel reste visible. Si non, faites en sorte qu'il soit rendu côté serveur.
  3. Structurez votre contenu. Utilisez des titres H2 clairs, des listes et des définitions directes, pour qu'un modèle puisse extraire des passages pertinents.
  4. Ajoutez une structured data correcte. Pas comme solution miracle, mais pour la lisibilité par les machines et le contexte pour les moteurs de recherche.
  5. Mesurez et répétez. Un audit AI-Readiness de Veesie scanne ces facteurs automatiquement et vous montre par catégorie où se trouvent les plus grands angles morts.

Si vous souhaitez parcourir ceci comme une checklist, utilisez la checklist d'audit GEO. Et si vous voulez savoir si cela fonctionne, comparez votre position avec le benchmark GEO par secteur et suivez votre GEO Score.

Conclusion : d'abord lisible, ensuite visible

La visibilité IA ne commence pas par de meilleurs textes, mais par un site que l'IA peut atteindre, lire et comprendre. La plupart des angles morts sont techniques et invisibles : un crawler bloqué par erreur, du contenu qui n'apparaît qu'avec JavaScript, ou de mauvaises attentes envers le schema et llms.txt.

L'AI-Readiness est ainsi la base silencieuse de toute votre stratégie GEO. Veesie rend cette base mesurable pour les marketeurs et agences, afin que vous vous assuriez d'abord d'être lisible, avant de vous battre pour la citation. Car invisible pour le crawler signifie invisible dans la réponse. Consultez Qu'est-ce que le GEO ? pour le cadre complet, lisez 8 conseils pour améliorer votre GEO Score pour la suite après votre AI-Readiness, ou créez un compte Veesie gratuit pour mesurer votre propre score.

AI-Readinessstructured dataschema markupAI-crawlersGPTBotllms.txtSEO technique

Questions fréquentes

Sources et références

  1. OpenAI : Bots et crawlers (GPTBot, OAI-SearchBot, ChatGPT-User)
  2. Anthropic : Does Anthropic crawl data from the web, and how can site owners block the crawler?
  3. Perplexity : Perplexity Crawlers (PerplexityBot, Perplexity-User)
  4. Google Search Central : Crawlers Google et Google-Extended
  5. Ahrefs : Does schema markup help AI citations? (2026)
  6. Searchviu : Schema markup and AI in 2025, what ChatGPT, Claude, Perplexity and Gemini really see
  7. Vercel : The rise of the AI crawler (rendu JavaScript des bots IA)
  8. llms.txt : la proposition (Jeremy Howard, Answer.AI, 2024)
  9. Search Engine Journal : Google compare llms.txt à la balise meta keywords

Découvrez votre propre GEO Score

7 jours gratuits, sans carte de crédit. Rapport hebdomadaire dans ChatGPT, Claude, Gemini et Perplexity.

Commencer gratuitement

Articles liés

Score AI-Readiness : votre site lisible par l'IA | Veesie