Contenu Web généré par IA et consignes qualité de Google (EEAT) : content is king !

Partager l'article :
Main à gauche de l'image tenant un Iphone avec les icônes des assistants IA : Claude, Mistral, ChatGPT

Selon une étude dévoilée par Graphite, en octobre 2025, environ 50% du contenu actuellement disponible en ligne seraient issuw d’une génération par intelligence artificielle. Les données brutes, accessibles en ligne, couvrent la période allant de janvier 2020 à mai 2025. Elles sont fondées sur l’étude de 65.000 articles, sélectionnés de façon aléatoire dans la base Common Crawl avec vérification que chacun d’entre eux est rédigé en anglais, possède un balisage de schéma d’article (données structurées en JSON-LD), comporte au moins 100 mots.

Graphique de l'étude Graphite montrant une convergence du contenu humain à 50% vs contenu IA à 50% dès début 2025

En novembre 2022, alors que ChatGPT se révèle au grand public, les données Graphite montrent que 92,25% du contenu est alors détecté comme étant de source humaine contre 7,75% alimentés par IA.

Un an plus tard, en novembre 2023, on mesure l’accélération : 61,1% vs 38,99%. En novembre 2024 : 48,92% vs 51,8%. Avec une forme de stabilité jusqu’en mai 2025.

La synthèse des données annuelles de l’étude Graphique fournit le tableau ci-dessous :

Contenu humainContenu IAIA vs Humain
202293,19%6,81%-86,38%
202368,39%31,61%-36,77%
202454,08%45,92%-8,16%
202548,62%51,38%2,76%

Cette évolution est à rapprocher de celle de la recherche de l’occurrence ChatGPT sur Google Trends !

Copie d'écran de la courbe Google Trends ChatGPT qui montre une forte croissance depuis décembre 2022

Si Google ne pénalise pas le contenu généré par IA, les critères du moteur de recherche se concentre sur la qualité de celui-ci (EEAT)

En préambule à ses Conseils de recherche concernant le contenu généré par IA, Google écrit, sous l’intertitre « Récompenser les contenus de haute qualité quelque soit la façon dont ils sont produits » :

« Les systèmes de classement de Google visent à récompenser les contenus originaux et de haute qualité qui répondent aux critères de ce que nous appelons l’E-E-A-T : l’expertise, l’expérience, la légitimité et la fiabilité. Nous nous concentrons sur la qualité du contenu plutôt que sur la façon dont il est produit. Cela nous permet de fournir des résultats fiables et de haute qualité aux utilisateurs depuis des années. (…) En ce qui concerne le contenu généré automatiquement, notre approche est restée constante depuis des années. L’utilisation de l’automatisation (y compris l’IA) pour générer du contenu dans le but principal de manipuler le classement dans les résultats de recherche enfreint nos règles concernant le spam. »

La recommandation se poursuit ainsi :

« L’automatisation est utilisée depuis longtemps pour générer des contenus utiles comme les résultats sportifs, les prévisions météorologiques et les transcriptions. L’IA peut permettre de développer de nouveaux niveaux d’expression et de créativité et d’aider les utilisateurs à créer des contenus de qualité pour le Web. (…) Les personnes souhaitant réussir sur la recherche Google doivent chercher à produire des contenus originaux, de haute qualité et people-first, présentant les qualités de l’E-E-A-T. »

Le critère EEAT reste donc central. Sur ce sujet, une publication Ouest Médias actualisée est en cours de rédaction car le concept s’est renforcé. Sur les fondements du EEAT, et dans cette attente, vous pouvez consulter cet article issu du blog Ouest Médias.

Pas de corrélation entre quantité de contenu généré par IA et classement dans les SERP Google selon Ahrefs

L’impact positif ou négatif de l’intelligence artificielle générative sur la qualité du contenu éditorial publié sur le Web, au sens de la qualité des résultats de recherche, étant un phénomène récent (ChatGPT vient de souffler sa troisième bougie), il est difficile de porter un regard comparatif sur le temps long : la création du premier index (BackRub) remonte en effet à 1996 !

Même si la part de Google quant au search mondial est en léger recul, la firme de Mountain View reste pour le moment en position dominante. Google revendique ainsi que son index est d’une taille « bien supérieure à 100 millions de gigaoctets ». Mais nous n’avons pas de visibilité sur l’ampleur des bases de connaissances des plateformes LLM.

Pour répondre à la question de savoir si Google sanctionne ou récompense le contenu généré par IA, nous trouvons des jalons d’information dans l’étude Ahrefs, publiée le 07/07/2025, sous le titre évocateur « Le contenu généré par l’IA n’affecte pas votre référencement sur Google » : 600.000 pages ont été analysées par l’éditeur de la suite d’outils SEO.

Comme le montre le diagramme ci-dessous, issue de cette étude Ahrefs, « il n’existe pas de corrélation évidente entre la quantité de contenu généré par IA sur une page et son positionnement dans les résultats de recherche Google. Cela suggère que Google ne récompense ni ne pénalise significativement les pages du simple fait qu’elles utilisent l’IA ».

schéma Ahrefs montrant qu'il n'existe pas de corrélation évidente entre la quantité de contenu généré par IA sur une page et son positionnement dans les résultats de recherche Google

Deux points positifs ou source d’espoir dans le combat éternel de l’Homme contre la Machine :

  • « Les pages les mieux classées, c’est-à-dire les premières, ont tendance à contenir légèrement moins de contenu généré par l’IA »
  • « Si les pages étudiées sont regroupées en trois groupes d’utilisation minimale de l’IA (0-30%), d’utilisation modérée de l’IA (30-70%) et d’utilisation importante de l’IA (70-100%) : le groupe avec une utilisation minimale de l’IA présente une très légère corrélation avec les classements les plus élevés »


Contenu humain vs contenu IA gen : gardons notre part d’originalité et d’authenticité non artificielle !

La conclusion de l’étude Ahrefs confirme le sens des recommandations Google : « Il semblerait que Google ne pénalise ni ne récompense activement les contenus utilisant l’IA. Vous n’avez donc aucune raison de les craindre et de les éviter à tout prix. Au final, Google se fiche probablement de la manière dont vous avez créé le contenu. Ce qui compte pour lui, c’est que les internautes le trouvent utile » écrit Si Quan Ong sur le blog Ahrefs.

Nous en revenons donc aux caractéristiques intrinsèques EEAT.

Comme il est avéré que les plateformes IA LLM (ChatGPT, Perplexity…) complètent leurs réponses génératives en aspirant les résultats de recherche de Google en temps réel (ou avec un léger décalage sur l’actualisation de l’index comme j’ai pu l’expérimenter à titre personnel), il convient bien de respecter en premier chef les consignes Google et les fondamentaux du SEO pour aller vers une visibilité globale en matière de recherche sur le Web.

Visibilité globale que l’on peut définir comme la synthèse du meilleur classement possible dans les SERP de Google, selon une requête (nous reviendrons prochainement en détail sur le Fan Query-Out qui s’apparente de plus en plus à la clé de voûte), et meilleure citation possible dans les réponses des IA génératives qui repose en large partie sur l’extractibilité du contenu par ces mêmes IA !

Plus que jamais, le contenu est roi et l‘originalité humaine est un facteur clé de succès. L’IA générative est l’outil qui peut servir à cadrer, préparer, faire une revue documentaire ou de littérature (sourcée). Mais la nature probabiliste des LLM qui lisse par moyenne un contenu 100% automatisé, la capacité des modèles à halluciner… va à l’encontre du EEAT.

Pour reprendre, une nouvelle fois, les propos de Despina Gavoyannis ici traduits en français :

« Contrairement aux moteurs de recherche, qui fonctionnent comme des cartes, les LLM présentent des réponses. Ils ne se contentent pas de recueillir des informations, ils les synthétisent en une prose fluide et autoritaire. Mais cette fluidité n’est qu’une illusion de jugement. Ce modèle ne pondère pas les idées. Il n’évalue pas l’originalité. Il s’agit simplement d’une répétition de schémas, d’une reformulation de ce qui a déjà été dit. Sans modèle pour ancrer une nouvelle idée, les titulaires d’un LLM ne savent pas quoi en faire, ni où la situer dans le tissu du savoir collectif de l’humanité. »

Source : LLMs Don’t Reward Originality, They Flatten It.

Cette qualité, cette fiabilité et cette originalité du contenu éditorial publié sur le Web sont une large partie du respect dû aux lecteurs.

En résumé : les 5 points clés de cet article « Contenu IA sur le Web vs Google EEAT » (*)

1. Explosion du contenu généré par IA
Selon l’étude Graphite (octobre 2025) portant sur 65 000 articles, le contenu généré par IA représente désormais 51,38% du contenu web en 2025, contre seulement 6,81% en 2022. Cette progression prend sa source dans le développement des IA génératives fondées sur les LLM, après le lancement de ChatGPT en novembre 2022.

2. Google ne pénalise pas l’IA, mais privilégie la qualité EEAT
Google affirme explicitement ne pas pénaliser le contenu généré par IA. Le moteur de recherche se concentre exclusivement sur les critères EEAT (Expertise, Expérience, Autorité, Fiabilité), indépendamment du mode de production. Seule l’automatisation visant à manipuler les classements enfreint les règles anti-spam.

3. Absence de corrélation négative entre IA et classement
L’étude Ahrefs (juillet 2025) analysant 600.000 pages démontre qu’il n’existe pas de corrélation évidente entre la quantité de contenu IA et le positionnement Google. Toutefois, les pages les mieux classées contiennent légèrement moins de contenu généré par IA (0 à 30% d’utilisation).

4. Les limites des LLM : aplatissement de l’originalité
Par leur nature probabiliste, les modèles de langage tendent à lisser et « moyenniser » le contenu, réduisant l’originalité. Cette standardisation va à l’encontre des critères EEAT qui valorisent l’authenticité, l’expertise personnelle et la perspective unique.

5. Stratégie gagnante : IA comme assistant, humain comme créateur
L’approche optimale consiste à utiliser l’IA générative comme outil d’aide (cadrage, recherche documentaire, structuration) tout en conservant la création humaine pour garantir originalité, authenticité et respect du lecteur. Cette combinaison favorise la visibilité globale : classement SEO dans les SERP et extractabilité par les IA génératives.

(*) Ce résumé a été réalisé par l’IA Claude d’Anthropic : il est le reflet de la compréhension par une intelligence artificielle générative de l’article dans son ensemble.

Pierre Minier

Lire sur le même sujet : Le SEO n’est pas mort, il évolue à l’ère de l’IA générative


Pour être au top de l’actualité : lancement le 12/11/25 de la version 5.1 de ChatGPT

Lire davantage