Cinq erreurs à éviter pour votre site internet afin d’être bien visible sur Google !
L’idée d’écrire cet article est venue lors de la remise des Trophées Crisalide Numérique à Rennes le 24 novembre dernier. La dirigeante des Ateliers Malegol, Coup de cœur du jury, y expliquait comment le site internet de son entreprise avait disparu de Google suite à une refonte : il avait été déployé en no index, les pages devenant invisibles aux yeux du moteur de recherche. Résultat : plus de trafic, chute drastique des formulaires de contact et des appels entrants.
Sur la base de cas concrets, issus de l’expérience Ouest Médias ces dernières années, voici quelques précautions pour prévenir toute mauvaise surprise de ce type. Il s’agit ici de conseils techniques simples… dont le bon respect ne présage en rien du plus ou moins bon classement SEO d’un site. Mais si la qualité du contenu selon l’intention de recherche a été travaillée avec soin, pour optimiser le référencement naturel, ne pas les suivre aura à l’inverse des conséquences dommageables.
1. Ne pas oublier de mettre votre site internet en pré-production en mode no index
Dans un projet de création ou de refonte d’un site internet, la pré-production est l’étape qui vient après les phases d’UX et d’UI puis de prototypage et maquette interactive (sous Figma). Des étapes successives que l’on peut regrouper sous le terme générique de webdesign.
L’environnement de pré-production consiste à intégrer progressivement les briques du site web en construction (qu’il s’agisse d’un CMS ou d’une appriche from scratch) à partir d’un hébergement dédié : tout cela se passe donc en ligne.
Les contenus étant alors accessibles aux robots des moteurs de recherche dont ceux de Google, ils sont potentiellement indexables : s’ils le sont, ils peuvent apparaître dans les résultats de recherche (les SERP) ! Ce qu’il faut évidemment éviter puisque la plateforme en question est en chantier.
Deux précautions usuelles et simples (en mode et/ou) :
- Mettre une identification préalable par login et mot de passe pour bloquer l’accès des robots à la pré-production
- Placer le site en pré-production en no index, cette balise html (le plus souvent dans la section head de la homepage et de chaque page) indiquant au robot qu’il ne doit pas indexer
Sur WordPress, au moment de la configuration initiale, la mise en no index se gère facilement depuis l’espace d’administration (Réglages / Lecture / Visibilité par les moteurs de recherche).
L’installation préalable du plugin Yoast est également une solution possible car il servira plus avant.
2. Ne pas oublier de basculer en index (et follow) votre site internet une fois celui-ci en ligne
De la pré-production à la mise en production du site internet, une fois celui-ci validé après la recette, il faut bien sûr basculer de no index à index : la valeur par défaut est d’ailleurs index follow, la balise follow précisant aux robots des moteurs de recherche qu’ils sont invités à suivre tant les liens internes que les liens sortants depuis les pages du site web.
Si tel n’est pas le cas, que se passe-t-il ? Un site internet en no index est invisible de Google et de tout moteur de recherche (Bing, Yahoo). Il n’apparaît pas dans les résultats de recherche. A moins d’avoir le lien de la page d’accueil ou de toute autre page, aucun utilisateur ne pourra visite le site internet. Il ne génèrera pas de trafic organique entrant. Toute optimisation de son référencement naturel sera vaine.
Comment vérifier que les pages d’un site internet sont indexées ? Il existe plusieurs solutions.
A titre d’exemple, en voici trois :
- Dans la barre de recherche de votre navigateur internet (Chrome, Safari, Firefox), saisir la requête suivante site:ouestmedias.com : en remplaçant ouestmedias.com par l’url du site à contrôler sans http://www. Vous obtiendrez en réponse une liste des pages indexées ainsi que leur nombre.
- Basculer dans la Search Console (photo ci-dessous), mais c’est un plus technique, et analyser les résultats obtenus entre le nombre de pages figurant bien dans l’index de Google et celles qui n’y sont pas. Il faut commencer par traiter celles qui sont mentionnées comme « explorées mais non indexées ».
- Utiliser un outil d’audit de bonne santé (comme Semrush sous licence chez Ouest Médias) : si le site est en no index, le verdict est immédiat car le robot de l’outil est également bloqué, ne pouvant crawlé les pages. Le message d’alerte arrive quelques secondes après le lancement du test.
En savoir plus : comment une agence digitale peut-elle vous aider dans le cadre d’un projet de site internet d’entreprise ?
Le pire des scénarios serait évidemment une pré-production en index et une mise en production en no index… mais n’y pensons pas !
3. Ne pas oublier de générer un sitemap et de l’intégrer dans la Search Console
Tout d’abord, qu’est-ce qu’un sitemap ou plan d’un site internet ? Comme le précise la documentation générale Google disponible sur le sujet :
« Un sitemap est un fichier dans lequel vous donnez des informations sur les pages, les vidéos et les autres fichiers présents sur votre site, et dans lequel vous indiquez les relations entre ces fichiers. Les moteurs de recherche tels que Google lisent ce fichier pour explorer plus efficacement votre site. Un sitemap indique à Google les fichiers que vous jugez importants sur votre site et fournit également des informations précieuses sur ces fichiers. Par exemple, il permet d’indiquer la dernière date de mise à jour d’une page, sa fréquence de modification et les versions qui existent dans d’autres langues. »
A propos des sitemaps – Google
Le sitemap est un fichier au format xml. Pour vérifier s’il est présent sur tel ou tel site internet, il suffit le plus souvent de saisir l’URL suivante dans la barre du navigateur :
• https://www.nomdedomainedusite/sitemap_index.xml
Si le site offre une architecture complexe avec de très nombreuses pages, il est intéressant de catégoriser le sitemap selon les grandes entrées de l’arborescence : l’offre, les services, les retours d’expérience, le blog…
Ainsi les URL internes sont rangées et classées par thèmes, ce qui rend plus facile la compréhension des ramifications de la plateforme par le robot Google quand il parcoure le sitemap. De même, si votre site est multilingue, un sous-sitemap par langue est utile pour plus de clarté.
Comment générer un sitemap ? Si vous êtes sur un CMS comme WordPress, aucun besoin d’écrire la moindre ligne de code ! Installez le plug in Yoast et il se charge de tout à votre place.
Comment faire en sorte que le sitemap soit pris en compte par Google ? Tout se passe au niveau de la Search Console. Il suffit juste de saisir l’URL du sitemap et d’envoyer l’information en validant.
4. Ne pas oublier de gérer les redirections des anciennes URL vers les nouvelles URL
Lors d’une refonte de site internet, il est classique et fréquent d’avoir de nouvelles pages, donc de nouvelles URL… mais aussi des pages existantes dont les URL vont changer. Or ces URL figurent dans l’index Google et peuvent potentiellement remonter dans les résultats de recherche suite à une requête par un internaute dans le moteur.
Prenons l’illustration suivante :
- Sur l’ancienne version du site Ouest Médias, la page traitant de l’optimisation du référencement naturel avait par exemple l’url https://www.ouestmedias.com/referencement-naturel
- Sur la nouvelle version, la même page est désormais accessible via l’URL https://www.ouestmedias.com/agence-seo-optimisation-referencement-naturel/
De façon concrète, si la page https://www.ouestmedias.com/referencement-naturel était correctement positionnée, et une fois le nouveau site déployé, elle va continuer à apparaître dans les SERP… alors que l’URL ne sera plus active. Tout clic sur cette dernière aboutira à une erreur 404 !
Comment remédier à une telle erreur 404 par la bonne gestion gestion des redirections ? En premier lieu, lors du démarrage du projet de refonte, créez un fichier Excel dans lequel vous listez les URL du site internet. Vous pouvez utiliser la Search Console pour vérifier les URL indexées, celles qui apparaissent en impressions et clics dans les résultats de recherche. Vous pouvez vous appuyer sur les données de Google Analytics ou des outils tiers comme Matomo pour déterminer les pages qui génèrent de l’audience (à conserver), celles qui déclinent (à booster) et celles qui n’attirent plus personne (à supprimer pour éviter de surcharger le site et réduire ainsi votre budget crawl).
Le nouveau site finalisé en préproduction, listez les nouvelles URL (en anticipant évidemment que le déploiement se fera sur le nom de domaine principal et non sur preprod.nomdedomaine sinon vous allez rediriger les anciennes URL vers la préprod !). Puis réalisez la correspondance dans le fichier Excel entre les nouvelles URL et les anciennes URL : c’est bon, vous avez votre tableau des redirections.
Pour deux pages, ancienne et nouvelle, qui traitent du même sujet : la gestion de la redirection est simple. C’est iso. Si la nouvelle page regroupe le contenu de plusieurs anciennes pages, tout est affaire de stratégie et réflexion (par exemple selon le potentiel SEO de la meilleure des anciennes pages ou bien en redirigeant vers une nouvelle page au contenu le plus proche…).
Comment gérer ces redirections sous WordPress ? Nul besoin, en théorie, de vous aventurer du côté du fichier htaccess pour adresser ces redirections (dites 301 quand elles sont permanentes). Le plug in Redirection (copie d’écran ci-dessous) fait cela très bien.
5. Ne pas oublier le SEO on page et respecter les bonnes pratiques pour chaque nouvelle page de votre site internet, article de blog ou d’actualité…
La performance d’un site internet en général et d’une page en particulier vis-à-vis d’un moteur de recherche dont Google dépend d’un certain nombre de critères bien identifiés. Même si la teneur et le fonctionnement des algorithmes restent un mystère.
On ne reviendra pas dans cet article sur la qualité du contenu, d’autant plus dans le contexte actuel de mise à jour Google dite Helpful Content : déployée aux Etats-Unis en août dernier, celle-ci est en cours de propagation en Europe (depuis le 05/12/22).
Comme l’écrit le site de référence Web RanK Info :
« Helpful Content Update vise à favoriser les sites qui publient des contenus utiles et à pénaliser ceux avec beaucoup de contenus créés spécialement pour les moteurs de recherche. Comme la mise à jour Panda (2011), l’algo est sitewide : si le site est mal vu par cet algo, tout le site peut être impacté, même les bonnes pages. »
source : Olivier Duffez – Web Rank Info
Le processus Semrush ci-dessous est indicatif : il fournit une feuille de route pour laquelle tous les jalons sont à traiter avec des points de passage à prioriser selon vos moyens (humains et techniques).
Si vous devez juste traiter le minimum, nous vous conseillons de commencer par l’indispensable SEO on page trop souvent négligé (combien de descriptions ou de H1 vides…) :
- Optimiser title et description pour chaque page car ces deux éléments conditionnent l’affichage de votre site internet dans les résultats de recherche… ce qui est le premier point de contact avec votre visiteur, avant la page d’accueil. N’oubliez pas que Google se réserve le droit de modifier la meta description à l’affichage !
- Optimiser la balise titre H1 de chaque page et jouer sur la complémentarité du vocabulaire spécifique et mots clés entre H1 et title ainsi que description
- Structurer votre balisage Hn (balises H2 et suivantes…) afin que le squelette de votre page soit structurée. Lors de l’indexation, chaque Hn facilite la compréhension du contenu qui suit par le robot Google.
- Optimiser vos photos : intégration des images au pixel près au rapport hauteur par largeur (si le bloc fait 800 x 600 pixels, ne pas y télécharger un fichier en 1024 pixels de large… le navigateur va être contraint de redimensionner au chargement !) et compression ad hoc.
- Remplir les champs alt des images : au-delà de la bonne pratique SEO, c’est un usage numérique responsable car inclusif…
En savoir plus : cinq conseils simples pour l’optimisation SEO courante de votre site web
Et pour finir : un site internet à votre image… mais qui doit correspondre à la façon dont votre entreprise est cherchée !
Le paradigme du référencement naturel a changé. Google n’est plus un moteur de recherche, c’est un moteur de question. Si l’on reprend le schéma Semrush ci-dessus, il faut considérer le départ et l’arrivée (points 1. et 9.) : votre site internet peut être super graphique et design, 100% à votre image… mais si vous vous définissez (votre entreprise, votre offre, vos produits ou services…) d’une manière qui ne correspond pas à celle dont vous être cherché, personne ne vous trouvera. Ou très peu.
En ce sens, l’enjeu central tourne autour de l’intention de recherche :
- Quel est le besoin de mon visiteur ?
- Comment va-t-il formuler sa question ?
- Quelle est sa volonté… ce qui renvoie à la nature de l’intention entre informationnelle, navigationnelle, commerciale et transactionnelle ?
- Comment puis-je répondre à cette question, que je dois anticiper voire deviner… pour mettre en face la meilleure page possible avec du contenu utile (et un call to action bien placé pour favoriser la prise de contact rapide)
Pierre Minier