Comment améliorer le budget crawl d’un site e-commerce ?
- 2 décembre 2024
- Envoyé par : Benjamin
- Catégorie: Divers
Avant d’envisager le développement de la popularité d’un site Internet, il est indispensable d’optimiser les deux autres piliers du SEO. Il s’agit pour rappel de la sémantique, c’est-à-dire tout ce qui a trait au contenu et à la façon dont il est structuré, et de la technique. Cette dernière est d’autant plus cruciale pour les sites marchands, ou e-commerce, du fait de leurs fonctionnalités naturellement plus nombreuses et complexes. Recherche interne, navigation à facettes, pagination, variantes de produits… Voilà quelques-unes de ces fonctionnalités garantes d’une bonne expérience utilisateur qui peuvent nuire à la visibilité organique d’une boutique en ligne si elles ne sont pas correctement implémentées. Au sujet de leur optimisation pour le référencement naturel, les visions s’opposent. Vous pourrez en effet lire tout et son contraire sur la meilleure manière de les travailler, chaque consultant SEO ayant sa propre vision résultant de ses propres expériences.
En agence puis chez l’annonceur, et maintenant en tant que freelance, j’ai eu l’occasion d’accompagner plusieurs dizaines de sites marchands. Je vous propose ici une synthèse des bonnes pratiques en matière de SEO technique pour le e-commerce. Des pratiques que j’ai ainsi pu appliquer et affiner au fil du temps, et qui vous permettront notamment d’exploiter de nouvelles opportunités de positionnement, de lutter efficacement contre le contenu dupliqué et surtout d’optimiser votre budget crawl.
Budget crawl, de quoi parle-t-on ?
Le crawl budget, ou budget crawl en anglais francisé, est un concept quelque peu énigmatique qui concerne avant tout les « gros » sites (à partir d’une dizaine de milliers de pages). Très simplement, je pourrai le définir comme le nombre de pages crawlées par GoogleBot lors du temps alloué à l’exploration d’un site. Ce n’est ni plus ni moins qu’un ratio mesurable avec un outil tel que la Search Console et plus encore un analyseur de logs (OnCrawl, Botify…). Il faut savoir que le crawl des sites par Google nécessite des ressources matérielles conséquentes, et donc onéreuses. De ce fait, aussi puissant soit-il, le célèbre moteur de recherche fragmente ses analyses, en particulier sur ces fameux « gros » sites. Dès lors, l’une des missions du consultant SEO est d’optimiser ce budget en favorisant la découverte et l’indexation des pages stratégiques.
De l’art de bien configurer les fonctionnalités e-commerce basiques
La recherche interne
La recherche interne est un outil souvent négligé malgré son potentiel immense. Il peut en effet vous permettre de découvrir les mots clés les plus recherchés directement sur votre site afin de déceler des opportunités de positionnement SEO que vous n’exploitez pas encore, ou mal, avec vos landings actuelles (pages de catégories ou fiches produits). Autrement dit, vous n’êtes pour l’instant pas visible sur ces mots clés. Dès que vous détectez une occurrence, la première étape consiste à déterminer si vous avez un intérêt business ou non à vous positionner sur le ou les termes liés. Par exemple, si vous ne vendez que des baskets Nike, et que vos utilisateurs saisissent régulièrement ‘’baskets adidas’’ dans votre moteur de recherche interne, le jeu n’en vaudra sans doute pas la chandelle. En revanche, si vous disposez d’une offre adaptée, foncez !
Oui, mais comment ? Faut-il nécessairement optimiser l’existant ou au contraire partir de zéro ? From scratch comme on dit dans le jargon de la tech. Eh bien tout dépend. S’il s’agit d’un mot clé relatif à un produit précis (une désignation ou une référence), et que celui-ci est en stock, l’optimisation de la fiche produit associée s’imposera. S’il s’agit d’un mot clé générique tel que ‘’maillot rouge femme’’, on se tournera vers la catégorie concernée avec l’utilisation éventuelle des facettes. Dans cet exemple, la logique voudrait qu’on exploite la combinaison de facettes ‘’couleurs = rouge’’ et ‘’sexe = femme’’ sur la catégorie ‘’maillot’’. Bien sûr, dans ce cas, il faudrait que la page de catégorie du site générée via l’utilisation des facettes soit crawlable et indexable par Google (et les autres moteurs de recherche). J’en parle plus longuement dans le point suivant. Ensuite, il pourra être intéressant de rediriger les pages de résultats de recherche interne vers les landings ainsi optimisées, et ce, à des fins d’UX et de SEO.
Je rappelle qu’une page, quelle qu’en soit la nature, aura plus de chances de bien se positionner dans Google si elle est parfaitement intégrée dans l’arborescence.
Quid du searchdexing ? Comme son nom l’indique, cette technique consiste à créer des pages de résultats de recherche indexables, via un process souvent automatisé. Cela peut s’avérer payant, à la seule condition que ledit process soit rigoureusement contrôlé : à partir de combien d’occurrences d’un terme de recherche doit-on créer et indexer une page ? Quels sont les termes à bannir pour éviter la création et l’indexation de pages nuisibles ? Comment intégrer les pages dans l’arborescence pour augmenter leur poids ? Aussi, il faudra s’assurer que la sélection de produits proposés soit pertinente avec idéalement des alternatives sous forme de cross-selling. Sinon, le trafic généré risque d’être de mauvaise qualité. Or, le but d’une telle technique reste la maximisation des performances globales du site, et in fine de transformer.
La navigation à facettes
Comme convenu, je reviens en détail sur la gestion de la navigation à facettes.
Elles sont aussi utiles pour les internautes qu’elles peuvent nuire à votre budget crawl.
Vous devez donc en avoir la parfaite maîtrise pour concilier UX et SEO.
Il existe différentes façons de procéder. Retenez que la meilleure approche est celle au cas par cas.
Néanmoins, si vous ne savez pas comment avancer sur ce point, je vous conseille de bloquer par défaut le crawl et l’indexation de l’ensemble des facettes. Je ne suis pas un grand fan de la balise meta robots, et encore moins du ‘’nofollow,noindex’’. Je prône plutôt l’obfuscation de liens et l’ajout de règles spécifiques complémentaires dans le fichier robots.txt. La configuration d’une canonical sera un plus en espérant que GoogleBot en tienne compte. Ainsi, vous êtes sûr que Google ne s’engouffrera pas dans vos facettes.
Notez qu’en procédant de la sorte, vous n’aurez aucune chance en l’état de ressortir sur des requêtes de longue traîne naturellement plus à même de convertir.
Le mieux reste par conséquent de définir votre stratégie après avoir réalisé une étude complète de mots clés. En fonction des opportunités identifiées, vous pourrez autoriser le crawl et l’indexation d’une combinaison limitée de facettes : 2 au maximum, par expérience. Vous pouvez également ouvrir individuellement celles stratégiques ou, si cela s’avère techniquement trop complexe, créer des landing pages sur mesure. Cela vous demandera toutefois plus de ressources, dans le cadre d’une démarche qui pourra vite devenir chronophage. De plus, le suivi dans le temps sera plus compliqué. A terme, vous risquez de vous retrouver avec des pages obsolètes.
Quelle que soit la manière dont vous vous y prendrez, vous vous efforcerez de personnaliser le contenu. Chaque page doit avoir une balise title, une balise meta description et un titre h1 uniques reflétant évidemment son contenu, et contenant son mot clé SEO principal. Pour aller plus loin, vous pourrez publier un paragraphe introductif avant la descente de produits et du texte à haute valeur ajoutée, plus étoffé, en bas de page.
La pagination
La pagination requière elle aussi beaucoup d’attention.
Presqu’incontournable pour segmenter les catégories les plus volumineuses en nombre de références, elles sont trop souvent délaissées et, pire encore, mal configurées.
Première règle : on laisse Google crawler et indexer l’ensemble des URL paginées. Pas de ‘’follow,noindex’’ ni, je vous en conjure, de canonical renvoyant vers l’URL native sur les pages >= 1 ! Laissez-moi vous rappeler une bonne fois pour toutes qu’avec une telle configuration, vous vous tirez une balle dans le pied ! Eh oui, vous altérez la visibilité de vos produits profonds qui ne seront tout simplement plus crawlés, et ce, même si vous utilisez une self canonical. Des études ont montré qu’à force de dire à Google de ne pas indexer une page, même crawlable, il finira certainement par ne plus la crawler non plus. Ou moins.
Deuxième règle : on favorise le crawl de toutes les URL paginées, y compris les plus éloignées de celle d’origine, à l’aide d’une pagination numéraire physique. Même si vous avez opté pour un système de scroll infini, vous devez permettre à Google de parcourir l’intégralité de vos catégories par le biais de liens en dur, ou « traditionnels » si vous préférez. En revanche, charge à vous de décider si vous souhaitez les afficher pour les utilisateurs. Personnellement, j’estime que l’un n’empêche pas l’autre et que tout ce qui a vocation à améliorer l’UX doit être accessible. Vous avez peut-être des utilisateurs qui ont désactivé Javascript, sait-on jamais.
Troisième règle : on personnalise le contenu. Indiquez dans vos métadonnées, en incluant le h1, le numéro de la page en cours de consultation, et supprimez l’ensemble des textes éventuellement optimisés pour le SEO de toutes les URL >= 1.
Vous l’aurez compris, le blocage des URL paginées dans le fichier robots.txt est exclu.
Les variantes de produit
Je ne reviendrai pas sur le béaba de l’optimisation des fiches de produits pour le SEO.
Je vais me pencher sur les variantes. Je parle ici des déclinaisons d’un même produit. Les pointures par exemple. Restons dans les sneakers que j’affectionne tant. Sur mon site, j’ai une paire de Air Jordan 1 Low ‘’Dark Mocha’’ x Travis Scott, une superbe collaboration disponible dans un vaste choix de pointures. De celles-ci dépend le prix mais, stratégiquement parlant, leur choix n’altérant pas le contenu, j’ai tout intérêt à n’avoir qu’une seule et unique URL présente dans les résultats de recherche organique de Google. Pour Google Ads et Shopping, c’est une autre histoire. Il me faut des URL distinctes grâce à des paramètres. Comment faire pour diffuser un flux Shopping le plus précis possible sans impacter le SEO ? En obfuscant les liens pointant vers les variantes, bien sûr, et en utilisant en parallèle une self canonical.
A contrario, dans le cas où une variante aurait une plus-value pour le SEO, par exemple la couleur d’un smartphone et plus précisément d’un iPhone, on créera une fiche produit dédiée et dûment personnalisée.
Ne pas oublier le béaba du SEO d’un site marchand
Le fait d’optimiser en profondeur les critères précédents ne vous dispense pas de respecter le béaba du SEO technique d’un site marchand.
Maillage interne : ne vous contentez pas des blocs de liens traditionnels (menus, cross-selling, fil d’Ariane…). Insérez des liens pertinents sur les attributs de vos produits pour mailler de manière contextualisée des collections secondaires. Donnez-vous de surcroit les moyens de vos ambitions en créant de véritables cocons sémantiques. Enfin, allez plus loin en créant des synergies entre votre boutique et votre blog, si vous en avez un.
Fichier sitemap.xml : pour améliorer votre budget crawl, assurez-vous d’avoir un fichier sitemap.xml correctement paramétré, avec éventuellement une priorisation des ordres de passage, maintenu à jour et dûment soumis à Google via la Search Console. L’URL de ce fichier doit par ailleurs être mentionnée dans un autre fichier important pour le SEO : le robots.txt. Il est évident que le sitemap.xml ne doit recenser que des URL stratégiques renvoyant un code 200.
Fil d’Ariane, ou breadcrumb : bien que basique, le fil d’Ariane demeure utile non seulement pour le référencement naturel, mais aussi pour l’expérience utilisateur. Comme son nom l’indique, il doit permettre de se situer dans l’arborescence en détaillant le chemin emprunté pour arriver jusqu’à la page finale. Les liens qu’il contient doivent être cliquables. Par ailleurs, le fil d’Ariane doit être balisé conformément aux standards définis par le site schema.org afin de pouvoir exploiter les résultats enrichis.
Temps de chargement : plus vos pages seront rapides à se charger, plus Google en découvrira lors de chaque passage. Recours aux nouveaux formats de fichiers pour les images (.webp et .avif), minification et chargement différé des ressources CSS et JS, ou encore déploiement d’un module de cache… Les possibilités ne manquent pas. Cependant, l’amélioration du temps de chargement ne doit pas être entreprise uniquement dans un objectif SEO.
And last but not least, cela va de soit : corrigez vos erreurs d’exploration !