Si vous êtes confus lorsque Google signale des redirections dans d’autres catégories, comme “bloqué par robots.txt”, “soft 404s”, “noindexed”, “404s”, et autres, il se peut que Google suive silencieusement la redirection et signale l’état de la véritable URL de destination à la place. Mon message couvre la situation en détail et fournit des exemples de ce qui se passe dans la nature.
Tout en analysant fortement les sites Web du point de vue du référencement, vous vous retrouverez sans aucun doute profondément dans les rapports de Google Search Console (GSC). GSC contient une multitude de données provenant directement de Google et peut aider les propriétaires de sites et les référenceurs à découvrir des informations clés. Cela dit, il est important de comprendre les nuances impliquées dans les rapports GSC et comment Google détermine les informations qu’il fournit dans ces rapports. Avoir une compréhension claire de ce que les données montrent est important lorsque vous prenez des mesures pour améliorer le référencement.
Et il n’y a pas de meilleur exemple de confusion des données GSC que la redoutable véritable URL de destination pour les redirections dans le rapport de couverture d’index de GSC (et l’outil d’inspection d’URL). J’ai reçu tellement de questions à ce sujet de la part de clients que j’ai décidé d’écrire cet article afin de pouvoir simplement pointer les gens ici plutôt que de l’expliquer encore et encore.
Alors, rejoignez-moi dans une aventure GSC où nous découvrons les secrets de la véritable URL de destination. Certains d’entre vous le savent peut-être déjà, mais je sais que d’autres ne le savent pas. Et pour ceux qui ne le font pas, tout cela aura du sens très bientôt. Vous n’êtes peut-être pas satisfait de la façon dont cela fonctionne, mais au moins vous comprendrez pourquoi les URL sont catégorisées de certaines manières dans GSC (et via l’outil d’inspection d’URL).
Quelle est la situation redoutée de l’URL de destination réelle dans GSC pour les redirections ?
Lors de l’affichage de l’état d’indexation dans GSC des URL qui sont redirigées, Google signale le véritable URL de destination (même si cette URL est en dehors de votre propre site). Par exemple, si vous redirigez une URL vers une autre URL et que cette URL n’est pas indexable pour une raison quelconque, GSC suivra silencieusement la redirection et signalera le statut de la destination finale. Et cela peut être très déroutant pour les propriétaires de sites et les référenceurs qui ne savent pas que cela se produit.
Oui, cela signifie que vous pouvez voir les URL apparaître comme “bloquées par robots.txt”, “noindexed”, “soft 404”, “404”, et plus encore (lorsque l’url que vous inspectez est en fait redirigée). Comme vous pouvez l’imaginer, de nombreux propriétaires de sites sont confus lorsqu’ils voient “bloqué par robots.txt” alors qu’ils savent à 100 % qu’une URL redirige.
John Mueller de Google a été interrogé à plusieurs reprises à ce sujet, et il a répondu avec ce que j’ai expliqué ci-dessus (et admet que cela peut être un peu déroutant). En outre, Barry a écrit un article expliquant comment cela se produit avec l’outil d’inspection d’URL basé sur les commentaires de John. Même si cela a été documenté, je trouve que c’est toujours une situation très confuse pour de nombreux propriétaires de sites et SEO (c’est pourquoi j’écris ce post).
Voici un de mes tweets avec un lien vers John expliquant comment Google suit silencieusement les redirections (et comment cela apparaît dans GSC) :
Maintenant que vous savez que cela se produit, vous vous demandez peut-être à quoi cela ressemble réellement dans GSC. Je couvrirai cela ensuite avec des exemples de ce qui se passe dans la nature.
Exemples de Google suivant silencieusement les redirections et signalant le véritable état de l’URL de destination dans GSC :
Ci-dessous, je vais fournir des exemples avec des captures d’écran de rapports Google sur les véritables URL de destination par rapport à la redirection. Encore une fois, c’est lorsque les URL de destination finale ne sont pas indexables pour une raison quelconque.
Bloqué par robots.txt :
L’url est redirigée en dehors du site vers une url bloquée par robots.txt. Google signale que l’URL de redirection est “bloquée par robots.txt”, car la destination finale est en fait interdite.
Une torsion sur bloqué par robots.txt :
Cette URL redirige d’abord vers une URL de suivi, qui est bloquée par robots.txt. La destination finale est pas bloqué, mais Google ne peut pas suivre la première redirection pour trouver l’URL de destination finale car elle n’est pas autorisée. Il sait simplement que la première URL de la chaîne est bloquée et le signale dans GSC. Ci-dessous, vous pouvez voir que la deuxième étape montre que l’URL est en fait bloquée par robots.txt (et c’est ce qui est signalé dans GSC).
Doux 404 :
L’url redirige vers une page qui est un soft 404 (un produit n’est pas disponible). Google signale que l’URL de redirection est un soft 404 (puisque la véritable URL de destination est considérée comme un soft 404).
Voici la page vers laquelle l’url redirige (avec le produit “actuellement indisponible”). D’où le soft 404 :
Non indexé :
Oui, vous l’avez deviné. L’url redirige vers une page qui n’est pas indexée. Google signale l’URL qui redirige comme non indexée dans le rapport de couverture :
Exploré, non indexé :
À première vue, vous pourriez penser que la redirection est signalée comme “explorée, non indexée”. Pas vrai! C’est l’URL de destination finale qui n’est pas indexée par Google. Google signale “Crawled, not indexed” pour la véritable URL de destination.
L’url de destination finale n’est en effet pas indexée :
404 :
Comment Google peut-il voir une redirection comme un 404 ? Ce n’est pas le cas. C’est la véritable URL de destination que 404 et c’est ce qui est rapporté dans GSC.
404 avec changement de nom de domaine :
Ceci est juste une variante de la situation 404 pour expliquer comment cela fonctionne lors du changement de noms de domaine. L’url de l’ancien domaine redirige vers une url du nouveau nom de domaine, mais l’url n’a jamais été migrée (il s’agit d’un 404). Google signale donc que l’url de redirection est un 404.
Désolé, plus de confusion avec les redirections :
Lorsqu’une URL redirige vers une page qui se résout avec un code de réponse d’en-tête 200 et est indexée, l’outil d’inspection d’URL signale avec précision à propos de la redirection (et dit que l’URL initiale est une redirection et non indexée), mais Google affiche le canonique comme la véritable URL de destination (où la redirection mène). Parlez de confusion, en particulier sur la base de tout ce que j’ai expliqué ci-dessus avec les autres exemples où les URL de redirection sont signalées comme quelque chose de différent d’une redirection…
Une solution possible dans GSC pour dissiper la confusion :
Alors, comment cela peut-il être plus intuitif ? Je pense que si GSC fournissait un message indiquant qu’il signalait la véritable URL de destination, cela pourrait dissiper la confusion pour les propriétaires de sites et les référenceurs. Ci-dessous, j’ai simulé à quoi cela peut ressembler dans GSC. Si Daniel Waisberg lit (et j’espère que vous l’êtes), alors s’il vous plaît ajoutez ceci !
Résumé : Dissiper la confusion avec les redirections et les rapports d’URL de destination.
J’espère que cet article vous a aidé à comprendre comment Google suit silencieusement les redirections et signale les véritables URL de destination dans GSC. Je sais que c’est un sujet déroutant pour de nombreux propriétaires de sites et SEO et je suis sûr que cela a conduit à de nombreux moments de casse-tête. Gardez simplement à l’esprit qu’à partir de maintenant, GSC signale les véritables URL de destination lorsqu’une URL est redirigée. Ne soyez donc pas surpris lorsque vous remarquez des redirections dans d’autres catégories dans les rapports de couverture de GSC (ou lorsque vous utilisez l’outil d’inspection d’URL). Et qui sait, peut-être que l’équipe produit de GSC mettra en œuvre ce message que j’ai simulé ci-dessus…
GG