Si vous avez déjà redirigé des URLs, vous pouvez toujours avoir des liens vers l'ancienne URL sur votre site web. Si vous recherchez une liste de tous ces liens, la page actuelle vers laquelle ils pointent (l'ancienne URL) et la page vers laquelle ils devraient pointer (la nouvelle URL), vous êtes au bon endroit.

La méthode ci-dessous peut être une première étape utile pour mettre à jour les liens internes vers les anciennes URLs.

La mise à jour des anciens liens peut contribuer à augmenter la vitesse de chargement des pages et à améliorer le crawl de votre site.

Pourquoi cette demande n'est pas aussi simple qu'elle en a l'air ?

Cette demande mélange des données provenant de différentes sources : des données de pages et des données de liens. Pour l'instant, il n'est pas possible de demander des informations à partir des deux ensembles de données en même temps.

Ce n'est pas grave : vous pouvez toujours obtenir les données que vous souhaitez à partir de chaque ensemble de données, puis utiliser différentes astuces pour réunir les résultats.

Comment obtenir une liste de toutes les pages qui ont été redirigées et l'URL vers laquelle elles sont redirigées ?

Naviguez dans le Data Explorer sous "Tools" dans les résultats de crawl.

Utilisez OnCrawl Query Language pour définir un filtre pour toutes les pages avec un status code 301.

Supprimez toutes les colonnes sauf "URL" et "Redirect target". (Si "Redirect target" n'est pas affiché, vous pouvez l'ajouter en utilisant le bouton "Add columns").

Cliquez sur "Export data" en haut de la page.

Comment obtenir une liste de tous les liens vers les pages qui ont été redirigées ?

Naviguez dans le Data Explorer sous "Tools" dans les résultats de crawl.

Changez le dataset en "Links".

Cliquez sur le quick filter intitulé "Pages pointing to 3xx erreurs".

Supprimez toutes les colonnes sauf "Link origin" et "Link target”.

Comment fusionner les fichiers ?

Utiliser la fonction VLOOKUP en Excel

Ouvrez un nouveau classeur Excel.

Collez le contenu de votre premier fichier (les pages) dans la première feuille. Nommez la feuille "Pages".

Créez une nouvelle feuille. Collez le contenu de votre deuxième fichier (les liens) dans une deuxième feuille et nommez-la "Liens".

Ajoutez une colonne à la feuille "Liens" et nommez la colonne "Nouvel emplacement".

Dans la cellule C2 de la feuille "Liens", utilisez une recherche VLOOKUP pour trouver la destination du lien que vous voyez en B2 dans la liste des pages de l'autre feuille.

Voici la formule complète :

=VLOOKUP(B2;'Pages'!A$1:B$1000;2;FAUX)

Assurez-vous que le "1000" dans “B$1000” est le numéro de la dernière ligne de la liste des pages.

Copiez la cellule C2 et mettez-la en page dans les autres cellules de la colonne C.

N'oubliez pas de sauvegarder le fichier Excel.

Utilisation de la fonction csvjoint dans le paquet Python csvkit

Téléchargez et installez le paquet Python csvkit, disponible ici sur GitHub.

Une documentation complète sur la fonction csvjoin est également disponible ici.

Vous devrez demander à l’algorithme de joindre le fichier 2 (les liens) au fichier 1 (les URLs), en utilisant la deuxième colonne du premier fichier (l'URL de destination) et la première colonne du deuxième fichier (l'URL qui a été redirigée).

Vous aurez besoin de :

  • L'emplacement du premier fichier, qui ressemblera à ceci :

~/Downloads/export-5975c7e1451c953ed90d7b7c-custom_query.csv

  • L'emplacement du deuxième fichier, qui ressemblera à ceci :

~/Downloads/export-5975c7e1451c953ed90d7b7c-custom_query\ \(1\).csv

Notez le slash avant les parenthèses d'ouverture et de fermeture.

Exécutez la commande -c 2,1.

Voici la ligne de commande complète :

csvjoin -c 2,1 ~/Downloads/export-5975c7e1451c953ed90d7b7c-custom_query.csv ~/Downloads/export-5975c7e1451c953ed90d7b7c-custom_query\ \(1\).csv > results_origin_target_location.csv

Cela peut prendre un certain temps, en fonction du nombre de lignes du premier dossier, qui doivent toutes être consultées dans le deuxième dossier.

Cela créera un fichier appelé "results_origin_target_location.csv" avec une ligne pour chaque lien. Chaque ligne indique l'origine du lien, la page vers laquelle il renvoie et la page vers laquelle il est redirigé.

Vous pouvez également trouver cet article en effectuant ces recherches :

301 todos los enlaces, página redirigida y página final

tous les liens vers une page en 301 avec la page redirigée et la page finale

Avez-vous trouvé votre réponse?