Audit Seo avec PrestaCrawl

PrestaCrawl est un outil de diagnostic Seo permettant d'auditer en profondeur votre site Web. Il aspire ( "crawl" en Anglais ) toutes les pages de votre site et en déduit des indicateurs techniques et Seo.

Ce site s'adresse à tout Webmaster avec ou sans connaissance Seo. Cet outil est la base pour toutes les agences Seo. Elles l'utilisent avant de vous donner des conseils d'optimisation. Avec PrestaCrawl vous avez la possibilité de devenir autonome. En corrigeant les problèmes détectés sur votre site vous résoudrez les problèmes courants par vous même et améliorerez votre référencement !

Vous trouverez ci-dessous la liste des indicateurs mesurés

1. Indicateurs techniques

Codes HTTP
Signification des principaux codes HTTP
  • 200: succès de la requête (l'idéal est d'avoir 100% des urls en code 200)
  • 301/302: les urls correspondantes ont des redirections, il faut traiter le problème sur votre site. Les moteurs de recherche perdent un temps inutile à suivre ces redirections et passent moins de temps sur les pages utiles.
  • 404: page non trouvée (signifie qu'il y a des liens vers des pages inexistantes), à corriger dès que possible.
  • 500/503: erreur serveur, à corriger rapidement car les moteurs de recherche n'aiment pas ces erreurs.
Liste complète des codes HTTP sur Wikipedia
Performance
Un temps de chargement faible sera meilleur pour votre référencement et ceci pour les raisons suivantes:
  • Le chargement rapide d'une page est mieux perçu par l'utilisateur et il restera plus longtemps sur votre site. Les moteurs de recherche tiennent compte du comportement des internautes.
  • Les moteurs de recherche ont ce qu'on appelle un "budget crawl". Moins de temps ils passeront à charger une page et plus de pages ils pourront crawler dans un temps défini.
Par conséquent moins de 500 ms est vivement conseillé comme temps de chargement optimal.
Les performances par groupe de pages permettent d'isoler une catégorie d'url ayant un problème de lenteur, voici comment interpréter ces données sur le graphique:
  • Si tous vos groupes sont au vert (donc moins de 500 ms), c'est parfait. Surveillez régulièrement que vous restez à ce niveau de performance.
  • Les groupes en Orange ou Rouge sont problématiques, il faut alors déterminer pourquoi d'un point de vue technique (page trop lourde, problème base de données, lenteur d'un Webservice, absence de cache, etc ...). Ces groupes pénalisent votre moyenne globale.

2. Indicateurs Seo

2.1 Indicateurs généraux

Les groupes de pages
Les groupes correspondent aux catégories de pages de votre site (on peut aussi employer le terme segment). Ils permettent d'effectuer une analyse plus fine de votre site, notamment :
  • Nombre d'urls par groupe
  • Temps de chargement par groupe - Parfois un temps de chargement élevé dans un groupe permet d'isoler un problème.
Il est important de configurer vos groupes avant de lancer un crawl (par défaut vous aurez "home" et "unknown")
Profondeur
La profondeur est le terme utilisé pour indiquer le nombre de clics à effectuer depuis la home pour atteindre une page.
  • La home est à la profondeur 0.
  • Le niveau 1 doit idéalement avoir entre 100 et 150 liens.
  • Les niveaux suivants doivent permettre d'atteindre rapidement l'intégralité des pages de votre site. Sur le principe de 100 liens par niveau, il suffit de multiplier par 100 à chaque étape.
Exemple de profondeur "idéale" pour un site de 10.000 pages. Niv 0 => 1 page, Niv 1 => 100 pages, Niv 2 = 9899 pages et 0 page sur les profondeurs suivantes. Le concept derrière cette théorie est que les moteurs de recherche doivent pouvoir atteindre vos pages en moins d'étapes possibles afin de transmettre un maximum de Ranking. Plus il y a d'étapes, plus le ranking est diminué.
PrestaCrawl
Nombre de sessions par profondeur
Les sessions représentent le nombre de visites issues des moteurs de recherche depuis les 30 derniers jours (source Google Analytics)
  • En général, sur les premières profondeurs (0,1,2, ...) vous devez avoir des sessions.
  • Il se peut qu'à partir d'une certaine profondeur, vous n'ayez plus aucune session. Dans ce cas il faut travailler à supprimer les pages trop profondes ou à les remonter à une profondeur plus haute.
Ce graphique est la pour démontrer que les pages profondes n'apportent pas ou peu de traffic Seo et qu'il faut travailler à réduire la profondeur global d'un site.
PrestaCrawl combiné à Google Analytics

2.2 Indicateurs sur le contenu

Balise title
La balise title est probablement la balise la plus importante de chaque page de votre site
  • Elle ne doit pas être oubliée
  • Elle doit idéalement contenir entre 50 et 60 caractères (en vert dans le graphe ci-dessus)
  • Elle doit être unique sur l'intégralité de votre site. D'où la notion de balise title dupliquée que vous pourrez trouver ci-dessous. Eliminez les doublons autant que possible.
Plus d'info sur la balise title sur Moz.com (en Anglais)
Balise meta description
La balise meta description est d'une importance relative car non indexée par les moteurs de recherche. Cependant, les moteurs de recherche peuvent l'utiliser dans leur résultat.
  • Elle doit idéalement contenir entre 150 et 160 caractères (en vert dans le graphe ci-dessus)
  • Elle doit être unique sur l'intégralité de votre site. D'où la notion de balise meta description dupliquée que vous pourrez trouver ci-dessous. Éliminez les doublons autant que possible.
Plus d'info sur la balise meta description sur Moz.com (en Anglais)
content.h1
La balise H1 est la deuxième balise importante après la balise title.
  • C'est le titre de la page vu par l'utilisateur. Elle renseigne sur le contenu.
  • Certains moteur recherche comme Google accorderait plus poids aux mots clés contenus dans cette balise.
  • Ne pas l'oublier et elle doit être unique sur l'ensemble du site.
Contenu dupliqué
Définition : le contenu dupliqué correspond à une page avec du contenu identique ou similaire (approximativement le même contenu mais pas 100% identique) à une autre page mais avec une url différente.
  • Les moteurs de recherche éliminent les pages en contenu dupliqué mais perdent du temps à crawler ces pages.
  • Les sites avec beaucoup contenu dupliqué doivent traiter ce problème.
  • PrestaCrawl utilise un algorithme de détection de contenu dupliqué proche de celui utilisé par les moteurs recherche.
La détection de contenu dupliqué est très complexe, l'algorithme de PrestaCrawl donne en général de bons résultats mais certains résultats peuvent parfois s'avérer inexacts. L'idée est de vous mettre sur la piste de type de pages en contenu dupliqué.

2.3 Indicateurs sur le maillage interne

Liens
En terme de maillage interne, il convient de vérifier le nombre de liens par profondeur du site.
  • Sur le principe de 100/150 liens par page, il faut s'assurer que la moyenne de liens par profondeur est cohérente.
  • La somme des liens par profondeur permet de visualiser où se concentre la diffusion des liens. Une diffusion optimale sera à une profondeur la plus basse possible (relative à la taille du site).
Liens internes entrants
En terme de maillage interne, chaque page doit recevoir un minimum de liens. Cette fonctionnalité de Prestcrawl vise à montrer les pages recevant peu de liens internes.
  • Les pages recevant 1 seul lien méritent votre attention. La structure de votre site leur accorde peu d'importance. Il faut déterminer pourquoi.
  • Entre 2 et 5 liens c'est assez faible (tout dépend de la taille de votre site). C'est une indication pas forcément dramatique.