La balise noindex est une balise qui sert à ne pas indexer une page web de votre site (elle indique aux robots des moteurs de recherche qu’ils ne doivent pas ajouter ladite page dans l’index du moteur).
Elle fait partie des bonnes pratiques d’indexation dans l’univers du SEO / référencement naturel.
Pour autant, il faut l’utiliser à bon escient et ne pas en abuser sinon les risques d’erreur auront de réelles répercutions sur votre référencement.
Qu’est ce que le référencement naturel ?
Qu’est ce que SEO ? Il s’agit du référencement naturel ou Search Engine Optimisation, c’est à dire le travail consistant à assurer la présence de vos pages web sur les listes de résultats de recherche des moteurs de recherche, Google en premier.
Les robots des moteurs découvrent vos pages et les analysent (phase de crawl), ils peuvent décider ou pas de les indexer (c’est à dire les placer dans leur index / base de données). Seulement si elles sont indexées, lesdites pages pourront être positionnées. Si elles sont bien positionnées (sur la première page de résultats) elles pourront générer du trafic.
C’est pourquoi la bonne prise en compte de vos pages par les moteurs est très importante.
Dossier : Qu’est ce que le référencement naturel ?
Pourquoi surveiller l’indexation des pages de votre site ?
Google a des milliards de pages dans son index
Qu’est ce que la balise “Noindex” et à quoi sert-elle ?
Il s’agit d’une balise à ajouter dans la section <head> d’une page lorsqu’on souhaite que celle-ci ne soit pas indexée par les moteurs.
Elle se présente sous cette forme :
<meta name=”robots” content=”noindex”>.
Elle explique aux robots des moteurs qui analysent cette page que ladite page ne doit pas être indexée.
<meta name=”robots” content=”noindex,nofollow”>
L’ajout de la commande nofollow indique que les liens présents sur la page ne doivent pas être suivis. C’est à dire que les robots des moteurs ne doivent pas se rendre sur les pages de destination des liens en question.
Les limites de la balise noindex
Le défaut de cette balise est qu’il a fallu à Googlebot (le robot d’indexation de Google, et Googlebot mobile pour l’indexation mobile) dépenser du budget de crawl (comprendre du temps d’analyse) pour découvrir la balise. Le “mal” est donc fait. On aura du crawl inutile.
Tant que faire ce peut (et si la structure du site le permet), il vaut mieux indiquer dans le robots.txt les types de pages à ne pas crawler/indexer.
La balise noindex est valable par exemple pour des pages de pagination : on autorise les robots à crawler le contenu des pages mais pas à les indexer.
Cf : les balises rel prev rel next.
Voici la syntaxe de la balise meta robots : <meta name=robots content=”max-snippet:-1, max-image-preview:large, max-video-preview:-1“
Balise noindex : Quelles sont les balises supplémentaires importantes pour le SEO (balises html) ?
La balise meta title
Elle est l’un des éléments vus en premier par les robots des moteurs. Le contenu de la balise doit correspondre au contenu de la page de destination. La limite d’affichage de la title s’arrête à 65 caractères.
La balise meta keywords (ou balise keyword)
Elle ne sert à rien et n’est plus prise en compte par les moteurs de recherche depuis bien longtemps.
La balise meta description (ou balise description)
Elle n’a pas d’impact sur le positionnement de votre page sur les listes de résultats de Google mais elle a un impact sur le taux de clics sur le lien vers la page depuis la liste de résultats Google. Elle doit être sexy et expliquer en quoi la page répond à l’intention de l’utilisateur. La limite d’affichage de la description s’arrête à 150 caractères.
La balise rel canonical
Elle indique aux robots des moteurs de recherche quelle est l’url de référence à prendre en compte (valable quand une page est accessible via plusieurs url).
Si la balise présente dans le code-source de la page de référence pointe vers la page de référence, on dit que la balise est self referencing.
La balise rel canonical est prise en compte par les robots pour identifier la bonne url (Google ne prendra pas la peine d’indexer plusieurs url correspondant à une même page).
Balise noindex : Les autres éléments SEO présents dans une page
Afin qu’une page soit SEO friendly il faut qu’elle remplisse différents critères :
>> Les éléments cités ci-dessus.
>> Balises H1 H2 H3…> Hn.
>> Balise index ou noindex.
>> Attribut alt.
>> Fil d’Ariane.
>> Liens internes.
>> Contenu éditorial.
>> Header / footer.
>> Balise rel prev rel next en cas de pagination.
>> Balise hreflang pour les versions multilingues.
>> Header / footer.
>> Bouton Call To Action.
Balise noindex : Autres outils pour gérer la bonne indexation d’un site (indexation des pages)
Ils ont tous les deux un rôle dans l’indexation des pages de votre site sur les moteurs de recherche.
- La Search Console est un outil évidemment très important pour le référencement (anciennement nommée Google Webmaster Tools). L’onglet couverture vous indique le nombre de pages indexées (chiffre bien plus précis qu’avec la commande site: sur la barre de recherche Google).
A noter que l’onglet donne aussi des informations sur les pages qui ne sont pas indexées alors qu’elles devraient l’être. Très utile pour activer les chantiers de correction.
- Le fichier fichier “.htaccess” qu’on retrouve à la racine du serveur (racine du site) au même endroit que le fichier robots.txt, le fichier sitemap.xml.
Le fichier htaccess a pour objectif de gérer les paramètres serveurs ainsi que les les systèmes de redirection réalisés tout au long de la vie du site (une redirection 301 s’avère déjà une première solution pour éviter la présence de pages orphelines).
Balise noindex : Le mot de la fin
La balise noindex est présente dans le code html (langage html) de la page ou code-source. Plus précisément dans la balise <head> </head>.
L’indexation des pages web ne doit pas concerner le contenu dupliqué, ou le contenu de pages similaires.
Le robot d’indexation de Google, le Googlebot prend en compte l’url canonique comme méthode d’indexation.
Ressources complémentaires autour de la balise noindex
Les règles d’ergonomie mobile.
Comment indexer une page web ?
Quelles sont les règles SEO on-page ?
Qu’est ce que l’ergonomie mobile.
Qu’est ce que le mobile index first ?
Supports pédagogiques pour construire votre projet entrepreneurial.
Documentation officielle de Google sur le noindex.