Sommaire
partager l'article sur
SEO
31/5/2022
Pierre-François Viaud
Pierre-François Viaud
No items found.

Une Nouvelle balise robots pour faciliter l’indexation : indexifembedded

Depuis quelques jours, Google dote la célèbre balise meta "robots" d'un nouvel attribut appelé  "Indexifembedded" qui permettra désormais d'indiquer que le contenu de certains sous-fichiers peut être indexé même si la page parent ne l'est pas…

Mais d’abord, qu’est-ce que c’est une balise méta “robots” ?

Les balises méta robots, généralement situées au niveau de l’entête HTML des pages de sites web permettent, entre autres, de donner des indications aux robots lors de leur passage : en d’autres termes, ils agissent sur le crawl et l’indexation des pages web de votre site.

Une nouvelle Mise à jour de Google pour faciliter l’indexation

Google a annoncé début 2022 ce nouvel attribut avec la balise meta "robots" d'Indexifembedded. Globalement, il permet d’indiquer à Google que vous souhaitez que votre contenu soit indexé lorsqu'il est intégré à d'autres pages (en particulier sur des pages tierces tel qu’un contenu en iframe*). Ainsi, même si la page de contenu "parente" contient une balise noindex, le contenu intégré par l’iframe pourrait tout de même être indexé par Google.

*iFrame est le nom donné à une balise HTML utilisée dans le langage informatique pour intégrer dans une page HTML le contenu d'une autre page HTML.

Une balise META facile à intégrer dans l’entête

Vous l’aurez compris, ces deux attributs ("noindex" et "Indexifembedded”) seront donc utilisés en combinaison :  dans le cas de figure où la page parent n’est pas indexée (balise noindex ) contrairement au contenu de l'iframe (attribut Indexifembedded).  Cette combinaison de balises devrait être notamment efficace  pour les sites d'actualités qui revendent leur contenu à de nombreuses autres sources.

Voici un cas précis où l’utilisation de la propriété indexifembedded peut être pertinent dans une page : 

Prenons l’exemple de l’url : journal.com/janvier/2021/podcast=covid que vous ne vous ne souhaitez pas indexer par le Googlebot, indiqué via la balise noindex.  Vous ne souhaitez néanmoins pas empêcher l’indexation du contenu intégré via des iframes dans une autre page qui souhaite récupérer ce contenu tel que site.com/actualité/podcast=covid : il serait alors pertinent dans ce cas de figure d’utiliser le nouvel attribut proposé par Google.


Pour l’intégrer dans les métas, dans le head HTML, voici ce qu’il faut mettre :

<meta name="googlebot" value="noindex" />                  // Ici, nous demandons à ne pas indexer la page

<meta name="googlebot" value="indexifembedded" />   // Ici, nous demandons l’indexation du contenu

<!-- OR →
<meta name="googlebot" value="noindex,indexifembedded" />

Vous pouvez également spécifier la balise dans l'en-tête HTTP de la page :

X-Robots-Tag: googlebot:noindex

X-Robots-Tag: googlebot:indexifembedded

Ou

X-Robots-Tag: googlebot:noindex,indexifembedded

Pour conclure, l'attribut “indexifembedded” est donc idéal pour les éditeurs de contenu qui ne souhaitent pas que leurs pages soient indexées par Googlebot mais qui n'auraient aucun problème que leur contenu soit indexé lorsqu'il est intégré dans des sites Web externes ou des pages via des iframes.