Si on utilise les modules « Path » et « PathAuto », pour éviter le « duplicate content » (contenu en double exemplaire), rappelons qu'il est nécessaire après l'installation d'un Drupal bien frais d'éditer et retoucher le robots.txt d'origine, sous peine de risquer de retrouver son site dans le bac à sable de Google ou d'avoir du contenu indexé non désiré.
Comment procéder ? Juste éditer à la racine du site le présent robots.txt (par exemple avec nano) et rajouter tout en bas :
# Rajout
Disallow: /node/
Disallow: /comment/
Disallow: /taxonomy/
Disallow: /archive/
Disallow: *?page=
Disallow: *?from=
Disallow: /*sort=
Disallow: /*?quicktabs_
Disallow: /aggregator/
Disallow: /tracker/
Disallow: /tracker
Disallow: /user/
Disallow: /*?*
Disallow: /*feed
Disallow: /*feeds
Disallow: /u/
Disallow: /privatemsg/
Disallow: /mail/
Disallow: /files/
Disallow: /search/
Disallow: /book/print/
Disallow: /print/
Disallow: /forward/
Disallow: /event/*/table/
Disallow: /event/*/list/
Disallow: /event/*/month/
Disallow: /event/*/week/
Disallow: /event/*/day/
# Type de contenu à ne pas indexer
Disallow: /logs/
Voilà tout.
Commentaires
#1. Juste une petite précision
#2. Merci bien, j'avais oublié de
Merci bien, j'avais oublié de rajouter mes directives ! Grrrr, j'ai une bonne partie de mon site en duplicate content.
Poster un nouveau commentaire