Donnez vie à vos documents numériques !
 

En-tête > X-Robots-Tag: noindex ? – RÉPONDU

abracadabraPDF Forums PDF – Général En-tête > X-Robots-Tag: noindex ? – RÉPONDU

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #44473
    DanielSan
    Membre

    Bonjour,

    j’ai lu ici que pour ne pas indexer nos PDF dans les moteurs de recherche,
    il fallait modifier l’en-tête du document et fournir l’indication X-Robots-Tag: noindex…

    1/ Est-ce vrai ?
    2/ Comment fait-on ?

    Cordialement.
    _____
    D.San

    PS : j’ai déjà rajouté une indication dans mon fichier robots.txt disant de ne pas aller fouiner dans tel dossier.

Affichage de 9 réponses de 1 à 9 (sur un total de 9)
  • Auteur
    Réponses
  • #54806
    Merlin
    Maître des clés

    Salut,

    Tu as mal lu :

    – Pour ne pas voir un document PDF indexé, le mieux est d’insérer un X-Robots-Tag: noindex dans l’en-tête HTTP utilisé.

    :geek:

    Pour qu’un PDF ne soit pas indexé il faut soit le protéger par un mot de passe à l’ouverture (comme conseillé sur la page en lien), soit le protéger contre les modifications en cochant l’option “Chiffrer l’ensemble du contenu du document” (par opposition à l’option située immédiatement en-dessous).

    :Smiley01:

    [attachment deleted by admin]

    #54807
    DanielSan
    Membre

    ce n’est pas que j’ai mal lu, mais mal compris :geek:
    quand je génère un PDF avec un script PHP, j’envoie effectivement un en-tête.
    Je pensais que l’en-tête venait en début de PDF alors qu’il n’en fait apparemment pas partie … il est juste avant la génération du PDF.

    Même si je place un mot de passe ou que je crypte le pdf, celui-ci sera quand-même indexé mais illisible, non ..?
    Moi je souhaite mettre à disposition des PDFs sur un site web seulement accessibles par ce dernier et non directement par le moteur de recherche car celui-ci aurait indexé le fichier.

    M’enfin, avec un fichier robots.txt indiquant de ne pas mettre son nez dans tel dossier et des liens “téléchargez le PDF” avec un attribut rel=no-follow, ça devrait déjà faire quelque chose.
    Je souhaitais pousser le bouchon un pu plus loin en prévoyant le cas où un internaute rediffuse un des PDFs sans prendre la peine de gérer les moteurs de recherche …

    Je vais creuser.
    Merci.

    #54808
    Merlin
    Maître des clés

    Je souhaitais pousser le bouchon un pu plus loin en prévoyant le cas où un internaute rediffuse un des PDFs sans prendre la peine de gérer les moteurs de recherche …

    Pouvez répéter la question ???
    :Euuuh:  :Smiley01:

    #54809
    DanielSan
    Membre

    je ne souhaite pas que les PDFs que je mets en ligne se retrouvent indexés sur les moteurs de recherche.
    Mais ces PDFs peuvent-être téléchargés par les internautes.
    Si ces derniers rediffusent mon PDF sur leur propre site, je risque de voir mon PDF indexé sur les moteurs …
    D’où l’en-tête spécifique … mais ce n’est pas possible. Donc on oublie.

    C’est mieux là ?

    #54810
    Merlin
    Maître des clés

    Oui.

    Si tes PDF sont “protégés” contre les modifications, et donc cryptés, seul le nom de fichier sera indexable.
    On peut par exemple utiliser la protection la plus faible qui autorise “Tout sauf l’extraction des pages” pour ne pas pénaliser l’utilisateur.

    :idee:

    PS : c’est trop bien les textes blancs dans les boutons !
    Je ne résiste pas au plaisir de modifier encore ce message.

    :bravo:

    #54811
    DanielSan
    Membre

    ok j’ai bien compris.

    Je souhaite que rien n’apparaisse avec ce type de recherche sur Google :

    Code:
    site:mon-site.com filetype:pdf

    en protégeant à minima de cette manière, on verra quand-même apparaître le fichier dans les moteurs, ce n’est pas ce que je recherche.
    Merci quand-même pour l’astuce.

    #54812
    Merlin
    Maître des clés

    Je souhaite que rien n’apparaisse avec ce type de recherche sur Google :

    Code:
    site:mon-site.com filetype:pdf

    Pourquoi ne pas les zipper ?
    :doute:

    #54813
    DanielSan
    Membre

    1/ cela rajoute une étape au visiteur (et crois-moi il y en a qui ne savent pas comment dézipper)
    2/ on ne peut pas visualiser directement dans le navigateur
    3/ si demain les moteurs se mettent à indexer les zip …

    Mais l’idée n’est pas bête du tout de zipper un fichier éviter l’indexage

    #54814
    Merlin
    Maître des clés

    2/ on ne peut pas visualiser directement dans le navigateur

    A propos de l’affichage des PDF dans les navigateurs : http://www.magazine-avosmac.com/phpBB2/viewtopic.php?t=13202&postdays=0&postorder=asc&start=15

    3/ si demain les moteurs se mettent à indexer les zip…

    Il restera les formats GZIP, TAR, etc.
    :Smiley08:

Affichage de 9 réponses de 1 à 9 (sur un total de 9)
  • Vous devez être connecté pour répondre à ce sujet.