remplir automatiquement le champ auteur avec le nom du fichier  (Lu 198 fois) Partager ce sujet Imprimer

1 B


pphilippe13  01 avril 2021 : 11:45

BonjourJe suis en train de récupérer un bon millier de fichier pdf "neutres" c'est à dire non OCR et sans champs renseignés.
J'ai trouvé la commande ocr_par_lot et elle fonctionne. J'ai vu qu'il était possible de renseigner les champs "titre" "auteur" "mot clef" Mais pour bien faire il faudrait que je puisse enregistrer chaque nom de fichier dans le champ "auteur" sinon il faudra que je le fasse en manuel. Savez vous où je puis trouver une telle commande ? D'avance merci pphilippe
 acrobat pro X

IP archivée


bebarth  01 avril 2021 : 12:03

bonjour,
BonjourJe suis en train de récupérer un bon millier de fichier pdf "neutres" c'est à dire non OCR et sans champs renseignés.
J'ai trouvé la commande ocr_par_lot et elle fonctionne.
Ce sont donc des feuilles scannées que tu passes en OCR pour récupérer le texte.

 
J'ai vu qu'il était possible de renseigner les champs "titre" "auteur" "mot clef" Mais pour bien faire il faudrait que je puisse enregistrer chaque nom de fichier dans le champ "auteur" sinon il faudra que je le fasse en manuel.

Si je comprends bien tu parles des champs de description du document.

C'est effectivement possible à condition de trouver tous ces renseignements après l'OCR.
Il faudrait voir un peu quelques scans pour voir si on peut trouver facilement ces renseignements.
@+
 :bonjour:


IP archivée


pphilippe13  01 avril 2021 : 12:46

bonjour,Ce sont donc des feuilles scannées que tu passes en OCR pour récupérer le texte.

 
Si je comprends bien tu parles des champs de description du document.

C'est effectivement possible à condition de trouver tous ces renseignements après l'OCR.
Il faudrait voir un peu quelques scans pour voir si on peut trouver facilement ces renseignements.
@+
 :bonjour:
BonjourMerci de ta réponse.
 Malheureusement ces fichiers sont des vieux journaux du début du XXè, l'OCR donne des résultats trop aléatoires. Par contre ils sont tous construits sur la même forme :  "nom de fichier" = "nom-de-la-revue-année-mois-jour" - Si comme dans excel il était possible d'avoir accès à ce champ pour le coller dans le champ auteur cela m'aiderai beaucoup. Mais est-ce possible ?  Belle journée, pphilippe  Acrobat X

IP archivée


bebarth  01 avril 2021 : 13:28

Oui, c’est possible !
Mais pourquoi mettre le nom du fichier dans “auteur” ?
@+
 :bonjour:

IP archivée


Merlin  01 avril 2021 : 14:13

Bonjour

C'est le script d'une action que j'ai trouvé, il y a longtemps, sur feu le site Acrobat's Users.

//Begin script

var strFilename = "";
var strChar;
var i = this.path.length;

do {
strChar = this.path.substr(i-1,1)
//console.println(strChar);
strFilename = strChar + strFilename;
i--;
}
while (strChar != "/")
strFilename = strFilename.substring(1,strFilename.length-4);

this.info.Authors = strFilename;

//End script

IP archivée


pphilippe13  01 avril 2021 : 14:34

Oui, c’est possible !
Mais pourquoi mettre le nom du fichier dans “auteur” ?
@+
 :bonjour:
MerciParce que l'auteur est contenu dans le nom du fichier, et plus tard,  si je cherche une information, c'est dans ce champ que j'irai le chercher.  Merci pour le script ... mais je suis néophyte ... je dois créer une nouvelle action et remplir le champ commande avec ce script ?  J'ai bon ??  En tout cas merci  pphilippe
 

IP archivée


bebarth  01 avril 2021 : 18:09

bonjour,
Mon script est un peu plus court :
this.info.Author=this.documentFileName.substr(0, this.documentFileName.length-4);
this.saveAs({cPath: this.path});
  • Tu lances l'action que je te joins.
  • Tu ajoutes les fichiers désirés ou un répertoire contenant ces fichiers.
  • Tous les fichiers traités seront indiqués.
  • Puis "Début".
@+
 :bonjour:

IP archivée


pphilippe13  01 avril 2021 : 20:53

bonjour,
Mon script est un peu plus court :
this.info.Author=this.documentFileName.substr(0, this.documentFileName.length-4);
this.saveAs({cPath: this.path});
  • Tu lances l'action que je te joins.
  • Tu ajoutes les fichiers désirés ou un répertoire contenant ces fichiers.
  • Tous les fichiers traités seront indiqués.
  • Puis "Début".
@+Merci Bebarth
  Je jongle un peu entre Linux pour lire les scripts et Win7 sur un autre ordi qui OCRise une centaine de fichiers.  Comme j'ai une interface anglaise d'Acrobat X, je crois avoir compris, je vais tenter ça ces jours ci, quand l'OCR sera terminé.
  Je ne sais pas comment vous dire merci ... vous êtes des sacrés bibliothèques (chez moi c'est un vrai compliment)   Bon week-end
pphilippe
 :bonjour:

IP archivée


bebarth  01 avril 2021 : 21:39

Fait un essai sur quelques copies de fichiers pour voir si ça te convient!
@+
 :bonjour:

IP archivée


pphilippe13  08 avril 2021 : 16:32

BonjourMe pardonnerez vous cette question ?
Dans le script court suivant :
({cPath: this.path})
path =? nom du chemin ?
En l'état ce script ne fonctionne pas, ou plutôt, je ne suis pas compétent pour le faire fonctionner ...
 je vous joins une capture ...
Merci pour vos lumières
pphilippe

IP archivée