[TYPO3-UG France] Indexation de fichiers PDF, Word

Alban Cousinié ace at mind2machine.com
Fri Oct 20 09:17:29 CEST 2006


Tu dois avoir une erreur. Il arrive parfois qu'avec la directive PHP
open_basedir ou le safe_mode, PHP ne puisse pas exécuter les logiciels
catdoc et autres, et qu'il défaille silencieusement. Dans ce cas il suffit
d'ajuster la configuration de ton virtual host ou de PHP, ou alors de
relocaliser les logiciels catdoc et autres sous la racine de l'hébergement
web si tu n'as pas accès aux fichiers de configuration du serveur. 

Pour si c'est ton problème, il faut activer l'option debug dans la
configuration de l'extension (dans l'extension manager).
Ensuite tu vas dans web>info et tu sélectionnes l'affichage indexed search
dans la liste de sélection. Tu cliques sur la poubelle rouge pour
réinitialiser la base de données d'indexed search, puis tu visualises à
nouveau ta page en mode frontend.
Ensuite, toujours dans web>info>indexed search, tu cliques sur le titre de
la page nouvellement indexée et tu consultes le détail de l'enregistrement.
Tu devrais voir également les infos de débogage et quelques messages
d'erreur. 

A+

Alban

-----Message d'origine-----
De : typo3-france-bounces at lists.netfielders.de
[mailto:typo3-france-bounces at lists.netfielders.de] De la part de KISTER
RAPHAEL
Envoyé : jeudi 19 octobre 2006 15:15
À : typo3-france at lists.netfielders.de
Objet : [TYPO3-UG France] Indexation de fichiers PDF, Word

Bonjour à tous,
Je souhaite indexer des fichiers PDF et Word, mais je n'y arrive pas. J'ai
placé dans une page un contenu de type Texte avec un lien vers un fichier
local et un contenu de type Lien vers un fichier avec également un lien vers
un fichier local.
J'utilise Typo3 Version 3.8.0 avec par contre l'extension Indexed Search
Engine version 2.9.2 (issue de Typo3 V4.0.2). Les parseurs externes sont
installés (pdftools, catdoc, ...).
Voici la configuration de l'extension Indexed Search Engine :
Path to PDF parsers : /usr/bin/
PDF parsing mode : 20
Path to unzip : /usr/bin/
Path to WORD parser : /usr/bin/
Path to EXCEL parser :/usr/bin/
Path to POWERPOINT parser :/usr/bin/
Debug mode : 0
Full Text Data Length : 0
Disable Indexing in Frontend : 0
Min TTL (hours) for indexed page : 1
Max TTL (hours) for indexed page : 2
Max external files to index : 5
Use "crawler" extension to index ex... : 0
Bitmask for Flags (Advanced) : 192
Ignore Extensions : 
Index External HTML URLs : 0
L'indexation est activée à partir du gabarit de la page
(page.config.index_enable = 1) et la mise en cache de la page est désactivé
(page.config.no_cache=0).
J'ai essayé d'utiliser les parseurs (pdftotext et catdoc) en ligne de
commande et ils fonctionnent correctement.
Lorsque la page est indexée, le contenu est bien indexé, mais les fichiers
ne le sont pas.
Quelqu'un peut-il m'indiquer comment il faut faire pour indexer des fichiers
externes (pdf, word).
Merci d'avance,
Raph


	

	
		
___________________________________________________________________________ 
Découvrez une nouvelle façon d'obtenir des réponses à toutes vos questions !

Demandez à ceux qui savent sur Yahoo! Questions/Réponses
http://fr.answers.yahoo.com
_______________________________________________
TYPO3-france mailing list
TYPO3-france at lists.netfielders.de
http://lists.netfielders.de/cgi-bin/mailman/listinfo/typo3-france




More information about the TYPO3-france mailing list