[TYPO3-german] Frage zu crawler (für indexed_search)
Thomas Scholze
tscholze at fh-lausitz.de
Wed Sep 19 17:15:10 CEST 2007
Daniel Becker schrieb:
> bisher hätte ich nur beizutragen, dass man erstmal zusehen muss, das man
> per Kommandozeile dieses Skript für den crawler starten können muss (und
> dann den cronjob einrichten).
>
> Bisher ist mir noch nicht klar, welche Rolle die Indexing Configurations
> spielen. Auch würde ich gerne einmal die Woche die Jobliste löschen und
> komplett neue generieren lassen, was auch noch nicht klappt. Mal sehen -
> wenn ich durchsehe (habe wenig Zeit für sowas), werde ich mal sehen, was
> ich beizutragen habe.
Meine Erkenntnisse, wobei es sein kann, dass ich mit meinen
Interpretationen falsch liege:
Der CLI-Aufruf ".../typo3/cli_dispatch.phpsh crawler"
- arbeitet die queue ab
- wertet die Indexing Configurations aus
- PDFs werden "richtig" indiziert
Der CLI-Aufruf ".../typo3/cli_dispatch.phpsh crawler_im 10 -o exec -n=2
-d=999 -proc tx_indexedsearch_reindex"
- egal was als "proc" angegeben ist, der crawler nimmt alles aus dem PageTS
- PDFs werden nicht ordentlich indiziert (wenn in nicht cachebaren
content-elementen verlinkt)
- wenn queue-modus mit der Option "-n" benutzt (-n=2 getestet), werden
trotzdem alle einträge in der queue zur selben Zeit geplant, obwohl in
der shell richtig angezeigt
- gute möglichkeit um die queue zu füllen (ggf. ganze Seite einmal die
Woche)
Mein Fazit:
".../typo3/cli_dispatch.phpsh crawler" jede Minute laufen lassen, damit
die Queue abgearbeitet wird
a.) um die Queue zu füllen crawler_im -o queue laufen lassen (Tiefe von
999 möglich)
b.) auf der Seite Indexing Configurations verteilen um die Queue zu
füllen, nicht cachebare Inhaltselemente werden indiziert (nur eine Tiefe
von 3 möglich?
".../typo3/cli_dispatch.phpsh crawler_im -o exec"
verwenden wenn es mal schnell gehen soll...dumm dabei, dass sich das
access.log extrem füllt
Ich habe mir noch die Frage gestellt, wie ich die Kategorieauswahl in
die Erweiterte Suche bekomme. Verschiedene Versuche mit
search.defaultFreeIndexUidList im Template scheiterten.
Viele Grüße aus der Lausitz.
Thomas
More information about the TYPO3-german
mailing list