[TYPO3-german] Frage zu crawler (für indexed_search)

Thomas Scholze tscholze at fh-lausitz.de
Wed Sep 19 17:15:10 CEST 2007


Daniel Becker schrieb:
> bisher hätte ich nur beizutragen, dass man erstmal zusehen muss, das man 
> per Kommandozeile dieses Skript für den crawler starten können muss (und 
> dann den cronjob einrichten).
> 
> Bisher ist mir noch nicht klar, welche Rolle die Indexing Configurations 
> spielen. Auch würde ich gerne einmal die Woche die Jobliste löschen und 
> komplett neue generieren lassen, was auch noch nicht klappt. Mal sehen - 
> wenn ich durchsehe (habe wenig Zeit für sowas), werde ich mal sehen, was 
> ich beizutragen habe.

Meine Erkenntnisse, wobei es sein kann, dass ich mit meinen 
Interpretationen falsch liege:

Der CLI-Aufruf ".../typo3/cli_dispatch.phpsh crawler"

- arbeitet die queue ab
- wertet die Indexing Configurations aus
- PDFs werden "richtig" indiziert


Der CLI-Aufruf ".../typo3/cli_dispatch.phpsh crawler_im 10 -o exec -n=2 
-d=999 -proc tx_indexedsearch_reindex"

- egal was als "proc" angegeben ist, der crawler nimmt alles aus dem PageTS
- PDFs werden nicht ordentlich indiziert (wenn in nicht cachebaren 
content-elementen verlinkt)
- wenn queue-modus mit der Option "-n" benutzt (-n=2 getestet), werden 
trotzdem alle einträge in der queue zur selben Zeit geplant, obwohl in 
der shell richtig angezeigt
- gute möglichkeit um die queue zu füllen (ggf. ganze Seite einmal die 
Woche)


Mein Fazit:
".../typo3/cli_dispatch.phpsh crawler" jede Minute laufen lassen, damit 
die Queue abgearbeitet wird
a.) um die Queue zu füllen crawler_im -o queue laufen lassen (Tiefe von 
999 möglich)
b.) auf der Seite Indexing Configurations verteilen um die Queue zu 
füllen, nicht cachebare Inhaltselemente werden indiziert (nur eine Tiefe 
von 3 möglich?

".../typo3/cli_dispatch.phpsh crawler_im -o exec"
verwenden wenn es mal schnell gehen soll...dumm dabei, dass sich das 
access.log extrem füllt


Ich habe mir noch die Frage gestellt, wie ich die Kategorieauswahl in 
die Erweiterte Suche bekomme. Verschiedene Versuche mit 
search.defaultFreeIndexUidList im Template scheiterten.

Viele Grüße aus der Lausitz.
Thomas


More information about the TYPO3-german mailing list