[TYPO3-german] Frage zu crawler (für indexed_search)

Peter Russ peter.russ at 4many.net
Wed Sep 19 20:23:58 CEST 2007


--- Original Nachricht ---
Absender:   Thomas Scholze
Datum:       19.09.2007 17:15:
[...]

> Meine Erkenntnisse, wobei es sein kann, dass ich mit meinen 
> Interpretationen falsch liege:
> 
> Der CLI-Aufruf ".../typo3/cli_dispatch.phpsh crawler"
> 
> - arbeitet die queue ab
richtig
> - wertet die Indexing Configurations aus
welche meinst Du damit, die TSconfig oder...
> - PDFs werden "richtig" indiziert
was ist "richtig"
> 
> 
> Der CLI-Aufruf ".../typo3/cli_dispatch.phpsh crawler_im 10 -o exec -n=2 
> -d=999 -proc tx_indexedsearch_reindex"
> 
> - egal was als "proc" angegeben ist, der crawler nimmt alles aus dem PageTS
> - PDFs werden nicht ordentlich indiziert (wenn in nicht cachebaren 
> content-elementen verlinkt)
Diese Verhalten ist normal, da nur cachebare Elemente indiziert werden 
(diese Ausssage widerspricht Deinem Fazit)
> - wenn queue-modus mit der Option "-n" benutzt (-n=2 getestet), werden 
> trotzdem alle einträge in der queue zur selben Zeit geplant, obwohl in 
> der shell richtig angezeigt
> - gute möglichkeit um die queue zu füllen (ggf. ganze Seite einmal die 
> Woche)
> 
> Mein Fazit:
> ".../typo3/cli_dispatch.phpsh crawler" jede Minute laufen lassen, damit 
> die Queue abgearbeitet wird
Genau so sinnvoll bei bei directmail

> a.) um die Queue zu füllen crawler_im -o queue laufen lassen (Tiefe von 
> 999 möglich)
> b.) auf der Seite Indexing Configurations verteilen um die Queue zu 
> füllen, nicht cachebare Inhaltselemente werden indiziert (nur eine Tiefe 
> von 3 möglich?
Das indizieren von nicht cachebaren Elementen ist mir nocht nicht 
gelungen. Es scheitern ganze Seiten, wenn sich darin nur eine Element 
befindet, dass zwar vom Typ USER ist, aber einen cHash voraussetzt!

> 
> ".../typo3/cli_dispatch.phpsh crawler_im -o exec"
> verwenden wenn es mal schnell gehen soll...dumm dabei, dass sich das 
> access.log extrem füllt

access.log vom Apache? Gibt es da nicht eine Option die Zugriffe zu filtern?

[...]

Gruss. Peter.

-- 
Fiat lux!
Docendo discimus.
_____________________________
4Many® Services
XING: http://www.xing.com/go/invuid/Peter_Russ


More information about the TYPO3-german mailing list