[TYPO3-german] crawler beschleunigen
Peter Russ
peter.russ at 4many.net
Fri Jun 22 11:39:22 CEST 2007
Thomas Scholze schrieb:
> Hallo,
> eine kurze Frage: Ist es möglich den crawler etwas zu beschleunigen?
>
> Ich möchte (da Mitternachts der Cache geleert wird) mit dem crawler die
> Seiten neu cachen und in dem Zug auch im Index updaten.
>
> Das ganze läuft mit folgender config:
> -- TypoScript --
> ## http://wiki.typo3.org/index.php/Ext_crawler
> tx_crawler.crawlerCfg.paramSets.main =
> tx_crawler.crawlerCfg.paramSets.main {
> procInstrFilter =
> tx_indexedsearch_crawler,tx_indexedsearch_reindex,tx_cachemgm_recache
> cHash = 1
> baseUrl = http://www.domain.de/
> }
> #set up a crawl for users who have group id of 1
> tx_crawler.crawlerCfg.paramSets.grp1 < tx_crawler.crawlerCfg.paramSets.main
> tx_crawler.crawlerCfg.paramSets.grp1 {
> userGroups = 1
> }
>
> -- crawler-aufruf in der Shell --
> $ time
> /home/www/vh/www.fh-lausitz.de/typo3/sites/typo3_FHL_test/typo3/cli_dispatch.phpsh
> crawler_im 2 -d 999 -n 999 -ss -proc
> tx_cachemgm_recache,tx_indexedsearch_reindex,tx_indexedsearch_crawler -o
> exec
>
> -- mit dem Ergebnis --
> real 981m14.729s
> user 0m15.978s
> sys 0m2.571s
>
> ------------------------
> Also nicht für jeden Tag geeignet.
>
> Was mir ebenfalls aufgefallen ist, dass wenn man über CLI nur
> -proc tx_cachemgm_recache
> angibt auch alle anderen Parameter automatisch mit abgearbeitet werden,
> in dem fall tx_indexedsearch_crawler,tx_indexedsearch_reindex.
> Lässt sich nur beheben, wenn man ein separates paramSets definiert in
> der die nicht gewünschten parameter auch nich drin sind.
>
> Abgesehen davon läuft tx_cachemgm_recache alleine auch nicht schneller ...
>
>
> Vielen Dank für eure Hilfe, ich würde dann auch versuchen
> http://wiki.typo3.org/index.php/Ext_crawler ein Update zu verschaffen.
>
> Grüße
> Thomas
Um wieviele Seiten handelt es sich?
Deine Seiten werden 2mal gecrawlt: 1 mal ohne Group in main, einmal mit
Group 1 (was m.E eigentlich so lauten sollte: 0,-2,1)
Eine Beschleinigung könnte erreicht werden, wenn die Gruppenberechtigung
sich auf Seiten und nicht auf Inhaltebene beschränkt. Hier kommt in der
nächsten Woche ein Patch, um dies zu vereinfachen.
Ansonsten.....
Gruss. Peter.
--
Fiat lux!
Docendo discimus.
_____________________________
4Many® Services
openBC: http://www.openbc.com/go/invuid/Peter_Russ
More information about the TYPO3-german
mailing list