[TYPO3-german] Crawler TSconfig Konfiguration

Tim Zech tizech at gmail.com
Thu Jul 27 17:21:27 CEST 2006


&L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]

das bedeutet:
die EXT:crawler liest aus der tabelle _TABLE alle einträge. davon wird
jeweils der Wert aus sys_language_uid für &L= eingesetzt.

konkret:
nehmen wir an du hast 2 Sprachen Englisch (UID=1) und Französisch
(UID=2) neben deiner default Sprache. Dann wird an jede URL die
Indiziert werden kann erst ohne L, dann mit L=1 und dann mit L=2
indiziert, so kann man in jeder Sprache suchen.

cachemgm_recache kannst du getrost rausnehmen, denn Kaspar hat diese
EXT noch nicht released. :-(

Der CronJop muss nicht jede Minute laufen, es tut aber nicht weh dies
zu tun, denn jeder start des CronJobs arbeitet erst alle im CrawlerLog
auf Pending stehende Dokumente ab. Wenn er damit durch ist, is gut.
Ausser: Wenn du eine Indexing Config hast mit dein Einstellungen jede
Nacht 1 Uhr den Seitenbaum abzugrasen, läuft der Crawler von da an neu
durch.

Das CLI Script für den CronJob läuft max 1h wenn dann der nächste
Crawler gestartet wird beendet dieser das alte Script und läuft selbst
weiter. Alle Starts innerhalb dieser Stunde werden abgebrochen da noch
ein Thread läuft.

Zu deiner Config, Ich bin mir nicht sicher ob du die Benötigst, wenn
du keine Parameter übergeben willst. Über das Zweigleisige zwischen
Indexing Configuration und Crawler-Config bin ich mir noch nicht klar.
Wann was gebraucht wird. Bei mir beachtet der Crawler beide
Einstellungen soweit ich weis. Hab das aus Zeitmangel aber noch nicht
beobachtet.


2006/7/27, Julian Kleinhans <jk at marketing-factory.de>:
> Hi liste,
>
> ich bin gerade dabei mich in die Crawler Extension einzuarbeiten. Und
> habe mir schon die Doku und den Podcast von Kasper reingezigen.
>
> Bzgl. der TSconfig habe ich entweder was nicht so verstanden oder es ist
> "nicht gut" erklärt/dokumentiert ;-)
>
> Kaspers TSconfig ist für Mehrsprachige Seite mit den tt_news
> beschrieben.. doch ich benutze davon keines.
>
> tx_crawler.crawlerCfg.paramSets {
>    language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
>    language.procInstrFilter =tx_indexedsearch_reindex,tx_cachemgm_recache
>    language.baseUrl = http://localhost:8888/typo3/dummy_4.0/
>    mininews
> =&L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]&tx_mininews_pi1[showUid]=[_TABLE:tx_mininews_news]
>    mininews.procInstrFilter = tx_indexedsearch_reindex
>    mininews.cHash = 1
>    mininews.baseUrl = http://localhost:8888/typo3/dummy_4.0/
> }
>
>
> anhand der doku und der obenstehenden TSconfig habe ich versucht
> nachzuvollziehen was da passiert, doch verstehen tu ich das nicht so
> ganz. Mein TSconfig schaut momentan so aus
>
> #Crawler for indexed_search
> tx_crawler.crawlerCfg.paramSets {
>    all =
>    all.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
>    all.baseUrl = http://www.meinedomain.de/
> }
>
> funktionieren will das ganze noch nicht so... .-/
> Ideen ?
>
> Und warum soll der cronjob (der im podcast) erklärt wird jede minute
> laufen ? Oder habe ich das falsch verstanden ?
>
>
> Vielleicht hat ja der ein oder andere ein paar tips für mich ;-)
>
> gruss julian
> _______________________________________________
> TYPO3-german mailing list
> TYPO3-german at lists.netfielders.de
> http://lists.netfielders.de/cgi-bin/mailman/listinfo/typo3-german
>


More information about the TYPO3-german mailing list