[TYPO3-german] Fragen zum crawler und indexed search

Marius Shekow info at planetnexuiz.de
Mon Sep 24 23:18:06 CEST 2007


Hallo,

ich habe ein paar Fragen zur automatischen Indexierung meiner Seite 
mittels indexed_search extension + Crawler extension.

Zunächst mal mein TS-Code der Root Seite (bei Fehlern bitte gleich 
meckern!):
-------------------------------------------------
tx_crawler.crawlerCfg.paramSets {
	tt_content_index = 
&L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
	tt_content_index.procInstrFilter = tx_indexedsearch_reindex
	tt_content_index.baseUrl = http://www.domain.com/

	tt_news_index = 
&tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:24;_FIELD:uid]&L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
	tt_news_index.procInstrFilter = tx_indexedsearch_reindex
	tt_news_index.pidsOnly = 26
	tt_news_index.cHash = 1
	tt_news_index.baseUrl = http://www.domain.com/
}
# id 26 = news detail page
# id 24 = news sys folder ID
-------------------------------------------------

Frage 1)
Wenn ich auf InfoModule->Site Crawler->Start Crawling gehe, dann die 
Processing Instruction auf Re-indexing (now) stelle und auf Crawl URLs 
klicke, und danach das Log anschaue, steht folgendes in der Status 
Spalte: ".."
Was bedeutet das denn nun ? Fehlschlag oder Erfolg?

Habe dann noch weitere Fragen:
Mein Ziel ist es, per Cronjob alle Seiten alle 24h zu indexieren. Mir 
ist prinzipiell klar wieso dafür ein Cronjob jede Minute gemacht werden 
soll, allerdings gibt es trotzdem für mich jede Menge Ungereimheiten:

Frage 2)
Im Backend Menü (Start Crawling) kann ich das Re-indexing auf z.B. 
"Midnight" stellen. Im Log sehe ich dann die Bestätigung, dass ein Job 
zur Indexierung aller Seiten um Mitternacht angelegt wurde. Aber was 
muss man tun damit das JEDEN TAG so ist?

Frage 3)
Angenommen ich adde so einen Job für Midnight zur Queue. Wenn ich dann 
im Dropdown Menü auf die "CLI Status" Seite wechsle und auf "Run now" 
klicke (Anmerkung: es ist noch NICHT!!! Mitternacht zum Zeitpunkt meines 
Mausklicks), dann läuft das Script trotzdem durch. Was natürlich 
Schwachsinn ist, da das Script ja erst um Mitternacht aktiv werden 
sollte --> Warum läuft das Script trotzdem?

Frage 4)
Wenn ich, wie in Frage 3 beschrieben, nun auf Run klicke, braucht der 
Vorgang knapp 400 Sekunden für 12 Rows. Das ist insoweit schonmal 
irgendwie stark verdächtig --> Vorschläge ?

Frage 5) Wenn ich auf Run now geklickt und 400 Sekunden Geduld 
aufgebracht habe und danach das Crawler Log anschaue, steht in der 
Status spalte die höchst aussagekräftige Meldung "Error: .."
--> Vorschläge?

Vielen Dank,
Marius

P.S. Leider haben es meine langen Fragen an sich, nicht beantwortet zu 
werden. Wenn ihr was wisst, dann sagt es bitte ;). IdR werden meine 
Probleme in Mailinglisten eher selten beantwortet, da es entweder 
Probleme sind die noch kein Mensch hatte, oder keiner den Beitrag je bis 
zum Ende durchgelesen hat und auf dem Weg dort hin an Langeweile 
verstorben ist.


More information about the TYPO3-german mailing list