[TYPO3-german] Fragen zum crawler und indexed search
Marius Shekow
info at planetnexuiz.de
Mon Sep 24 23:18:06 CEST 2007
Hallo,
ich habe ein paar Fragen zur automatischen Indexierung meiner Seite
mittels indexed_search extension + Crawler extension.
Zunächst mal mein TS-Code der Root Seite (bei Fehlern bitte gleich
meckern!):
-------------------------------------------------
tx_crawler.crawlerCfg.paramSets {
tt_content_index =
&L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
tt_content_index.procInstrFilter = tx_indexedsearch_reindex
tt_content_index.baseUrl = http://www.domain.com/
tt_news_index =
&tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:24;_FIELD:uid]&L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
tt_news_index.procInstrFilter = tx_indexedsearch_reindex
tt_news_index.pidsOnly = 26
tt_news_index.cHash = 1
tt_news_index.baseUrl = http://www.domain.com/
}
# id 26 = news detail page
# id 24 = news sys folder ID
-------------------------------------------------
Frage 1)
Wenn ich auf InfoModule->Site Crawler->Start Crawling gehe, dann die
Processing Instruction auf Re-indexing (now) stelle und auf Crawl URLs
klicke, und danach das Log anschaue, steht folgendes in der Status
Spalte: ".."
Was bedeutet das denn nun ? Fehlschlag oder Erfolg?
Habe dann noch weitere Fragen:
Mein Ziel ist es, per Cronjob alle Seiten alle 24h zu indexieren. Mir
ist prinzipiell klar wieso dafür ein Cronjob jede Minute gemacht werden
soll, allerdings gibt es trotzdem für mich jede Menge Ungereimheiten:
Frage 2)
Im Backend Menü (Start Crawling) kann ich das Re-indexing auf z.B.
"Midnight" stellen. Im Log sehe ich dann die Bestätigung, dass ein Job
zur Indexierung aller Seiten um Mitternacht angelegt wurde. Aber was
muss man tun damit das JEDEN TAG so ist?
Frage 3)
Angenommen ich adde so einen Job für Midnight zur Queue. Wenn ich dann
im Dropdown Menü auf die "CLI Status" Seite wechsle und auf "Run now"
klicke (Anmerkung: es ist noch NICHT!!! Mitternacht zum Zeitpunkt meines
Mausklicks), dann läuft das Script trotzdem durch. Was natürlich
Schwachsinn ist, da das Script ja erst um Mitternacht aktiv werden
sollte --> Warum läuft das Script trotzdem?
Frage 4)
Wenn ich, wie in Frage 3 beschrieben, nun auf Run klicke, braucht der
Vorgang knapp 400 Sekunden für 12 Rows. Das ist insoweit schonmal
irgendwie stark verdächtig --> Vorschläge ?
Frage 5) Wenn ich auf Run now geklickt und 400 Sekunden Geduld
aufgebracht habe und danach das Crawler Log anschaue, steht in der
Status spalte die höchst aussagekräftige Meldung "Error: .."
--> Vorschläge?
Vielen Dank,
Marius
P.S. Leider haben es meine langen Fragen an sich, nicht beantwortet zu
werden. Wenn ihr was wisst, dann sagt es bitte ;). IdR werden meine
Probleme in Mailinglisten eher selten beantwortet, da es entweder
Probleme sind die noch kein Mensch hatte, oder keiner den Beitrag je bis
zum Ende durchgelesen hat und auf dem Weg dort hin an Langeweile
verstorben ist.
More information about the TYPO3-german
mailing list