[TYPO3-german] crawler für indexed_search einrichten
Tamas Szalai
typo3_maillist at tamas.szalai.de
Mon Aug 13 14:10:58 CEST 2007
Hallo Liste,
ich möchte den crawler für indexed_search konfigurieren. Dazu habe ich
mir die Anleitung im Typo3-wiki[1] durchgelesen und auf meine
Installation hin angepasst. Mein TS sieht folgendermassen aus:
----->8----->8----->8----->8----->8----->8----->8----->8----->8----->8-----
page = PAGE
...
################
#indexed_search#
################
#Config Indexed Search Engine
#einschalten:
page.config.index_enable = 1
page.config.index_externals = 0
#Vorgaben:
plugin.tx_indexedsearch {
#Suchregeln:
show.rules = 0
#Ziel für die Links der Suchausgabe:
result_link_target = _self
#Var-Type, wonach wird gesucht (hier Wortteil):
_DEFAULT_PI_VARS.type = 1
#CSS-Layout ? (nö, hier nicht)
_CSS_DEFAULT_STYLE >
#Wo ist das Plugin?
searchpagePID = 193
}
...
#########
#crawler#
#########
#set up a crawl for users that arent logged in
tx_crawler.crawlerCfg.paramSets.test =
tx_crawler.crawlerCfg.paramSets.test {
cHash = 1
procInstrFilter = tx_indexedsearch_reindex, tx_indexedsearch_crawler
baseUrl = http://MEINE_GEHEIME_URL.de/
}
#set up a crawl for users who have group id of 1,4,5
tx_crawler.crawlerCfg.paramSets.grp1 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp1{
userGroups = 0,-2,1,4,5
}
#set up a crawl for users who have group id of 6,7,8
tx_crawler.crawlerCfg.paramSets.grp2 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp2{
userGroups = 0,-2,6,7,8
}
#set up a crawl for users who have group id of 11,12,14,15
tx_crawler.crawlerCfg.paramSets.grp3 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp3{
userGroups = 0,-2,11,12,14,15
}
-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----
Schaue ich nun unter Web/Info/Site Crawler -> Start Crawling steht bei
jeder Seite überall nur "No Entries". Als nächstes schaue ich mir den
Crawler Log unter Web/Info/Site Crawler -> Crawler Log an und stelle
fest, dass jede URL z.B. folgendermassen aussieht:
http://MEINE_GEHEIME_URL.deindex.php?id=2
Da fehlt doch offensichtlich der Schrägstrich zwischen .de und
index.php ... deswegen nun meine Frage:
Ist die Konfiguration soweit erstmal in Ordnung?
Die Konfiguration für die indexed_search ist hier aus dem Archiv der
Mailinglist - und funktioniert soweit ich das beurteilen kann -> es
werden Suchergebnisse angezeigt.
Die Konfiguration für den crawler stammt wie gesagt aus der wiki und da
bin ich mir ebend nicht so sicher, ob die soweit auch stimmt ...
TIA
[1] = http://wiki.typo3.org/index.php/Ext_crawler
More information about the TYPO3-german
mailing list