[TYPO3-german] crawler für indexed_search einrichten

Tamas Szalai typo3_maillist at tamas.szalai.de
Mon Aug 13 14:10:58 CEST 2007


Hallo Liste,

ich möchte den crawler für indexed_search konfigurieren. Dazu habe ich
mir die Anleitung im Typo3-wiki[1] durchgelesen und auf meine
Installation hin angepasst. Mein TS sieht folgendermassen aus:

----->8----->8----->8----->8----->8----->8----->8----->8----->8----->8-----

page = PAGE

...


################
#indexed_search#
################

#Config Indexed Search Engine
#einschalten:
page.config.index_enable = 1
page.config.index_externals = 0

#Vorgaben:

plugin.tx_indexedsearch {
#Suchregeln:
	show.rules = 0
#Ziel für die Links der Suchausgabe:
	result_link_target = _self
#Var-Type, wonach wird gesucht (hier Wortteil):
	_DEFAULT_PI_VARS.type = 1
#CSS-Layout ? (nö, hier nicht)
	_CSS_DEFAULT_STYLE >
#Wo ist das Plugin?
	searchpagePID = 193
	}

...

#########
#crawler#
#########

#set up a crawl for users that arent logged in
tx_crawler.crawlerCfg.paramSets.test = 
tx_crawler.crawlerCfg.paramSets.test {
	cHash = 1
	procInstrFilter = tx_indexedsearch_reindex, tx_indexedsearch_crawler
	baseUrl = http://MEINE_GEHEIME_URL.de/
}

#set up a crawl for users who have group id of 1,4,5
tx_crawler.crawlerCfg.paramSets.grp1 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp1{
	userGroups = 0,-2,1,4,5
}

#set up a crawl for users who have group id of 6,7,8
tx_crawler.crawlerCfg.paramSets.grp2 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp2{
	userGroups = 0,-2,6,7,8
}

#set up a crawl for users who have group id of 11,12,14,15
tx_crawler.crawlerCfg.paramSets.grp3 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp3{
	userGroups = 0,-2,11,12,14,15
}

-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----

Schaue ich nun unter Web/Info/Site Crawler -> Start Crawling steht bei
jeder Seite überall nur "No Entries". Als nächstes schaue ich mir den
Crawler Log unter Web/Info/Site Crawler -> Crawler Log an und stelle
fest, dass jede URL z.B. folgendermassen aussieht:

http://MEINE_GEHEIME_URL.deindex.php?id=2

Da fehlt doch offensichtlich der Schrägstrich zwischen .de und
index.php ... deswegen nun meine Frage:

Ist die Konfiguration soweit erstmal in Ordnung? 

Die Konfiguration für die indexed_search ist hier aus dem Archiv der
Mailinglist - und funktioniert soweit ich das beurteilen kann -> es
werden Suchergebnisse angezeigt.

Die Konfiguration für den crawler stammt wie gesagt aus der wiki und da
bin ich mir ebend nicht so sicher, ob die soweit auch stimmt ... 


TIA

[1] = http://wiki.typo3.org/index.php/Ext_crawler




More information about the TYPO3-german mailing list