[TYPO3-german] Typo3 4.3.0 + crawler 3.0.5 + indexed search

Jochen Graf graf at uni-landau.de
Tue Mar 9 14:47:43 CET 2010


johannes weber|medienlounge schrieb:
> Hallo Forum,
> ich versuche eine funktionierende Konfiguration für typo3 mit crawler 
> und indexed search zu finden.
> mein Problem:
> 1. Indexed search
> erster Test - disableFrontendIndexing und useCrawlerForExternalFiles 
> nicht angehakt.
> Ergebnis: Über Web -> Info werden Seiten indiziert und auch PDF 
> Dokumente gefunden.
> Dort kann ich mit Klick auf den Dokumentennamen auch die Keywords sehen.
> Daher sollten die pdftotext usw Tools richtig funktionieren und die 
> Dateien richtig parsen.
> Problem ist nun das die Suche keines der Keywords ausgibt.
> Konfiguration im Template:
>
>
> # Konfiguration der Indizierten Suche
>
> config.index_enable = 1
> config.index_externals = 1
>
> Frage ist nun - muß ich noch bezügl Sprache oder sonstigem konfigurieren?
>
> der nächste Versuch:
> 2. Crawler.
> Hier gibt es einige Anleitungen - vieles sehr veraltert und daher 
> dieser neue Thread.
> Änderungen in der Indexed Search:
>  disableFrontendIndexing und useCrawlerForExternalFiles jetzt angehakt
> Crawler installiert und konfiguriert.
> Dann im Backend einen User _cli_crawler anlegen - war früher auch mal 
> _cli_lowlevel.
> Wenn das funktioniert kann man über ssh auf dem Server das Skript
> php  /pfad/zum/www/typo3/cli_dispatch.phpsh crawler
> bzw gibt zumindest keine Fehlermeldungen aus.
> Den angeblichen Konfigurationsrecord kann ich zwar über Typo3 anlegen, 
> aber so richtig funktioniert er nicht.
> Daher mein Workaround (empfohlen über wiki.typo3.)
>
> tx_crawler.crawlerCfg.paramSets.test =
> tx_crawler.crawlerCfg.paramSets.test {
> cHash = 1
> procInstrFilter = tx_indexedsearch_reindex, 
> tx_indexedsearch_crawler,tx_cachemgm_recache
> baseUrl = [url]http://192.168.1.99/crawler/[/url]
> }
>
> #set up a crawl for users who have group id of 1
> tx_crawler.crawlerCfg.paramSets.grp1 < 
> tx_crawler.crawlerCfg.paramSets.test
> tx_crawler.crawlerCfg.paramSets.grp1{
> userGroups = 1
> }
>
>
> Hiermit kann ich eine der beiden Konfigurationen auswählen, ich 
> bekomme dann auch über
> Web ->Info den Punkt Crawler, kann mich hier durchklicken und bekomme 
> eine Liste mit den zu crawlenden Seiten, und wenn ich dort bei jeder 
> manuell auf das "refresh icon" klicke, dann "tut sich" da etwas.
> Nur von erfolg ist die Suche auch nicht.
>
> Bin mittlerweile etwas ratlos und hoffe auf Tipps.
>
> noch etwas, der Crawler in der Version 3.0.5 hat meines Erachtens nach 
> auch einen Bug:
> [url]http://bugs.typo3.org/view.php?id=13703[/url]
> Mit dem angegebenen Workaround scheint es zu funktionieren.
>
> Nur generell noch keine Vernünftige Such bzw Ergebnisausgabe.
>
> Letzte Anmerkung:
> habe zur Ausgabe auf einer Seite den Seiteninhalt Search form 
> angelegt, Ziel die selbe Seite.
> Sollte ja auch richtig sein, nachdem er ja manches findet, aber 
> einfach nicht Inhalte von pdf Dokumenten ausgeben will.
> _______________________________________________
> TYPO3-german mailing list
> TYPO3-german at lists.typo3.org
> http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german
>
>
Hallo,

so habe das mal an laufen gebracht.

Im extension-manager > Indexsearch "Doppelklick"  haken entfernt.  Use 
"crawler" extension to index ex....

Ich setzte Debian Lenny ein, auf der Seite 
http://www.debian.de/distrib/packages konnte ich die Packete finden, die 
ich für Debain benötige.

apt-get install xpdf-reader
apt-get install emacspeak
apt-get install xpdf-utils
apt-get install xpdf-reader
apt-get install gworkspace-apps-wrappers
apt-get install xpdf-reader

ich gehe mal davon aus, dass evtl. nicht alle Packete installiert sind.


http://www.paeps.technik.uni-landau.de
Suchwort "rasmus"

Wenn es Dir etwas bringt, richte ich Dir einen Zugang auf dem Typo3 
Server ein.



-- 
Mit freundlichen Grüssen

Jochen Graf

Universität Koblenz-Landau / Campus Landau
Arbeitstelle Multimedia/Technik-Administration

Thomas-Nast-Str. 44
76829 Landau

mail: graf at uni-landau.de
fon: 06341-990-224

http://www.uni-koblenz-landau.de/landau

http://www.paeps.uni-landau.de
http://www.paeps.technik.uni-landau.de/


http://www.wulv.uni-landau.de
http://www.ueberlebenmitklips.uni-landau.de/




More information about the TYPO3-german mailing list