[TYPO3-german] Typo3 4.3.0 + crawler 3.0.5 + indexed search
Jochen Graf
graf at uni-landau.de
Tue Mar 9 14:47:43 CET 2010
johannes weber|medienlounge schrieb:
> Hallo Forum,
> ich versuche eine funktionierende Konfiguration für typo3 mit crawler
> und indexed search zu finden.
> mein Problem:
> 1. Indexed search
> erster Test - disableFrontendIndexing und useCrawlerForExternalFiles
> nicht angehakt.
> Ergebnis: Über Web -> Info werden Seiten indiziert und auch PDF
> Dokumente gefunden.
> Dort kann ich mit Klick auf den Dokumentennamen auch die Keywords sehen.
> Daher sollten die pdftotext usw Tools richtig funktionieren und die
> Dateien richtig parsen.
> Problem ist nun das die Suche keines der Keywords ausgibt.
> Konfiguration im Template:
>
>
> # Konfiguration der Indizierten Suche
>
> config.index_enable = 1
> config.index_externals = 1
>
> Frage ist nun - muß ich noch bezügl Sprache oder sonstigem konfigurieren?
>
> der nächste Versuch:
> 2. Crawler.
> Hier gibt es einige Anleitungen - vieles sehr veraltert und daher
> dieser neue Thread.
> Änderungen in der Indexed Search:
> disableFrontendIndexing und useCrawlerForExternalFiles jetzt angehakt
> Crawler installiert und konfiguriert.
> Dann im Backend einen User _cli_crawler anlegen - war früher auch mal
> _cli_lowlevel.
> Wenn das funktioniert kann man über ssh auf dem Server das Skript
> php /pfad/zum/www/typo3/cli_dispatch.phpsh crawler
> bzw gibt zumindest keine Fehlermeldungen aus.
> Den angeblichen Konfigurationsrecord kann ich zwar über Typo3 anlegen,
> aber so richtig funktioniert er nicht.
> Daher mein Workaround (empfohlen über wiki.typo3.)
>
> tx_crawler.crawlerCfg.paramSets.test =
> tx_crawler.crawlerCfg.paramSets.test {
> cHash = 1
> procInstrFilter = tx_indexedsearch_reindex,
> tx_indexedsearch_crawler,tx_cachemgm_recache
> baseUrl = [url]http://192.168.1.99/crawler/[/url]
> }
>
> #set up a crawl for users who have group id of 1
> tx_crawler.crawlerCfg.paramSets.grp1 <
> tx_crawler.crawlerCfg.paramSets.test
> tx_crawler.crawlerCfg.paramSets.grp1{
> userGroups = 1
> }
>
>
> Hiermit kann ich eine der beiden Konfigurationen auswählen, ich
> bekomme dann auch über
> Web ->Info den Punkt Crawler, kann mich hier durchklicken und bekomme
> eine Liste mit den zu crawlenden Seiten, und wenn ich dort bei jeder
> manuell auf das "refresh icon" klicke, dann "tut sich" da etwas.
> Nur von erfolg ist die Suche auch nicht.
>
> Bin mittlerweile etwas ratlos und hoffe auf Tipps.
>
> noch etwas, der Crawler in der Version 3.0.5 hat meines Erachtens nach
> auch einen Bug:
> [url]http://bugs.typo3.org/view.php?id=13703[/url]
> Mit dem angegebenen Workaround scheint es zu funktionieren.
>
> Nur generell noch keine Vernünftige Such bzw Ergebnisausgabe.
>
> Letzte Anmerkung:
> habe zur Ausgabe auf einer Seite den Seiteninhalt Search form
> angelegt, Ziel die selbe Seite.
> Sollte ja auch richtig sein, nachdem er ja manches findet, aber
> einfach nicht Inhalte von pdf Dokumenten ausgeben will.
> _______________________________________________
> TYPO3-german mailing list
> TYPO3-german at lists.typo3.org
> http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german
>
>
Hallo,
so habe das mal an laufen gebracht.
Im extension-manager > Indexsearch "Doppelklick" haken entfernt. Use
"crawler" extension to index ex....
Ich setzte Debian Lenny ein, auf der Seite
http://www.debian.de/distrib/packages konnte ich die Packete finden, die
ich für Debain benötige.
apt-get install xpdf-reader
apt-get install emacspeak
apt-get install xpdf-utils
apt-get install xpdf-reader
apt-get install gworkspace-apps-wrappers
apt-get install xpdf-reader
ich gehe mal davon aus, dass evtl. nicht alle Packete installiert sind.
http://www.paeps.technik.uni-landau.de
Suchwort "rasmus"
Wenn es Dir etwas bringt, richte ich Dir einen Zugang auf dem Typo3
Server ein.
--
Mit freundlichen Grüssen
Jochen Graf
Universität Koblenz-Landau / Campus Landau
Arbeitstelle Multimedia/Technik-Administration
Thomas-Nast-Str. 44
76829 Landau
mail: graf at uni-landau.de
fon: 06341-990-224
http://www.uni-koblenz-landau.de/landau
http://www.paeps.uni-landau.de
http://www.paeps.technik.uni-landau.de/
http://www.wulv.uni-landau.de
http://www.ueberlebenmitklips.uni-landau.de/
More information about the TYPO3-german
mailing list