[TYPO3-german] Typo3 4.3.0 + crawler 3.0.5 + indexed search

Tue Mar 9 08:50:17 CET 2010

Hi,

guck dir mal
https://typo3.org/extensions/repository/?tx_terfe_pi1[view]=search&no_cache=1&tx_terfe_pi1[sword]=solr

an, gerade für große Seiten ist indexed_search problematisch :(

Grüße
Kay

Am 09.03.2010 08:17, schrieb johannes weber|medienlounge:
> Hallo Forum,
> ich versuche eine funktionierende Konfiguration für typo3 mit crawler
> und indexed search zu finden.
> mein Problem:
> 1. Indexed search
> erster Test - disableFrontendIndexing und useCrawlerForExternalFiles
> nicht angehakt.
> Ergebnis: Über Web -> Info werden Seiten indiziert und auch PDF
> Dokumente gefunden.
> Dort kann ich mit Klick auf den Dokumentennamen auch die Keywords sehen.
> Daher sollten die pdftotext usw Tools richtig funktionieren und die
> Dateien richtig parsen.
> Problem ist nun das die Suche keines der Keywords ausgibt.
> Konfiguration im Template:
>
>
> # Konfiguration der Indizierten Suche
>
> config.index_enable = 1
> config.index_externals = 1
>
> Frage ist nun - muß ich noch bezügl Sprache oder sonstigem konfigurieren?
>
> der nächste Versuch:
> 2. Crawler.
> Hier gibt es einige Anleitungen - vieles sehr veraltert und daher dieser
> neue Thread.
> Änderungen in der Indexed Search:
> disableFrontendIndexing und useCrawlerForExternalFiles jetzt angehakt
> Crawler installiert und konfiguriert.
> Dann im Backend einen User _cli_crawler anlegen - war früher auch mal
> _cli_lowlevel.
> Wenn das funktioniert kann man über ssh auf dem Server das Skript
> php /pfad/zum/www/typo3/cli_dispatch.phpsh crawler
> bzw gibt zumindest keine Fehlermeldungen aus.
> Den angeblichen Konfigurationsrecord kann ich zwar über Typo3 anlegen,
> aber so richtig funktioniert er nicht.
> Daher mein Workaround (empfohlen über wiki.typo3.)
>
> tx_crawler.crawlerCfg.paramSets.test =
> tx_crawler.crawlerCfg.paramSets.test {
> cHash = 1
> procInstrFilter = tx_indexedsearch_reindex,
> tx_indexedsearch_crawler,tx_cachemgm_recache
> baseUrl = [url]http://192.168.1.99/crawler/[/url]
> }
>
> #set up a crawl for users who have group id of 1
> tx_crawler.crawlerCfg.paramSets.grp1 < tx_crawler.crawlerCfg.paramSets.test
> tx_crawler.crawlerCfg.paramSets.grp1{
> userGroups = 1
> }
>
>
> Hiermit kann ich eine der beiden Konfigurationen auswählen, ich bekomme
> dann auch über
> Web ->Info den Punkt Crawler, kann mich hier durchklicken und bekomme
> eine Liste mit den zu crawlenden Seiten, und wenn ich dort bei jeder
> manuell auf das "refresh icon" klicke, dann "tut sich" da etwas.
> Nur von erfolg ist die Suche auch nicht.
>
> Bin mittlerweile etwas ratlos und hoffe auf Tipps.
>
> noch etwas, der Crawler in der Version 3.0.5 hat meines Erachtens nach
> auch einen Bug:
> [url]http://bugs.typo3.org/view.php?id=13703[/url]
> Mit dem angegebenen Workaround scheint es zu funktionieren.
>
> Nur generell noch keine Vernünftige Such bzw Ergebnisausgabe.
>
> Letzte Anmerkung:
> habe zur Ausgabe auf einer Seite den Seiteninhalt Search form angelegt,
> Ziel die selbe Seite.
> Sollte ja auch richtig sein, nachdem er ja manches findet, aber einfach
> nicht Inhalte von pdf Dokumenten ausgeben will.