[TYPO3-german] Typo3 4.3.0 + crawler 3.0.5 + indexed search

johannes weber|medienlounge info at medienlounge.com
Tue Mar 9 09:44:14 CET 2010


Hi,
danke für den Tipp,
darüber bin ich auch schon gestolpert, nur leider braucht man hierfür  
wieder den ganzen JAVA Kram .... :(
Ich dachte das es ne Möglichkeit geben muß dem System vernünftig  
beizubringen PDF in den Index aufzunehmen.
Aber auch bei den Antworten hier und in Foren merke ich, dass  
anscheinend mehre Leute das Problem haben,
es aberkeine vernünfige Anleitung gibt - dich auch für aktuellere  
Systeme funktioniert.
Daher der Versuch hier ein WLAKTHROUGH gemeinsam zu erstellen.

Hoffe weiterhin auf HIlfe
Johannes

On Mar 9, 2010, at 8:50 AM, Kay Strobach wrote:

> Hi,
>
> guck dir mal
> https://typo3.org/extensions/repository/? 
> tx_terfe_pi1[view]=search&no_cache=1&tx_terfe_pi1[sword]=solr
>
> an, gerade für große Seiten ist indexed_search problematisch :(
>
> Grüße
> Kay
>
> Am 09.03.2010 08:17, schrieb johannes weber|medienlounge:
>> Hallo Forum,
>> ich versuche eine funktionierende Konfiguration für typo3 mit crawler
>> und indexed search zu finden.
>> mein Problem:
>> 1. Indexed search
>> erster Test - disableFrontendIndexing und useCrawlerForExternalFiles
>> nicht angehakt.
>> Ergebnis: Über Web -> Info werden Seiten indiziert und auch PDF
>> Dokumente gefunden.
>> Dort kann ich mit Klick auf den Dokumentennamen auch die Keywords  
>> sehen.
>> Daher sollten die pdftotext usw Tools richtig funktionieren und die
>> Dateien richtig parsen.
>> Problem ist nun das die Suche keines der Keywords ausgibt.
>> Konfiguration im Template:
>>
>>
>> # Konfiguration der Indizierten Suche
>>
>> config.index_enable = 1
>> config.index_externals = 1
>>
>> Frage ist nun - muß ich noch bezügl Sprache oder sonstigem  
>> konfigurieren?
>>
>> der nächste Versuch:
>> 2. Crawler.
>> Hier gibt es einige Anleitungen - vieles sehr veraltert und daher  
>> dieser
>> neue Thread.
>> Änderungen in der Indexed Search:
>> disableFrontendIndexing und useCrawlerForExternalFiles jetzt angehakt
>> Crawler installiert und konfiguriert.
>> Dann im Backend einen User _cli_crawler anlegen - war früher auch mal
>> _cli_lowlevel.
>> Wenn das funktioniert kann man über ssh auf dem Server das Skript
>> php /pfad/zum/www/typo3/cli_dispatch.phpsh crawler
>> bzw gibt zumindest keine Fehlermeldungen aus.
>> Den angeblichen Konfigurationsrecord kann ich zwar über Typo3  
>> anlegen,
>> aber so richtig funktioniert er nicht.
>> Daher mein Workaround (empfohlen über wiki.typo3.)
>>
>> tx_crawler.crawlerCfg.paramSets.test =
>> tx_crawler.crawlerCfg.paramSets.test {
>> cHash = 1
>> procInstrFilter = tx_indexedsearch_reindex,
>> tx_indexedsearch_crawler,tx_cachemgm_recache
>> baseUrl = [url]http://192.168.1.99/crawler/[/url]
>> }
>>
>> #set up a crawl for users who have group id of 1
>> tx_crawler.crawlerCfg.paramSets.grp1 <  
>> tx_crawler.crawlerCfg.paramSets.test
>> tx_crawler.crawlerCfg.paramSets.grp1{
>> userGroups = 1
>> }
>>
>>
>> Hiermit kann ich eine der beiden Konfigurationen auswählen, ich  
>> bekomme
>> dann auch über
>> Web ->Info den Punkt Crawler, kann mich hier durchklicken und bekomme
>> eine Liste mit den zu crawlenden Seiten, und wenn ich dort bei jeder
>> manuell auf das "refresh icon" klicke, dann "tut sich" da etwas.
>> Nur von erfolg ist die Suche auch nicht.
>>
>> Bin mittlerweile etwas ratlos und hoffe auf Tipps.
>>
>> noch etwas, der Crawler in der Version 3.0.5 hat meines Erachtens  
>> nach
>> auch einen Bug:
>> [url]http://bugs.typo3.org/view.php?id=13703[/url]
>> Mit dem angegebenen Workaround scheint es zu funktionieren.
>>
>> Nur generell noch keine Vernünftige Such bzw Ergebnisausgabe.
>>
>> Letzte Anmerkung:
>> habe zur Ausgabe auf einer Seite den Seiteninhalt Search form  
>> angelegt,
>> Ziel die selbe Seite.
>> Sollte ja auch richtig sein, nachdem er ja manches findet, aber  
>> einfach
>> nicht Inhalte von pdf Dokumenten ausgeben will.
>
> _______________________________________________
> TYPO3-german mailing list
> TYPO3-german at lists.typo3.org
> http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german
>





More information about the TYPO3-german mailing list