[TYPO3-german] indexed search, meta description und tt_news

Volker Golbig typo3 at machwert.de
Thu Jul 12 11:49:44 CEST 2007


Hallo Michael,

zu Punkt 1: ziemlich langsame Performance

Dazu hat mal Peter Russ folgendes in der t.dev Mailingliste gepostet:

"
It takes several 10s of seconds to get search result displayed.

The problem is the "fulltext" search on a regular index either on 
index_fulltext.fulltext or on index_words.baseword performed by a
"where index_words.baseword like '%nonsense%'" query.

We could speed up the time (10s of sec down to millisec) by doing the 
following:

1) adding fulltext index to index_fulltext.fulltext and index_words.baseword

2) changed query in class.tx_indexedsearch.php to use fulltext 
capabilites of MySql.

Limitation: requires newer versions of MySql (4.0 or later)

Diff for TYPO3 4.0.5 can be found here:
http://bugs.typo3.org/view.php?id=5089
"

Habe das bereits erfolgreich umgesetzt, und die Performance-Steigerung 
ist riesig. Leider ist damit aber keine Teilwortsuche mehr möglich. Also 
eine Suche nach "Typo" liefert kein Ergebnis, wenn nur "Typo3" im Inhalt 
vorkommt.

Nochmal eine kurze Beschreibung:
1. Da ich nicht überall SSH Zugang hab, und nicht sicher war, dass das 
diff auch für meine aktuelle indexed_search Version taugt, hab ich ins 
diff-File geschaut, und in der entsprechenden indexed_search Datei 
lediglich die Änderung vorgenommen. War nur eine if-Abrage, die geändert 
werden musste soweit ich mich erinnere.

2. Per phpmyadmin habe ich die einen FULLTEXT Index in den 
index_fulltext und index_words Tabellen gesetzt.

Das wars auch schon.

zu Punkt 2: "abenteuerliche" Suchergebnisse"
Das Problem kenne ich - tritt bei allen meinen indexed_search 
Installationen auf. Würde mich auch interessieren, ob jemand weiß, wie 
es zustande kommt.

zu Punkt 3: meta description wird mit indiziert
Dazu hast du ja schon die Hack-Lösung
Ich hoffe auch, dass es mal konfigurierbar wird.

zu Punkt 4: mehrfachindizierung bei tt_news

Das löse ich bei mir auch so, wie du es beschreibst.
Bei den zeitgesteuerten Einträgen hilft schätzungsweise nur eine 
re-Indexierung - am besten täglich per cronjob mit der crawler Ext, die 
leider etwas schwierig zu verstehen und konfigurieren ist.


Cheerio
Volker


Michael Haugg schrieb:
> Hallo,
> 
> meine Sorgen, was die indexed search betrifft sind vielfältiger Natur:
> 
> 1. ziemlich langsame Performance
> 2. "abenteuerliche" Suchergebnisse
> 3. meta description wird mit indiziert
> 4. mehrfachindizierung bei tt_news
> 
> 
> 
> Zu Punkt 1. wäre zu bemerken, dass die Seite doch mittlerweile einen 
> recht beträchtlichen Umfang (ca. 1000 Seiten) erreicht hat und es 
> insofern ganz schön was zu suchen gibt. Könnte also auch ganz normal 
> sein - oder welche Erfahrungen habt ihr da so? Bei mir dauert eine 
> durchschnittliche Suche ca. 8-15 Sek.
> 
> 
> 
> 2. es kommen öfters Suchergebnisse wie z. B:
> _______________________________________________________
> Anzeige der Ergebnisse 1 bis 10 von insgesamt 40
> 
>     * Seite 1 * Seite 2 * Seite 3 * Seite 4 * Nächste >
> 
>     [dann werden die ersten 10 Suchergenisse gelistet]
> _______________________________________________________
> 
> Klickt man dann aber z. B. auf "Seite 4" kommt als nächstes
> _______________________________________________________
> Anzeige der Ergebnisse 31 bis 13 von insgesamt 13
> 
>     * < Zurück    * Seite 1    * Seite 2
> 
>     * < Zurück    * Seite 1    * Seite 2
> _______________________________________________________
> 
> ALLERDINGS JETZT OHNE SUCHERGEBNISSE!!!
> 
> Gestern habe ich dann mal die ganzen index-Tabellen geleert und den 
> index neu aufgebaut, indem ich mal alles Seiten durch den Validator 
> gejagt habe - war eh mal wieder fällig ;-)
> 
> Aber das obige Beispiel stammt leider von heute... an was kann das liegen?
> 
> 
> 
> 3. Die auf Rootlevel mit page.meta.DESCRIPTION = {$var_meta_Description} 
> definierten Inhalte werden bei jeder Seite mit indiziert. Wie kann man 
> das verhindern?
> 
> 
> 
> 4. Die mehrfachindizierung bei tt_news habe ich hoffentlich dadurch 
> gelöst, indem ich dontUseBackPid = 1 verwende und nur jeweils die 
> SINGLE-News-Seite indizieren lasse. D. h. ich habe bei den LIST und 
> LATEST Seiten "Nicht suchen" aktiviert. Ist das so richtig?
> 
> Es wurden aber auch news indiziert, die durch ein festgelegtes 
> Stop-Datum gar nicht mehr angezeigt werden können. Wie erkennt denn die 
> indexed search das der beispielsweise vor einer indizierte Artikel nun 
> gar nicht mehr vorhanden ist?
> 
> 
> 
> Wisst ihr noch ein paar Tricks und Kniffe die ganze "Angelegenheit" zu 
> optimieren?
> 
> Viele Grüße
> 
> Michael


More information about the TYPO3-german mailing list