[TYPO3-german] indexed search, meta description und tt_news
Volker Golbig
typo3 at machwert.de
Thu Jul 12 11:49:44 CEST 2007
Hallo Michael,
zu Punkt 1: ziemlich langsame Performance
Dazu hat mal Peter Russ folgendes in der t.dev Mailingliste gepostet:
"
It takes several 10s of seconds to get search result displayed.
The problem is the "fulltext" search on a regular index either on
index_fulltext.fulltext or on index_words.baseword performed by a
"where index_words.baseword like '%nonsense%'" query.
We could speed up the time (10s of sec down to millisec) by doing the
following:
1) adding fulltext index to index_fulltext.fulltext and index_words.baseword
2) changed query in class.tx_indexedsearch.php to use fulltext
capabilites of MySql.
Limitation: requires newer versions of MySql (4.0 or later)
Diff for TYPO3 4.0.5 can be found here:
http://bugs.typo3.org/view.php?id=5089
"
Habe das bereits erfolgreich umgesetzt, und die Performance-Steigerung
ist riesig. Leider ist damit aber keine Teilwortsuche mehr möglich. Also
eine Suche nach "Typo" liefert kein Ergebnis, wenn nur "Typo3" im Inhalt
vorkommt.
Nochmal eine kurze Beschreibung:
1. Da ich nicht überall SSH Zugang hab, und nicht sicher war, dass das
diff auch für meine aktuelle indexed_search Version taugt, hab ich ins
diff-File geschaut, und in der entsprechenden indexed_search Datei
lediglich die Änderung vorgenommen. War nur eine if-Abrage, die geändert
werden musste soweit ich mich erinnere.
2. Per phpmyadmin habe ich die einen FULLTEXT Index in den
index_fulltext und index_words Tabellen gesetzt.
Das wars auch schon.
zu Punkt 2: "abenteuerliche" Suchergebnisse"
Das Problem kenne ich - tritt bei allen meinen indexed_search
Installationen auf. Würde mich auch interessieren, ob jemand weiß, wie
es zustande kommt.
zu Punkt 3: meta description wird mit indiziert
Dazu hast du ja schon die Hack-Lösung
Ich hoffe auch, dass es mal konfigurierbar wird.
zu Punkt 4: mehrfachindizierung bei tt_news
Das löse ich bei mir auch so, wie du es beschreibst.
Bei den zeitgesteuerten Einträgen hilft schätzungsweise nur eine
re-Indexierung - am besten täglich per cronjob mit der crawler Ext, die
leider etwas schwierig zu verstehen und konfigurieren ist.
Cheerio
Volker
Michael Haugg schrieb:
> Hallo,
>
> meine Sorgen, was die indexed search betrifft sind vielfältiger Natur:
>
> 1. ziemlich langsame Performance
> 2. "abenteuerliche" Suchergebnisse
> 3. meta description wird mit indiziert
> 4. mehrfachindizierung bei tt_news
>
>
>
> Zu Punkt 1. wäre zu bemerken, dass die Seite doch mittlerweile einen
> recht beträchtlichen Umfang (ca. 1000 Seiten) erreicht hat und es
> insofern ganz schön was zu suchen gibt. Könnte also auch ganz normal
> sein - oder welche Erfahrungen habt ihr da so? Bei mir dauert eine
> durchschnittliche Suche ca. 8-15 Sek.
>
>
>
> 2. es kommen öfters Suchergebnisse wie z. B:
> _______________________________________________________
> Anzeige der Ergebnisse 1 bis 10 von insgesamt 40
>
> * Seite 1 * Seite 2 * Seite 3 * Seite 4 * Nächste >
>
> [dann werden die ersten 10 Suchergenisse gelistet]
> _______________________________________________________
>
> Klickt man dann aber z. B. auf "Seite 4" kommt als nächstes
> _______________________________________________________
> Anzeige der Ergebnisse 31 bis 13 von insgesamt 13
>
> * < Zurück * Seite 1 * Seite 2
>
> * < Zurück * Seite 1 * Seite 2
> _______________________________________________________
>
> ALLERDINGS JETZT OHNE SUCHERGEBNISSE!!!
>
> Gestern habe ich dann mal die ganzen index-Tabellen geleert und den
> index neu aufgebaut, indem ich mal alles Seiten durch den Validator
> gejagt habe - war eh mal wieder fällig ;-)
>
> Aber das obige Beispiel stammt leider von heute... an was kann das liegen?
>
>
>
> 3. Die auf Rootlevel mit page.meta.DESCRIPTION = {$var_meta_Description}
> definierten Inhalte werden bei jeder Seite mit indiziert. Wie kann man
> das verhindern?
>
>
>
> 4. Die mehrfachindizierung bei tt_news habe ich hoffentlich dadurch
> gelöst, indem ich dontUseBackPid = 1 verwende und nur jeweils die
> SINGLE-News-Seite indizieren lasse. D. h. ich habe bei den LIST und
> LATEST Seiten "Nicht suchen" aktiviert. Ist das so richtig?
>
> Es wurden aber auch news indiziert, die durch ein festgelegtes
> Stop-Datum gar nicht mehr angezeigt werden können. Wie erkennt denn die
> indexed search das der beispielsweise vor einer indizierte Artikel nun
> gar nicht mehr vorhanden ist?
>
>
>
> Wisst ihr noch ein paar Tricks und Kniffe die ganze "Angelegenheit" zu
> optimieren?
>
> Viele Grüße
>
> Michael
More information about the TYPO3-german
mailing list