[Typo3-german] IndexedSearch indiziert trotz TYPO3SEARCH_ zu viel
typo3user at gmx.net
typo3user at gmx.net
Wed Nov 9 14:00:49 CET 2005
>> Ich habe eine Seite die aus divs aufgebaut ist, von der Struktur her so:
>> [body]
>> [div id="container"]
>> [div id="a"]content für a[/div]
>> [div id="b"]
>> [!--TYPO3SEARCH_begin--]
>> content für b
>> [!--TYPO3SEARCH_end--]
>> [/div]
>> [/div]
>> [/body]
>
>Ich gehe davon aus, du hast "<>" statt "[]" genutzt, dann sollte das in
>der Form schon passen.
ja natürlich; ist nur so, dass manche Mailreader einen Anfall bekommen wenn sie gültige HTML-Tags vorfinden und mir die Kommentare wichtig waren
>> Ist:
>> - IndexedSearch indiziert sowohl b als auch a, trotz der Angabe der TYPO3SEARCH_-Grenzen. Wenn man beispielsweise nach einem Seitentitel wie er im Seitenmenu (mit TS in a erzeugt) vorkommt, so werden *alle* Seiten aufgelistet, da in allen der a-Bereich
vorkommt
>> und überall dieser Titel drinsteht
>
>Vielleicht wurde die Seite gar nicht neu indiziert nach Template
>Änderung? Schau mal im Web>Info>, dort auf eine Seite gehen, und in der
>Selektbox "Indexsuche" auswählen. Da sieht mal ziemlich genau, welche
>Wörter auf der Seite indiziert wurden. Und viel schöner: Du kannst das
>Ergebnis der Indizierung verwerfen.
Du meinst Web>Info:"Indexed Search"?
Habe darüber schon seitenweit den Datenbestand des IS gelöscht (rot hinterlegter Mülleimer); ein Klick auf eine FE-Seite und *schwuppz* wieder ist sie im IS
>Nicht vergessen alle möglichen Caches zu leeren. Dann nochmal auf die
>Seite browsen und sehen, ob sich was geändert hat.
habe nochmal alle Seiten im IS gelöscht, FE-Cache und typo3conf-Cache gelöscht, BE-Logout, FE-Reload im Browser, herumklicken im FE, Suche nach Sachen die definitiv NICHT im IS landen sollen und - schon wieder sind sie drin :(
Hier als Beispiel eine Zeile aus der Tabelle aus Web>Info:"Indexed Search":
Content:
"Sitemap header mainmenu nav Home search login No login? Register now! Forgot your password? Sitemap Home"
Words:
"content forgot header home last login mainmenu nav no now page password register search sitemap this updated was your"
so Sachen wie "No login?" und "Register now!" kommen aus dem a-Bereich, welcher DEFINITIV AUSSERHALB von TYPO3SEARCH_ liegt und via TS erzeugt wird. Die anderen Seiten mit a-Bereich enthalten ebenfalls diese Wörter
>> Verwunderlich ist auch, dass die Seite bereits indiziert wird, obwohl ich als BE-User noch eingeloggt bin. Nach dem was ich sonst gelesen habe sollte IS warten bis keiner mehr im BE angemeldet ist bevor es anfängt die Seiten durch Aufruf zu indizieren.
>
>Davon habe ich noch nie gehört, was hätte das überhaupt für ein Sinn?
>Stell dir vor auf einer Seite wird non-stop gearbeitet, wird die dann
>nie volltext-durchsuchbar? Wäre ein etwas komisches "Feature". :)
öööööh. Witzigerweise finde ich dazu nun auch nichts mehr in meinen 8000+ Mails und 230MB Doku... o_O
Ich stelle diesen einen Aspekt mal zurück :P
Dirk
More information about the TYPO3-german
mailing list