[Typo3-german] IndexedSearch indiziert trotz TYPO3SEARCH_ zu viel

typo3user at gmx.net typo3user at gmx.net
Wed Nov 9 14:00:49 CET 2005


>> Ich habe eine Seite die aus divs aufgebaut ist, von der Struktur her so:
>> [body]
>>   [div id="container"]
>>     [div id="a"]content für a[/div]
>>     [div id="b"]
>> [!--TYPO3SEARCH_begin--]
>>       content für b
>> [!--TYPO3SEARCH_end--]
>>     [/div]
>>   [/div]
>> [/body]
>
>Ich gehe davon aus, du hast "<>" statt "[]" genutzt, dann sollte das in
>der Form schon passen.

ja natürlich; ist nur so, dass manche Mailreader einen Anfall bekommen wenn sie gültige HTML-Tags vorfinden und mir die Kommentare wichtig waren

>> Ist:
>> - IndexedSearch indiziert sowohl b als auch a, trotz der Angabe der TYPO3SEARCH_-Grenzen. Wenn man beispielsweise nach einem Seitentitel wie er im Seitenmenu (mit TS in a erzeugt) vorkommt, so werden *alle* Seiten aufgelistet, da in allen der a-Bereich 
vorkommt 
>> und überall dieser Titel drinsteht
>
>Vielleicht wurde die Seite gar nicht neu indiziert nach Template
>Änderung? Schau mal im Web>Info>, dort auf eine Seite gehen, und in der
>Selektbox "Indexsuche" auswählen. Da sieht mal ziemlich genau, welche
>Wörter auf der Seite indiziert wurden. Und viel schöner: Du kannst das
>Ergebnis der Indizierung verwerfen.

Du meinst Web>Info:"Indexed Search"?

Habe darüber schon seitenweit den Datenbestand des IS gelöscht (rot hinterlegter Mülleimer); ein Klick auf eine FE-Seite und *schwuppz* wieder ist sie im IS

>Nicht vergessen alle möglichen Caches zu leeren. Dann nochmal auf die
>Seite browsen und sehen, ob sich was geändert hat.

habe nochmal alle Seiten im IS gelöscht, FE-Cache und typo3conf-Cache gelöscht, BE-Logout, FE-Reload im Browser, herumklicken im FE, Suche nach Sachen die definitiv NICHT im IS landen sollen und - schon wieder sind sie drin :(

Hier als Beispiel eine Zeile aus der Tabelle aus Web>Info:"Indexed Search":
Content:
"Sitemap header mainmenu nav Home search     login       No login?  Register now! Forgot  your password? Sitemap Home"
Words:
"content forgot header home last login mainmenu nav no now page password register search sitemap this updated was your"

so Sachen wie "No login?" und "Register now!" kommen aus dem a-Bereich, welcher DEFINITIV AUSSERHALB von TYPO3SEARCH_ liegt und via TS erzeugt wird. Die anderen Seiten mit a-Bereich enthalten ebenfalls diese Wörter

>> Verwunderlich ist auch, dass die Seite bereits indiziert wird, obwohl ich als BE-User noch eingeloggt bin. Nach dem was ich sonst gelesen habe sollte IS warten bis keiner mehr im BE angemeldet ist bevor es anfängt die Seiten durch Aufruf zu indizieren.
>
>Davon habe ich noch nie gehört, was hätte das überhaupt für ein Sinn?
>Stell dir vor auf einer Seite wird non-stop gearbeitet, wird die dann
>nie volltext-durchsuchbar? Wäre ein etwas komisches "Feature". :)

öööööh. Witzigerweise finde ich dazu nun auch nichts mehr in meinen 8000+ Mails und 230MB Doku... o_O
Ich stelle diesen einen Aspekt mal zurück :P


Dirk






More information about the TYPO3-german mailing list