[TYPO3-german] Glossar mit Autotagging

Wed Oct 29 22:04:22 CET 2008

Am Wed, 29 Oct 2008 09:52:15 +0100 schrieb Jochen Rau:

> Hallo Manfred,
[...]
> Contagged bietet noch ein paar Sachen mehr (z.B. findet es auch mit
> Bindestrich verbundene Begriffe; außerdem können einzelne Äste oder
> Seiten des Seitenbaums aus- bzw. eingeschlossen werden).
> 
>> Und ich parse das Dokument im DOM mit JavaScript, ich will ganz sauber
>> über das DOM und nicht über den HMTL-Code noch in TYPO3 gehen. Vortei:
>> ich erwische alles, kann aber durch meinen Node- und Class-Filter
>> ungewolltes ausblenden! Gerade das, was Jochen unten im Wiki als
>> Problematik beim Parsen beschreibt, konnte ich mit meiner Methode
>> umgehen. Der Parser findet alle Texte und ihre Wörter zuverlässig, ich
>> hatte bis dato keine Ausreisser, dass irgendein Tag zerhackt worden
>> wäre, und durch das neu Taggen über das DOM ist hier auch alles sehr
>> sauber und wenig fehleranfällig. Die Hautparbeit steck wirklich im
>> JS-Parser, der hat mich echte Nerven gekostet, das Drumherum und die
>> Anbindung als Extension ist an dieser Stelle nur Beiwerk.
> 
> Das Parsen des 'fertigen' HTML-Dokuments hat den entscheidenden
> Nachteil, dass man jegliche Information über den Ursprung (z.B. Uid des
>   tt_news-Datensatzes) verliert.
> 
> Die Problematik, die ich beschreibe, betrifft die a21glossary, die eben
> mit einem Regulären Ausdruck die komplett fertige HTML-Seite parst. Ich
> bin ein Fan von Regulären Ausdrücken, aber das würde ich mir nicht
> antun, dafür einen passenden Ausdruck zu schreiben ;-)

nur mal so als Idee:
könnte man die Suche evtl. mit HTML-Lommentaren als Markern ähnlich wie 
bei indexed search auf Teile der generierten Webseite einschränken?

bernd
-- 
http://www.pi-phi.de/t3v4/cheatsheet.html