[TYPO3-german] Glossar mit Autotagging
bernd wilke
x00nsji02 at sneakemail.com
Wed Oct 29 22:04:22 CET 2008
Am Wed, 29 Oct 2008 09:52:15 +0100 schrieb Jochen Rau:
> Hallo Manfred,
[...]
> Contagged bietet noch ein paar Sachen mehr (z.B. findet es auch mit
> Bindestrich verbundene Begriffe; außerdem können einzelne Äste oder
> Seiten des Seitenbaums aus- bzw. eingeschlossen werden).
>
>> Und ich parse das Dokument im DOM mit JavaScript, ich will ganz sauber
>> über das DOM und nicht über den HMTL-Code noch in TYPO3 gehen. Vortei:
>> ich erwische alles, kann aber durch meinen Node- und Class-Filter
>> ungewolltes ausblenden! Gerade das, was Jochen unten im Wiki als
>> Problematik beim Parsen beschreibt, konnte ich mit meiner Methode
>> umgehen. Der Parser findet alle Texte und ihre Wörter zuverlässig, ich
>> hatte bis dato keine Ausreisser, dass irgendein Tag zerhackt worden
>> wäre, und durch das neu Taggen über das DOM ist hier auch alles sehr
>> sauber und wenig fehleranfällig. Die Hautparbeit steck wirklich im
>> JS-Parser, der hat mich echte Nerven gekostet, das Drumherum und die
>> Anbindung als Extension ist an dieser Stelle nur Beiwerk.
>
> Das Parsen des 'fertigen' HTML-Dokuments hat den entscheidenden
> Nachteil, dass man jegliche Information über den Ursprung (z.B. Uid des
> tt_news-Datensatzes) verliert.
>
> Die Problematik, die ich beschreibe, betrifft die a21glossary, die eben
> mit einem Regulären Ausdruck die komplett fertige HTML-Seite parst. Ich
> bin ein Fan von Regulären Ausdrücken, aber das würde ich mir nicht
> antun, dafür einen passenden Ausdruck zu schreiben ;-)
nur mal so als Idee:
könnte man die Suche evtl. mit HTML-Lommentaren als Markern ähnlich wie
bei indexed search auf Teile der generierten Webseite einschränken?
bernd
--
http://www.pi-phi.de/t3v4/cheatsheet.html
More information about the TYPO3-german
mailing list