[TYPO3-german] Umlaute auf der Website

Peter Linzenkirchner peter at linzenkirchner.de
Fri Jul 28 12:05:29 CEST 2006


Hallo Andreas:

Am 28. Jul 2006 um 11:38 schrieb andreas.gehrke:

> Hallo Peter,
>
>> Werden die Umlaute im Browser denn falsch dargestellt?
>
> auf einem deutschen Betriebssystem natürlich nicht, da das ja auch auf
> iso-8859-1 läuft. Auf einem amerikanischen oder japanischen oder  
> türkischen
> oder ... aber schon.

Auf jedem. Bzw. auch jedem, auf dem ein Browser läuft, der in den  
letzten 5 bis 8 Jahren programmiert wurde. Der erkennt nämlich im  
Header die Codierung iso8859-1 und verwendet die passende  
Kodiertabelle. Und die enthält in jedem Fall die deutschen Umlaute.

> Aber okay, wenn das w3c konform ist mache ich nichts weiter und  
> freue mich.
> Ist ja eh eine deutschsprachige seite. Bisher ging ich jedoch immer  
> davon
> aus, dass umlaute im html-quelltext nicht nur hässlich aussehen  
> sondern auch
> nicht standard konform sind.

Das stimmt nicht. Sie sehen erheblich besser aus (oder kannst du  
Entities besser lesen als Umlaute?) und sie sind standardkonform.

> Wenn ich dich richtig verstehe muss ich einfach nur alles auf utf-8
> umstellen und typo macht mir entities draus?

Nein, dann macht Typo3 praktisch überhaupt keine Entities mehr, nicht  
mal, wenn du japanische Schriftzeichen verwendest.

Das Problem ist ein Verständnisproblem:

Der Browser liest im Header, welche Kodierung eingestellt ist.
Danach sucht er, ob er eine Kodiertabelle hat. Hat er in der Regel,  
wenn ere korrekt installiert wurde.
Danach stellt er alle Zeichen, die in dieser Kodiertabelle sind,  
korrekt dar. Alle _anderen_ Zeichen, die nicht in der Kodiertabelle  
enhalten sind, würde er falsch darstellen. Deshalb müssen diese  
Zeichen (und nur diese) in Entities dargestellt werden.

Wie du in meinem Link sehen kannst, sind die meisten Sonderzeichen  
der europäischen Zeichen in iso8859-1 enthalten. Im Detail:
Alle Zeichen, die in der Grundtabelle iso8859:
   http://de.selfhtml.org/inter/zeichenkodierungen.htm
enthalten sind und alle Zeichen, die in der erweiterten Tabelle -1  
enthalten sind:
   http://de.selfhtml.org/inter/zeichenkodierungen.htm#iso8859_liste
werden nicht in Entities umgewandelt, da diese immer korrekt  
dargestellt werden. Prinzipiell auf jedem Betriebssystem, aber  
natürlich nur sofern Schriften geladen sind, die diese Zeichen auch  
enthalten. Das trifft aber auf Windows ab 95 und Mac OS X ab Vs. 1 zu  
automatisch zu; ausserdem wäre das Problem natürlich auch bei  
Entities gegeben. Wer keine japansiche Schrift geladen hat (oder eine  
Schrift mit japanischen Zeichen), kann keine japanischen Zeichen  
darstellen, weder utf-8 kodiert noch als Entity.

utf-8 ist die größte Kodiertabelle.
   http://de.selfhtml.org/inter/unicode.htm
Sie enthält 64.000 Zeichen (stimmt das? ich weiss die genaue Zahl  
nicht, aber es sind sehr sehr viele :-)) Und wieder werden nur die  
Zeichen kodiert, die dort nicht enhalten sind. Also praktisch gar  
keines mehr.

Entities müssen nur noch in Ausnahmefällen gesetzt werden. Nätürlich  
müssen die Steuerzeichen immer maskiert werden: <> & und so weiter;  
ausserdem typgrafische Zeichen wie kleine/große Leerzeichen, der  
Halb- oder Geviertstrich und so weiter. Und das Euro-Zeichen meines  
Wissens, das ist auch nicht in iso8859-1 enthalten.


Viele Grüße
Peter Linzenkirchner

-- 
-----------------------------------------------
Peter Linzenkirchner
Lisardo Multimedia GmbH
http://www.lisardo.biz/
Herrenbachstraße 19, 86161 Augsburg
Tel. ++49-821-150565, Fax ++49-821-150595
-----------------------------------------------





More information about the TYPO3-german mailing list