[TYPO3-german] Serverseinstellungen utf-8 -> Suche Umlaute (yatse)
David Bruchmann
david at bruchmann-web.de
Wed Sep 8 12:16:33 CEST 2010
Am 08.09.2010 08:31, schrieb Marc Bastian Heinrichs:
> Ein Unterschied fürs Deutsche zwischen
> utf8_general_ci und utf8_unicode_ci besteht lediglich beim ß.
>
> utf8_general_ci: ß = s / utf8_unicode_ci: ß = ss
>
> Die Umlaute werden gleich behandelt und daher das Ä auch bei
> utf8_general_ci bei A einsortiert. Entspricht auch der eigenen Erfahrung
> und ist nachlesbar unter
> http://dev.mysql.com/doc/refman/5.1/de/charset-unicode-sets.html
>
> Wenn dies in Kauf genommen werden kann, sollte also utf8_general_ci
> benutzt werden, weil die benutzte Sortierfolge schneller ist.
Hallo Marc Bastian,
danke für den Hinweis und den Link.
Bei der Sortierung habe ich mich bzgl. der deutschen Umlaute geirrt - sorry.
Wenn's um Abwägung zwischen Performance und Qualität geht ist sicher die
Art und Anzahl der Sprachen nicht ganz unerheblich, die in der Datenbank
gespeichert werden sollen - bei einsprachigen Websites reicht ja auch
ein ASCII-Setup.
Folgendes wollte ich noch erwähnen, auch falls es Allen klar sein sollte:
Ich habe keinen Hinweis darauf gefunden, daß Ä wie Ae interpretiert wird.
Das ist generell bei fehler-, bzw. schreibweisentoleranter Sortierung zu
berücksichtigen weil sich daraus folgendes Bild, nämlich daß für die
adäquaten Schreibweisen Ä und AE an zwei verschiedenen Stellen gesucht
werden muß und hier scheinbar generell keine Übereinstimmung in Unicode
gemappt wird:
AA
...
AAD
AAE
AAF
...
AÄ
...
AD
AE
AF
...
AY
AZ
...
ÄA
ÄÄ
...
ÄAD
ÄAE
ÄAF
...
ÄD
ÄE
ÄF
...
ÄZ
Gruß,
David
More information about the TYPO3-german
mailing list