[TYPO3-german] Serverseinstellungen utf-8 -> Suche Umlaute (yatse)

David Bruchmann david at bruchmann-web.de
Wed Sep 8 12:16:33 CEST 2010


  Am 08.09.2010 08:31, schrieb Marc Bastian Heinrichs:
> Ein Unterschied fürs Deutsche zwischen
> utf8_general_ci und utf8_unicode_ci besteht lediglich beim ß.
>
> utf8_general_ci: ß = s / utf8_unicode_ci: ß = ss
>
> Die Umlaute werden gleich behandelt und daher das Ä auch bei
> utf8_general_ci bei A einsortiert. Entspricht auch der eigenen Erfahrung
> und ist nachlesbar unter
> http://dev.mysql.com/doc/refman/5.1/de/charset-unicode-sets.html
>
> Wenn dies in Kauf genommen werden kann, sollte also utf8_general_ci
> benutzt werden, weil die benutzte Sortierfolge schneller ist.

Hallo Marc Bastian,

danke für den Hinweis und den Link.
Bei der Sortierung habe ich mich bzgl. der deutschen Umlaute geirrt - sorry.

Wenn's um Abwägung zwischen Performance und Qualität geht ist sicher die 
Art und Anzahl der Sprachen nicht ganz unerheblich, die in der Datenbank 
gespeichert werden sollen - bei einsprachigen Websites reicht ja auch 
ein ASCII-Setup.

Folgendes wollte ich noch erwähnen, auch falls es Allen klar sein sollte:
Ich habe keinen Hinweis darauf gefunden, daß Ä wie Ae interpretiert wird.
Das ist generell bei fehler-, bzw. schreibweisentoleranter Sortierung zu 
berücksichtigen weil sich daraus folgendes Bild, nämlich daß für die 
adäquaten Schreibweisen Ä und AE an zwei verschiedenen Stellen gesucht 
werden muß und hier scheinbar generell keine Übereinstimmung in Unicode 
gemappt wird:

AA
...
AAD
AAE
AAF
...
AÄ
...
AD
AE
AF
...
AY
AZ
...
ÄA
ÄÄ
...
ÄAD
ÄAE
ÄAF
...
ÄD
ÄE
ÄF
...
ÄZ


Gruß,
David



More information about the TYPO3-german mailing list