[TYPO3-UG Dutch] utf8 *update*

H. Hahn h.hahn at hahn-informatica.nl
Tue Aug 5 20:06:04 CEST 2008


De eerste keer heb ik de tabellen met de hand omgezet (vreselijk). 
Daarbij ontdekte ik dat de database een instelling heeft als default 
voor alle nieuw(!) aan te maken tabellen, en dat de instelling van een 
tabel weer default is voor nieuw aan te maken kolommen (of zo).

Je moet dus omzetten op tabelniveau (alle relevante kolommen) en op 
databaseniveau. Alleen de tabellen omzetten is dus niet voldoende. Een 
nieuw aan te maken tabel neemt als defaultinstelling die van de database 
over.

De meeste problemen met tekens lijken op te treden met de range 
0128-0191 (0x80-0xBF0) in ISO-8859. Wat daarna komt schijnt reeds 
compatibel met UTF8 te zijn.
Wie niet bang is om een PHP-scriptje te bakken, kan de reeks 0128-0191 
zelf omzetten. PHP heeft daar handige functies voor (al moet ik steeds 
opnieuw kijken welke ook weer wat doet).
Een remedie tegen al dit gelazer is om waar mogelijk en zinvol "HTML 
entities" te gebruiken (bijv. '„' voor „ (0132) en '”' voor 
” (0148). Daarmee klopt het altijd. Die worden pas bij de weergave van 
de website door de browser omgezet in de juiste tekens.

Er blijft dan alleen nog een probleempje als je dergelijke tekens (maar 
ook de "hogere", zoals umlaut- en accentletters) in je commentaartekst 
hebt staan. Die worden dan door een soort wybertje met een vraagteken 
weergegeven. Normaal zie je dat alleen in de Vieuw Source, maar de 
HTML-validator (ook die plug-in voor Firefox) mekkert erover. (Maar 
vreemd genoeg worden exotische tekens, zoals Hebreeuws, weer wel goed 
weergegeven, ook in commentaar.)

Enne, bij elke nieuwe site eerst de (nog lege) database op UTF8 zetten. 
Zolang T3 zich niet om de charset van de database bekommert en de 
defaultinstelling ongemoeid laat, ben je hiermee ook van het gedoe af.

H. Hahn
> Bij sommige sites heb ik de db (alle tabellen) op utf-8 gezet. Maar ik 
> merk geen verschil met sites waar ik dat niet gedaan heb.
> Het grootste probleem ondervind ik bij het plakken van tekst uit 
> andere bronnen.
> Je krijgt een foutmelding bij het voor de eerste keer opslaan. Dan 
> wordt in feite de zaak geconverteerd. Da's dus een goeie indicatie of 
> er foute tekens in staan.
> Daarna moet je goed controleren welke tekentjes (kwootjes en accenten) 
> in vraagtekens omgezet zijn. Maar het leed is meestal wel te overzien.
>
>
> Met vriendelijke groeten,
>
> Daniel Doesburg
> -- 
> Word jij mijn collega bij Netcreators?
> http://www.netcreators.com/bedrijf/vacatures/
>
>
>
> dick hoogendijk schreef:
>> On Tue, 05 Aug 2008 13:49:25 +0200
>> "Daniel Doesburg [netcreators]" <daniel at netcreators.com> wrote:
>>
>>> Als ik lieg lieg ik in commissie. Je moet, tenzij je veel chinees
>>> wilt publiceren, deze waarde gewoon op 1 laten staan.
>>> Ik heb daar veel problemen door gehad. En het duurde heel lang voor
>>> ik er achter was dat dit de boosdoener was.
>>
>> Oké, doe ik dat. Heb jij de interne tablestructuur op utf8 laten
>> zetten? Ondervind je daarvan voor- / nadelen?
>>



More information about the TYPO3-UG-dutch mailing list