[TYPO3-UG Dutch] utf8 *update*
H. Hahn
h.hahn at hahn-informatica.nl
Tue Aug 5 20:06:04 CEST 2008
De eerste keer heb ik de tabellen met de hand omgezet (vreselijk).
Daarbij ontdekte ik dat de database een instelling heeft als default
voor alle nieuw(!) aan te maken tabellen, en dat de instelling van een
tabel weer default is voor nieuw aan te maken kolommen (of zo).
Je moet dus omzetten op tabelniveau (alle relevante kolommen) en op
databaseniveau. Alleen de tabellen omzetten is dus niet voldoende. Een
nieuw aan te maken tabel neemt als defaultinstelling die van de database
over.
De meeste problemen met tekens lijken op te treden met de range
0128-0191 (0x80-0xBF0) in ISO-8859. Wat daarna komt schijnt reeds
compatibel met UTF8 te zijn.
Wie niet bang is om een PHP-scriptje te bakken, kan de reeks 0128-0191
zelf omzetten. PHP heeft daar handige functies voor (al moet ik steeds
opnieuw kijken welke ook weer wat doet).
Een remedie tegen al dit gelazer is om waar mogelijk en zinvol "HTML
entities" te gebruiken (bijv. '„' voor „ (0132) en '”' voor
” (0148). Daarmee klopt het altijd. Die worden pas bij de weergave van
de website door de browser omgezet in de juiste tekens.
Er blijft dan alleen nog een probleempje als je dergelijke tekens (maar
ook de "hogere", zoals umlaut- en accentletters) in je commentaartekst
hebt staan. Die worden dan door een soort wybertje met een vraagteken
weergegeven. Normaal zie je dat alleen in de Vieuw Source, maar de
HTML-validator (ook die plug-in voor Firefox) mekkert erover. (Maar
vreemd genoeg worden exotische tekens, zoals Hebreeuws, weer wel goed
weergegeven, ook in commentaar.)
Enne, bij elke nieuwe site eerst de (nog lege) database op UTF8 zetten.
Zolang T3 zich niet om de charset van de database bekommert en de
defaultinstelling ongemoeid laat, ben je hiermee ook van het gedoe af.
H. Hahn
> Bij sommige sites heb ik de db (alle tabellen) op utf-8 gezet. Maar ik
> merk geen verschil met sites waar ik dat niet gedaan heb.
> Het grootste probleem ondervind ik bij het plakken van tekst uit
> andere bronnen.
> Je krijgt een foutmelding bij het voor de eerste keer opslaan. Dan
> wordt in feite de zaak geconverteerd. Da's dus een goeie indicatie of
> er foute tekens in staan.
> Daarna moet je goed controleren welke tekentjes (kwootjes en accenten)
> in vraagtekens omgezet zijn. Maar het leed is meestal wel te overzien.
>
>
> Met vriendelijke groeten,
>
> Daniel Doesburg
> --
> Word jij mijn collega bij Netcreators?
> http://www.netcreators.com/bedrijf/vacatures/
>
>
>
> dick hoogendijk schreef:
>> On Tue, 05 Aug 2008 13:49:25 +0200
>> "Daniel Doesburg [netcreators]" <daniel at netcreators.com> wrote:
>>
>>> Als ik lieg lieg ik in commissie. Je moet, tenzij je veel chinees
>>> wilt publiceren, deze waarde gewoon op 1 laten staan.
>>> Ik heb daar veel problemen door gehad. En het duurde heel lang voor
>>> ik er achter was dat dit de boosdoener was.
>>
>> Oké, doe ik dat. Heb jij de interne tablestructuur op utf8 laten
>> zetten? Ondervind je daarvan voor- / nadelen?
>>
More information about the TYPO3-UG-dutch
mailing list