[TYPO3-UG Dutch] Vreemde tekens bij RSS

Jigal van Hemert jigal at xs4all.nl
Mon Aug 8 11:45:38 CEST 2011


Hoi,

On 8-8-2011 11:17, Marijn Depraetere wrote:
> Betreffende de charset-discussie.  TYPO3 raad UTF-8 aan ALS ook je database
> in UTF-8 staat.

Sinds TYPO3 4.5 gebruikt TYPO3 standaard voor interne zaken UTF-8. Op de 
impact hiervan kom ik verderop nog terug.

> T'is ook niet dat de ene charset noodzakenlijk "beter" is dan de
> andere.  T'hangt er wat vanaf waarvoor je site moet dienen.

UTF-8 heeft als voordelen:
- alle Unicode tekens (en dat omvat ongeveer alle tekens van alle 
natuurlijke talen) zijn te gebruiken
- het is de meest efficiënte codering van unicode
- het is grotendeel compatibel met latin1 (ISO-8859-1, etc.)

Wat is het gevolg van de keuze van tekenset en codering voor een TYPO3 
site? Er is een aantal punten waarbij de tekenset van belang is:
- backend (de schermen waar redacteuren teksten invoeren)
- database (opslag van invoer)
- frontend (weergave van content)
Als al deze items dezelfde tekenset gebruiken als TYPO3 intern gebruikt 
(UTF-8) dan is er vanzelfsprekend geen enkele conversie nodig. Er zitten 
slimme conversie-routines in TYPO3, maar zoals elke bewerking kost ook 
dit processortijd.

Door de backend, de database en de frontend in UTF-8 te zetten voorkom 
je kostbare conversies in TYPO3 en werkt de site zo snel mogelijk.

Al jaren kunnen browsers en databases perfect omgaan met UTF-8 data, dus 
dat kan ook gee bezwaar zijn.

> ISO-8859-1 begrijpt het euro teken, bij UTF-8 moet dat&_euro;
> (zonder _ ) zijn.

Helaas onjuist; ISO-8859-1 [1] bevat geen Euro-teken, Windows-1252 [2] 
wel en ook IS-8859-15 [3] bevat een Euro-teken, maar op een andere 
positie als Windows-1252.

> Veranderen op een live website van charset is sowieso een slecht
> idee.

In een TYPO3 site valt dit reuze mee. In je HTML templates hoor je geen 
teksten te hebben zitten. Als de boel in de juiste tekenset in de 
database zit (dus latin1 (bijv. ISO-8859-1) data in latin1 tabellen) dan 
is het een kwestie van met een scriptje de database velden te laten 
omzetten. Verder kun je in TYPO3 heel goed de frontend, backend en 
database-connectie op UTF-8 instellen en de boel is geregeld.

[1] http://en.wikipedia.org/wiki/ISO/IEC_8859-1
[2] http://en.wikipedia.org/wiki/Windows-1252
[3] http://en.wikipedia.org/wiki/ISO/IEC_8859-15

-- 
Kind regards / met vriendelijke groet,

Jigal van Hemert.


More information about the TYPO3-UG-Dutch mailing list