[TYPO3-UG Dutch] Vreemde tekens bij RSS
Jigal van Hemert
jigal at xs4all.nl
Mon Aug 8 11:45:38 CEST 2011
Hoi,
On 8-8-2011 11:17, Marijn Depraetere wrote:
> Betreffende de charset-discussie. TYPO3 raad UTF-8 aan ALS ook je database
> in UTF-8 staat.
Sinds TYPO3 4.5 gebruikt TYPO3 standaard voor interne zaken UTF-8. Op de
impact hiervan kom ik verderop nog terug.
> T'is ook niet dat de ene charset noodzakenlijk "beter" is dan de
> andere. T'hangt er wat vanaf waarvoor je site moet dienen.
UTF-8 heeft als voordelen:
- alle Unicode tekens (en dat omvat ongeveer alle tekens van alle
natuurlijke talen) zijn te gebruiken
- het is de meest efficiënte codering van unicode
- het is grotendeel compatibel met latin1 (ISO-8859-1, etc.)
Wat is het gevolg van de keuze van tekenset en codering voor een TYPO3
site? Er is een aantal punten waarbij de tekenset van belang is:
- backend (de schermen waar redacteuren teksten invoeren)
- database (opslag van invoer)
- frontend (weergave van content)
Als al deze items dezelfde tekenset gebruiken als TYPO3 intern gebruikt
(UTF-8) dan is er vanzelfsprekend geen enkele conversie nodig. Er zitten
slimme conversie-routines in TYPO3, maar zoals elke bewerking kost ook
dit processortijd.
Door de backend, de database en de frontend in UTF-8 te zetten voorkom
je kostbare conversies in TYPO3 en werkt de site zo snel mogelijk.
Al jaren kunnen browsers en databases perfect omgaan met UTF-8 data, dus
dat kan ook gee bezwaar zijn.
> ISO-8859-1 begrijpt het euro teken, bij UTF-8 moet dat&_euro;
> (zonder _ ) zijn.
Helaas onjuist; ISO-8859-1 [1] bevat geen Euro-teken, Windows-1252 [2]
wel en ook IS-8859-15 [3] bevat een Euro-teken, maar op een andere
positie als Windows-1252.
> Veranderen op een live website van charset is sowieso een slecht
> idee.
In een TYPO3 site valt dit reuze mee. In je HTML templates hoor je geen
teksten te hebben zitten. Als de boel in de juiste tekenset in de
database zit (dus latin1 (bijv. ISO-8859-1) data in latin1 tabellen) dan
is het een kwestie van met een scriptje de database velden te laten
omzetten. Verder kun je in TYPO3 heel goed de frontend, backend en
database-connectie op UTF-8 instellen en de boel is geregeld.
[1] http://en.wikipedia.org/wiki/ISO/IEC_8859-1
[2] http://en.wikipedia.org/wiki/Windows-1252
[3] http://en.wikipedia.org/wiki/ISO/IEC_8859-15
--
Kind regards / met vriendelijke groet,
Jigal van Hemert.
More information about the TYPO3-UG-Dutch
mailing list