[Typo3-german] Chinesische Seite mit Typo3 ?????

Michael Stucki michael at typo3.org
Wed Dec 14 08:51:20 CET 2005


Hallo Elmar,

>> Wie aufopfernd!
> 
> Na, Du greifst wenigstens hin und wieder eine "Spende" für Deine Arbeit
> zu TYPO3 ab!   ;-)

Die Spenden halten sich sehr in Grenzen bzw. liegen zur Zeit bei 0.
Das war bereits vor der Gründung der Association so, mittlerweile ist die
allgemeine Einstellung wohl noch stärker verbreitet, die Arbeit sei mit den
100 Euros an die Association getan.

> Man muss hin und wieder darauf hinweisen, daß die Hilfe hier aber
> komplett ehrenamtlich ist. Dafür bekommt wohl keiner was. Bin immer
> ziemlich angenervt, wenn Leute wie selbstverständlich Hilfe von der
> Community erwarten und sich am Ende auch noch beschweren, daß der
> Service nicht stimmt.
> 
> Das bezieht sich jetzt in keiner Weise auf Tom. Lieber vorbeugen als
> sich nachher ärgern.

Da hast Du natürlich schon recht, war ja auch kein Vorwurf meinerseits.
Bloss halt ein kleiner Wink (an wen auch immer)...

>> Wir (http://www.snowflake.ch/) haben kürzlich für einen Kunden eine
>> bestehende Latin1-Seite vollständig nach UTF-8 konvertiert und
>> anschliessend einen chinesischen Bereich (= mit chinesischen Zeichen,
>> logischerweise) hinzugefügt.
>> 
>> Meine Erfahrungen dabei:
>> 
>> 1. Das Umwandeln der Datenbank war mit Hilfe einer Extension recht
>> einfach, aber trotzdem zeitaufwändig.
> 
> Das mit einer Extension mag gehen, solang man sicher sein kann, daß nur
> ein Zeichensatz in der Datenbank liegt. Wenn ich mir das aber mit
> gemischten Zeichensätzen vorstelle!! In tt_content hätte ich noch einen
> Anhalt, welche Sprache => Zeichensatz im jeweiligen Datenbanksatz liegt.
> Aber in den vielen weniger gut dokumentiereten Tabellen?

Hast recht. config.renderCharset sort wahrscheinlich für ein mittleres Chaos
in der DB, darum ist forceCharset auf jeden Fall empfehlenswerter.

Mit ein wenig Zusatzaufwand sollte es trotzdem möglich sein, diese Inhalte
irgendwie nach UTF-8 zu wandeln:

- sys_template auslesen um von jeder Seite das Render-Charset zu wissen
- jede Tabelle anhand pid[charset] nach UTF-8 wandeln

Da ich aber generell immer nur 1 Charset pro DB verwende habe ich keine
fertige Lösung dafür parat.

> Eine automatische Konversionsextension wäre toll. Ich wollte für ihr
> Funktionieren nicht ohne Weiteres geradestehen.

Sollte mit ein wenig Anpassung (siehe oben) an meiner vorhandenen Extension
möglich sein.

>> Mit Hilfe von "mysqldump --default-character-set=..." und anschliessendem
>> Neuimport (ungetestet) sollte man mittlerweile aber viel einfacher eine
>> ganze DB konvertieren können.
> 
> Hmm. Leider ungetestet.

Es wird aber funktionieren, siehe
http://www.issociate.de/board/post/142472/utf-8_und_mysqldump.html,
Kommentar #504258.

> Woran orientiert sich "mysqldump --default-character-set=...", wenn in
> tt_content ganz unterschiedliche Zeichensätze abgelegt sind?  Ich kann
> mir das jetzt ohne weitere Aufklärung erst einmal schwerlich vorstellen.

Bei gemischten Zeichensätzen kannst Du mysqldump wohl kaum verwenden, siehe
oben.

>> 2. Sämtliche Email-Funktionen sind/waren noch überhaupt nicht
>> UTF-8-ready, teilweise ist ISO-8859-1 in den Mail-Headern sogar noch
>> hardcodiert. Bernhards kb_mailcs Extension ist ein kleiner Schritt zur
>> Lösung, gewisse Probleme (z.B. t3lib_div::quoted_printable()) sind aber
>> immer noch falsch.
> 
> Das ist ein wichtiger Hinweis. Wie machen das die vielen russischen
> TYPO3 Seiten?

Gute Frage. Wahrscheinlich verwenden sie einfach keine Sonderzeichen im
Header, oder denn sie verzichten auf QP-Header, was jedoch laut RFC nicht
erlaubt ist und (viel wichtiger) auch wirklich von vielen Mailclients nicht
akzeptiert wird.

>> 3. Viele Extensions haben noch locallang- sowie Template-Files, die
>> _nicht_ in UTF-8 kodiert sind. Eine Lösung hierfür habe ich ebenfalls in
>> Arbeit.
> 
> Im ExtDevEval ist doch eigentlich schon ein Tool drin, das nach
> locallang*.xml konvertiert.

Du müsstest jede bestehende Extension anpassen, mein Lösungsansatz ist
einfacher:

Definiere gleich am Anfang des Files den Character-Set. Das geht sowohl mit
HTML/TMPL, CSS, XML wie auch mit PHP Files.

TYPO3 berücksichtigt dann jeweils diese Angaben und wandelt den Inhalt nach
UTF-8 um.

- michael
-- 
Use a newsreader! Check out
http://typo3.org/community/mailing-lists/use-a-news-reader/



More information about the TYPO3-german mailing list