[Typo3-german] Import von mehr als 10'000 HTML Seiten in Typo3

christian reiter cr at n-o-s-p-a-m-cxd.de
Thu Jul 14 10:14:32 CEST 2005


Hallo,

ich hatte eine ähnliche Situation mit Seiten aus einem anderen CMS welches
eine völlig andere Struktur hatte.
Erst einmal ist es wichtig sich einen Überblick über die Struktur der
vorhandenen Seiten zu schaffen und wie man den Content strukturiert
importiert bekommt.
Title-Tag, Metatags etc kann man ja gut herausparsen und da die
existierenden Seiten sicherlich irgendeinem Template System folgen wird man
auch die Inhalte herausbekommen. Dort dann am besten gleich den HTML Code
soweit vereinfachen, dass nur die nötigste Auszeichnung zurückbleibt.
(Wahrscheinlich handelt es sich ja um Old-school HTML)
Ein bisschen überlegen muss man mit längeren Seiten, in denen sehr flexibel
Bilder eingebaut sind, die alle in verschiedene Richtungen ausgerichtet
sind - um das eine Bild links und das andere Bild rechts darzustellen, sind
dann 2 tt_content Elemente nötig.
Allgemein würde ich eher dazu neigen, eher etwas zu viele content Elemente
anzulegen als immer alles in eines hineinzumatschen.
Also zB den Inhaltstext aufsplitten nach <Hx> oder was immer für Headlines
benutzt wird, diese jeweils als header eines tt_content Elementes mit
header_layout als Hx und dann den folgenden Text. Das gibt einem dann die
Möglichkeit die einzelnen Elemente auch als Ankerlinks anzusprechen.
Ein wichtiges Thema sind natürlich Links, wenn es viele Querverlinkungen aus
dem Fliesstext zwischen den verschiedenen Seiten gibt, solte man sich auch
überlegen ob man nicht die Arbeit investiert diese auch umzuschreiben. Das
geht natürlich erst, nachdem alle Seiten und content Elemente ihre IDs
erhalten haben, also in einem zweiten Durchlauf nach dem Insert der Pages
und tt_content Elemente. Hier ist es natürlich eine Erleichterung wenn alle
Links absolut sind, dann lässt sich das vernünftig auflösen, da es nach
Import aus einem Dateisystem mit Ordnernamen als basis für die
Seitenstruktur ja auf dem ersten Treelevel jeder name einzigartig sein muss
und innerhalb jedes Baums dann auch nur einzigartige Namen mit der gleichen
pid vorkommen.
Bei >10.000 HTML Seiten lohnt es sich in jedem Fall ziemlich viel Zeit in
das Importskript zu stecken. Wichtig wird sein nicht nur an den einfacheren
Beispielen, was die komplexität der Seitenstruktur angeht, zu testen.

Vielleicht wäre ja sogar darüber nachzudenken, das Skript gleich als Typo3
Extension umzusetzen. Man kann dann ja auch gleich auf einige vorgefertigte
Funktionen zurückgreifen.

grüsse,

Christian Reiter

"Andy Link" <shareit at freemails.ch> schrieb im Newsbeitrag
news:mailman.1.1121292287.23851.typo3-german at lists.netfielders.de...
> Hallo Newsgroup
>
> Ich will mehr als 10'000 HTML Seiten in das Typo3 importieren. Diese sind
in
> einer Ordnerstruktur abgelegt. Der Ordnername ergibt den jeweiligen
> Menupunkt (Knotennamen) im Typo3, die HTML Seiten sind untergeordnete
Pages.
>
> Weil ich nichts gefunden habe, mit dem ich diese Aufgabe einfach
> bewerkstelligen kann, muss ich eine kleine Applikation programmieren, die
> mir diesen Bulk Import vornimmt.
>
> Ich habe die Typo3 DB studiert und gehe davon aus, dass ich für jede Seite
> einen Datensatz in der Tabelle "pages" und einen Eintrag unter
"tt_content"
> erstellen muss. Die Beziehungen werden über die uids und pids gesteuert.
>
> Sieht grundsätzlich nicht so kompliziert aus, fragt sich nur ob das auch
> wirklich so funktioniert. Was muss ich beachten, bei einem solchen Import?
> Wo müssen allenfalls zusätzliche Datensätze angelegt werden? Hat jemand
> schon etwas ähnliches gemacht?
>
> Greets
> Andy
>
>





More information about the TYPO3-german mailing list