[TYPO3-german] [OT] google / tt_news / indexed_search & duplicate Content

Daniel Gercke gercke at hnm.de
Fri Apr 21 13:40:05 CEST 2006


Hi Liste,

am 24.11.2004 hat Andreas Fritz schon einen ähnlichen Post verfasst, 
aber soweit ich sehen konnte bisher keine Antworten erhalten. Daher 
versuche ich das ganz nochmal aufzurollen.

Folgende Problematik:

Auf der Seite gibt es einen News Teaser, der aus verschiedenen 
Kategorien die aktuellsten News anzeigt. Des weiteren es gibt einige 
News Seiten, teilweise mit mehr als einer Kategorie, teilweise nur eine 
Kategorie, und es gibt hierfür auch entsprechende Archive.

Mal abgesehen von den Archiven setzt sich ja eine Link zur Detailansicht 
der News dann so zusammen:

http://meinedomain.xx/index.php?id=253&tx_ttnews[tt_news]=237&tx_ttnews[backPid]=2&cHash=bd27bb5d3c

Je nach verwendeter URL umschreibung kann der Aufbau der URL etwas 
anders ausseehen, das Problem beleibt aber gleich. Durch die Übergabe 
der Backlinks und des cHash Parameters kommen so für eine News mehrere 
Detailansichten zustande. Dies passiert auch bei SimulateStatic oder 
RealUrl, da die Parameter in den Pfad der Seite einfliessen. So entsteht 
bei RealUrl z.B. so etwas:

http://meinedomain.de/unterseite/aktuelles/nachrichten/nachricht/1345dfc20c/wohnungsdatenbank/zeitung.html
http://meinedomain.de/unterseite/aktuelles/nachrichten/nachricht/9ed3a57372/aktuelles/zeitung.html

Sehr schönes Beispiel:

http://www.google.de/search?q=site:www.fli.bund.de+%22Der+Steinmarder+stamme&hl=de&lr=lang_de&filter=0

Das ganze wird noch eine Nummer schärfer, wenn die News ins Archiv 
wandert, oder es so viele News gibt, das der Page Browser ins Spiel 
kommt, denn dann kommen weitere Parameter hinzu (z.B. 
tx_ttnews[pointer]). Je älter die News wird, desto weiter wandert sie 
natürlich im Pagebrowser nach hinten, wodurch sich logischerweise 
weitere "identische" Seiten ergeben.

Wenn ich das duplicate Content Konzept von Google richtig verstanden 
habe, dann wären das alles Seiten die als duplicate Content gelten, und 
demzufolge möglicherweise durch Google bestraft werden.

Wie habt ihr dieses Problem gelöst? Ich will nicht unbedingt diese 
Seiten von der Indizierung ausschliessen. Oder ist ein anderer Backlink 
möglicherweise schon genügend "anderer Content"?

Das Problem setzt sich dann weiter fort, wenn man die indexed_search 
auch über die Newsseiten verwendet, da dann hier auch die selbe News 
mehrfach indiziert wird, aufgrund der unterschiedlichen Parameter. Dies 
ist natürlich nicht gewollt. Das einzige wirklich hilfreiche was mir 
hierzu eingefallen ist, ist die News nicht mit indexed search zu 
indizieren, aber das kann ja nicht der Weisheit letzter Schluss sein.

Bitte helft mir hier mal etwas auf die Sprünge!

-- 
Mit freundlichem Gruß


Daniel Gercke

programmierung . system managements

--
haus neuer medien GmbH . agentur fuer neuen antrieb
.
Tel 03834 8313 0 . Fax 8313 13 . info at hnm.de . www.hnm.de
Wolgaster Strasse 146  (Ollmannsche Villa) . 17489 Greifswald
.
Tel 040 2384 4630 . Fax 4154 6520 . Osterstrasse 124 . 20255 Hamburg
.
AG Stralsund HRB 5089 . Geschaeftsfuehrer RA Daniel Scheibner
.
-- 
[Diese Nachricht gilt als frei von Viren und gefaehrlichen Dateianhaengen.
Schutz vor Viren und Spam von haus neuer medien. Bei Fragen oder Interesse Kontakt ueber mailscanner at hnm.de oder 03834 83130.]




More information about the TYPO3-german mailing list