[TYPO3-german] [OT] google / tt_news / indexed_search & duplicate Content
Daniel Gercke
gercke at hnm.de
Fri Apr 21 13:40:05 CEST 2006
Hi Liste,
am 24.11.2004 hat Andreas Fritz schon einen ähnlichen Post verfasst,
aber soweit ich sehen konnte bisher keine Antworten erhalten. Daher
versuche ich das ganz nochmal aufzurollen.
Folgende Problematik:
Auf der Seite gibt es einen News Teaser, der aus verschiedenen
Kategorien die aktuellsten News anzeigt. Des weiteren es gibt einige
News Seiten, teilweise mit mehr als einer Kategorie, teilweise nur eine
Kategorie, und es gibt hierfür auch entsprechende Archive.
Mal abgesehen von den Archiven setzt sich ja eine Link zur Detailansicht
der News dann so zusammen:
http://meinedomain.xx/index.php?id=253&tx_ttnews[tt_news]=237&tx_ttnews[backPid]=2&cHash=bd27bb5d3c
Je nach verwendeter URL umschreibung kann der Aufbau der URL etwas
anders ausseehen, das Problem beleibt aber gleich. Durch die Übergabe
der Backlinks und des cHash Parameters kommen so für eine News mehrere
Detailansichten zustande. Dies passiert auch bei SimulateStatic oder
RealUrl, da die Parameter in den Pfad der Seite einfliessen. So entsteht
bei RealUrl z.B. so etwas:
http://meinedomain.de/unterseite/aktuelles/nachrichten/nachricht/1345dfc20c/wohnungsdatenbank/zeitung.html
http://meinedomain.de/unterseite/aktuelles/nachrichten/nachricht/9ed3a57372/aktuelles/zeitung.html
Sehr schönes Beispiel:
http://www.google.de/search?q=site:www.fli.bund.de+%22Der+Steinmarder+stamme&hl=de&lr=lang_de&filter=0
Das ganze wird noch eine Nummer schärfer, wenn die News ins Archiv
wandert, oder es so viele News gibt, das der Page Browser ins Spiel
kommt, denn dann kommen weitere Parameter hinzu (z.B.
tx_ttnews[pointer]). Je älter die News wird, desto weiter wandert sie
natürlich im Pagebrowser nach hinten, wodurch sich logischerweise
weitere "identische" Seiten ergeben.
Wenn ich das duplicate Content Konzept von Google richtig verstanden
habe, dann wären das alles Seiten die als duplicate Content gelten, und
demzufolge möglicherweise durch Google bestraft werden.
Wie habt ihr dieses Problem gelöst? Ich will nicht unbedingt diese
Seiten von der Indizierung ausschliessen. Oder ist ein anderer Backlink
möglicherweise schon genügend "anderer Content"?
Das Problem setzt sich dann weiter fort, wenn man die indexed_search
auch über die Newsseiten verwendet, da dann hier auch die selbe News
mehrfach indiziert wird, aufgrund der unterschiedlichen Parameter. Dies
ist natürlich nicht gewollt. Das einzige wirklich hilfreiche was mir
hierzu eingefallen ist, ist die News nicht mit indexed search zu
indizieren, aber das kann ja nicht der Weisheit letzter Schluss sein.
Bitte helft mir hier mal etwas auf die Sprünge!
--
Mit freundlichem Gruß
Daniel Gercke
programmierung . system managements
--
haus neuer medien GmbH . agentur fuer neuen antrieb
.
Tel 03834 8313 0 . Fax 8313 13 . info at hnm.de . www.hnm.de
Wolgaster Strasse 146 (Ollmannsche Villa) . 17489 Greifswald
.
Tel 040 2384 4630 . Fax 4154 6520 . Osterstrasse 124 . 20255 Hamburg
.
AG Stralsund HRB 5089 . Geschaeftsfuehrer RA Daniel Scheibner
.
--
[Diese Nachricht gilt als frei von Viren und gefaehrlichen Dateianhaengen.
Schutz vor Viren und Spam von haus neuer medien. Bei Fragen oder Interesse Kontakt ueber mailscanner at hnm.de oder 03834 83130.]
More information about the TYPO3-german
mailing list