[TYPO3-german] indexed_search: Findet nicht sichtbare/gelöschte Inhalte

Martin Schulz msc at avenit.de
Thu Jul 7 11:16:30 CEST 2016


Hallo,

Problem:

Wenn Datensätze (Seiten, Datensätze anderer Art  z.B. News,Event ...) im FE nicht mehr sichtbar sind, werden sie nicht aus dem Index gelöscht und sind weiterhin sichtbar, wobei die Verlinkung bei den Suchergebnissen dann einen 404 Fehler wirft. 

Frage:

Gibt es eine "elegante" Lösung die so alte Datensätze aus dem Index löscht?



Folgende Lösungen sind mit bekannt, sie sind jedoch als nicht "elegant" einzustufen. Es scheint mir auch kein super spezielles Problem, daher frage ich mich, ob es da nicht schon was von indexed_search oder ratiopharm gibt?!?!

1) Manuelles Löschen im BE (Info->Indexed Search). Ist bei größeren Detailseiten mit hunderten Datensätzen in zig Sprachen nicht praktikabel.

2) Irgend ein Hook im BE der beim Ändern/Löschen eines Datensatzes ggf. Inizees löscht. Ist nicht sicher, da der Datensatz nicht definiert wo er angezeigt wird und welche Seite daher aus dem Index zu löschen ist. Eine News z.B. wird nicht nur auf der Detailseite angezeigt sondern auch noch als Quer-Verlinkung im Produktbereich, auf der Startseite oder wo auch immer. Weiterhin löst es nicht das Problem der automatischen "Deaktivierung" von Datensätzen durch die Sichtbarkeitseinstellungen, die keinerlei Hook triggert.

3) Irgendein Cron, der alte Datensätze auf Basis einer Konfiguration löscht. Ist nicht sicher, da ein Eintrag im Index sehr wohl schon sehr alt sein kann aber trotzdem valide, da er z.B. nicht regelmäßig im FE angesurft wird und somit nicht regelmäßig aktualisiert wird. Eine passende Zeit zu definieren, die alte Einträge nicht zu lang im Index lässt, aber trotzdem keine Einträge löscht die eben nur länger nicht neu-indiziert wurden, ist fast unmöglich.

4) Verwendung des Crawlers in Verbindung mit einem vorherigen Flush des Index. Unschön und unnötig, da bei großen mehrsprachigen Projekten damit einer wiederkehrende unnötige Last auf dem Server entsteht und auch regelmäßig für eine Zeit X die Suche im FE keine oder unvollständige Ergebnisse anzeigt. Bei internationalen Seiten gibt es hier nicht wirklich ein gutes Zeitfenster.


Bei so einer alteingessenen Extension muss es doch eine elegante Lösung geben den Index konsistent zu halten ?!!? Weiß jmd Rat oder kann einer der o.g. Lösungen empfehlen?


More information about the TYPO3-german mailing list