[TYPO3-german] mal wieder: crawler konfigurieren (log läuft voll?)

Daniel Becker dtbecker at web.de
Mon Oct 22 23:53:13 CEST 2007


Da es sonst niemand macht, antworte ich mir selbst, denn ich habe es  
inzwischen herausgefunden....


> läuft bei mir inzwischen der crawler (für indexedsearch) ganz
> wunderbar. Ich rufe minütlich das Skript
> cli_dispatch.phpsh crawler auf, um die queue abzuarbeiten, und
> wöchentlich das Skript cli_dispatch.phpsh crawler_im (mit diversen
> Parametern) auf, um eine neue queue zu erstellen.
>
> Es bleibt ein Restproblem (das letzte verbliebene):
> Unter Info -> Site crawler -> crawler log gibt es ja eine Liste der
> jobs, die erledigt wurden. Ich hatte gehofft, dass die durch das
> crawler_im Skript zurückgesetzt wird, aber das ist nicht so. Somit
> wird diese LIste immer voller und die einzige Kur ist es, im BE von
> Hand "flush entries" zu wählen.
>
> Gibt es die Möglichkeit, crawler_im oder ein anderes Skript so
> aufzurufen, dass dieses Log geleert wird? Ist das nicht ein Problem,
> wenn diese Liste immer länger wird? Ich habe schon versucht, dass aus
> den diversen crawler-php's zu lesen, aber ....

Dieses log wird in die Tabelle tx_crawler_queue geschrieben. Wenn man  
ein Skript wie dieses
#!/bin/bash
mysql –user=DERUSERNAME –password=DASPASSWORT – 
database=DERDATENBANKNAME -e ‘TRUNCATE TABLE tx_crawler_queue’

in die cronjobs mitaufnimmt, am besten kurz bevor man die queue neu  
erstellt, dann wird diese Tabelle geleert und man muss das nicht von  
Hand machen.

Vielleicht hilft es jemandem, der es auch beunruhigend findet, wenn  
diese Tabelle immer voller wird…

Daniel





More information about the TYPO3-german mailing list