[TYPO3-german] Extbase-Erweiterung: Suche inkl. pdf

Stephan Schuler Stephan.Schuler at netlogix.de
Thu Feb 17 18:01:10 CET 2011


Hallo Christian.


Es gibt natürlich wie immer mehrere Lösungsansätze für eine Aufgabe, und es kommt dabei darauf an was du eigentlich tun willst.

Zunächst: Ja, das Frontend bei der Indizierung mit einzuspannen *ist* ein Umweg. Schon deshalb, weil PDF-Files auf Seiten die noch nie im Frontend angezeigt wurden auch nicht indiziert werden.

Ich sehe aber zwei Vorteile -- allerdings wird bei dir vermutlich keiner davon zum Einsatz kommen.

1.: Indizierung in Bezug auf Benutzergruppen.
Die Seite im FE wird pro Benutzergruppenkonfiguration (erklären will ich das mal nicht, "pro Benutzergruppe" wäre allerdings falsch, auch wenn das der häufigste Sonderfall davon ist) gecacht. Wenn in diesem Arbeitsschritt die PDF-Files mit indiziert werden erhältst du die Unterscheidung, welche Benutzer das PDF-File auch auf natürlichem Wege im Frontend finden könnten und welche nicht. Das ist zwar keinesfalls ein Sicherheitsmerkmal (die Datei ist natürlich weiterhin über ihren Link verfügbar), es kann aber bei der Einschränkung der Ausgabe der Suchanfrage relevant sein: Ich kann PDF-Files in der Ergebnisliste für Benutzer ausblenden, wenn die Benutzer an die Datei nicht auf anderen Wegen gelangen würden.

2.: Indizierung in Bezug auf Seiten.
Hintergrund dabei ist die Fragestellung, auf welchen Seiten im Frontend die gesuchte Information angezeigt oder verlinkt wird. Im Zusammenhang mit suchmaschinenfreundlichen URLs werden GET-Parameter häufig in den Pfad einer Seite kodiert. Über "http://www.domain.de/news/details/17-02-2011-irgendwas.html" könnte man auf die Seite (im TYPO3-Backend) mit dem Namen "news" gelangen, und "details/17-02-2011-irgendwas.html" könnte die Information "von der tt_news mit der UID 1024 die Detailansicht anzeigen" bedeuten. Wenn du das PDF-File jetzt grundsätzlich auf der Seite "news" anzeigst, trifft das natürlich auch auf "http://www.domain.de/news/details/17-02-2011-irgendwas.html" zu, auch hier wird das PDF-File angezeigt.
Wenn du nun die Information abbilden möchtest, auf welchen Seiten im Frontend dein PDF-File verwendet wird, wirst du nicht um den Frontend-Cache herum kommen. Ein schlichter SQL-Query bei der Indizierung im Backend wird dir nämlich bestenfalls "http://www.domain.de/news.html" liefern -- was zwar richtig ist, aber eben auch deutlich zu wenig.


Gruß,



Stephan Schuler
Web-Entwickler

Telefon: +49 (911) 539909 - 0
E-Mail: Stephan.Schuler at netlogix.de
Internet: http://media.netlogix.de
-----Ursprüngliche Nachricht-----

Von: typo3-german-bounces at lists.typo3.org [mailto:typo3-german-bounces at lists.typo3.org] Im Auftrag von christian oettinger
Gesendet: Donnerstag, 17. Februar 2011 13:33
An: typo3-german at lists.typo3.org
Betreff: Re: [TYPO3-german] Extbase-Erweiterung: Suche inkl. pdf

Hallo Stephan,

vielen Dank für Deine Antwort. Darf ich nochmal nachhaken? Diese Frage ist für mich sehr wichtig: Ich habe einen Datensatz, dem ein pdf zugeordnet ist (und der tatsächlich ausschließlich über das Backend gepflegt wird). Es scheint mir in diesem Fall(!) unnötig kompliziert zu sein, via "Seite" zu denken. Ist es nicht ein Umweg das Frontend-Rendering als Auslöser für die Indizierung zu nehmen?
Aber vermutlich gibt es einen Grund, warum das so üblich ist? Also anders gefragt: Gibt es dabei einen Vorteil den ich nicht sehe? Ist das indizieren eines pdfs komplizierter als ich es mir vorstelle?

Danke für Eure Hilfe und viele Grüße!
christian (oe)




> Hallo Christian.
>
>
> Auch wenn das "der alte Weg" ist, würde ich das wohl trotzdem so machen wie bisher und den "indexing"-Hook in tslib_fe nehmen.
>
> Beim Indizieren einer Seite würde ich die verlinkten PDF-Files auslesen und der Seite zuordnen. So ist pro Benutzergruppe klar, welches PDF-File auf welcher Seite angezeigt wird.
> Eine Datei braucht natürlich nicht mehrfach zu indiziert werden, nur weil sie auf mehreren Seiten auftaucht oder auf einer Seite von mehreren Benutzergruppen gesehen werden kann. Auf der anderen Seite kann sich eine Datei durchaus ändern, ohne dass sich der Dateiname ändert. Deshalb würde ich eine Datei anhand "irgendeiner Prüfsumme" und ihrer externen URL identifizieren.
>
> Wenn bei dir sichergestellt ist, dass deine Dateien zwingend über das TYPO3-Backend hochgeladen werden kannst du die Datei natürlich auch im File-Speichern-Dialog abfangen. Sobald du deinen Benutzern aber FTP-Zugang erlaubst wird das schon schwierig.
>
>
> http://buzz.typo3.org/people/stucki/article/typo3-frontend-rendering-e
> xplained/
> Seiten 7 und 11 im verlinkten PDF.
>
>
> Grüße,
>
>
>
> Stephan Schuler
> Web-Entwickler
>
> Telefon: +49 (911) 539909 - 0
> E-Mail: Stephan.Schuler at netlogix.de
> Internet: http://media.netlogix.de
>
> --
> netlogix GmbH&  Co. KG
> IT-Services | IT-Training | Media
> Andernacher Straße 53 | 90411 Nürnberg
> Telefon: +49 (911) 539909 - 0 | Fax: +49 (911) 539909 - 99
> E-Mail: mailto:info at netlogix.de | Internet: http://www.netlogix.de/
>
> netlogix GmbH&  Co. KG ist eingetragen am Amtsgericht Nürnberg (HRA
> 13338) Persönlich haftende Gesellschafterin: netlogix Verwaltungs GmbH
> (HRB 20634)
> Umsatzsteuer-Identifikationsnummer: DE 233472254
> Geschäftsführer: Stefan Buchta, Matthias Schmidt
>
> -----Ursprüngliche Nachricht-----
>
>
> Von: typo3-german-bounces at lists.typo3.org
> [mailto:typo3-german-bounces at lists.typo3.org] Im Auftrag von Georg
> Ringer
> Gesendet: Dienstag, 15. Februar 2011 17:42
> An: typo3-german at lists.typo3.org
> Betreff: Re: [TYPO3-german] Extbase-Erweiterung: Suche inkl. pdf
>
> Am 15.02.2011 15:01, schrieb christian oettinger:
>> Beim Speichern im Backend wird das pdf per pdftotext gelesen und in
>> ein extra Tabellenfeld geschrieben, das später durchsucht werden kann.
>> Sprich "indizieren" jeweils beim speichern.
>> Warnungen, andere Ansätze oder auch Ermutigungen wären sehr willkommen.
>
> das empfinde ich am saubersten.
>
> Georg
> _______________________________________________
> TYPO3-german mailing list
> TYPO3-german at lists.typo3.org
> http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german
>

_______________________________________________
TYPO3-german mailing list
TYPO3-german at lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german



More information about the TYPO3-german mailing list