[TYPO3-german] crawler Indexed_search läuft jetzt

Jochen Graf graf at uni-landau.de
Wed Mar 10 09:14:49 CET 2010


Hallo,

ich habe nun den Crawler zum laufen gebracht.

Debian 5.0.4
mysql  Ver 14.12
PHP 5.2.6-1+lenny6
Typo3 4.2.3


macina_searchbox  2.2.0
crawler  2.1.0
Indexed_search  2.12.0

PHP auf der Kommandozeile
zum Aufruf von PHP Scripte musste ich  das Packet  php5-cli installieren.

habe einen backend user angelegt
_cli_lowlevel

Dann im Listenmodul "auf der RootSeite"

eine neue Indexierungseinstellungen angelegt.
http://www.paeps.technik.uni-landau.de/fileadmin/Indexierungseinstellungen.JPG

Im Setup

config {
index_enable = 1
index_externals = 1
}

###########
plugin.tx_indexedsearch {
#### Standard-CSS-Styles löschen
  _CSS_DEFAULT_STYLE >
#### Anzahl der ausgegebenen Suchergebnisse auf einer Seite
  _DEFAULT_PI_VARS.results = 10
#### Suchworte kennzeichnen
  forwardSearchWordsInResultLink = 1
##############################
  blind {
#### settings: 0=aktiv (sichtbar), -1 inaktiv (nicht sichtbar)
#### Vergleichs-Typ (Ganzes Wort, Wortteil,etc)
    type=-1
#### type default option (und /oder)
    defOp=0
#### Bereich(e) der website
    sections=0
#### Suche in Medientypen (erweiterungen)
    media=1
#### Sortierung
    order=-1
#### Ansicht (Sektionshierachie / Liste)
    group=-1
#### Ansicht: Erweiterte Vorschau
    extResume = -1
#### Sprachwahlbox
    lang=-1
#### Aufsteigend absteigend
    desc=-1
#### Ergebnisse (Anzahl der Treffer pro Seite)
    results=0
  }
  show {
#### settings: 1=aktiv (sichtbar), 0 inaktiv (nicht sichtbar)
#### Zeige Kurzanleitung
    rules=0
#### Erstellungsinformationen des Hash
    parsetimes=1
#### Zweite Ebene im Bereichs-dropdown anzeigen
    L2sections=1
#### Erste ebene im Bereichs-dropdown anzeigen
    L1sections=1
#### Alle "nicht im menü" oder "im menü verstecken" in Suche einbeziehen
    LxALLtypes=0
#### Leeren des Suchfeldes nach der Suche
#### VORSICHT: Wenn eingeschaltet, funktioniert der Seitennavigator 
nicht mehr
    clearSearchBox = 0
#### Aktuelles Suchwort zu den bisherigen hinzufügen (Checkbox)
    clearSearchBox.enableSubSearchCheckBox=0
  }
  search {
#### Wird nur benötigt, wenn es mehr als eine Root-Page im Seitenbaum gibt.
#### ansonsten leer lassen.
    #rootPidList = 1
  }
}
#################




macina_searchbox

page.10.marks.SUCHE  < plugin.tx_macinasearchbox_pi1
page.10.marks.SUCHE {

#Seite mit dem Plugin index-search
   pidSearchpage = 43
   templateFile = fileadmin/template/searchbox/template.htm
 }
 


IM TSCONFIG


// Nicht vergessen: nur gecachte Seiten können indexiert werden
// Daher config.no_cache = 0 im TypoScript-Setup
tx_crawler.crawlerCfg.paramSets {
  language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
  language.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
  language.baseUrl = http://www.paeps.technik.uni-landau.de/
}



Auf der Console als root

cd /www/web/www.paeps.technik.uni-landau.de/typo3

php -f  cli_dispatch.phpsh crawler_im 1 -d 99 -proc 
tx_indexedsearch_reindex -n 1000 -o queue

[10-03 07:26:00] ?id=2
[10-03 07:26:00] ?id=44
[10-03 07:26:00] ?id=59
[10-03 07:26:00] ?id=55
[10-03 07:26:00] ?id=46
[10-03 07:26:00] ?id=69
[10-03 07:26:00] ?id=45
[10-03 07:26:00] ?id=52
[10-03 07:26:00] ?id=70
[10-03 07:26:00] ?id=57
[10-03 07:26:00] ?id=58
[10-03 07:26:00] ?id=56
[10-03 07:26:00] ?id=53
[10-03 07:26:00] ?id=65
[10-03 07:26:00] ?id=51
[10-03 07:26:00] ?id=61
[10-03 07:26:00] ?id=62
[10-03 07:26:00] ?id=63
[10-03 07:26:00] ?id=64
[10-03 07:26:00] ?id=66
[10-03 07:26:00] ?id=54
[10-03 07:26:00] ?id=67
[10-03 07:26:00] ?id=29
[10-03 07:26:00] ?id=30
[10-03 07:26:00] ?id=26
[10-03 07:26:00] ?id=4
[10-03 07:26:00] ?id=7
[10-03 07:26:00] ?id=8
[10-03 07:26:00] ?id=9
[10-03 07:26:00] ?id=11
[10-03 07:26:00] ?id=10
[10-03 07:26:00] ?id=25
[10-03 07:26:00] ?id=23
[10-03 07:26:00] ?id=24
[10-03 07:26:00] ?id=12
[10-03 07:26:00] ?id=21
[10-03 07:26:00] ?id=13
[10-03 07:26:00] ?id=22
[10-03 07:26:00] ?id=5
[10-03 07:26:00] ?id=6
[10-03 07:26:00] ?id=19
[10-03 07:26:00] ?id=20
[10-03 07:26:00] ?id=17
[10-03 07:26:00] ?id=14
[10-03 07:26:00] ?id=15
[10-03 07:26:00] ?id=16
[10-03 07:26:00] ?id=43
[10-03 07:26:00] ?id=31


Im Modul > WEB >  unter Info "Indexsuche auswählen" bei Indexsuche Words 
an Content,
da sieht man auch, welche PDF Dateien Indiziert wurden.

http://www.paeps.technik.uni-landau.de/fileadmin/suche.JPG


Um auch das durchsuchen der PDF Dokumente zu ermöglichen, musste ich 
folgende Packete installieren.

apt-get install xpdf-reader
apt-get install emacspeak
apt-get install xpdf-utils
apt-get install gworkspace-apps-wrappers


Es werden allerdings nur verlinkte PDFS durchsucht, hatte mal den 
mocfilemanager installiert und PDF Dateien hochgeladen, da werden keine 
PDF Dateien durchsucht.

http://www.paeps.technik.uni-landau.de/index.php?id=67

.
Mein CSS

/* ##############################
** ### tx_indexedsearch #########
** ##############################
*/
tx-indexedsearch .tx-indexedsearch-searchbox 
INPUT.tx-indexedsearch-searchbox-button {width:100px;}
tx-indexedsearch .tx-indexedsearch-searchbox 
INPUT.tx-indexedsearch-searchbox-sword {width:150px;}
tx-indexedsearch .tx-indexedsearch-whatis P .tx-indexedsearch-sw 
{font-weight:bold; font-style:italic;}
tx-indexedsearch .tx-indexedsearch-whatis {margin-top:10px; 
margin-bottom:5px;}
tx-indexedsearch P.tx-indexedsearch-noresults {text-align:center; 
font-weight:bold;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title 
{background:#eeeeee;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title P 
{font-weight:bold;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title 
P.tx-indexedsearch-percent {font-weight:normal;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-descr P 
{font-style:italic;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-descr P 
tx-indexedsearch-redMarkup {}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-info 
{background:#E0E7F5;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead 
{margin-top:20px; margin-bottom:5px;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead H2 
{color:#006699; margin-top:0px; margin-bottom:0px; background:transparent;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead TABLE 
{background:#cccccc;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead TD 
{vertical-align:middle;}
tx-indexedsearch .tx-indexedsearch-res .noResume {color :#666666;}
tx-indexedsearch-sw, .csc-sword, .tx-indexedsearch-redMarkup {    
font-family:monospace;    font-style:normal;    padding:0 0.3em 0 0.3em; 
background:#ffff88; border:1px #ccd solid;}



-- 
Mit freundlichen Grüssen

Jochen Graf

Universität Koblenz-Landau / Campus Landau
Arbeitstelle Multimedia/Technik-Administration

Thomas-Nast-Str. 44
76829 Landau

mail: graf at uni-landau.de
fon: 06341-990-224

http://www.uni-koblenz-landau.de/landau

http://www.paeps.uni-landau.de
http://www.paeps.technik.uni-landau.de/


http://www.wulv.uni-landau.de
http://www.ueberlebenmitklips.uni-landau.de/




More information about the TYPO3-german mailing list