[TYPO3-german] crawler Indexed_search läuft jetzt
Jochen Graf
graf at uni-landau.de
Wed Mar 10 09:14:49 CET 2010
Hallo,
ich habe nun den Crawler zum laufen gebracht.
Debian 5.0.4
mysql Ver 14.12
PHP 5.2.6-1+lenny6
Typo3 4.2.3
macina_searchbox 2.2.0
crawler 2.1.0
Indexed_search 2.12.0
PHP auf der Kommandozeile
zum Aufruf von PHP Scripte musste ich das Packet php5-cli installieren.
habe einen backend user angelegt
_cli_lowlevel
Dann im Listenmodul "auf der RootSeite"
eine neue Indexierungseinstellungen angelegt.
http://www.paeps.technik.uni-landau.de/fileadmin/Indexierungseinstellungen.JPG
Im Setup
config {
index_enable = 1
index_externals = 1
}
###########
plugin.tx_indexedsearch {
#### Standard-CSS-Styles löschen
_CSS_DEFAULT_STYLE >
#### Anzahl der ausgegebenen Suchergebnisse auf einer Seite
_DEFAULT_PI_VARS.results = 10
#### Suchworte kennzeichnen
forwardSearchWordsInResultLink = 1
##############################
blind {
#### settings: 0=aktiv (sichtbar), -1 inaktiv (nicht sichtbar)
#### Vergleichs-Typ (Ganzes Wort, Wortteil,etc)
type=-1
#### type default option (und /oder)
defOp=0
#### Bereich(e) der website
sections=0
#### Suche in Medientypen (erweiterungen)
media=1
#### Sortierung
order=-1
#### Ansicht (Sektionshierachie / Liste)
group=-1
#### Ansicht: Erweiterte Vorschau
extResume = -1
#### Sprachwahlbox
lang=-1
#### Aufsteigend absteigend
desc=-1
#### Ergebnisse (Anzahl der Treffer pro Seite)
results=0
}
show {
#### settings: 1=aktiv (sichtbar), 0 inaktiv (nicht sichtbar)
#### Zeige Kurzanleitung
rules=0
#### Erstellungsinformationen des Hash
parsetimes=1
#### Zweite Ebene im Bereichs-dropdown anzeigen
L2sections=1
#### Erste ebene im Bereichs-dropdown anzeigen
L1sections=1
#### Alle "nicht im menü" oder "im menü verstecken" in Suche einbeziehen
LxALLtypes=0
#### Leeren des Suchfeldes nach der Suche
#### VORSICHT: Wenn eingeschaltet, funktioniert der Seitennavigator
nicht mehr
clearSearchBox = 0
#### Aktuelles Suchwort zu den bisherigen hinzufügen (Checkbox)
clearSearchBox.enableSubSearchCheckBox=0
}
search {
#### Wird nur benötigt, wenn es mehr als eine Root-Page im Seitenbaum gibt.
#### ansonsten leer lassen.
#rootPidList = 1
}
}
#################
macina_searchbox
page.10.marks.SUCHE < plugin.tx_macinasearchbox_pi1
page.10.marks.SUCHE {
#Seite mit dem Plugin index-search
pidSearchpage = 43
templateFile = fileadmin/template/searchbox/template.htm
}
IM TSCONFIG
// Nicht vergessen: nur gecachte Seiten können indexiert werden
// Daher config.no_cache = 0 im TypoScript-Setup
tx_crawler.crawlerCfg.paramSets {
language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
language.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
language.baseUrl = http://www.paeps.technik.uni-landau.de/
}
Auf der Console als root
cd /www/web/www.paeps.technik.uni-landau.de/typo3
php -f cli_dispatch.phpsh crawler_im 1 -d 99 -proc
tx_indexedsearch_reindex -n 1000 -o queue
[10-03 07:26:00] ?id=2
[10-03 07:26:00] ?id=44
[10-03 07:26:00] ?id=59
[10-03 07:26:00] ?id=55
[10-03 07:26:00] ?id=46
[10-03 07:26:00] ?id=69
[10-03 07:26:00] ?id=45
[10-03 07:26:00] ?id=52
[10-03 07:26:00] ?id=70
[10-03 07:26:00] ?id=57
[10-03 07:26:00] ?id=58
[10-03 07:26:00] ?id=56
[10-03 07:26:00] ?id=53
[10-03 07:26:00] ?id=65
[10-03 07:26:00] ?id=51
[10-03 07:26:00] ?id=61
[10-03 07:26:00] ?id=62
[10-03 07:26:00] ?id=63
[10-03 07:26:00] ?id=64
[10-03 07:26:00] ?id=66
[10-03 07:26:00] ?id=54
[10-03 07:26:00] ?id=67
[10-03 07:26:00] ?id=29
[10-03 07:26:00] ?id=30
[10-03 07:26:00] ?id=26
[10-03 07:26:00] ?id=4
[10-03 07:26:00] ?id=7
[10-03 07:26:00] ?id=8
[10-03 07:26:00] ?id=9
[10-03 07:26:00] ?id=11
[10-03 07:26:00] ?id=10
[10-03 07:26:00] ?id=25
[10-03 07:26:00] ?id=23
[10-03 07:26:00] ?id=24
[10-03 07:26:00] ?id=12
[10-03 07:26:00] ?id=21
[10-03 07:26:00] ?id=13
[10-03 07:26:00] ?id=22
[10-03 07:26:00] ?id=5
[10-03 07:26:00] ?id=6
[10-03 07:26:00] ?id=19
[10-03 07:26:00] ?id=20
[10-03 07:26:00] ?id=17
[10-03 07:26:00] ?id=14
[10-03 07:26:00] ?id=15
[10-03 07:26:00] ?id=16
[10-03 07:26:00] ?id=43
[10-03 07:26:00] ?id=31
Im Modul > WEB > unter Info "Indexsuche auswählen" bei Indexsuche Words
an Content,
da sieht man auch, welche PDF Dateien Indiziert wurden.
http://www.paeps.technik.uni-landau.de/fileadmin/suche.JPG
Um auch das durchsuchen der PDF Dokumente zu ermöglichen, musste ich
folgende Packete installieren.
apt-get install xpdf-reader
apt-get install emacspeak
apt-get install xpdf-utils
apt-get install gworkspace-apps-wrappers
Es werden allerdings nur verlinkte PDFS durchsucht, hatte mal den
mocfilemanager installiert und PDF Dateien hochgeladen, da werden keine
PDF Dateien durchsucht.
http://www.paeps.technik.uni-landau.de/index.php?id=67
.
Mein CSS
/* ##############################
** ### tx_indexedsearch #########
** ##############################
*/
tx-indexedsearch .tx-indexedsearch-searchbox
INPUT.tx-indexedsearch-searchbox-button {width:100px;}
tx-indexedsearch .tx-indexedsearch-searchbox
INPUT.tx-indexedsearch-searchbox-sword {width:150px;}
tx-indexedsearch .tx-indexedsearch-whatis P .tx-indexedsearch-sw
{font-weight:bold; font-style:italic;}
tx-indexedsearch .tx-indexedsearch-whatis {margin-top:10px;
margin-bottom:5px;}
tx-indexedsearch P.tx-indexedsearch-noresults {text-align:center;
font-weight:bold;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title
{background:#eeeeee;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title P
{font-weight:bold;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-title
P.tx-indexedsearch-percent {font-weight:normal;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-descr P
{font-style:italic;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-descr P
tx-indexedsearch-redMarkup {}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-info
{background:#E0E7F5;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead
{margin-top:20px; margin-bottom:5px;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead H2
{color:#006699; margin-top:0px; margin-bottom:0px; background:transparent;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead TABLE
{background:#cccccc;}
tx-indexedsearch .tx-indexedsearch-res .tx-indexedsearch-secHead TD
{vertical-align:middle;}
tx-indexedsearch .tx-indexedsearch-res .noResume {color :#666666;}
tx-indexedsearch-sw, .csc-sword, .tx-indexedsearch-redMarkup {
font-family:monospace; font-style:normal; padding:0 0.3em 0 0.3em;
background:#ffff88; border:1px #ccd solid;}
--
Mit freundlichen Grüssen
Jochen Graf
Universität Koblenz-Landau / Campus Landau
Arbeitstelle Multimedia/Technik-Administration
Thomas-Nast-Str. 44
76829 Landau
mail: graf at uni-landau.de
fon: 06341-990-224
http://www.uni-koblenz-landau.de/landau
http://www.paeps.uni-landau.de
http://www.paeps.technik.uni-landau.de/
http://www.wulv.uni-landau.de
http://www.ueberlebenmitklips.uni-landau.de/
More information about the TYPO3-german
mailing list