|
|||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | ||||
SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |
java.lang.Object | +--searchDesign.Parser
Beschreibung: Der Parser wird über die Methode initialize mit einer Stopwort-Datei und einem Crawler initialisiert. Er bearbeitet sequentiell alle Dateien, die der Crawler ihm zur Verfügung stellt mit seiner Methode nextWord. Die Methode nextWord, die die nextWord() des benoetigten Filters aufruft gibt erst null zurück, wenn das letzte Wort der letzten Datei abgearbeitet wurde. Nachdem er alle Dateien abgearbeitet hat, erzeugt der Parser eine docMap-Datei (Methode writeDocMap, s.u.) und schreibt die Pfade der bearbeiteten Dateien, jeweils gefolgt (in einer neuen Zeile) von der Anzahl der eingelesenen Nichtstopwörter.
Constructor Summary | |
Parser()
|
Method Summary | |
void |
initialize(java.lang.String stopWordFileName,
CrawlerInterface crawler)
Initialisierungsmethode Liest die Stopwords datei ein und traegt sie auf eine Hashtable ein |
Data |
nextWord()
liefert jeweils ein Wort zurück, in Form eines KeyData. |
void |
writeDocMap(java.lang.String fileName)
schreibt in der DocMap-Datei mit Namen fileName folgende Informationen: - in der ersten Zeile: die Anzahl der bearbeiteten Dateien - danach jeweils den Pfad zu einer bearbeiteten Datei, gefolgt in einer eigenen Zeile von der Anzahl der in der betroffenen Datei eingelesenen Nichtstopwörter. Die DocMap-Datei enthält keine Leerzeilen |
Methods inherited from class java.lang.Object |
clone,
equals,
finalize,
getClass,
hashCode,
notify,
notifyAll,
toString,
wait,
wait,
wait |
Constructor Detail |
public Parser()
Method Detail |
public void initialize(java.lang.String stopWordFileName, CrawlerInterface crawler) throws java.io.FileNotFoundException, java.io.IOException
stopWordFileName
- Der Pfad zu der Datei, die die Stopwörter enthältcrawler
- Der zuvor erzeugte Crawlerpublic Data nextWord() throws java.io.IOException, java.io.FileNotFoundException
public void writeDocMap(java.lang.String fileName)
fileName
- Der Pfad zur DocMap-Datei
|
|||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | ||||
SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |