|
|||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | ||||
SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |
Beschreibung: Der Parser wird über die Methode initialize mit einer Stopwort-Datei und einem Crawler initialisiert. Er bearbeitet sequentiell alle Dateien, die der Crawler ihm zur Verfügung stellt mit seiner Methode nextWord. Die Methode nextWord gibt erst null zurück, wenn das letzte Wort der letzten Datei abgearbeitet wurde. Nachdem er alle Dateien abgearbeitet hat, erzeugt der Parser eine docMap-Datei (Methode writeDocMap, s.u.) und schreibt die Pfade der bearbeiteten Dateien, jeweils gefolgt (in einer neuen Zeile) von der Anzahl der eingelesenen Nichtstopwörter.
Method Summary | |
void |
initialize(java.lang.String stopWordFileName,
CrawlerInterface crawler)
Initialisierungsmethode |
Data |
nextWord()
liefert jeweils ein Wort zurück, in Form eines KeyData. |
void |
writeDocMap(java.lang.String fileName)
schreibt in der DocMap-Datei mit Namen fileName folgende Informationen: - in der ersten Zeile: die Anzahl der bearbeiteten Dateien - danach jeweils den Pfad zu einer bearbeiteten Datei, gefolgt in einer eigenen Zeile von der Anzahl der in der betroffenen Datei eingelesenen Nichtstopwörter. Die DocMap-Datei enthält keine Leerzeilen |
Method Detail |
public void initialize(java.lang.String stopWordFileName, CrawlerInterface crawler) throws java.io.FileNotFoundException, java.io.IOException
stopWordFileName
- Der Pfad zu der Datei, die die Stopwörter enthältcrawler
- Der zuvor erzeugte Crawlerpublic void writeDocMap(java.lang.String fileName)
fileName
- Der Pfad zur DocMap-Dateipublic Data nextWord() throws java.io.IOException, java.io.FileNotFoundException
|
|||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | ||||
SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |