searchDesign
Interface CrawlerInterface
- public interface CrawlerInterface
Beschreibung: Ein Crawler speichert die Pfade der Text-Dateien (.txt, .html und .htm),
die sich im übergebenen Verzeichnis und in seinen Unterverzeichnissen befinden.
Er geht dafür durch das ihm in der Methode initialize übergebene Startverzeichnis
und dessen Verzeichnisse rekursiv durch und speichert die Pfade der darin gefundenen
Dateien in einer geeigneten Datenstruktur ab.
Gibt nach dem Einlesen der Filenamen eine Meldung über die Zahl der gefundenen
Text-Dateien aus.
- Version:
- 1.0
Method Summary |
java.lang.String[] |
getFiles()
Gibt ein String Array zurueck, das die kompletten Pfade zu allen
Text- und HTML-Dateien enthaelt, die in dem zu scannenden
Verzeichnis liegen. |
void |
initialize(java.lang.String path)
Initialisierungsfunktion
Übergibt das Startverzeichnis für die Suche nach Dokumenten. |
initialize
public void initialize(java.lang.String path)
throws java.io.FileNotFoundException
- Initialisierungsfunktion
Übergibt das Startverzeichnis für die Suche nach Dokumenten.
- Parameters:
path
- der Pfad zum zu indizierenden Verzeichnis- Throws:
- java.io.FileNotFoundException - Wenn der Pfad ungültig ist.
getFiles
public java.lang.String[] getFiles()
- Gibt ein String Array zurueck, das die kompletten Pfade zu allen
Text- und HTML-Dateien enthaelt, die in dem zu scannenden
Verzeichnis liegen.
- Returns:
- ein String Array mit Pfaden