searchDesign
Interface CrawlerInterface


public interface CrawlerInterface

Beschreibung: Ein Crawler speichert die Pfade der Text-Dateien (.txt, .html und .htm), die sich im übergebenen Verzeichnis und in seinen Unterverzeichnissen befinden. Er geht dafür durch das ihm in der Methode initialize übergebene Startverzeichnis und dessen Verzeichnisse rekursiv durch und speichert die Pfade der darin gefundenen Dateien in einer geeigneten Datenstruktur ab. Gibt nach dem Einlesen der Filenamen eine Meldung über die Zahl der gefundenen Text-Dateien aus.

Version:
1.0

Method Summary
 java.lang.String[] getFiles()
          Gibt ein String Array zurueck, das die kompletten Pfade zu allen Text- und HTML-Dateien enthaelt, die in dem zu scannenden Verzeichnis liegen.
 void initialize(java.lang.String path)
          Initialisierungsfunktion Übergibt das Startverzeichnis für die Suche nach Dokumenten.
 

Method Detail

initialize

public void initialize(java.lang.String path)
                throws java.io.FileNotFoundException
Initialisierungsfunktion Übergibt das Startverzeichnis für die Suche nach Dokumenten.
Parameters:
path - der Pfad zum zu indizierenden Verzeichnis
Throws:
java.io.FileNotFoundException - Wenn der Pfad ungültig ist.

getFiles

public java.lang.String[] getFiles()
Gibt ein String Array zurueck, das die kompletten Pfade zu allen Text- und HTML-Dateien enthaelt, die in dem zu scannenden Verzeichnis liegen.
Returns:
ein String Array mit Pfaden