WARTE AB

WAIT-Perl-Modul ist ein Umschreiben des FreeWais-SF-Motors in Perl und XS.
Jetzt downloaden

WARTE AB Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Ulrich Pfeifer
  • Website des Verlags:
  • http://search.cpan.org/~ulpfr/

WARTE AB Stichworte


WARTE AB Beschreibung

WAIT-Perl-Modul ist ein Umschreiben des FreeWais-SF-Motors in Perl und XS. WAIT-Perl-Modul ist ein Umschreiben des FreeWais-SF-Motors in Perl und Xs.Die zentrale Idee des Systems besteht darin, ein Framework und die Bausteine für jedes Indexierungs- und Suchsystem bereitzustellen, die die Benutzer möglicherweise bauen möchten. Natürlich begrenzt der Rahmen die Klasse des Systems, die bauen kann. + ------ + + ----- + + ------ + ==> | Zugang | ==> | Parse | ==> | | + ------ + + ----- + | | || | | + ----- + || | Filter | ==> | Index | / | | + ----- + + -------- + + ----- + | | 1}, "$ _n"; } else {Push @Result, {}, "$ _n"; }} Rendite @Result; # Wir gehen nicht nach Geschwindigkeit} Offensichtlich könnte man Split über Tag implementieren. Der Grund für zwei Funktionen ist Geschwindigkeit. Wir müssen bei der Indexierung einer Sammlung Split für jedes Dokument anrufen. Daher ist die Geschwindigkeit unerlässlich. Andererseits wird das Tag aufgerufen, um ein einzelnes Dokument anzuzeigen und ein wenig langsamer zu sein. Es kann sich darum kümmern, mutige und kursive Regionen zu markieren. Sehen Sie das Warten :: Parse :: NROFF, wie dies die Leistung verringern kann Der Datenbankadministrator definiert für jedes Attribut, wie der Inhalt verarbeitet werden soll, bevor er im Index gespeichert ist. Normalerweise enthält die Verarbeitung Schritte, um den Zeichensatz, die Falltransformation, auf Wörtern einzuschränken und auf Word-Stängel zu teilen. Im Warten sind diese Schritte natürlich als Pipeline der Verarbeitungsschritte definiert. Die Pipelines bestehen aus Funktionen in der Package Wait :: Filter, die von den häufigsten Funktionen vorgefüllt ist, jedoch jederzeit erweitert ist. Das Äquivalent für eine typische FreeWais-SF-Verarbeitung wäre diese Pipeline: Die Funktion Isotr ersetzt unbekannte Zeichen per Rohlinge. Isolc transformiert in Kleinbuchstaben. Split2 spaltet in Worte auf und entfernt Wörter kürzer als zwei Zeichen. STOP wird entfernt Die Haltestellen der FreeWais-SF und der Vorbau gilt den Porter-Algorithmus zum Berechnen des STEM der Wörter. Die Filterdefinition für eine Sammlung definiert einen Satz von Pipelines für die Attribute und ändert die Pipelines, die für Präfix- und Intervallsuche verwendet werden sollen. komplette Arbeitsbeispiele sind mit WAIT im Skript-Verzeichnis. Es wird empfohlen, das Muster der die Skripte smakewhatis und sman.Requirements zu folgen: · Perl-Anforderungen: · Perl.


WARTE AB Zugehörige Software