Lucene

Lucene ist eine Perl-API an den C-Anschluss der Lucene-Suchmaschine.
Jetzt downloaden

Lucene Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Thomas Busch
  • Website des Verlags:
  • http://search.cpan.org/~tbusch/Lucene-0.13/lib/Lucene.pm

Lucene Stichworte


Lucene Beschreibung

Lucene ist eine Perl-API an den C-Anschluss der Lucene-Suchmaschine. Lucene ist eine Perl-API zum C-Anschluss der Lucene-Suchmaschine.SynopsiseinInitialize / leerer Lucene-Index My $ Analyzer = Neue Lucene :: Analysis :: Standard :: Standardanalyzer (); Mein $ store = lucene :: store :: fsdirectory-> getverirectory ("/ home / lucene", 1); Mein $ tmp_writer = New Lucene :: Index :: IndexWriter ($ Store, $ Analyzer, 1); $ tmp_writer-> schließen; undef $ tmp_writer; Wählen Sie Ihren Analysator (String-Tokenizer) # -Plappen Text und teilt es in Non-Letter-Zeichen. # so wie zuvor und entfernt Haltwörter mein $ Analyzer = Neue Lucene :: Analysis :: Stopanalyzer (); # wie zuvor, aber Sie geben Ihre eigenen Haltwörter an # spaltet Text bei Whitespace-Figuren My $ Analyzer = Neue Lucene :: Analysis :: WhitespaceAnalyzer (); # Unterklammern Text, tokenisiert, basierend auf einem Grammer, dass # Blätter genannte Behörden intakt (E-Mails, Firmennamen, # Web-Hostnames, IP-Adressen usw.) und entfernte Stop-Wörter My $ Analyzer = Neue Lucene :: Analysis :: Standard: Standard: : Standardanalyzer (); # wie zuvor, aber Sie geben Ihre eigenen Stop-Wörter meinen $ Analyzer = Neue Lucene :: Analysis :: Standard :: Standardanalyzer (); # nimmt String, wie es ist (nur bei Verwendung von Clucene-0.9.17 oder höher) mein $ Analyzer = Neue Lucene :: Analysis :: Keywordsangestellanalyzer (); Erstellen Sie ein benutzerdefiniertes Analysator-Paket MyAnalyzer; Verwenden Sie Basis 'Lucene :: Analysis :: Analyzer'; # Sie müssen super: neu anrufen, wenn Sie neue () sub neue {My $ class = Shift implementieren; mein $ self = $ class-> super :: new (); # ... zurückgeben $ selbst; } Sub-Tokenstream {mein ($ self, $ field, $ reader) = @_; Mein $ ret = New Lucene :: Analysis :: Standardtokenizer ($ laceer); if ($ Field EQ "mykeywordfield") {Return $ ret; } $ ret = New Lucene :: Analysis :: LowerCaseFilter ($ ret); $ ret = New Lucene :: Analysis :: Stoppfilter ($ ret, ); Rückkehr $ ret; } Package Main; Mein $ Analyzer = New MyAnalyzer; Wählen Sie Ihren Shop (Lageregler) # in-Memory Storage My $ Store = New Lucene :: Shop :: RamDirectory (); # disk-basierter Speicher My $ Store = Lucene :: Shop :: FSDirectory-> getverectory ("/ home / lucene", 0); Öffnen und Konfigurieren eines Indexwriter My $ Writer = New Lucene :: Index :: Indexwriter ($ , $ Analyzer, 0); # Optionale Einstellungen für den Stromverbraucher $ Writer-> Setmererfactor (100); $ writer-> setusecompundfile (0); $ writer-> setmaxfieldlänge (255); $ writer-> setminmergedocs (10); $ Writer-> setmaxmergedocs (100); Dokumente erstellen und Felder hinzufügen My $ doc = New Lucene :: Dokument; # Feld wird analysiert, indiziert und gespeichert $ doc-> add (lucene :: document :: feld-> text ("content", $ content)); # Feld wird indiziert und gespeichert $ doc-> add (lucene :: document :: feld-> Stichwort ("isbn", $ isbn)); # Feld wird nur gespeichert $ doc-> add (lucene :: document :: feld-> ungeeindruckt ("sales_rank", $ sales_rank)); # Feld wird analysiert und indexiert $ doc-> add (lucene :: document :: feld-> otored ("Kategorien", $ Kategorien); Anforderungen: · Perl.


Lucene Zugehörige Software