Das Lemur-Projekt.

Language-Modellierungs- und Informationsabrufanwendungen
Jetzt downloaden

Das Lemur-Projekt. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Freeware
  • Preis:
  • FREE
  • Name des Herausgebers:
  • The Lemur Team
  • Website des Verlags:
  • http://www.lemurproject.org/
  • Betriebssysteme:
  • Mac OS X
  • Dateigröße:
  • 63.6 MB

Das Lemur-Projekt. Stichworte


Das Lemur-Projekt. Beschreibung

Language-Modellierung und Informationsabruf Das LEMUR-Toolkit ist eine freie und offene Quellanwendung, die zur Erleichterung der Forschung in der Sprachmodellierung und des Informationsabrufs entworfen wurde. Das LEMUR-Toolkit enthält Technologien wie Ad-hoc und verteiltes Abruf, Quersprache IR, Summarisierung, Filterung und Klassifizierung. Hier sind einige wichtige Funktionen von "The Lemur Project": · Anspruchsvolle strukturierte Abfragesprachen (mit Anfragen und INDRI) · Unterstützung für XML- und strukturiertes Dokumentenabruf · Häufig verwendet mit einer Vielzahl von Forschungstestsammlungen (z. B. TREC-CDs 1-5, WT10G, RCV1, GOV, GOV2) verwendet · Indexieren Sie Ihre Webseiten mit einem "Out-of-the-BOX-Site-Suchfunktion · Interaktive Schnittstellen für Windows, Linux und Web · Distributed Information Retrieval- und Dokument-Clustering-Anwendungen · Plattform, schneller und modularer Code in C ++ geschrieben · C ++, Java und C # APIs · Kostenlose und Open-Source-Software · Im Einsatz seit über 6 Jahren von einer großen und wachsenden Benutzergemeinschaft Indizierung: · Mehrere Indexierungsmethoden für kleine, mittlere und große (Terabyte) -Kollektionen · Integrierte Unterstützung für englischer, chinesischer und arabischer Text · Porter- und Krovetz-Wort-Word-Stemming · Inkrementelle Indexierung. · Out-of-the-Box-Indexierungsunterstützung für TREC-Text, TREC-Web, Klartext, HTML, XML, PDF, MBOX, Microsoft Word und Microsoft PowerPoint · Indexe Inline und Offset von Text Annotationen (z. B. Teil der Sprache und genannten Entitäten) · Indexe Dokumentattribute Abruf: · Unterstützt Hauptsprache Modellierungsansätze wie IndRI und KL-Divergenz sowie Vektorraum, TF.IDF, Okapi und Anfragen · Relevanz- und Pseudo-Relevanz-Feedback · Wildcard-Laufzeit-Erweiterung (mit INDRI) · Durchgangs- und XML-Elementabruf · Cross-lingual Abruf · Glätten über Dirichlet-Priors und Markov-Ketten · Unterstützt beliebige Dokumentpriors (z. B. Seitenrang, URL-Tiefe) Was ist neu in dieser Version: · 2799440 Terminfo zurückgegeben von IndriteMinfolist hat keine Positionen · 2794361 Harreestlinks schafft keine Ernteverzeichnisse · 2788507 KROVETZEMERMERTRANSFORMATION Kann einen Puffer überlaufen · 2788504 AnchortextannoTator kann einen Puffer überlaufen · 2787935 Pagerank-Müllkern, wenn Links-Pfad schlecht ist · 2784994 Falscher Artikel · 2783665 TextTokenizer vorzeitig beendet zitierte Tagattribute · 2782954 INDRI :: Parse :: HTMLPARSER :: Handletag kann einen Puffer überlaufen · 2772914 iRevalgui.jar gibt verrückte Ergebnisse · 2772846 bin / iReval.jar ist eine ungültige .jar-Datei (lemur v48) · 2770916 DocumentLength-Puffer-Korruption mit mehreren Threads · 2747981 WARCDOCUERTIERATOR VERFÜGBARE DOKUMENTEN IN DER WARK-FILE · 2747707 TextTokenizer erkennt einige zitierte Tag-Attribute nicht


Das Lemur-Projekt. Zugehörige Software

Gmpy.

Erweiterungsmodul, das die GMP-Bibliothek umhüllt, um dem Python-Code schneller Multisprecision-Arithmetik bereitzustellen ...

199 228 KB

Herunterladen

Fertig Lisp.

Eine Bindung von mehreren beliebten Lisp-Paketen für OS X, einschließlich: Aquamacs, Sbcl und Schleim ...

245 72.7 MB

Herunterladen