Terrier

Terrier - Sehr flexibel, effizient, und robuste Suchmaschine, leicht einsetzbar in Großraumkollektionen von Dokumenten
Jetzt downloaden

Terrier Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Freeware
  • Preis:
  • FREE
  • Name des Herausgebers:
  • University of Glasgow
  • Website des Verlags:
  • http://ir.dcs.gla.ac.uk/terrier/index.html
  • Betriebssysteme:
  • Mac OS X
  • Dateigröße:
  • 5.8 MB

Terrier Stichworte


Terrier Beschreibung

Terrier - Sehr flexible, effiziente und robuste Suchmaschine, leicht einsetzbar in Großkollektionen von Dokumenten Terrier ist eine sehr flexible, effiziente, effektive und robuste Suchmaschine, die auf großen Abholungen von Dokumenten leicht einsetzbar ist. Terrier implementiert modernste Indexierungs- und Abruffunktionalitäten. Terrier bietet eine ideale Plattform für die schnelle Entwicklung großer Abrufanwendungen. Die Open Source-Version von Terrier bietet eine flexible, umfassende, transparente und robuste Plattform für Forschung und Experimente im Textabruf.Die Forschung in Terrier steigt ständig auf Neue Zweige des breiteren Informationsabruffelds, der Terrier eine ideale, starke, modulare und modernste Plattform für die Entwicklung, Beurteilung und Bewertung neuer Konzepte und Ideen herstellt. Errier ist in Java geschrieben und wurde für das Web verwendet Unternehmenssuche, Desktop-, Intranet- und vertikale Suchmaschinen sowie Entwicklung und Bewertung neuer Großradinformationstechniken und -anwendungen.terrier wird in der Abteilung für Computing Science an der Universität Glasgow entwickelt. Hier sind einige wichtige Funktionen von "Terrier": Allgemein: · Indexierung von Unterstützung für gemeinsame Desktop-Dateiformate und für häufig verwendete TREC-Forschungssammlungen (z. B. TREC-CDs 1-5, WT2G, WT10G, GOV, GOV2, Blogs06). · Viele Dokumentengewichtungsmodelle, wie z. B. viele parameterfreie Divergenz aus Zufälligkeitsgewichtung, Okapi BM25 und Sprachmodellierung. · Herkömmliche Abfragesprachen, einschließlich Sätze und Begriffe, die in Tags auftreten. · Handhabung Volltextindexierung großer Dokumentensammlungen in einer zentralen Architektur auf mindestens 25 Millionen Dokumente. · Modulare und offene Indexierung und Abfrage von APIs, um eine einfache Erweiterung für Ihre eigenen Anwendungen und Forschung zu ermöglichen. · Aktive Informationen Abrufforschung in die Open Source-Plattform. · Open Source (Mozilla Public License). · In Cross-Platform Java geschrieben - arbeitet an Windows, Mac OS X, Linux und Unix. · Große Benutzerbasis über 3 Jahre der öffentlichen Freigabe.indexing: · der Bücherindexierung von markierten Dokumentensammlungen, wie z. Informationen, so Als Titel, H1, HTML-Tags-Informationen · Indexierung von Positionsinformationen auf einem Wort oder einem Block (z. B. ein Fenster der Begriffe innerhalb einer Entfernung) -Pass-Indizierung. · Verschiedene Stemming-Techniken unterstützt, einschließlich des Schneeball-Stemmers für europäische Sprachen Suchen oder in einer Batch-Einstellung für Forschung und Experimente. · Bietet viele Standard-Dokumentengewichtungsmodelle, darunter bis 126 Divergenz von Randoms (DFR) Dokumentierungsmodelle und anderen Modellen wie Okapi BM25, Sprachmodellierung und TF-IDF. Das neue DFR-DFR-Gewichtungsmodell ist ebenfalls enthalten, der eine robuste Leistung auf einer Reihe von Testsammlungen bereitstellt, ohne dass eine Parameter-Tuning oder -training erforderlich ist. · Erweiterte Abfragesprache, die boolesche Betreiber, +/- Operatoren, Satz- und Proximitätssuche unterstützt, und Felder. · Bietet eine Reihe von parameterfreien DFR-Begriffs-Gewichtungsmodellen für die automatische Abfrageerweiterung zusätzlich zur Abfrageerweiterung von ROCCHIO. · Flexible Bearbeitung von Begriffen durch eine Pipeline von Komponenten, z. B. Haltwörterentferner und Stemmers.Experimentation: · Griffe alle derzeit verfügbaren TREC-Testsammlungen - siehe TREC-Experimentierbeispiele für Beispiele und bekannte Einstellungen. · Leicht bibliotbar, um viele Parametereinstellungen oder viele Gewichtungsmodelle in Batch-Form auszuwerten. · Integrierte Evaluierungswerkzeuge zur Verwendung mit TREC Ad-hoc und bekannt Artikelsuche Retrieval-Ergebnisse, um verschiedene Präzisions- und Rückrufmaßnahmen zu erstellen. Note: Terrier wird unter der Publikum Mozilla-Lizenz veröffentlicht.


Terrier Zugehörige Software

SableVM.

SableVM - ein robustes, sauberes, pflegeleichtes und erstklassiges, extrem tragbares, effizientes und spezielles Spezifikation-kompatibel Java virtuell ...

343 1.3 MB

Herunterladen

Vergrößern

Vergrößern - Open Source ActionScript-Vorverarbeitungs-Tool, das den JAPLO JAVA-Präprozessor mit Flash-Funktion erweitert ...

162 1.1 MB

Herunterladen

BEGEISTERN

ELATE - Entwickeln Sie os-unabhängige, aufdringliche, anpassbare, erweiterbare, generische Protokollierung und Tracing-Software-Mechanismen ...

205 105 KB

Herunterladen