Rauschen

FAST, PURE-PYTHON Full Text Indexing, Suchen und Rechtschreiblicht
Jetzt downloaden

Rauschen Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Apache
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Matt Chaput
  • Website des Verlags:
  • http://whoosh.ca/
  • Betriebssysteme:
  • Mac OS X 10.0 or later
  • Dateigröße:
  • 154 KB

Rauschen Stichworte


Rauschen Beschreibung

Schnelle, pur-Python-Volltextindexing, Suche und Rechtschreibprüfung Whoosh ist eine schnelle, anfechselige Full-Text-Indizierung und Suchbibliothek, die in reinem Python umgesetzt wird. Whojh ist so schnell oder schneller bei der Indexierung als andere Python-Suchbibliotheken, die C- oder Java-Bibliotheken einwickeln (z. B. Pyluzene ?, xappy), und nicht so viel langsamer bei der Suche. Fonds-Zeile, whoosh ist für die meisten Anwendungen schnell genug und sollte bei den folgenden Umständen nützlich sein: · Anywhere, wo eine Pure-Python-Lösung wünschenswert ist, ist es wünschenswert, es zu vermeiden, einheimische Bibliotheken erstellen / kompilieren zu können Eine Forschungsplattform (zumindest für Programmierer, die Python leichter zu lesen und zu arbeiten als Java;) · Wenn eine benutzerfreundliche pythonische Schnittstelle für Sie wichtiger ist als Rohgeschwindigkeit. Whooh nimmt viel Inspiration (und übersetzt manchmal Code) von anderen Suchmaschinen. Das grundlegende Design ist ähnlich wie (aber nicht völlig funktioniert und ist nicht komplett wie nicht kompatibel mit) Lucene, sondern verwendet einige Scoring-Algorithmen von Terrier, KinoSearch-Indexierungsalgorithmus, und der englische morphologische Variationsgenerator aus Minion. Hier sind einige wichtige Funktionen von "whoosh": · Pythonische API. · Pure-Python. Keine Kompilierung oder Binärpakete benötigt, keine geheimnisvollen Abstürze. · Fielded Indexierung und Suche. · Schnelle Indexierung und Abruf - viel schneller als jede andere Pure-Python-Lösung. · Steckbarer Scoring-Algorithmus (einschließlich BM25F), Textanalyse, Speicher, Buchungsformat usw. · Leistungsstarke Abfragesprachen, die von Pyparsing analysiert wurde. · Reiner Python-Zauber-Checker (soweit ich weiß, der einzige). Anforderungen: · Python Was ist neu in dieser Version: · Weighting.final () -Methode hinzugefügt, die die endgültige Punktzahl eines Dokuments ändern kann, nachdem alle Term-Scores angesammelt wurden.


Rauschen Zugehörige Software