Microsearch.

Eine kleine Suchbibliothek
Jetzt downloaden

Microsearch. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • BSD License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Daniel Lindsley
  • Website des Verlags:
  • http://toastdriven com

Microsearch. Stichworte


Microsearch. Beschreibung

MicroSearch ist eine kleine Python-Suchbibliothek. Impliziert, ein Lernwerkzeug zu sein, um den Grundlagen der Suche zu sein Talk - https://us.pycon.org/2012/schedule/presentation/66/usigtexample:import MicroSearch # Erstellen Sie eine Instanz, um darauf zu zeigen, wo die Daten gespeichert werden sollten.ms = microSearch.microsearch ('/ tmp / microSearch ') # Index einiger data.ms.index (' email_1 ', {' text ': "peter, \ n \ n \ n \ n \ n \ n \ n \ n \ n \ n \ n \ n \ n \ n \ Ni'm, die diese TPS berichtet, berichtet auf meinem Schreibtisch Anfang morgen! Und säubern Sie Ihren Schreibtisch! \ N \ nlumberggh "}) Ms.Index ('email_2', {'text': 'jeder, \ n \ nm-mmm-my rote hefter ist verschwunden. HH-hat a-an-any, das es gesehen hat? \ n \ nmilton '}) Ms.Index (' Email_3 ', {' Text ': "Peter, \ N \ NYEAH, ich werde Sie am Samstag eingehen müssen. Vergessen Sie nicht diese Berichte. \ n \ nlumbergh"} ) Ms.Index ('email_4', {'text': 'Wie fühlen Sie sich, Management zu werden? \ N \ NThhe Bobs'}) # Suchen Sie auf it.ms.Search ('Peter') MS.SEARCH ('TPS Report') Kreuzungsthis Library soll anderen helfen, andere zu lernen. Während es eine vollständige Testabdeckung aufweist, ist es möglicherweise nicht für die Produktionsnutzung geeignet. Gründe, warum Sie es möglicherweise nicht in einem realen Code verwenden möchten: - Keine Parallelitätsunterstützung versucht, atomisch mit Dateien zu arbeiten, es gibt jedoch keine Schlösser, so dass es möglich ist, dass er schreibt, um zwischen Prozessen zu überlappen - vielleicht Thread-Safe? Ziemlich alles ist in einem Fall, aber ich habe es jedoch nicht intensiv mit dem Threading-keinen Support zum Löschen von Dokumenten getestet. Wenn ein vorhandenes Dokument ändert oder gelöscht wird, werden stale Daten im Index ein Problemumgehung verlassen, wenn Bewegen der Dokumente aus und erneut Nicht lucene! Mit einem MBP 2011 in den ersten 1.2K-Dokumenten des EMRON Corpus: - Indexierung ist ziemlich langsam bei ~ 1-Dokument pro Sekunde - Suche ist ziemlich schnell bei ~ 0,007 sec pro Abfrage-RAM überschritten bei der Indexierung von 10 MB, wenn Sie in der Indexierung, 10 MB beim Such-Skript überschritten werden In der Quell-Repo als ENRON_BENCH.PY.RUNNE-Tests mit einer Quellkasse, RUN: in Python 2: Python -m UnitTest2 Testsin Python 3: Python -m UnitTest-Teststests sollten jederzeit unter Python 2.7 und Python 3.2.produzieren


Microsearch. Zugehörige Software