| verblüfft Poster ist ein Python-Wrapper für die MG-Suchmaschine. |
Jetzt downloaden |
verblüfft Ranking & Zusammenfassung
- Name des Herausgebers:
- Matthias Kramm
- Website des Verlags:
- http://www.athana.org/magpy/
verblüfft Stichworte
verblüfft Beschreibung
Poster ist ein Python-Wrapper für die MG-Suchmaschine. Poster ist ein Python-Wrapper für die MG-Suchmaschine MASTY - *. TAR.GZ, und führen Sie die folgenden Befehle aus: ("/ tmp / data", "alice") während 1: query = sys.stdin.readline () q = speichern.newquery (abfragen) drucken "suche nach", abfragen, "(Wörter", q.words () , ")" für Docnum, Ranking in q.execute (): drucken "Dokument", docnum, "Übereinstimmungen (Ranking", Ranking, ")" Bevor Sie funktionieren, müssen Sie zuerst den Suchgeschäft anlegen (hier) den Standort "/ TMP / Daten", mit dem Namen "Alice". Das folgende Skript erstellt ein solches Speicher aus einer RAW-Textdatei, die sie in einzelne Dokumente spaltet, indem Sie ihn in Absätze aufteilen. #! / usr / bin / pythonimport mgindexerfi = open ("alice13a.txt", "rb") fo = open ("alice13a.splized.txt", "wb") für die linie in fi.Readlines (): # teilen Datei in den Absatzgrenzen if line.strip () == " .txt "," / tmp / data / "," alice ") Wenn Sie viele einzelnen Dokumente haben, möchten Sie eine Suche ausführen, das folgende Skript ist wahrscheinlich näher an dem, was Sie brauchen (Hinweis erzeugt eine neue Sammlung der Name "Dateien", sodass Sie "Alice" von "Dateien" im obigen Beispielabfrage-Skript ersetzen müssen): #! / usr / bin / pythonimport mgindexerimport ospath = "files /" fo = Open ("searchdata.txt", "WB") für die Datei in OS.ListDir (Pfad): Wenn os.path.isfile (Pfad + Datei): # Kopieren von Datei fi = Öffnen (Pfad + Datei, "RB") für Zeile in fi.Readlines (): FO.Write (Linie) # Schreiben Sie Dokumentgrenze fo.write (mgindexer.separator) fo.close () mgindexer.makesindex ("suchedata.txt", "/ tmp / data", "Dateien") Was ist neu in dieser Version: · Dieses r Elease fügt Unterstützung für die Wildcard-Suche (Abkürzung) hinzu. · Dokumenttypen, die von Whitespace unterscheiden, werden jetzt unterstützt.
verblüfft Zugehörige Software