Das Lemur-Toolkit.

Kostenloser Sprachmodellierer für Mac OS X
Jetzt downloaden

Das Lemur-Toolkit. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Freeware
  • Preis:
  • FREE
  • Name des Herausgebers:
  • The Lemur Team
  • Website des Verlags:
  • http://www.lemurproject.org/
  • Betriebssysteme:
  • Mac OS X
  • Dateigröße:
  • 63.2 MB

Das Lemur-Toolkit. Stichworte


Das Lemur-Toolkit. Beschreibung

Free Language Modeler für Mac OS X Das Lemur-Toolkit ist so konzipiert, dass er Forschung in der Sprachmodellierung und des Informationsabrufs erleichtert, einschließlich solcher Technologien wie Ad-hoc und verteiltes Abruf, Zusammenfassung, Quersprache IR, Filterung und Klassifizierung. Was ist neu in dieser Version: · 4.9 Korrigiert verschiedene Probleme im 4.8 Vertriebspaket, bietet ein neues · Fileclassenvironment für den Warc-Dateieingang, verschiedene Indexendruckgeschwindigkeiten · Optimierungen für INDRI; und mehr. · Anwendungen, die mit dem LEMUR-Toolkit zusammengestellt werden, bedürfen der folgenden · Bibliotheken: Z, Iberty, Pthread und M auf Linux und zusätzlich Sockel · Und NSL auf Solaris. Anwendungen in Visual Studio erfordern erforderlich · Zusätzliche Bibliothek WSOCK32.lib. Die Java-JAR-Dateien wurden mit erstellt · Java 5 (JDK 1.5.5.0). Die Java UIs erfordern Java 5. Wir haben mit GCC getestet · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux X86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) und Visual Studio 2005 (Windows · XP). Verbesserungen: · Die LayoutManager-Einschränkungen wurden modifiziert, um die Größe zu verbessern · Verhalten der Komponenten. · Die Symbolleiste des Abfrageprotokolls und des Servers unterstützen das automatische Hochladen von Protokoll · Dateien auf geplanter Basis. Diese Vorliebe kann vom Benutzer der · Symbolleiste an vollständig automatisch, automatisch mit Bestätigung erforderlich · Vor dem Upload oder nur manuelle Upload nur. · In IndRI wurde eine neue FileclasseSwelt, WARC, hinzugefügt worden. Diese Umgebung · Ermöglicht die Indexierung des CLUEWEB09 Corpus, · Http: //boston.lti.cmu.edudata/clueweb09/ · Indri-Indexierungsgeschwindigkeits-Optimierungen, Bereitstellen von 5-15% Beschleunigen für GOV2 (25 Millionen Dokumente) Größensammlungen: · 1) Reduzieren Sie die Anzahl der Speicherzuteilungen / Deallokationen in · Indexwriter :: _ lookuptermid. · 2) Verwenden Sie die Option Voll Tabellen, -CF, von Flex. · 3) Machen Sie keine ASCII-Fallnormalisierung in · UTF8CASEmormalizationTransformation, da sie redundant ist. · 4) Verwenden Sie hash_set vom STL anstelle von string_set für Stoppwörter. · 5) Wenn der gelöschte Zähler 0 in der LöschdocumentList ist, erwerben Sie nicht das Lesen · Sperren, bevor Sie false zurücksenden. · 6) Verleih, anstatt in der RepositoryMaintenAnthread, zu verschmelzen, · Reduzieren Sie die Zahlenzeiten temporäre Indizes werden kopiert. Hör auf, Trimmung zu sammeln · Kandidaten, wenn ein Index zweimal die Größe des vorhergehenden Index ist · angetroffen. · 7) Nehmen Sie die Größe der Diskindexe bei der Schätzung des Gedächtnisses berücksichtigen · Verwendung. · 8) Begrenzen Sie die Gesamtmenge des Speichers, die zur Cache-Dokumentenlänge auf 20 MB verwendet wird · (5.000.000 Dokumente).


Das Lemur-Toolkit. Zugehörige Software

Rr.

Kostenloses Programm, das Datei- und Verzeichnispfade behält, ...

198 31 KB

Herunterladen