Das Lemur-Toolkit.Kostenloser Sprachmodellierer für Mac OS X | |
Jetzt downloaden |
Das Lemur-Toolkit. Ranking & Zusammenfassung
Anzeige
- Lizenz:
- Freeware
- Preis:
- FREE
- Name des Herausgebers:
- The Lemur Team
- Website des Verlags:
- http://www.lemurproject.org/
- Betriebssysteme:
- Mac OS X
- Dateigröße:
- 63.2 MB
Das Lemur-Toolkit. Stichworte
Das Lemur-Toolkit. Beschreibung
Free Language Modeler für Mac OS X Das Lemur-Toolkit ist so konzipiert, dass er Forschung in der Sprachmodellierung und des Informationsabrufs erleichtert, einschließlich solcher Technologien wie Ad-hoc und verteiltes Abruf, Zusammenfassung, Quersprache IR, Filterung und Klassifizierung. Was ist neu in dieser Version: · 4.9 Korrigiert verschiedene Probleme im 4.8 Vertriebspaket, bietet ein neues · Fileclassenvironment für den Warc-Dateieingang, verschiedene Indexendruckgeschwindigkeiten · Optimierungen für INDRI; und mehr. · Anwendungen, die mit dem LEMUR-Toolkit zusammengestellt werden, bedürfen der folgenden · Bibliotheken: Z, Iberty, Pthread und M auf Linux und zusätzlich Sockel · Und NSL auf Solaris. Anwendungen in Visual Studio erfordern erforderlich · Zusätzliche Bibliothek WSOCK32.lib. Die Java-JAR-Dateien wurden mit erstellt · Java 5 (JDK 1.5.5.0). Die Java UIs erfordern Java 5. Wir haben mit GCC getestet · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux X86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) und Visual Studio 2005 (Windows · XP). Verbesserungen: · Die LayoutManager-Einschränkungen wurden modifiziert, um die Größe zu verbessern · Verhalten der Komponenten. · Die Symbolleiste des Abfrageprotokolls und des Servers unterstützen das automatische Hochladen von Protokoll · Dateien auf geplanter Basis. Diese Vorliebe kann vom Benutzer der · Symbolleiste an vollständig automatisch, automatisch mit Bestätigung erforderlich · Vor dem Upload oder nur manuelle Upload nur. · In IndRI wurde eine neue FileclasseSwelt, WARC, hinzugefügt worden. Diese Umgebung · Ermöglicht die Indexierung des CLUEWEB09 Corpus, · Http: //boston.lti.cmu.edudata/clueweb09/ · Indri-Indexierungsgeschwindigkeits-Optimierungen, Bereitstellen von 5-15% Beschleunigen für GOV2 (25 Millionen Dokumente) Größensammlungen: · 1) Reduzieren Sie die Anzahl der Speicherzuteilungen / Deallokationen in · Indexwriter :: _ lookuptermid. · 2) Verwenden Sie die Option Voll Tabellen, -CF, von Flex. · 3) Machen Sie keine ASCII-Fallnormalisierung in · UTF8CASEmormalizationTransformation, da sie redundant ist. · 4) Verwenden Sie hash_set vom STL anstelle von string_set für Stoppwörter. · 5) Wenn der gelöschte Zähler 0 in der LöschdocumentList ist, erwerben Sie nicht das Lesen · Sperren, bevor Sie false zurücksenden. · 6) Verleih, anstatt in der RepositoryMaintenAnthread, zu verschmelzen, · Reduzieren Sie die Zahlenzeiten temporäre Indizes werden kopiert. Hör auf, Trimmung zu sammeln · Kandidaten, wenn ein Index zweimal die Größe des vorhergehenden Index ist · angetroffen. · 7) Nehmen Sie die Größe der Diskindexe bei der Schätzung des Gedächtnisses berücksichtigen · Verwendung. · 8) Begrenzen Sie die Gesamtmenge des Speichers, die zur Cache-Dokumentenlänge auf 20 MB verwendet wird · (5.000.000 Dokumente).
Das Lemur-Toolkit. Zugehörige Software
Qchartdig
Notieren Sie Ihre Gedanken mit diesem Tagebuch mit dem qt-basierten Tagebuch ...
342 69 KB