Genseim

Python Framework für Themenmodellierung
Jetzt downloaden

Genseim Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • LGPL
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Radim Rehurek
  • Website des Verlags:
  • http://nlp.fi.muni.cz

Genseim Stichworte


Genseim Beschreibung

Python Framework für Themenmodellierung Genseim ist eine in Python geschriebene Bibliothek, um unübervisiertes Lernen aus rohen, unstrukturierten digitalen Texten zu lernen. Es bietet einen Rahmen für die lernende (* latente *) Corpus-Struktur. Einmal gefunden, können Dokumente in Bezug auf diese Struktur kurz ausgedrückt werden, die für die topische Ähnlichkeit abgefragt werden, und so weiter. `Wikipedia _.Genssims Zielgruppe ist die NLP-Forschungsgemeinschaft und die interessierte Öffentlichkeit. Gensim soll kein Produktionsinstrument für kommerzielle Umgebungen sein. Creation von Gensim wurde durch ein wahrgenommenes Mangel an verfügbaren, skalierbaren Software-Frameworks motiviert, die das Thema-Modellierung und / oder ihre überwältigende interne Komplexität realisieren. Sie können mehr über die Motivation in unserem "LREC 2010-Werkstattpapier" lesen, `_.Die Hauptdesignziele hinter Gensim sind: 1. Unkomplizierte Schnittstellen und niedrige API-Lernkurve für Entwickler, erleichtern Modifikationen und schnelles Prototyping.2. Speicherunabhängigkeit in Bezug auf die Größe des Eingangskorpus; Alle Zwischenstufen und Algorithmen arbeiten streaming Mode, die ein Dokument gleichzeitig verarbeitet. Hier sind einige wichtige Funktionen von "Genseim": · Speicherunabhängigkeit - Es ist nicht erforderlich, dass der gesamte Text Corpus (oder alle Zwischenzeit-Dokumentenmatrizen) nicht in RAM in RAM aufzunehmen. · Bietet Implementierungen für mehrere beliebte Themen-Inferenzalgorithmen, darunter latente semantische Analyse (LSA, LSI) und latente Dirichlet-Zuteilung (LDA) und macht das Hinzufügen neuer Einfache. · Enthält E / A-Wrapper und Wandler um mehrere beliebte Datenformate. · Ermöglicht Ähnlichkeitsabfragen in ihrer latenten, topischen Darstellung. Anforderungen: · Python


Genseim Zugehörige Software