Cleartk.

ein Toolkit zur Entwicklung statistischer natürlicher Sprachverarbeitungskomponenten in Java
Jetzt downloaden

Cleartk. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • BSD
  • Preis:
  • FREE
  • Name des Herausgebers:
  • ClearTK Team
  • Website des Verlags:
  • http://code.google.com/p/cleartk/
  • Betriebssysteme:
  • Mac OS X
  • Dateigröße:
  • 435 KB

Cleartk. Stichworte


Cleartk. Beschreibung

Ein Toolkit zur Entwicklung statistischer natürlicher Sprachverarbeitungskomponenten in Java Das ClearTK-Toolkit basiert auf dem Apache-UIMA-Framework für Textanalysis.Cleartk ist ein Projekt, das im Zentrum für Rechensprache und Bildungsforschung (CLEAR) an der Universität Colorado in Boulder entwickelt wurde. ClearTk bietet in einer Nussschale einen Rahmen für die Entwicklung statistischer Natural Language Processing (NLP) in Java und bietet zwei Bibliotheken: ClearTk-Framework und ClearTk-Toolkit, die kurz unten zusammengefasst sind. CLEARTK Framework: Der ClearTK-Framework bietet Infrastruktur zur Entwicklung von UIMA Analyse-Engines, die statistisches Lernen als Grundlage für die Entscheidungsfindung und Annotationserstellung verwenden. Das CLEARTK-Framework liefert Folgendes: · Eine Rich-Feature-Extraktionsbibliothek · Eine gemeinsame Schnittstelle und Wrapper für beliebte Maschinenlernen-Bibliotheken, die auf Modellen wie maximale Entropie, Support-Vektormaschinen und bedingte Zufallsfelder basieren. Es unterstützt derzeit libsvm, OpenNLP Maxent, Mallet-Klassifizierer, Mallet bedingte Zufällige Felder, SVMlight. Der Ansatz des Entwicklers ermöglicht es, dass man einen Best-of-Breed-Ansatz nutzen kann, indem man eine Maschinenlernen-Bibliothek für einen anderen so twagt, dass der Code, der die Kernlogik des Analyse-Motors implementiert, nicht geändert werden muss. · Die App bietet ein agnostischer Ansatz des Typensystems. Das ClearTK-Framework hängt nicht von einem bestimmten Typ-System ab. Der vom Rahmen bereitgestellte Code soll als Grundlage für die Erstellung neuer Analysismotoren in Ihrer Umgebung verwendet werden, so dass Sie Komponenten erstellen können, die für Ihre Anforderungen und das TYP-System spezifisch sind. · Das Framework kann aus der Seite Downloads heruntergeladen werden, aus dem Subversion-Repository als Eclipse-Projekt ausgecheckt oder als MAVEN-Abhängigkeit hinzugefügt wird, wenn Sie MAVEN verwenden, um Ihr Projekt aufzubauen (siehe unten). Cleartk Toolkit: Das ClearTK-Toolkit bietet UIMA-Komponenten und / oder Infrastruktur zum Ansprechen bestimmter Aufgaben. Das Toolkit liefert Folgendes: · Sammlungsleser für häufig verwendete Corpora (z. B. CONLL, ACE, PenntreeBank, Genia, Timeml) · Infrastruktur zur Erstellung von NLP-Komponenten für spezifische Aufgaben wie Teil der Speech-Tagging, Bio-Chunking, benannte Entität Anerkennung, syntaktisches Parserier, semantische Rollenkennzeichnung, zeitliche Auflösung usw. · Wrapper für gemeinsame NLP-Komponenten wie den Schneeball-Stemmer und OpenNLP-Komponenten. · Das ClearTK-Toolkit bietet ein Typsystem und viele der Komponenten (und die Gerätestests), die von diesem Typsystem abhängen. Wir haben jedoch hart daran gearbeitet, den Code im Toolkit-Typ-System Agnostic durch Parametrisierung von Komponenten durch Typen oder durch Parametern von Komponenten oder durch parametrische Komponenten, die über die generische Tippen, parametrieren. · Das Toolkit ist derzeit nur als Eclispe-Projekt verfügbar, das aus den Anforderungen der Subversion-Repository ausgecheckt werden kann: · Java


Cleartk. Zugehörige Software

Apache Pivot.

Java-basierte RIA-Bauplattform, die die verbesserten Merkmale eines modernen RIA-Toolkits mit der Robustheit der Java-Plattform kombiniert ...

234 16.7 MB

Herunterladen