Clark-System

Ein XML-basierte Softwaresystem für die in Java implementierte Corpora-Entwicklung
Jetzt downloaden

Clark-System Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Freeware
  • Name des Herausgebers:
  • CLaRK Team
  • Betriebssysteme:
  • Windows All
  • Dateigröße:
  • 3.8 MB

Clark-System Stichworte


Clark-System Beschreibung

Das Hauptziel für das Design des Systems ist die Minimierung des menschlichen Eingriffs während der Erstellung von Sprachressourcen. Es enthält mehrere Technologien: 1. XML-Technologie; 2. Unicode; 3. regelmäßige kaskadierte Grammatiken; 4. Einschränkungen über XML-Dokumente. Für Dokumentenmanagement, Speicherung und Abfragen haben wir die XML-Technologie aufgrund seiner Beliebtheit und ihrer einfachen Verständigung ausgewählt. Der Kern von Clark ist ein Unicode-XML-Editor, der die Hauptschnittstelle zum System ist. Neben der XML-Sprache selbst haben wir eine XPath-Sprache für die Navigation in Dokumenten und einer XSLT-Sprache zur Transformation von XML-Dokumenten implementiert. Für mehrsprachige Verarbeitungsaufgaben basiert Clark auf einer Unicode-Kodierung der Informationen im System. Es gibt einen Mechanismus für die Schaffung einer Hierarchie von Tokenisern. Sie können an den Elementen in den DTDs angehängt werden, und auf diese Weise gibt es unterschiedliche Tokenisatoren für verschiedene Teile der Dokumente. Der grundlegende Mechanismus von Clark für die sprachliche Verarbeitung von Text-Corpora ist der kaskadierte reguläre Grammatikprozessor. Die Hauptherausforderung an die fraglichen Grammatiken ist, wie Sie sie auf die XML-Kodierung der sprachlichen Informationen anwenden können. Das System bietet eine Lösung mithilfe einer XPath-Sprache zum Erstellen des Eingangsworts an die Grammatik und eine XML-Kodierung der Kategorien der erkannten Wörter. Gib Clark-System ein, um seine Fähigkeiten vollständig zu beurteilen!


Clark-System Zugehörige Software