Natürliche Sprache Toolkit.

Natural Language Toolkit ist eine Suite von Python-Bibliotheken und -programmen für die symbolische und statistische Natürlichkeits-Verarbeitung.
Jetzt downloaden

Natürliche Sprache Toolkit. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • GPL
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Steven Bird
  • Website des Verlags:

Natürliche Sprache Toolkit. Stichworte


Natürliche Sprache Toolkit. Beschreibung

Natural Language Toolkit ist eine Suite von Python-Bibliotheken und -Programme für die symbolische und statistische Natursprachverarbeitung. Natural Language Toolkit ist eine Suite von Python-Bibliotheken und -Programme für die symbolische und statistische Natursprachverarbeitung. NLTK enthält grafische Demonstrationen und Beispieldaten. Es wird von einer umfangreichen Dokumentation einbezogen, einschließlich Tutorials, die die zugrunde liegenden Konzepte hinter den von der Toolkit-Verarbeitungsaufgabe unterstützt werden, die von der Toolkit.Documentation unterstützt werden. Seite: Insbesondere enthält die NLTK-Homepage drei Arten von Dokumentationsarten: · Tutorials Unterrichten Sie die Schüler, wie Sie das Toolkit verwenden, im Rahmen der Durchführung bestimmter Aufgaben. Sie sind für jeden geeignet, der lernen möchte, wie Sie das Toolkit verwenden möchten. · Die Referenzdokumentation der Toolkit beschreibt jedes Modul, Schnittstelle, Klasse, Methode, Funktion und Variable im Toolkit. Diese Dokumentation sollte sowohl für Benutzer als auch für Entwickler nützlich sein. · Eine Reihe von technischen Berichten ist verfügbar. Diese Berichte erklären und rechtfertigen und rechtfertigen das Design und die Implementierung des Toolkits. Sie werden von den Entwicklern des Toolkits verwendet, um die Konstruktion des Toolkits zu leiten und zu dokumentieren. Die Studierenden können diese Berichte beraten, wenn sie weitere Informationen darüber wünschen, wie das Toolkit entworfen wird und warum sie so gestaltet ist. Was ist neu in dieser Version: NLTK: - Erweitertes Semantikpaket für die Erstbestellung Logik, lineare Logik, Klebstoffsemantik, DRT, LFG (DAN Garrette) - Neue WORSENSE-Klasse in WordNet .Synset unterstützen Zugriff auf Synsets aus Sense-Tasten und Zugriff auf Sense-Zählungen (Joel Nothman) - Schnittstelle zur Linearkette CRF-Implementierung von Mallet (NLTK.TAG.CRF) - Misc-Bugfixes inkl. Misc Leser, neuer Regeltyp: ChunkRuleWithContext- Neuer GUI für POS-markierte Concordancing NLTK.Draw.POS_CONCORDANCE - NEU GUI für die Entwicklung von regexP-Chunkers NLTK.Draw.rechunkparser - Bio_SENTS () und BIO_Words () Methoden hinzugefügt, um zuzulassen, dass Lesen (Word, Tag, Chunk_Typ) Tupel von Conll-2000 Corpus. Auch modifizierte ConllchunkCorpusView, um diese Änderungen zu unterstützen. -Verzierende Bäume, die die Elternzeiger automatisch aufrechterhalten (NLTK.Tree.ParentTree und NLTK.Tree.multiparedtree) - Neuer WordNet-Browser GUI (Jussi Salmela, Paul Bone) - Verbesserte Unterstützung für faule Sequenzen - generierte () Methode zur Wahrscheinlichkeitsverteilung - mehr Flexibler Parser zum Umwandeln von Halterungen in Breaking-Fixes an DocStrings, um die API-Dokumentation Control (Arbeitsplatzarbeit) - neues NLG-Paket, FUF / Surge (Petro Verkhogliad) - neues Abhängigkeitsparer-Paket (Jason Narad) - New Coreference-Paket, inkl. Für ACE-2, MUC-6 und MUC-7 Corpora (Joseph Frazee) - CCG Parser (Graeme Gange) - Erstauftragsauflösung Theorem-Besprecher (Dan Garrette) Daten: - NNW NPS Chat Corpus A ND Corpus Reader (NLTK.corpus.nps_chat) - ConllCorpusReader kann jetzt verwendet werden, um die CONLL 2004 und 2005 corpora zu lesen Es werden eingelegte Versionen dieser Objekte in Daten / Tagger und Daten / Chunkers eingecheckt.Book: - Sonstige Korrekturen als Antwort auf Feedback von Lesern Was ist neu in dieser Version? · Diese Version finalisiert die API von NLTK vor der Version 2.0 und der Veröffentlichung des NLTK-Buchs. Es gab Dutzende kleinerer Verbesserungen und Bugfixes. Viele Namen des Formulars NLTK.FOO.BAR sind jetzt als NLTK.BAR verfügbar. Es wird im Entscheidungsbaum, Kollokationen und Toolbox-Modulen erweitert. Ein neues Übersetzungsspielzeug NLTK.Misc.babelfish wurde hinzugefügt. Ein neues Modul NLTK.Help bietet Zugriff auf die Dokumentation der Tagset. Feste Importe, so dass NLTK ohne Tkinter (zum Laufen auf Servern) erstellt und installiert wird. Neue Daten umfassen ein maximales Entropie-Chunker-Modell und aktualisierte Grammatiken. NLTK-Conent enthält Aktualisierungen des Coreferenzpakets (Joseph Frazee) und dem Isri-arabischen Stemmer (Hosam Algasaier). Das Buch ergab erhebliche redaktionelle Korrekturen vor der endgültigen Veröffentlichung.


Natürliche Sprache Toolkit. Zugehörige Software

Cal10n

Eine Java-Bibliothek zum Schreiben lokalisierter (internationalisierter) Nachrichten ...

167

Herunterladen