Wp2txt.

Extrahieren Sie Text aus der Wikipedia-Dump-Datei schnell und einfach.
Jetzt downloaden

Wp2txt. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Name des Herausgebers:
  • Yoichiro Hasebe
  • Dateigröße:
  • 5.2 MB

Wp2txt. Stichworte


Wp2txt. Beschreibung

WP2TXT ist eine kleine, benutzerfreundliche Anwendung, die speziell entwickelt wurde, die Ihnen dabei dabei unterstützt, Klartextdaten aus der Wikipedia-Dump-Datei (codiert in XML / komprimiert mit BZIP2), die alle MediaWiki-Markups und anderen Metadaten abreißen. Es ist ursprünglich gedacht, für Forscher nützlich zu sein, die nach einem einfachen Weg suchen, um ein multi-linguales Open-Source-Corpora zu erhalten, aber für andere Zwecke handlich sein kann.


Wp2txt. Zugehörige Software