| Wikiprep Perl-Skript für die Vorverarbeitung von Wikipedia XML-Dumps |
Jetzt downloaden |
Wikiprep Ranking & Zusammenfassung
- Name des Herausgebers:
- Evgeniy Gabrilovich
- Betriebssysteme:
- Mac OS X
Wikiprep Stichworte
Wikiprep Beschreibung
Perl-Skript für die Vorverarbeitung Wikipedia XML-Müllkippe WikipRep ist ein Perl-Skript, das MediaWiki Data Dumps im XML-Format analysiert und nützliche Informationen von ihnen extrahiert. WikipRep implementiert eine Teilmenge der MediaWiki-Syntax (z. B. der Vorlage-Aufnahme mit Parametern, externen und internen Verbindungen, Umleitungen, Überschriften usw.) erfolgt in Form mehrerer Dateien: Einige von ihnen in einem einfachen, lineorientierten Format und einigen von ihnen in Xml. Eine der Dateien enthält auch verarbeitete Wikipedia-Seiten in einer einfachen HTML-ähnlichen Syntax. Ziel von Wikiprep ist es, Wikipedia-Daten-Dumps in ein Format zu konvertieren, das mit anderen Werkzeugen problemlos verarbeitet werden kann. Diese Werkzeuge müssen dann nicht das gesamte Wissen aller Macken und ungeraden Ecken der MediaWiki-Syntax haben. Anforderungen: · Perl.
Wikiprep Zugehörige Software