HtmlCleaner Ranking & Zusammenfassung
- Name des Herausgebers:
- Vladimir Nikic
- Betriebssysteme:
- Mac OS X
HtmlCleaner Stichworte
HtmlCleaner Beschreibung
KOSTENLOSER SOURCE-HTML-PARSER HTMLCleaner ist ein freier, offener Quell-HTML-Parser, der in Java geschrieben ist. HTML, die auf dem Netz gefunden wurde, ist in der Regel schmutzig, schlecht ausgebildet und ungeeignet für die Weiterverarbeitung. Für einen ernsthaften Verbrauch solcher Dokumente ist es notwendig, das Durcheinander zuerst zu reinigen und die Bestellung auf Tags, Attribute und gewöhnlichen Text zu bringen. Für das angegebene HTML-Dokument setzt HTMLCleaner individuelle Elemente und produziert gut ausgebildetes XML. Standardmäßig folgt HTMLCleaner ähnliche Regeln, die die meisten Webbrowser verwenden, um das Dokumentobjektmodell erstellen zu können. Der Benutzer kann jedoch benutzerdefiniertes Tag und Regelsatz für die Tag-Filterung und -ausgleich bereitstellen. Anforderungen: · Java 1.6 oder höher Was ist neu in dieser Version: · Parsing-Transformationen werden entwickelt, um bestimmte Tags oder Attribute während des Bereinigungsvorgangs leicht zu überspringen oder zu ändern. · Nur wenige mehr Konstrukteure wurden in der Klasse HTMLCleaner hinzugefügt, um die Möglichkeit, dasselbe sauberere Eigenschaften mit mehreren saubereren Instanzen wiederverwenden zu können. · Code Cleanup.
HtmlCleaner Zugehörige Software