HtmlCleaner

freier und offener HTML-Parser
Jetzt downloaden

HtmlCleaner Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • BSD
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Vladimir Nikic
  • Website des Verlags:
  • Betriebssysteme:
  • Mac OS X
  • Dateigröße:
  • 1.6 MB

HtmlCleaner Stichworte


HtmlCleaner Beschreibung

KOSTENLOSER SOURCE-HTML-PARSER HTMLCleaner ist ein freier, offener Quell-HTML-Parser, der in Java geschrieben ist. HTML, die auf dem Netz gefunden wurde, ist in der Regel schmutzig, schlecht ausgebildet und ungeeignet für die Weiterverarbeitung. Für einen ernsthaften Verbrauch solcher Dokumente ist es notwendig, das Durcheinander zuerst zu reinigen und die Bestellung auf Tags, Attribute und gewöhnlichen Text zu bringen. Für das angegebene HTML-Dokument setzt HTMLCleaner individuelle Elemente und produziert gut ausgebildetes XML. Standardmäßig folgt HTMLCleaner ähnliche Regeln, die die meisten Webbrowser verwenden, um das Dokumentobjektmodell erstellen zu können. Der Benutzer kann jedoch benutzerdefiniertes Tag und Regelsatz für die Tag-Filterung und -ausgleich bereitstellen. Anforderungen: · Java 1.6 oder höher Was ist neu in dieser Version: · Parsing-Transformationen werden entwickelt, um bestimmte Tags oder Attribute während des Bereinigungsvorgangs leicht zu überspringen oder zu ändern. · Nur wenige mehr Konstrukteure wurden in der Klasse HTMLCleaner hinzugefügt, um die Möglichkeit, dasselbe sauberere Eigenschaften mit mehreren saubereren Instanzen wiederverwenden zu können. · Code Cleanup.


HtmlCleaner Zugehörige Software

Pergamon

Open Source-Java-Bibliothek, mit der Sie Metadaten aus verschiedenen Dateitypen extrahieren können ...

223 12.1 MB

Herunterladen