HTML-Parser

-Bibliothek zum Analysieren von HTML-Inhalten
Jetzt downloaden

HTML-Parser Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • LGPL
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Derrick Oswald
  • Website des Verlags:
  • Betriebssysteme:
  • Mac OS X
  • Dateigröße:
  • 323 KB

HTML-Parser Stichworte


HTML-Parser Beschreibung

Bibliothek zum Parsen von HTML-Inhalten HTML-Parser ist eine freie und Open-Source-Java-Bibliothek verwendet, um Parsing HTML in entweder einer linearen oder verschachtelte Art und Weise. In erster Linie verwendet für die Transformation oder Extraktion, verfügt über HTML-Filter, Besucher, benutzerdefinierte Tags und einfach zu bedienen Java Beans. Es ist eine schnelle, robuste und gut getestet package.ExtractionExtraction alle Programme, Information Retrieval umfasst, die nicht die Quellseite bewahren sollen. Dies umfasst Anwendungen wie: · Textextraktion, für beispielsweise Verwendung als Eingabe für Textsuche Datenbanken · Link-Extraktion, für Web-Seiten oder Ernte E-Mail addressesscreen Schaben kriechen durch, zur programmatischen Dateneingabe von Web-Seiten · Ressourcengewinnung, das Sammeln von Bildern oder Ton · ein Browser Front-End, die Vorstufe der Seitenanzeige · Link-Überprüfung, um sicherzustellen, Links gültig sind · Ort-Überwachung, Überprüfung auf Seite Unterschiede jenseits verein diffsThere sind mehrere Einrichtungen in der HTMLParser Code-Basis, um Hilfe bei der Extraktion, einschließlich Filter, Besucher und Java Beans. TransformationTransformation umfasst die gesamte Verarbeitung, wo der Eingang und der Ausgang HTML-Seiten sind. Einige Beispiele sind: · URL-Rewriting, ändern einige oder alle Links auf einer Seite · Website zu erfassen, Verschieben von Inhalten aus dem Internet auf die lokale Festplatte · Zensur, das Entfernen zu verletzen Wörter und Phrasen von Seiten · HTML-Bereinigung, Korrektur fehlerhafte Seiten · ad Entfernung, Excision URLs verweisen Werbung · Umstellung auf XML, Verschieben bestehende Web-Seiten in XML-Anforderungen: · Java Was ist neu in dieser Version: · Das HTMLParser Projekt wurde mit einer neuen Lizenz, neue Build-Umgebung, neues Repository und einer neuen Website aktualisiert. Um diese radikale Änderung zu identifizieren, die Version wurde auf 2,0 revved. · Auf Anfragen von der Apache-Community Als Reaktion hat die HTMLParser Lizenz von GNU Library oder Lesser General Public License geändert, auf die mehr Apache freundlich Common Public License 1.0 (http://opensource.org/licenses/cpl1.0.txt) . · Das HTMLParser Repository wurde von CVS auf Subversion geändert (http://subversion.tigris.org/). · Um die automatische Integration in anderen Projekten zu unterstützen, hat die Build-Umgebung von Ant auf Maven 2 (http://maven.apache.org/) geändert. Dies hat eine Gelegenheit, die Website (http://htmlparser.org) zu aktualisieren.


HTML-Parser Zugehörige Software

Effivalue

Eine kostenlose Bibliothek, um einen universellen Serialisierungsmechanismus für einen C ++ - Datentyp bereitzustellen ...

44 122 KB

Herunterladen