HTML-ParserHTML-Parser ist eine Java-Bibliothek, mit der HTML entweder linear oder verschachtelt ist. | |
Jetzt downloaden |
HTML-Parser Ranking & Zusammenfassung
Anzeige
- Lizenz:
- LGPL
- Preis:
- FREE
- Name des Herausgebers:
- Derrick Oswald
- Website des Verlags:
- http://htmlparser.org
HTML-Parser Stichworte
HTML-Parser Beschreibung
HTML-Parser ist eine Java-Bibliothek, mit der HTML entweder linearer oder verschachtelter Weise analysiert wird. HTMLPARSER ist ein superschneller Echtzeit-Parser für Real-World HTML. Was die meisten Entwicklern an HtmlParser anziehen hat, ist ihre Einfachheit in Design, Geschwindigkeit und Fähigkeit, mit dem Streaming Real-World HTML zu handhaben. Die beiden grundlegenden Anwendungsfälle, die von dem Parser abgewickelt werden, sind Extraktion und Transformation (der Synthesen-Verwendung-Case, wobei HTML Seiten werden von Grund auf erstellt, wird besser von anderen Werkzeugen, die näher an der Datenquelle näher sind). Während frühere Versionen auf die Datenextraktion von Webseiten konzentriert sind, hat Version 1.4 des HTMLPARSER erhebliche Verbesserungen im Bereich der Transformationswebseiten mit vereinfachtem Tag-Erstellung und Bearbeitung und Verbatim TOHTML () -Methode Output. Um HTMLPARSER zu verwenden, müssen Sie benötigen um Code in der Java-Programmiersprache schreiben zu können. Obwohl einige Beispielprogramme bereitgestellt werden, die bei der Erstellung nützlich sein können, benötigen Sie mehr als wahrscheinlich, dass Sie Ihre eigenen Programme erstellen oder diejenigen ändern, die zur Verfügung gestellt werden sollen, um Ihre beabsichtigte Anwendung anzupassen. Um die Bibliothek zu verwenden, müssen Sie die Bibliothek verwenden. Fügen Sie Ihren Klassenpfad entweder den HTMLlexer.jar oder HTMLPARSER.JAR hinzu, wenn Sie beim Kompilieren und Laufen kompilieren. Der HTMLEXER.JAR bietet einen niedrigen Pegelzugriff auf generische Zeichenfolge, Bemerkungen und Tag-Knoten auf der Seite auf einer linearen, flachen, sequentiellen Weise. Der HTMLParser.jar, der die in htmllexer.jar gefundenen Klassen enthält, bietet Zugriff auf eine Seite als Folge von verschachtelten differenzierten Tags, die Zeichenfolge, Bemerkung und andere Tag-Knoten enthalten. Wenn also die Ausgabe von Anrufen an die Lexer NextNode () -Methode ist:
HTML-Parser Zugehörige Software
Japar
JAVA ist eine Java-API, die so konzipiert wurde, dass sie die API der Sun-API mit verschiedenen Funktionen ausdehnt. ...
165
Libphish
libphish ist eine plattformübergreifende Bibliothek, um mit der offenen Phishing-Datenbank zu interagieren. ...
141
GNU LIBXMI.
GNU LIBXMI ist eine C / C ++ - Funktionsbibliothek für die Rasterisierung von 2-D-Vektorgrafiken. ...
154
Smalloc
SMALOC (Static Memory Puffer Malloc) ist ein idealer Speichermanager für Echtzeit-Linux-Kernel-Module. ...
218