| Webharvest. Kostenloses und Open Source Web Data Extraktionstool in Java geschrieben |
Jetzt downloaden |
Webharvest. Ranking & Zusammenfassung
- Name des Herausgebers:
- Vladimir Nikic
- Betriebssysteme:
- Mac OS X
Webharvest. Stichworte
Webharvest. Beschreibung
Kostenloses Web Data Extraktionstool in Java geschrieben Web-Harvest bietet einen Weg, um gewünschte Webseiten zu sammeln und nützliche Daten von ihnen zu extrahieren. Um dies zu tun, nutzt sie gut etablierte Techniken und Technologien für die Text- / XML-Manipulation wie reguläre Ausdrücke, XQuery und XSLT.Web-Harvest konzentriert sich hauptsächlich auf HTML / XML-basierte Websites, die immer noch eine große Mehrheit des Webinhalts machen. Andererseits konnte es leicht durch benutzerdefinierte Java-Bibliotheken ergänzt werden, um seine Extraktionsfähigkeiten zu erhöhen. Hinweis: WebHarvest ist lizenziert und unter den Bedingungen der BSD-Lizenz verteilt. Anforderungen: · Java Was ist neu in dieser Version: · GUI wird eingeführt. · Der HTML-to-XML-Prozessor legt Attribute zur Steuerung des Reinigungsverhaltens aus. · Mehr Skriptsprachen und -Funktionen unterstützt. · Zugriff auf httpClient in der Laufzeit unterstützt. · Anzahl anderer Verbesserungen und Korrekturen.
Webharvest. Zugehörige Software