J4L OCR-Werkzeuge. Ranking & Zusammenfassung
- Name des Herausgebers:
- J4L Components
- Betriebssysteme:
- Windows All
J4L OCR-Werkzeuge. Stichworte
J4L OCR-Werkzeuge. Beschreibung
J4L OCR-Tools ist ein leistungsstarker Satz von Komponenten, die auf OCR-Funktionen in Java-Anwendungen umfassen. Das heißt, Sie können Faxe oder Scannen von Dokumenten empfangen und Geschäftsinformationen aus den Bildern extrahieren. Die wichtigsten 2 Komponenten sind: · Ein Java-Wrapper für den Tesseract OCR-Motor. Die OCR-Engine Tesseract selbst wird unter der Apache 2.0-Lizenz geliefert, und wir unterstützen nur eine Version, die nur für Windows kompiliert wurde. · Ein Textdokumentsparer. Der Bilderkennungsprozess kann daher in 2 Schritte unterteilt werden: · Die Komponente nimmt eine Bilddatei (TIF, PNG, JPG usw.) an und gibt den darin enthaltenen Text zurück. Der Java-Wrapper führt diesen Vorgang mit Tesseract aus. Alternativ können Sie einen beliebigen anderen OCR-Motor verwenden. · In dem zweiten Schritt muss Ihre Java-Anwendung den von der OCR-Engine zurückgegebenen Text verstehen. Dies erfolgt durch den Dokumentenparser. Der Dokumentparser verwendet als Input als Textzeichenfolge (die Daten) und eine XML-Datei, die die Struktur des Dokuments beschreibt, und der OUUPUT ist ein Geschäftsdokument entweder als Java-Objekt oder als XML-Datei
J4L OCR-Werkzeuge. Zugehörige Software