Tesseract-ocr.

OCR-Motor, der zwischen 1985 und 1995 in HP Labs entwickelt wurde, und jetzt bei Google
Jetzt downloaden

Tesseract-ocr. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Name des Herausgebers:
  • theraysmith
  • Website des Verlags:
  • Betriebssysteme:
  • Windows XP / Vista / 7
  • Dateigröße:
  • 0 KB

Tesseract-ocr. Stichworte


Tesseract-ocr. Beschreibung

Bearbeiten von Tesseract ist wahrscheinlich der genaueste Open Source-OCR-Motor, der verfügbar ist. Kombiniert mit der LEPTONICA-Bildverarbeitungsbibliothek können Sie eine Vielzahl von Bildformaten lesen und in über 60 Sprachen in Text umwandeln. Es war eine der Top-3-Motoren im UnliV-Genauigkeitstest von 1995. Zwischen 1995 und 2006 hatte es wenig Arbeit, aber seitdem wurde es ausführlich von Google verbessert. Tesseract Release Notes 23. Oktober 2012 - v3.02.02 - Umgezogener Darsteller / Peitschenspieler in CCMain. - In den Ausgabe-Iteratoren für Hebräisch / Arabisch rechts nach links / Bidi-Fähigkeit hinzugefügt. - Absatzerkennung in der Layoutanalyse / Post OCR hinzugefügt. - Inkonsistente XHEIHs während des Trainings und des Überhäcks festgelegt. - Gleichzeitige mehrsprachige Fähigkeiten hinzugefügt. - Refactored Top-Level-Word-Erkennungsmodul. - Experimenteller Gleichungsdetektor hinzugefügt. - Verbesserte Handhabung der Auflösung von Eingabebildern. - Blamer-Modul zur Fehleranalyse hinzugefügt. - Das extern verwendete Namespace mit dem Entfernen von Baseapi.h aufgeräumt. - Dead Memory Management-Code entfernt. - Aufgehobene Einschränkungen auf Steuerungsparameter. - Unterstützung für grundlegende Unterstützung in Klassifizierer und Schulungen. - Refactored Class Pruner. - Fixierte Trainingslecks und Zufälligkeit. - Wichtige Verbesserungen der Layoutanalyse zur besseren Bilderkennung, dienlicher Erkennung, bessere Fundfindung, bessere Tabstop-Finding. - Verbesserte Linienerkennung und Entfernung. - Fixierter Pitch-Chopper für CJK hinzugefügt. - Unicharset hinzugefügt, um Werd_Phoice zu einem leichteren Umgang mit mehreren Sprachen zu erstellen. - Probleme mit intern skalierten Bildern. - Seite und BBoX in die Zeichenfolge in TR-Dateien hinzugefügt, um die Quelle von Trainingsdaten besser zu erkennen. - Fixiert an Hindi Shiroreka Splitter. - Word Bigram-Korrektur hinzugefügt. - Reduzierter Stapelspeicherverbrauch und eliminierte hässliche Typedefs. - Neue Uniform Classifier-API hinzugefügt. - Neuen Trainingsfehlerzähler hinzugefügt. - Endian-Fehler in Dawg-Leser behoben. - C-API (dank Tobias Müller) - neue Lösung für VS 2008 (dank Tom Powers) - Und mehr...


Tesseract-ocr. Zugehörige Software