{"id":3195,"date":"2013-01-04T19:15:01","date_gmt":"2013-01-04T18:15:01","guid":{"rendered":"http:\/\/www.bdjl.de\/localhost\/?p=3195"},"modified":"2013-01-07T12:08:46","modified_gmt":"2013-01-07T11:08:46","slug":"ocr-unter-linux-revisited","status":"publish","type":"post","link":"https:\/\/www.bdjl.de\/localhost\/?p=3195","title":{"rendered":"OCR unter Linux revisited"},"content":{"rendered":"<p><a href=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2013\/01\/gimagereader_tesseract.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-3196\" alt=\"gimagereader_tesseract\" src=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2013\/01\/gimagereader_tesseract-640x389.png\" width=\"640\" height=\"389\" srcset=\"https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2013\/01\/gimagereader_tesseract-640x389.png 640w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2013\/01\/gimagereader_tesseract-1024x623.png 1024w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2013\/01\/gimagereader_tesseract-624x380.png 624w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2013\/01\/gimagereader_tesseract.png 1440w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a><\/p>\n<p>Tesseract befindet sich in einer aktuellen Version in den Repos von Fedora 18 (sowie Ubuntu) und <a href=\"http:\/\/sourceforge.net\/projects\/gimagereader\/\" target=\"_blank\">gimagereader<\/a> ist als RPM f\u00fcr Fedora 15 \/ als DEB f\u00fcr Ubuntu nach Installation einiger Voraussetzungen nicht nur installierbar, sondern arbeitet rund.<\/p>\n<p>Die Voraussetzungen werden mit RPM bei einem<\/p>\n<blockquote><p>rpm -i gimagereader-0.9-1.fc15.noarch.rpm<\/p><\/blockquote>\n<p>angezeigt und sind z\u00fcgig an Bord geholt:<\/p>\n<blockquote><p>yum install gnome-python2-gtkspell pypoppler python-imaging-sane<\/p><\/blockquote>\n<p>Wer unter Ubuntu mit gdebi, qapt oder \u00fcber das Softwarecenter installiert, zieht die Abh\u00e4ngigkeiten automatisch mit.<\/p>\n<p>Die Erkennungsleistung ist schon bei 300 DPI Scans hervorragend und kann durchaus mit kommerziellen Produktion mithalten &#8211; selbst bei kursivem Text oder leicht schr\u00e4gen Vorlagen.<\/p>\n<p>Was man von dieser L\u00f6sung nicht erwarten darf, sind Mehrfachtextboxen oder gar ordentliche Erkennungsleistungen bei Tabellen. Was auch nicht geht, ist der Export von Bildern oder des Layouts aus dem Scan in die Textdatei. Tesseract liefert plain text. Wer mehr will, kann z.B. das sehr gute Online-OCR von Finereader benutzen: <a href=\"http:\/\/finereader.abbyyonline.com\/\" target=\"_blank\">http:\/\/finereader.abbyyonline.com\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesseract befindet sich in einer aktuellen Version in den Repos von Fedora 18 (sowie Ubuntu) und gimagereader ist als RPM f\u00fcr Fedora 15 \/ als DEB f\u00fcr Ubuntu nach Installation einiger Voraussetzungen nicht nur installierbar, sondern arbeitet rund. Die Voraussetzungen werden mit RPM bei einem rpm -i gimagereader-0.9-1.fc15.noarch.rpm angezeigt und sind z\u00fcgig an Bord geholt: [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5,7],"tags":[116,348,347,346],"class_list":["post-3195","post","type-post","status-publish","format-standard","hentry","category-linux","category-office","tag-fedora","tag-gimagereader","tag-ocr","tag-tesseract"],"_links":{"self":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts\/3195","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3195"}],"version-history":[{"count":10,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts\/3195\/revisions"}],"predecessor-version":[{"id":3204,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts\/3195\/revisions\/3204"}],"wp:attachment":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3195"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3195"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3195"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}