{"id":224,"date":"2009-01-03T15:08:38","date_gmt":"2009-01-03T14:08:38","guid":{"rendered":"http:\/\/www.bdjl.de\/localhost\/?p=224"},"modified":"2013-01-04T19:16:21","modified_gmt":"2013-01-04T18:16:21","slug":"ocr","status":"publish","type":"post","link":"https:\/\/www.bdjl.de\/localhost\/?p=224","title":{"rendered":"OCR unter Linux"},"content":{"rendered":"<p>OCR ist unter Linux ein Problemkind. Es gibt zwar <a href=\"http:\/\/jocr.sourceforge.net\/\" target=\"_blank\">gocr<\/a>, <a href=\"http:\/\/www.gnu.org\/software\/ocrad\/ocrad.html\" target=\"_blank\">ocrad<\/a> und hoffentlich bald auch ein einfach zu installierendes <a href=\"http:\/\/code.google.com\/p\/tesseract-ocr\/\" target=\"_blank\">tesseract<\/a>, das deswegen hier nicht mehr weiter behandelt wird, aber weder gocr noch ocrad liefern bei mir Erkennungsraten von mehr als 90% unter Idealbedingungen.<\/p>\n<p>Damit dauert die Bearbeitung der Ergebnisse oft l\u00e4nger als das Abtippen &#8211; vor allem weil a und o, l und 1 sowie in bzw. rn und m Fehler auch beim Korrekturlesen nur schwer zu finden sind, wenn man den Text schon kennt.<\/p>\n<p>Dabei w\u00fcrde mit kooka eine v\u00f6llig ausreichende Oberfl\u00e4che f\u00fcr OCR zur Verf\u00fcgung stehen, die bis auf Mehrfachauswahlen schon fast alles mitbringt, was man im OCR Alltag als Pauker braucht.<\/p>\n<blockquote><p>sudo apt-get install kooka ocrad gocr<\/p><\/blockquote>\n<p>Unter Hardy und Gnome nistet sich kooka dann im Men\u00fc unter \/Anwendungen \/Grafik ein.<\/p>\n<p><a href=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-231\" title=\"bildschirmfoto\" alt=\"bildschirmfoto\" src=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-450x321.png\" width=\"450\" height=\"321\" srcset=\"https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-450x321.png 450w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto.png 1024w\" sizes=\"auto, (max-width: 450px) 100vw, 450px\" \/><\/a><\/p>\n<p>Der Scan erfolgt aus der Oberfl\u00e4che von kooka heraus.<\/p>\n<p><a href=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-1.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-230\" title=\"bildschirmfoto-1\" alt=\"bildschirmfoto-1\" src=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-1-450x393.png\" width=\"450\" height=\"393\" srcset=\"https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-1-450x393.png 450w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-1.png 540w\" sizes=\"auto, (max-width: 450px) 100vw, 450px\" \/><\/a><\/p>\n<p>Bei der ersten Verwendung fragt kooka nach dem Standarddateiformat, in dem die Scans in einer Art &#8222;internen Speicher&#8220; vorr\u00e4tig gehalten werden sollen.<\/p>\n<p><a href=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-2.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-228\" title=\"bildschirmfoto-2\" alt=\"bildschirmfoto-2\" src=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-2-450x319.png\" width=\"450\" height=\"319\" srcset=\"https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-2-450x319.png 450w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-2.png 1024w\" sizes=\"auto, (max-width: 450px) 100vw, 450px\" \/><\/a><\/p>\n<p>Nach einer einfachen Auswahl des zu \u00fcbersetzenden Bildbereichs mit der Maus kann das OCR durch Klick auf das entsprechende Icon auch einfach gestartet werden &#8211; hier mit ocrad.<\/p>\n<p><a href=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-3.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-227\" title=\"bildschirmfoto-3\" alt=\"bildschirmfoto-3\" src=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-3-450x320.png\" width=\"450\" height=\"320\" srcset=\"https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-3-450x320.png 450w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-3.png 1024w\" sizes=\"auto, (max-width: 450px) 100vw, 450px\" \/><\/a><\/p>\n<p>Nach kurzer Zeit wird ein Textfensterchen mit dem Plaintextergebnissen eingeblendet. Ein Klick in das Fenster gefolgt von [Strg] [A] und [Strg] [C] sowie ein folgender Klick in die Textverarbeitung und [Strg] [V] erledigt den Rest. Jetzt darf Korrektur gelesen werden &#8211; und das nicht zu knapp.<\/p>\n<p><a href=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-4.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-226\" title=\"bildschirmfoto-4\" alt=\"bildschirmfoto-4\" src=\"http:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-4-450x319.png\" width=\"450\" height=\"319\" srcset=\"https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-4-450x319.png 450w, https:\/\/www.bdjl.de\/localhost\/wp-content\/uploads\/2009\/01\/bildschirmfoto-4.png 1024w\" sizes=\"auto, (max-width: 450px) 100vw, 450px\" \/><\/a><\/p>\n<p>V\u00f6llig unertr\u00e4gliche Ergebnisse werden IMHO mit gocr erzeugt, das als Erkennungsengine ebenfalls eingestellt werden kann. Die Installation von ocrad lohnt also. Au\u00dferdem ist ocrad meist um Einiges schneller als gocr.<\/p>\n<p>Was weder unter gocr noch ocrad funktioniert ist die Erkennung von Layouts. Selbst einfachste Tabellen, wie im Bild oben leidlich zu erkennen, bringen beide OCR v\u00f6llig aus dem Tritt. Was relativ gut hinhaut ist, wenn man etwas Gl\u00fcck hat, die Erkennung von reinen Textbl\u00f6cken bei serifenlosen Schriften mit mindestens 12 Pixel Schriftgr\u00f6\u00dfe.<\/p>\n<p>Im Alltag setze ich an dieser Stelle auf eine VM unter Windows 98 SE oder auch Windows XP. F\u00fcr beide Betriebssysteme habe ich schlie\u00dflich Lizenzen irgendwann im Laufe meiner Computergeschichte erworben, warum sollte ich diese verkommen lassen?<\/p>\n<p>In diese VM habe ich mir einen FineReader 6 installiert, den ich einst bei <a href=\"http:\/\/pearl.de\" target=\"_blank\">pearl<\/a> f\u00fcr 5\u20ac kaufte (oder war es bei <a href=\"http:\/\/zweitausendeins.de\" target=\"_blank\">zweitausendeins<\/a>? Ich wei\u00df es nicht mehr). Der Scan erfolgt unter Linux mit Sane, die Bilder werden in einem Tauschverzeichnis abgelegt auf das aus der VM heraus zugegriffen werden kann. Die Ergebnisse des FineReader &#8211; meist erstelle ich eine DOC und eine TXT Datei &#8211; landen dann ebenfalls wieder im Tauschverzeichnis. Die Weiterverarbeitung erfolgt dann in OpenOffice. Sobald das Endergebnis fertig ist, l\u00f6sche ich die Inhalte im Tauschverzeichnis. Insgesamt recht umst\u00e4ndlich &#8211; aber im Alltag viel viel schneller und weniger Nervenaufreibend als die Arbeit mit kooka und ocrad \/ gocr. Leider habe ich es bisher nicht hinbekommen den FineReader unter Wine zur Mitarbeit zu \u00fcberreden &#8211; das w\u00e4re eindeutig die bessere L\u00f6sung. <a href=\"http:\/\/appdb.winehq.org\/objectManager.php?sClass=application&amp;iId=1035\" target=\"_blank\">Andere waren da erfolgreicher<\/a>: <a title=\"wine\" href=\"http:\/\/appdb.winehq.org\/objectManager.php?sClass=application&amp;iId=1035\" target=\"_blank\">WineHQ<\/a><\/p>\n<p>Bis tesseract soweit ist werde ich wohl bei diesem workaround bleiben m\u00fcssen. Leider.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>OCR ist unter Linux ein Problemkind. Es gibt zwar gocr, ocrad und hoffentlich bald auch ein einfach zu installierendes tesseract, das deswegen hier nicht mehr weiter behandelt wird, aber weder gocr noch ocrad liefern bei mir Erkennungsraten von mehr als 90% unter Idealbedingungen. Damit dauert die Bearbeitung der Ergebnisse oft l\u00e4nger als das Abtippen &#8211; [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5],"tags":[347],"class_list":["post-224","post","type-post","status-publish","format-standard","hentry","category-linux","tag-ocr"],"_links":{"self":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts\/224","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=224"}],"version-history":[{"count":17,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts\/224\/revisions"}],"predecessor-version":[{"id":3203,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=\/wp\/v2\/posts\/224\/revisions\/3203"}],"wp:attachment":[{"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=224"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=224"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bdjl.de\/localhost\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=224"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}