Online OCR

Politiklehrer brauchen Zeitungsausschnitte wie ein Fisch das Wasser. Ideal ist es, wenn diese noch mit Zeilennummern versehen und um unnütze Details gekürzt werden können. Hierzu setze ich OCR Software ein – leider in einer virtuellen Maschine, weil Linux sich hier von seiner spröden Seite zeigt (siehe: OCR unter Linux).

Einen Scan des lesenswerten Artikels ‚Die Unsicherheitskrise‚ von Stefan Kornelius aus der SZ vom 7./8.02.2009 (p. 4) nahm ich zur Vorlage, um die Qualität verschiedener Online-OCR-Dienste zu testen (mit freundlicher Genehmigung der SZ). Dabei wurde darauf verzichtet, die Dienste mit mehrspaltigem Layout und eingebetteten Bildern zu foltern. Dafür war aber die Scanqualität an sich nicht gerade rosig.

tohoku

http://ocr1.sc.isc.tohoku.ac.jp/e1/

Ein Staat geht hr die Sicherheit sei-
ner Bürger drei Verpflichtungen ein: Er
schützt mit seinem Militär vor einem äu-
Qeren Feind, er sor& rr_t der Polúei für
SicherheitiInInneren, und erbetreibt ei-
ne uIwichtige Wirtschaftspolitik, die vor
ökonomischer Unsicherheit schützen
soll. Erstaunlich nw, dass der Zusam-
memang zwischen der ökonomischen
Knse und der physisclien Sicherheit, der
UnverseMheit der Bürger von Riga bis
Sh h . S_ p lobisSacramen

Ich behaupte, dass hier GOCR im Hintergrund läuft – zumindest erinnert mich die schlechte Erkennungsleistung stark an dieses Programm. Ich habe es zwar nicht ausprobiert, aber die Nachbearbeitung dürfte in diesem Fall fast so viel Zeit brauchen wie das Abtippen.

my.ocrnow

https://my.ocrnow.com

Ein Staat geht für die Sicherheit sei­ner Bürger drei Verpflichtungen ein: Er schützt mit seinem Militär vor einem äu­ßeren Feind, er sorgt mit der Polizei für Sicherheit im Inneren, und er betreibt ei­ne umsichtige Wirtschaftspolitik, die vor ökonomischer Unsicherheit schützen soll. Erstaunlich nur, dass der Zusam­menhang zwischen der ökonomischen Krise und der physischen Sicherheit, der Unversehrtheit der Bürger von Riga bis Shanghai, von Säo Paulo bis Sacramen-to

Keine schlechte Erkennungsleistung für einen kostenlosen Service, der lediglich eine Registrierung voraussetzt. Fortgeschrittene Funktionen sind kostenpflichtig und beinhalten das Zusenden des fertigen OCRs und die Einreichung per Mail.

iupr

http://demo.iupr.org/cgi-bin/main.cgi

Ein Staat geht fiir die Sicherheit sei

ner Burger drei Verpflichtungen ein: Er schiitzt mit seinem Militar vor einem auBeren Feind, er sorgt mit der Polizei fiir Sicherheit im Inneren, und er betreibt eine iunsichtige Wirtschaftspolitik, die vor okonomischer Unsicherheit schiitzen soll. Erstaunlich nur, dass der Zusammenhang zwischen der okonomischen Krise und der physischen Sicherheit, der Unversehrtheit der Burger von Riga bis Shanghai, von S50 Paulo bis Sacramen- ‚ ` ‚ “ i’Dl€1H‘Is€°

Schon besser als tohoku – aber auch nur, weil die Fehler auf den ersten Blick zu sehen sind. An den besser erkennbaren Bildstellen (also nicht am Falz in der Zeitung) ist die Erkennungsleistung ordentlich.

ocrterminal

http://www.ocrterminal.com

Ein Staat geht fur die Sicherheit seiner Burger drei Verpflichtungen ein: Er schutzt mit seinem Militar vor einem au-Beren Feind, er sorgt mit der Polizei fur Sicherheit im Inneren, und er betreibt eine umsichtige Wirtschaftspolitik, die vor okonomischer Unsicherheit schutzen soil. Erstaunlich nur, dass der Zusam-menhang zwischen der okonomischen Krise und der physischen Sicherheit, der Unversehrtheit der Burger von Riga bis Shanghai, von Sao Paulo bis Sacramento

Saubere Erkennungsleistung auf dem Niveau von my.ocrnow. Die Seite bietet ihre Dienste kostenlos an, erlaubt aber „nur“ 30 Seiten am Tag, was für den Alltag wohl völlig ausreichend sein dürfte.

Fazit

Die Ergebnisse waren recht eindeutig: my.ocrnow oder ocrterminal können weiter empfohlen werden. Standalone Anwendungen wie FineReader oder Omnipage schlagen diese Services aber um Längen in der Erkennungsleistung (bezogen auf den Gesamtartikel), sind schneller, arbeiten sich auch durch umfangreiche Dokumentenstapel und beschweren sich nicht, wenn sie mit mehrspaltigem Layout konfrontiert werden.

Für anspruchsvollere OCR-Jobs führt demnach kein Weg an Programmen wie FineReader und Omnipage vorbei, aber für den schnellen Scan zwischendurch und auch für kurze Artikel reicht inzwischen ein Online-OCR. Unter Linux sind diese bei unter einer Seite Textumfang wohl auch schneller zu nutzen als der Start der virtuellen Maschine an Zeit braucht.

Alles klar

Einfache Erklärung gefällig?

Der Internationale Gideonbund verteilt in 188 Ländern der Erde Neue Testamente, seit über fünfzig Jahren werden auch hierzulande u.a. Bibeln in Schulen verteilt. Die deutschen Landesregierungen befürworten dies ausdrücklich, überlassen es aber letztlich den Schulleitungen, ob sie es haben wollen oder nicht. Die betreffende Schule in Winnenden hat NICHT ERLAUBT, dass die Neuen Testamente an ihre Schüler verteilt werden. – Wir können halt nur ernten, was gesät wurde.“

Gefunden auf: http://www.soulsaver.de/soulblog/index.php?/archives/2825-Winnenden-trauert-Winnenden-traeumt..html

Moorhuhn

Wer hätte das gedacht – Moorhuhn 2 läuft auch unter Wine. Die Installation ist kinderleicht: Einfach XP in Wine einstellen und dann ein paar mal doppelklicken. Die Jungs sind glücklich 😉

Demokratiesicherung

Endlich! Das Bundesverfassungsgericht hat die Verwendung einiger Wahlcomputersysteme als verfassungswidrig verurteilt und damit meiner Meinung nach ein entscheidendes Urteil zur Sicherung der Demokratie in Deutschland gefällt.

Vor allem für Computerversteher wie mich war es schwierig zu verstehen, wieso Menschen in einem so entscheidenden Moment wie einer Wahl auf Nachprüfbarkeit verzichten wollen. Dieses sich-ausliefern an einen Hersteller mit eindeutigen ökonomischen Interessen sowie an Techniker, vor allem aber die oft unerträgliche Zirkelargumentation der Wahlmaschinenverfechter, die behaupteten, dass alle Wahlen mit Computern ordentlich abgelaufen wären, weil niemand je das Gegenteil bewiesen hätte und das blinde Vetrauen in die politische Elite eines Landes … mir wurde davon schlecht. Demokratie ist schließlich auch Macht auf Zeit durch Wahl, weil das Volk gelernt hat, den Mächtigen eben nicht zu vertrauen.

Die einzige Erklärung, die ich für die Föderung von Wahlmaschinen noch finden konnte war bald kaum mehr unterscheidbar von vulgär-marxistischen Verschwörungstheorien, so dass ich mir zuletzt frustiert jeden Kommentar zum Thema sparen musste, wollte ich nicht komplett platzen.

Der für mich entscheidende Satz aus dem Urteil:

Der Wähler selbst muss ohne nähere computertechnische Kenntnisse nachvollziehen können, ob seine abgegebene Stimme als Grundlage für die Auszählung oder jedenfalls als Grundlage einer späteren Nachzählung unverfälscht erfasst wird.

Weitere Informationen zu den technischen Hintergründen der Manipulierbarkeit von Wahlen durch den Einsatz von Wahlcomputern finden sich auf den Seiten des CCC:

http://wahlcomputer.ccc.de/?language=de

… oder auch auf youtube. Hier zeigt der CCC wie 3 Personen in 60 Sekunden einen Nedap Wahlcomputer hacken:

[youtube VN3bZTwFkIo]

Der vom BVerfG zugelassene Wahlstift ist zwar ebenfalls nicht sicher …

[youtube 6bAiQxW4Ny4]

… aber hier ist die Manipulation wenigstens nachprüfbar.

Mich persönlich störte an diesen Kästen vor allem auch die offensichtliche Einschränkung meiner Freiheit auch eine ungültige Stimme abgeben zu können.

Ach ja – wir sollten den folgenden, etwas älteren Beitrag nicht vergessen:

[youtube Ydnex1bOXiU]

Blautopf

morvai csilla

morvai csilla

Endlich mal wieder Zeit meine Podcasts auf den neuesten Stand zu bringen. Hierbei bin ich über einen SWR2 Wissen Bericht über den Blautopf gestolpert. Weitere Informationen sind auf den Seiten der Arge Grabenstetten zu finden.

Stellarium

Nette Software – neben Celestia einige der wenigen Pakete zum Thema, die sich direkt in den Repos von Ubuntu befinden. Im Ordner ./stellarium in /home befindet sich die config.ini und hier sind die Daten für Nehren einzutragen:

name                           = Nehren
latitude                       = +48d25’52.32″
longitude                    = +09d04’10.26″
altitude                       = 427

http://www.stellarium.org/de/

Janis turtelt 2

bildschirmfoto

reset

penup

turnright 270

forward 180

turnright 90

turnright 45

forward 60

pendown

forward 170

turnright 90

forward 170

turnleft 180

turnright 315

forward 239

turnright 270

forward 200

turnleft 90

forward 239

turnleft 90

forward 200

penup

turnright 250

forward 123

turnright 20

pendown

forward 29

turnright 90

turnright 180

forward 29

turnright 270

forward 29

turnright 272

forward 29

turnright 178

penup

forward 160

turnright 180

pendown

forward 79

turnright 270

forward 40

turnright 270

forward 79

turnright 180

penup

forward 240

pendown

forward 29

turnleft 270

forward 58

turnright 90

forward 29

turnleft 270

forward 58

penup

turnright 270

forward 100

turnright 90

forward 30

pendown

forward 29

turnleft 270

forward 29

turnright 90

forward 29

turnright 90

forward 29

turnleft 90

penup

forward 111

pendown

forward 29

turnright 270

forward 29

turnright 270

forward 29

turnleft 90

forward 29

penup

forward 30

… es wird nun Zeit für Schleifen und Bedingungen 🙂

Janis turtelt

janisturtle

Janis hat heute Morgen plötzlich beschlossen, dass er programmieren will. Um für einen etwas einfacheren Einstieg zu sorgen hab ich ihm dann kturtle installiert und er hat als erstes Projekt eine Kirche gewählt. Eine Kirche! An mir liegt das nicht 😉

reset

penup

turnright 270

forward 100

turnright 90

forward 130

turnright 45

pendown

forward 60

turnright 90

forward 60

turnright 135

forward 84

turnright 270

forward 300

turnright 270

forward 84

turnright 270

forward 300

penup

turnright 0

turnright 180

forward 150

turnright 270

pendown

forward 180

turnright 90

forward 150

turnright 270

turnleft 180

forward 178

turnright 90

penup

forward 150

turnright 45

pendown

turnleft 1

forward 123

turnleft 1

turnright 90

forward 129

penup

forward 33

Er wollte eigentlich eine deutsche Version des Programms – aber hier brach dann wieder der Englischpauker beim Vater durch.

Witzig war, wie schnell das ging: 20 Minuten gemeinsames spielen, 10 Minuten neben dran sitzen und helfen und dann eine Stunde allein lassen. Nicht schlecht für 10 Jahre.

Stillstand II

Es war mal wieder der erste Sonntag im Monat und mein Software Raid hat sich wie üblich mit sich selbst beschäftigt. Das ging mir nun aber so auf den Wecker, dass ich die Ursachenforschung noch einmal anging – und dann leider feststellen musste, dass meine Platten nicht im DMA Modus liefen, da konnte ich  hdparm-en so viel ich wollte.

Also hab ich mir über ebay eine 3ware 7006-2 besorgt, heute eingebaut und siehe da – die Plattengeschwindigkeit hat sich verzehnfacht.

Hier gab es dann noch ein Debian-Paket für die einfachere Verwaltung und dort die Anleitung für die Einbindung in Nagios. Die passt noch nicht so 100%ig – aber dafür kann ich mit ./tw_cli arbeiten.

tw_cli info c0 allunitstatus

ist die schnellste Lösung. Nach einem

tw_cli

sind in einem interaktiven Modus weitere Befehle möglich – z.B.

/c0 show unitstatus

/c0 show drivestatus

Eine Übersicht liefert diese man page: http://www.cyberciti.biz/files/tw_cli.8.html