Blog

Practical Expercience with OCRopus Model Training

In this blog posts I would like to share some of my experience in training models for the outstanding OCR program OCRopus.

OCRopus

One of the most underestimated programs for OCR (Optical Character Recognition) is OCRopus. The reason for this may lie in its sophisticated operation with several command line programs. You have to know the correct order to invoke the programs and the effects of OCRopus’ various options. You can achieve very good recognition rates (>99% correct characters) with OCRopus. However, you have to train a recognition model for your sources. A very good introduction to the use of OCRopus and the training of models is given in these two blog posts:

Class or individual that is the question

Immer wieder kommt es vor, dass man bei der Erstellung von Taxonomien bzw. Ontologien vor der Frage steht, ob man etwas als Klasse oder Individuum modellieren soll. Das mag auf ersten Blick sonderbar erscheinen, sind doch Klasse und Individuum so völlig verschieden.

OpenStreetMap-Suche leicht gemacht

Als Ergänzung zu meinem vorherigen Post zu den Gedenksteinen in OpenStreetMap: Es gibt eine grafische Benutzeroberfläche, die die Suche nach Gedenksteinen viel einfacher macht: http://overpass-turbo.eu. Besonders hübsch ist dabei, dass man sich um die Bestimmung der boundind box keine Gedanken mehr machen muss - die wird automatisch vom aktuell angezeigten Kartenausschnitt übernommen.

Gedenksteine in OpenStreetMap

Da ich Gedenksteine der Weltkriege (vor allem des Ersten Weltkriegs) fotografisch dokumentiere, bin ich immer auf der Suche nach Gedenksteinen in der Umgebung. In OpenStreetMap sind bereits zahlreiche Gedenksteine verzeichnet. Diese sind mit dem Schlüssel “historic=memorial” markiert. Leider werden auch diverse andere Dinge mit diesem Schlüssel gekennzeichnet, so dass man entweder am Bildschirm einen genaueren Blick auf weitere Werte in OpenStreetMap werfen oder sich direkt vor Ort ein Bild machen muss.