ubuntuusers.de

Hinweis: Dies ist ein statischer Snapshot unseres Wikis vom 25. März 2013 und kann daher nicht bearbeitet werden. Der aktuelle Artikel ist unter wiki.ubuntuusers.de zu finden.

gImageReader

Dieser Artikel wurde für die folgenden Ubuntu-Versionen getestet:

Zum Verständnis dieses Artikels sind folgende Seiten hilfreich:

./gImageReader.png gImageReader {en} ist ein einfach zu bedienendes Frontend für das OCR-Programm tesseract-ocr (Versionen 2.0x und 3.0x werden unterstützt). Es ist in Python verfasst und ermöglicht die Texterkennung aus vorliegenden Bilddateien (es sind alle gängigen Formate verwendbar, auch PDF-Dateien), sowie den direkten Import über einen SANE-fähigen Scanner. Dabei sind alle von tesseract unterstützten Sprachen verwendbar, auch ggf. selbst erstellte. Im Programm wird außerdem eine Rechtschreibprüfung (über GTKSpell {en} mit Hunspell) verwendet, die Sprache ist einstellbar. Die Erkennung ist aufgrund des sehr guten Texterkennungsprogramms bei vernünftigen Vorlagen hervorragend. Das Programm wird vom Entwickler allerdings noch als im "beta"-Stadium befindlich geführt.

Installation

Zur Verwendung wird, neben den Abhängigkeiten, die direkt installiert werden, das Paket

  • python-imaging-sane

Wiki/Vorlagen/Installbutton/button.png mit apturl

Paketliste zum Kopieren:

sudo apt-get install python-imaging-sane 

sudo aptitude install python-imaging-sane 

benötigt[1], wenn ein Scanner direkt vom Programm aus angesprochen werden soll.

gImageReader liegt nicht in den Paketquellen vor, es kann aber von der Projektseite {dl} ein .deb-Paket bezogen und installiert[2] werden.

Hinweis!

Fremdpakete können das System gefährden.

Nach erfolgreicher Installation ist unter GNOME ein Eintrag "Anwendungen -> Grafik -> gImageReader" zu finden.

./gImageReader-settings.png

Konfiguration

Unter "Datei -> Konfigurieren" lassen sich die Pfade zur verwendeten Tesseract-Installation und dem dazugehörigen Sprachenverzeichnis ändern. Im Normalfall erkennt gImageReader die richtigen Pfade. Darunter lässt sich, wenn nötig, die bevorzugte Sprache verändern und die Ausrichtung der Felder im Hauptfenster verändern.

Darunter können weitere Angaben (Vorschläge zur Installation von Rechtschreibprogrammen, automatische Abfrage nach neuen Programmversion, Einsatz von Kantenglättung) gemacht werden.

Unter "Wörterbücher" lassen sich Angaben zu weiteren Wörterbüchern machen, falls spezielle Versionen, die nicht standardmäßig erkannt wurden, verwendet werden sollen.

Bedienung

Das Hauptfenster öffnet sich zunächst leer, über die Schaltfläche "Öffnen" (oder "Datei - Bilder Öffnen") lassen sich Bilddateien öffnen, die in der Seitenleiste als Vorschaubilder aufgelistet werden. Das jeweils ausgewählte Bild wird in der Mitte dargestellte, die Ansicht lässt sich über die Schaltflächen oben einstellen (Zoomen, Einpassen, Drehen, auch über den Reiter "Ansicht" erreichbar). Über die Schaltfläche "Bildbearbeitungsregler anzeigen" lassen sich Einstellungsmöglichkeiten zur Helligkeit, Kontrast und Auflösung des Bildes einblenden, sehr sinnvoll für schlechte Vorlagen etc.

./gImageReader-main.png

Im Bild selbst kann über Ziehen bei gedrückter linke Maustaste-Taste ein Ausschnitt festgelegt werden, der ausgelesen werden soll, was gerade bei verschachtelten Vorlagen mit Bildern nützlich sein kann. Die Erkennung wird dann über die Schaltfläche "Alles erkennen" (bei Teilauswahl "Selektion erkennen") gestartet, das Ergebnis erscheint nach kurzer Zeit im Fenster daneben. "Fehlerhaft" erkannte Wörter sind rot unterstrichen, in dem Fenster kann direkt korrigiert und umgestellt werden. Zudem kann über einen rechte Maustaste-Klick ein Kontextmenü mit weiteren Bearbeitungsoptionen geöffnet werden, bei einem rechte Maustaste-Klick auf ein unterschlängeltes Wort werden Alternativen angeboten, die direkt angewandt werden, oder auch das Wort in das Benutzerwörterbuch aufnehmen. Weitere Erkennungen können angehängt, oder in den Text an die Stelle des Cursors eingefügt werden. Über die Schaltfläche "Suchen und ersetzen" lassen sich häufig auftretende Fehler einfach korrigieren.

Eine Stapelverarbeitung mehrerer Vorlagen ist derzeit nicht vorgesehen, es wird immer nur das aktuell dargestellte Bild/Auswahl verarbeitet.

Die Speicherung des Textes erfolgt über die unscheinbare "Ausgabe speichern"-Schaltfläche rechts über dem Textfenster, daneben lässt sich das Fenster ("Ausgabe löschen") auch komplett leeren.

Der "Hilfe"-Aufruf öffnet eine kurze englischsprachige Beschreibung im Standard-Browser.

Scannen

Unter "Erwerben"/"Datei -> Bild Erwerben" (schlechte Übersetzung von "aquire") können Bildvorlagen direkt von einem Scanner erstellt werden. gImageReader erkennt im Normalfall einen angeschlossenen Scanner, bei mehreren kann im Auswahlfenster "Gerät" der gewünschte eingestellt werden. Darunter lässt sich der Pfad/Name zur Speicherung der Scans festlegen. Standardmäßig ist das Home-Verzeichnis des Benutzers, sowie der Dateiname scanX.png vorgesehen. Darunter lässt sich die gewünschte Auflösung für den Scan einstellen, allerdings werden ggf. auch vom Scanner nicht unterstützte Auflösungen angeboten. Ändern lassen sich diese Angaben, wenn man direkt den Quellcode in der Datei acquire.py die Werte ändert (Editor[3] mit Rootrechten nötig).

Für den Scan selbst lassen sich sonst keine weiteren Angaben machen. Der Scan wird anscheinend im Farbmodus und immer mit der größtmöglichen Scanfläche vorgenommen.

Probleme

Unter Oneiric Ocelot 11.10 und Natty Narwhal 11.04 startet der Scanner gar nicht und das Entfernen von Bildern aus dem Vorschaubereich funktioniert auch nicht. Der Entwickler arbeitet aber an einer Version mit GTK3, die dann laufen sollte.

Die Version 0.9.1 läuft zwar unter Precise Pangolin 12.04, allerdings kann (zumindest auf einem 64-bit-System) nur ein Scan durchgeführt werden; bei Aufruf des zweiten Scans bleibt die Oberfläche hängen, im Terminal erscheint eine Fehlermeldung in der Art

Exception in thread Thread-6:
Traceback (most recent call last):
  File "/usr/lib/python2.7/threading.py", line 551, in __bootstrap_inner
    self.run()
  File "/usr/lib/pymodules/python2.7/gimagereader/threadtools.py", line 56, in run
    result=self.task()
  File "/usr/lib/pymodules/python2.7/gimagereader/acquire.py", line 261, in __scan_do
    ret=scan_api.open_device(self.combo_source.get_active())
  File "/usr/lib/pymodules/python2.7/gimagereader/acquire.py", line 49, in open_device
    self.device=sane.open(self.devices[idx][0])
  File "/usr/lib/python2.7/dist-packages/sane.py", line 325, in open
    new=SaneDev(devname)
  File "/usr/lib/python2.7/dist-packages/sane.py", line 157, in __init__
    d['sane_signature'] = self._getSaneSignature(devname)
  File "/usr/lib/python2.7/dist-packages/sane.py", line 169, in _getSaneSignature
    raise RuntimeError('no such scan device "%s"' % devname)
RuntimeError: no such scan device "gt68xx:libusb:004:002"

Der Fehler trat bereits unter Maverick auf; eine Erklärung hatte der Entwickler dafür leider nicht.

Zwar ist es möglich, bei entsprechender Installation alte deutsche Rechtschreibung auszuwählen, allerdings funktioniert die Erkennung nicht, wenn gleichzeitig die "neue" installiert ist (siehe Alte deutsche Rechtschreibung).

Alternativen

ubuntuusers.local › WikigImageReader