ubuntuusers.de

Hinweis: Dies ist ein statischer Snapshot unseres Wikis vom 25. März 2013 und kann daher nicht bearbeitet werden. Der aktuelle Artikel ist unter wiki.ubuntuusers.de zu finden.
WikiYAGF

YAGF

Dieser Artikel wurde für die folgenden Ubuntu-Versionen getestet:

./yagf.png YAGF {en} ("Yet Another Graphical Frontend for cuneiform") ist ein grafisches Frontend für die Texterkennungsprogramme Cuneiform und Tesseract (auch Tesseract-Version 3). Als Datenquelle kann es diverse Bildformate und PDF-Dateien verarbeiten, kann aber auch direkt aus dem Programm heraus über XSane scannen. Die Texterkennung unterstützt das Verarbeiten mehrseitiger Dokumente (Stapelverarbeitung), und man kann den erfassten Text mit Aspell auf richtige Schreibweise überprüfen lassen oder ggf. selbst im Editorfenster direkt korrigieren. Mit YAGF lassen sich auch zweisprachige Vorlagen (russisch/englisch oder französich, spanisch, deutsch) bearbeiten.

Installation

Fertige Pakete

Bei getdeb {en} können deb-Pakete[2] für Lucid (0.8.7), sowie Oneiric und Precise (0.9) bezogen werden.

Hinweis!

Fremdpakete können das System gefährden.

Manuelle Installation

Das Programm liegt nicht in den Ubuntu-Paketquellen vor, es kann auch aus dem Quellcode erstellt werden.

Vorbereiten

Dafür zunächst folgende Pakete[1] installieren:

  • cmake

  • build-essential

  • libqt4-dev

  • aspell

  • aspell-de (bzw. die Wörterbücher in den gewünschten Sprachen)

  • libaspell-dev

  • xsane (um Dokumente direkt einscannen zu können)

Wiki/Vorlagen/Installbutton/button.png mit apturl

Paketliste zum Kopieren:

sudo apt-get install cmake build-essential libqt4-dev aspell aspell-de libaspell-dev xsane 

sudo aptitude install cmake build-essential libqt4-dev aspell aspell-de libaspell-dev xsane 

Außerdem ist zumindest eines der Texterkennungsprogramme Cuneiform oder Tesseract erforderlich. YAGF unterstützt auch Tesseract Version 3. Um Dokumente auch direkt aus dem Programm einscannen zu können, benötigt man einen SANE-tauglicher Scanner (siehe auch die SANE-Kompabilitätsliste {en}).

  • cuneiform

  • tesseract-ocr (sowie gewünschte Sprachpakete)

Wiki/Vorlagen/Installbutton/button.png mit apturl

Paketliste zum Kopieren:

sudo apt-get install cuneiform  tesseract-ocr 

sudo aptitude install cuneiform  tesseract-ocr 

Kompilieren

Das Quellcode-Archiv kann von der Projektseite {en} bezogen werden. Das Archiv entpacken[2] und das Programm kompilieren, dazu kommt cMake zum Einsatz. Da das Build-Skript leider nur das Kompilieren im Quellverzeichnis unterstützt, wechselt man dorthin und führt dann ein

cmake . 

aus. Danach das Programm dann normal kompilieren[4].

Hinweis!

Fremdsoftware kann das System gefährden.

Das installierte Programm findet sich z.B. in GNOME unter "Anwendungen -> Grafik -> YAGF"[4]

Bedienung

Die Digitalisierung des Textes wird in vier Schritten vorgenommen: Bild-Dateien laden/scannen, Dateien zur Verarbeitung vorbereiten, die eigentliche Texterkennung durchführen und schließlich das Abspeichern des Ergebnisses.

Dateien laden

YAGF kann die gängigen Bildformate JPEG, PNG, BMP, TIFF, GIF, PNM, PPM ,PBM und PDF verarbeiten. Bereits existierende Dateien können per "File -> Open Image..." oder der entsprechenden Schaltfläche importiert werden. PDFs werden über "Datei -> Import from PDF" eingelesen. Falls die Dateien durchnummeriert sind (z.B. bild001.png, bild002.png etc.), kann mit den Pfeiltasten schnell das nächste oder vorherige Bild aus dem selben Ordner geladen werden. Die geladenen Bilder sind als Miniaturen im Sidebar sichtbar.

Mit "File -> Scan..." oder der Scanner-Schaltfläche können Bilder via XSane gescannt und direkt importiert werden. XSane wird geöffnet, die Vorlagen werden standardmäßig als Strichzeichnung mit einer Auflösung von 300 dpi gescannt, das kann aber den eigenen Bedürfnissen entsprechend geändert werden. Die Format-Auswahl ist in XSane allerdings ausgeblendet. Die gescannten Vorlagen erscheinen durchnummeriert als input-xx.jpg-Dateien in YAGF. Die Navigation in den Dateien kann ebenfalls mit den Pfeiltasten erfolgen. XSane kann während der Arbeit mit YAGF geöffnet bleiben; neu erstellte Scans werden automatisch importiert. Beim Beenden von YAGF wird auch XSane geschlossen.

Die im Sidebar angezeigten Bilder können einfach mit der "Save"-Taste komplett abgespeichert werden; "Remove" entfernt das gerade im Betrachter angezeigte Bild, "Clear" entfernt alle Bilder aus dem Vorschau-Fenster, in Version 0.9 können die Miniaturen stattdessen angklickt und mit gedrückter linke Maustaste-Taste in den Papierkorb unten in der Seitenleiste befördertwerden. Eine nachträgliche Sortierung ist aber leider nicht vorgesehen. ./YAGF-large.png

Texterkennung vorbereiten

Den zu verwendenden OCR-Engine stellt man im Menü "Settings" ein, dort kann auch der Ort des tessdata-Verzeichnisses angegeben werden.

Im Hauptfenster von YAGF sind zwei große Fenster vorhanden. Links wird im Betrachter-Fenster das zu bearbeitende Dokument angezeigt, rechts das Ergebnis der Texterkennung. Im Betrachter-Fenster kann das Bild mit den Schaltflächen oben bei Bedarf gedreht werden. Mit der Plus- und Minus-Fläche wird die Ansicht vergrößert bzw. verkleinert, dazu können auch Strg + + und Strg + - oder das Mausrad mittlere Maustaste in Verbindung mit gedrückter Strg verwendet werden. Das hat keinen Einfluss auf die Auflösung für den eigentliche Erkennungsprozess, es wird auch die gesamte Seite gescannt, wenn sie nicht ganz sichtbar ist. Mit linke Maustaste kann eine exakte Auswahl aufgezogen werden, die erfasst werden soll. Mit der "Read as single column"-Fläche kann man YAGF anweisen, keine Spaltenerkennung vorzunehmen - ggf. sinnvoll für Texte mit großen Wortabständen (in Version 0.9 nicht mehr vorhanden).

Texterkennung durchführen

Dazu muss zunächst die gewünschte Sprache im Dropdown-Menü "Recognition Language" ausgewählt werden, zur Verfügung stehen die meisten der in Cuniform-Linux möglichen Sprachen, ausgenommen serbisch, kroatisch und slowenisch. Zusätzlich lassen sich mehrsprachige Textvorlagen (russisch jeweils in Kombination mit englisch, deutsch, französisch und spanisch) verarbeiten. Als Ausgabeformat lassen sich momentan nur "HTML" oder "TEXT" auswählen; die weiteren Cuneiform-Linux-Formate sind noch nicht implementiert. Einige Sprachen liegen nur für tesseract vor, sie müssen natürlich zuvor installiert werden.

Die eigentliche Erkennung erfolgt über die "Recognize"-Schaltfläche (angezeigtes Bild oder Ausschnitt) oder "Recognize all"-Schaltfläche. Mit letzterer werden alle Bilder als Stapel nacheinander verarbeitet, allerdings lassen sich in dem Modus keine gesonderten Auswahlen treffen. ./YAGF-context.png Das Ergebnis wird im Editor-Fenster angezeigt; dort wird der Text, wenn die Checkbox "Check spelling" aktiviert ist, automatisch überprüft und kann korrigiert werden; ab Version 0.8.6 existiert dafür eine "ABC"-Schaltfläche. Zur Anzeige von ggf. falsch geschriebenen oder erkannten Wörtern ist natürlich die entsprechende Aspell-Sprachdatei nötig; wenn sie nicht vorhanden ist, wird eine Fehlermeldung ausgegeben. Neu erstellte Texterkennungen werden an die bestehenden angehängt, sodass auch mehrseitige Projekte einfach in einer gemeinsamen Text/HTML-Datei erfasst werden können. Über das Kontextmenü lassen sich neben Bearbeitungsoptionen auch die Größe der angezeigten Schrift einstellen.

Wenn im erkannten Text Notierungen wie

/0.bmp width=360 height=518 alt="output_files/0"--
/1.bmp width=168 height=165 alt="output_files/1"--

vorkommen, sind Teile der Vorlage als Bilder erkannt worden; diese Dateien werden in ~/.yagf/output_files als .bmp-Dateien abgelegt. Die temporären Vorlagedateien (input_xx.jpg) werden ebenfalls in ~/.yagf zwischengespeichert. Mit Beenden des Programms werden all diese Daten gelöscht; wer sie benötigt, muss also vorher darauf zugreifen.

Texte abspeichern

Das korrigierte Ergebnis kann dann als Datei (Schaltfläche "Save Text") abgespeichert, oder auch in die Zwischenablage kopiert werden ("Copy recognized text to clipboard"). Wenn im Text-Editor kein Abschnitt markiert ist, wird der gesamte Text in die Zwischenablage geschrieben.

Tastenkürzel

YAGF Hauptfenster
TastenFunktion Übersetzt
Strg + O Open Image... Bild öffnen...
Strg + N Scan Scannen
Strg + R Recognize Text erkennen
Strg + A Recognize all pages Text aller Seiten erkennen
Strg + S Save text... Text speichern...
Strg + Q Quit Beenden
Bearbeitungsfenster
Strg + Z Undo Rückgängig
Strg + + Z Redo Wiederholen
Strg + A Select All Alles auswählen
Strg + X Cut Ausschneiden
Strg + C Copy Kopieren
Strg + V Paste Einfügen
Strg + + Larger Font Größere Schrift
Strg + - Smaller Font Kleinere Schrift

Alternativen

  • Texterkennung {Übersicht} - Übersichtsseite

  • cuneiform-qt, ein ähnliche, ebenfalls noch in der Entwicklung befindliches Programm, das .png, .jpg, .bmp und .tif-Formate auslesen kann.

  • xsane2cunei ermöglicht es, Cuneiform-Linux direkt aus XSane heraus zu verwendet; damit sind alle Cuneiform-Ausgabeformate verwendbar, allerdings ist keine direkte Korrektur möglich.

  • OcrGui - OCR-Programm, das neben tesseract-ocr auch GOCR {en} als OCR-Engine verwenden kann; noch in relativ frühem Entwicklungsstadium.

ubuntuusers.local › WikiYAGF