Wenn das Seitenlayout Ihrer Dokumente komplex ist oder Sie manuell transkribieren, führen Sie die Layouterkennung als separaten Schritt aus, um Textbereiche und -linien zu erkennen.
Die Layouterkennung ist die Segmentierung des Bildes in Textbereiche und -linien, um den Text und das Bild zu verbinden.
Der Textbereich ist ein Rechteck, das den gesamten handgeschriebenen Text im Bild/auf der Seite umschließt.
Die Linie ist eine Polylinie, die am unteren Rand der handschriftlichen Textzeile verläuft und der wichtigste Bezugspunkt für die Texterkennung ist.
Die Layouterkennung wird automatisch ausgeführt, wenn Sie einen Texterkennungsjob starten. Sie kann jedoch auch als separater Schritt ausgeführt werden. Dafür gibt es viele Gründe: zum Beispiel, wenn Sie Transkribus verwenden möchten, um Ihre Dokumente manuell zu transkribieren; wenn Sie die Transkriptionen für das Training eines neuen Modells vorbereiten;; oder wenn das Seitenlayout komplex ist (zum Beispiel eine Tabelle).
Um die Layouterkennung als separaten Schritt auszuführen, wählen Sie die zu verarbeitende(n) Seite(n) oder Dokument(e) aus; klicken Sie dann auf "Layouterkennung" im linken Menü unter "Tools".
Das "Voreinstellungsmodell" ist standardmäßig ausgewählt, Sie müssen nur auf "Start" klicken, um die Erkennung zu starten. Sie können den Fortschritt mit der Schaltfläche "Jobs" überprüfen.
Wenn Sie fertig sind, öffnen Sie die Seite und überprüfen Sie das Ergebnis der automatischen Layout-Erkennung auf dem Bild, das jetzt in Textbereiche und Linien segmentiert ist.
Wenn die automatische Layout-Erkennung schlecht funktioniert hat (z. B. einige Zeilen übersehen hat oder die Gruppierung von Zeilen in Textbereichen nicht korrekt ist), können Sie die erweiterten Konfigurationseinstellungen ändern, wie auf dieser Seite beschrieben.
Nächster Schritt: Erweiterte Layout-Konfigurationseinstellungen
Transkribus eXpert (veraltet)
Layouterkennung ist die Segmentierung des Bildes in Textbereiche, Linien und Grundlinien, um den Text und das Bild zu verbinden.
Der Textbereich ist ein Rechteck, das den gesamten handgeschriebenen Text im Bild/auf der Seite umschließt.
Die Grundlinie ist eine Polylinie, die am unteren Rand der handschriftlichen Textzeile verläuft und der wichtigste Bezugspunkt für die Texterkennung ist.
Die Linien sind Bereiche innerhalb eines Textbereichs und können als Polygone beschrieben werden, die den gesamten handgeschriebenen Text in einer Linie umschließen.
Die Layout-Erkennung wird automatisch durchgeführt, wenn Sie einen Texterkennungsauftrag starten, kann aber auch als separater Schritt ausgeführt werden.
Um die Layoutanalyse als separaten Schritt auszuführen, gehen Sie auf die Registerkarte "Tools" in der Verwaltungs- und Werkzeugleiste (auf der linken Seite des Bildschirms). Der Abschnitt, an dem wir interessiert sind, heißt "Layout Analysis".
Wählen Sie die aktuelle Seite, die Seiten oder das/die zu verarbeitende(n) Dokument(e) aus und klicken Sie dann auf "Run", um die Layoutanalyse zu starten. Die Layout-Analyse wird mit den Standardeinstellungen durchgeführt (Horizontal Text Line Orientation model; General region detection method).
Um den Fortschritt des Auftrags zu überprüfen, klicken Sie auf die Schaltfläche "Jobs". Wenn der Auftrag abgeschlossen ist, laden Sie die Seite(n) neu und die Textbereiche, Linien und Grundlinien werden im Bildfenster angezeigt. Sie können die Layout-Struktur auch auf der Registerkarte "Layout" in der Symbolleiste "Managing&Tools" sehen.
Wenn die automatische Layout-Erkennung schlecht funktioniert hat (z. B. einige Zeilen übersehen hat oder die Anordnung der Zeilen in den Textregionen nicht korrekt ist), können Sie die erweiterten Konfigurationseinstellungen ändern, wie auf dieser Seite beschrieben.