4. Zeitungen

Die Layout-Erkennung ist der schwierigste Teil bei der Arbeit mit Zeitungen. Verwenden Sie zuerst die Erkennung des gedruckten Blocks und dann die erweiterten Konfigurationseinstellungen für die Linienerkennung

Vorheriger Schritt: Automatische Layout-Erkennung


Die Verarbeitung von Zeitungen kann eine Herausforderung sein, wenn Sie direkt die Texterkennung ausführen.
Das Problem liegt oft nicht in der Fähigkeit des Modells, den Text zu lesen, sondern in der Layout-Erkennung, die als erster Schritt in die Texterkennung integriert ist.

Die Lösung besteht darin, die Layout- und Texterkennung in zwei getrennten Schritten auszuführen.

Die besten Ergebnisse erzielen Sie, wenn Sie zuerst die Methode zur Erkennung von gedruckten Blöcken verwenden, um die Seitenstruktur (die Artikel als einzelne Textblöcke) zu erkennen, und dann die Layout-Erkennung unter Beibehaltung der vorhandenen Textbereiche durchführen.

Die Anpassung der erweiterten Layout-Konfigurationseinstellungen hilft dabei, alle Zeilen in ihrer gesamten Länge zu erkennen.

Die meisten Einstellungen hängen von der Art der Zeitung und der Bildqualität ab, mit der Sie arbeiten, so dass es sich um einen Versuch-und-Irrtum-Prozess handeln kann. Wir empfehlen, die Einstellungen auf einigen Seiten zu testen, bevor Sie die Layout-Erkennung auf das gesamte Dokument anwenden.

Im Allgemeinen sind die folgenden Schritte zur Erkennung des Zeitungslayouts zu befolgen:

1) Erkennung von gedruckten Blöcken

Wählen Sie die Seite(n) aus und klicken Sie im Menü auf der linken Seite auf "Layout-Erkennung". Wählen Sie die Methode zur Erkennung von gedruckten Blöcken und starten Sie die Erkennung.

Bei diesem Schritt werden die Textblöcke und nicht die Zeilen erkannt: Es ist jedoch notwendig, dass die Seite in Textblöcke unterteilt ist (d. h. Artikel im Falle von Zeitungen); andernfalls erhalten Sie einen großen Textbereich, der die gesamte Seite umfasst, und die Lesereihenfolge der Zeilen wird durcheinander gebracht.

 

 

2) Layout-Erkennung mit erweiterten Einstellungen

Wählen Sie dieselbe(n) Seite(n) erneut aus, klicken Sie auf "Texterkennung" und wählen Sie im Dropdown-Menü "Layout" anstelle von "Texterkennung".

Versuchen Sie, die folgenden Einstellungen zu verwenden:

Layout Model Mixed Text Line Orientation
(klicken Sie auf Configure)  
Generation of Text Regions (Layout Blocks) Keep existing
Image Scaling Upscale
((klicken Sie auf Baseline Options)  
Minimal Baseline Lengh Low
Baseline Accuracy Threshold High
Use Trained Separators No
Max distance for merging baselines Medium
Split Lines on Regions border Yes


Unserer Erfahrung nach funktionieren diese Konfigurationseinstellungen für die meisten Zeitungen, aber es ist schwer zu verallgemeinern, da vieles von der Bildqualität und dem Zeitungstyp abhängt.

Wir empfehlen Ihnen, mit den empfohlenen Einstellungen zu beginnen und sie bei Bedarf zu ändern, wie auf der Seite Erweiterte Layout-Konfigurationseinstellungen erläutert wird.

 


In einigen Fällen hat es sich als nützlich erwiesen, die Bilder vor dem Hochladen in Transkribus zu verkleinern (auf die doppelte Größe).


Nachdem Sie sowohl die Erkennung des gedruckten Blocks als auch die Erkennung des Layouts durchgeführt haben, können Sie Ihre Zeitungen automatisch mit dem am besten geeigneten Texterkennungsmodell transkribieren, wie auf dieser Seite erläutert.