1. Warum ist es sinnvoll, ein Texterkennungsmodell zu trainieren?

Transkribus verfügt über vortrainierte öffentliche Modelle, sogenannte Public Models, die auf unterschiedliche Dokumententypen, Sprachen und Schriftarten angewendet werden können. Bei der Arbeit mit ungewöhnlichen Handschriften oder hochspezialisierten Dokumenten kann ein personalisiertes Modell die Transkriptionsgenauigkeit jedoch deutlich erhöhen. In diesem Artikel werden die Unterschiede und Vorteile personalisierter Modelle gegenüber herkömmlichen Public Models erklärt.

1. Verwendung von Public Models

Public Models werden auf einer breiten Palette unterschiedlicher Dokumente vortrainiert, was sie zu einer ausgezeichneten Wahl für grundlegende Transkriptionstätigkeiten macht.

Sofort einsatzbereit: Public Models sind bereits vortrainiert und können daher direkt auf Ihre Dokumente angewendet werden.
Groß & robust: Sie wurden auf einer großen Menge von Daten trainiert, weshalb sie für ein breites Spektrum unterschiedlicher Textarten effizient einsetzbar sind.
Benutzerfreundlich: Public Models wurden so konzipiert, dass sie möglichst zugänglich für neue User*innen sind sowie direkt und ohne Setup verwendet werden können.
Vielseitig anwendbar für handgeschriebenen und gedruckten Text: Viele Public Models wurden darauf trainiert, sowohl handgeschriebenen als auch gedruckten Text zu verarbeiten.

Anwendungsbereiche: Public Models bilden eine ideale Lösung für die Arbeit mit herkömmlichen Handschriften, gedruckten Materialien oder für schnelle Transkriptionen, wenn keine übermäßige Genauigkeit gefordert ist. Um mehr über die Verwendung von Public Models herauszufinden, lesen Sie diesen Artikel: Automatische Transkription von Dokumenten

2. Trainieren eines personalisierten Modells

Personalisierte Modelle sind perfekt auf Ihre spezifischen Dokumente zugeschnitten, sodass mit Ihnen eine höhere Genauigkeit und Konsistenz bei der Verarbeitung ungewöhnlicher oder komplexer Materialien erreicht werden können. Was bieten personalisierte Modelle im Detail?

Eine höhere Genauigkeit: Da personalisierte Modelle auf Ihren eigenen Dokumenten trainiert werden, werden Sie mit den darin enthaltenen spezifischen Handschriften und Layouts sehr gut vertraut gemacht, was zu präziseren Transkriptionen führt.
Anpassungsfähigkeit: Personalisierte Modelle können spezielles Vokabular, Terminologie oder Layouts verarbeiten, die für Public Models oft eine Herausforderung darstellen.
Kontrolle über Trainingsdaten: Sie entscheiden, welche Daten in das Training einbezogen werden, sodass das Modell auf die spezifischen Dokumententypen, mit denen Sie arbeiten, angepasst wird.
Eine perfekte Abstimmung auf Ihr Projekt: Personalisierte Modelle können durch neue Daten kontinuierlich verbessert werden, was Sie zur optimalen Lösung für spezialisierte, historische oder von mehreren Autor*innen verfasste Dokumente macht.

Anwendungsbereiche: Personalisierte Modelle eignen sich hervorragend für spezialisierte Projekte, ungewöhnliche Handschriften oder für Fälle, in denen Public Models nicht die notwendige Genauigkeit erreichen. Sie sind besonders nützlich für Tätigkeiten, die konsistente und qualitativ hochwertige Transkriptionen erfordern. Um mehr über das Training von personalisierten Texterkennungsmodellen zu erfahren, gehen Sie zum nächsten Schritt.

Nächster Schritt: Training von Texterkennungsmodellen

1. Warum ist es sinnvoll, ein Texterkennungsmodell zu trainieren?

Public Models sind sehr gut für den allgemeinen Gebrauch geeignet und liefern schnelle Ergebnisse. Personalisierte Modelle hingegen bieten die notwendige Präzision und Anpassungsfähigkeit für spezialisierte Projekte.

1. Verwendung von Public Models

2. Trainieren eines personalisierten Modells