3. Text-Tags

Markieren Sie Wörter wie Namen, Daten, Orte und Ereignisse mit Text-Tags, um Ihren Transkriptionen Informationen hinzuzufügen


Text-Tags ermöglichen es Ihnen, Ihre Transkriptionen zu bereichern, indem Sie einige Wörter (z. B. Abkürzungen, Orte, Personen usw.) markieren und Attribute hinzufügen. Sie können dann nach bestimmten Tags suchen und diese exportieren.

Um Text-Tags hinzuzufügen, nachdem Sie automatisch oder manuell ein Dokument transkribiert haben, öffnen Sie die Seite und markieren Sie die zu taggenden Wörter. Das Tagging-Fenster öffnet sich: Hier können Sie das entsprechende Tag auswählen und seine Attribute hinzufügen.

Klicken Sie auf "Konfigurieren", um die Tags auszuwählen, die im Tagging-Fenster angezeigt werden sollen.

Für jedes Tag kann die Wikidata-ID einfach als Attribut hinzugefügt werden. Klicken Sie auf die Schaltfläche Wikidata-ID: Es wird die wahrscheinlichste Entität basierend auf dem ausgewählten Wort vorgeschlagen: Wählen Sie sie aus, wenn sie korrekt ist, oder verwenden Sie die Suchleiste, um den richtigen Wikidata-Begriff zu finden.

Um neue Tag-Kategorien hinzuzufügen oder die Attribute zu ändern, klicken Sie auf die Schaltfläche "Konfiguration" in der unteren rechten Ecke. Auf der Registerkarte Tags können Sie die Tags verwalten, d. h. Tags aus der Liste entfernen, neue Tags erstellen, Attribute ändern und Farben ändern. Denken Sie daran, Ihre Einstellungen zu speichern, bevor Sie zum Editor zurückkehren.

Die Attribute beschreiben den Inhalt des Tags und können helfen, die aus der Transkription extrahierten Daten anzuzeigen und zu verarbeiten. Mit dem Tag date können Sie beispielsweise ein in das Dokument geschriebenes Datum markieren und die Eigenschaften Tag, Monat und Jahr in einer standardisierten Form hinzufügen. Allerdings müssen nicht alle Tags Attribute haben; es hängt von Ihren Bedürfnissen ab.

Verwenden Sie das Tagging-Fenster auch, um die Textstile zu ändern, insbesondere fett, durchgestrichen, unterstrichen, tiefgestellt und hochgestellt. Wenn Sie einen dieser Textstile auswählen, sehen Sie nur das ausgewählte Wort, das den Stil ändert, aber im Backend fügt Transkribus dem Wort ein Text-Tag hinzu.

Text-Tags sollten auf Ihre spezifischen Zwecke zugeschnitten sein, aber im Allgemeinen können wir sagen, dass die folgenden besonders nützlich sind, wenn Sie mit historischen Dokumenten arbeiten:

  • Abkürzung:
    Sie können das abgekürzte Wort markieren und die Erweiterung als Attribut eingeben.
    Es gibt keinen richtigen Weg, um mit Abkürzungen umzugehen. Abhängig von der Transkription, die Sie am Ende haben möchten, können Sie einen der folgenden Ansätze wählen:
    1. die erweiterte Version der Abkürzung direkt in den Texteditor übertragen (die neuronalen Netze sind oft in der Lage, Erweiterungen zu erkennen und zu verwenden, insbesondere wenn sie häufig auftreten);  
    2. transkribieren Sie die Abkürzung mit den Grundzeichen, die den vom Autor geschriebenen Zeichen am ähnlichsten sind; Sie können sie dann markieren und die Erweiterung als Eigenschaft schreiben;
    3. transkribieren Sie die Abkürzung mit den Unicode-Zeichen, die sich in der Nähe der speziellen Grapheme des Originaldokuments befinden. Denken Sie daran, dass Sie mit der virtuellen Tastatur Sonderzeichen hinzufügen können. Da es oft schwierig ist, zu entscheiden, welcher Unicode-Charakter der richtige sein könnte, können Sie die MUFI-Website konsultieren, um weitere Informationen zu diesem Thema zu erhalten. Wie oben, wenn Sie interessiert sind, können Sie das Kürzel markieren und die Erweiterung als Eigenschaft schreiben.
  • Unklar:
    Verwenden Sie dieses Tag, wenn der Text nicht transkribiert werden kann, da er unleserlich ist. Markieren Sie den unklaren Text im Texteditor und markieren Sie ihn als „unklar“; Sie können auch Alternativen oder Vorschläge für das unleserliche Wort als Attribut des Tags hinzufügen.
  • Lücke:
    Wenn der Text nicht gelesen werden kann, fügen Sie das "Lücke" -Tag an der Stelle hinzu, an der der unleserliche Text im Texteditor erscheinen soll.
  • Schwärzung:
    Verwenden Sie dieses Tag, um sensible Informationen in den Exportformaten zu schwärzen. Typischerweise wird dies verwendet, um personenbezogene Daten in einem Dokument zu verbergen, das öffentlich zugänglich gemacht wird. Das Schwärzungs-Tag wird in Verbindung mit dem Bereich "Schwärzen" verwendet, um das Wort oder den Abschnitt im Bild auszublenden. Vorerst sind die „Schwärzungs“ -Region und die erweiterte Exportfunktion zum Rendering der Schwärzung nur in Transkribus eXpert verfügbar.

Nachdem Sie Ihre Transkriptionen markiert haben, können Sie nach Tags suchen, wie auf der Seite Text-Tags suchen beschrieben, oder sie in einer Excel-Datei herunterladen, wie auf der Download-Seite beschrieben.

Lesen Sie die Seite Verwalten textueller Tags , wenn Sie mit anderen Transkribus-Benutzern zusammen an einer Sammlung arbeiten und Tags auf Sammlungsebene verwalten müssen.
 

Nächster Schritt: Herunterladen

 


 

Transkribus eXpert (veraltet)

Text-Tags ermöglichen es Ihnen, Ihre Transkriptionen zu bereichern, indem Sie einige Wörter (z. B. Abkürzungen, Orte, Personen usw.) markieren und Attribute hinzufügen. Sie können dann nach bestimmten Tags suchen und sie in verschiedene Dateiformate exportieren, damit Sie außerhalb von Transkribus weiter mit ihnen arbeiten können.

Die Tagging-Schnittstelle finden Sie, indem Sie auf die Registerkarte „Metadaten“ und dann auf die Registerkarte „Text“ klicken.

Um ein Text-Tag hinzuzufügen, markieren Sie den Text im Texteditor und klicken Sie anschließend auf die grüne Schaltfläche + neben dem Tag, das Sie anwenden möchten. Alternativ, nachdem Sie den Text markiert haben, klicken Sie mit der rechten Maustaste und wählen Sie das passende Tag unter „Alle Tags“.

Im oberen Abschnitt der Registerkarte Text sehen Sie die Tags, die in der Transkription der aktuellen Seite vorhanden sind. Durch Anklicken einer dieser Optionen springt das Bild und der Texteditor automatisch zu der Zeile, die es enthält.

Verwenden Sie die rote Schaltfläche hier, um Tags zu löschen: Wählen Sie das Tag aus der Liste aus (drücken Sie Strg, um mehr als ein Tag gleichzeitig auszuwählen) und klicken Sie auf die rote Schaltfläche. Alternativ können Sie ein Tag löschen, indem Sie das markierte Wort oder den markierten Satz markieren, mit der rechten Maustaste klicken und dann die Schaltfläche „Löschen“ drücken. Das Programm bietet Ihnen zwei Optionen: "Nur das hervorgehobene Tag löschen" oder "Alle Tags für die aktuelle Auswahl löschen".

Unten befindet sich der Abschnitt „Tag“: Hier sind alle Text-Tags aufgeführt, die Sie verwenden können. Sie können entscheiden, ob Sie alle Benutzer-Tags oder nur die mit der Sammlung verknüpften anzeigen möchten. In der Nähe jedes Tags gibt es einen grünen + Button und einen Stern-Button: Der erste fügt, wie bereits erläutert, dem markierten Text ein Tag hinzu; der Stern-Button gibt Zugriff auf erweiterte Optionen zum Taggen. Insbesondere können Sie mit den erweiterten Optionen alle Tags eines bestimmten Typs löschen oder umbenennen.

Durch Klicken auf die Schaltfläche „Anpassen“ öffnet sich das Fenster zur Tag-Konfiguration. Hier können Sie die Text-Tags sowohl auf Benutzer- als auch auf Sammlungsebene anpassen. Im Einzelnen können Sie:

  • Neue Tags erstellen;
  • Tags löschen; Farbe ändern, mit der das Tag angezeigt wird; Hinzufügen/Ändern von Eigenschaften neuer und vorhandener Tags;
  • Fügen Sie der Liste der "Tag-Spezifikationen" ein Tag hinzu und weisen Sie ihm eine Verknüpfung zu. Mit Tastenkombinationen können Sie das Einfügen häufig verwendeter Tags beschleunigen: Markieren Sie den Text und drücken Sie die Tastenkombinationen, um das Tag hinzuzufügen.  
  • Fügen Sie eine Verknüpfung zu den Eigenschaften Ihrer Tags hinzu, z. B. zum Erweitern von Abkürzungen oder zum Hinzufügen eines standardisierten Ländernamens zu einem Ortstag. Wählen Sie das Tag aus und geben Sie den gewünschten Immobilieninhalt ein. Klicken Sie dann auf „Tag-Spezifikation hinzufügen“: Jetzt werden Ihr Tag und seine Eigenschaft im Abschnitt „Tag-Spezifikation“ des Fensters angezeigt, und Sie können die Verknüpfung hinzufügen, die Sie verwenden möchten. Jetzt können Sie das Tag und seine Eigenschaft hinzufügen, indem Sie einfach das Wort oder die Phrase im Text-Editor-Feld markieren und dann auf die Verknüpfung drücken.

Im Fenster „Tag-Konfiguration“ werden vordefinierte Tags kursiv dargestellt; benutzerdefinierte werden ohne Kursivierung angezeigt. < br >
< em>

Schließlich befindet sich unten auf der Registerkarte Text der Abschnitt Eigenschaften, in dem Sie die Eigenschaften eines Tags bearbeiten können, falls vorhanden.

Text-Tags sollten auf Ihre spezifischen Zwecke zugeschnitten sein, aber im Allgemeinen können wir sagen, dass die folgenden besonders nützlich sind, wenn Sie mit historischen Dokumenten arbeiten:

  • Abkürzung:
    Sie können das abgekürzte Wort markieren und die Erweiterung als Eigenschaft eingeben.
    Es gibt keinen richtigen Weg, um mit Abkürzungen umzugehen. Abhängig von der Transkription, die Sie am Ende haben möchten, können Sie einen der folgenden Ansätze wählen:
    1. die erweiterte Version der Abkürzung direkt in   den Texteditor übertragen (die neuronalen Netze sind oft in der Lage, Erweiterungen zu erkennen und zu verwenden, insbesondere wenn sie häufig auftreten);  
    2. Transkribieren Sie die Abkürzung mit den Grundzeichen, die den vom Autor geschriebenen Zeichen am ähnlichsten sind; Sie können sie dann markieren und die Erweiterung als Eigenschaft schreiben;
    3. transkribieren Sie die Abkürzung mit den Unicode-Zeichen, die sich in der Nähe der speziellen Grapheme des Originaldokuments befinden. Denken Sie daran, dass Sie mit der virtuellen Tastatur Sonderzeichen hinzufügen können. Da es oft schwierig ist, zu entscheiden, welcher Unicode-Charakter der richtige sein könnte, können Sie die MUFI-Website konsultieren, um weitere Informationen zu diesem Thema zu erhalten. Wie oben, wenn Sie interessiert sind, können Sie das Kürzel markieren und die Erweiterung als Eigenschaft schreiben.
  • Unklar:
    Verwenden Sie dieses Tag, wenn der Text nicht transkribiert werden kann, da er unleserlich ist. Markieren Sie den unklaren Text im Texteditor und markieren Sie ihn als „unklar“; Sie können auch Alternativen oder Vorschläge für das unleserliche Wort als Attribut des Tags hinzufügen.
  • Lücke:
    Wenn der Text nicht gelesen werden kann, fügen Sie das "Lücke" -Tag an der Stelle hinzu, an der der unleserliche Text im Texteditor erscheinen soll.
  • Schwärzung:
    Verwenden Sie dieses Tag, um sensible Informationen in den Exportformaten zu schwärzen. Typischerweise wird dies verwendet, um personenbezogene Daten in einem Dokument zu verbergen, das öffentlich zugänglich gemacht wird. Das Schwärzungs-Tag wird in Verbindung mit dem Bereich „Schwärzen“ verwendet, der mit den Segmentierungswerkzeugen hinzugefügt werden muss. Um einen Teil Ihres Textes im Bildfenster zu schwärzen, gehen Sie zum Menü „Leinwand“, verwenden Sie das Dropdown-Menü auf der Schaltfläche „+…“ Segmentierungselement und wählen Sie „Schwärzen“. Verwenden Sie den Bereich „Schwärzen“, um das Wort oder den Abschnitt zu markieren, das/den Sie ausblenden möchten (denken Sie daran, im Hauptmenü auf die Schaltfläche „Artikel-Sichtbarkeit“ zu klicken und „Schwärzungen rendern“ auszuwählen, um die geschwärzten Abschnitte auf einer Seite anzuzeigen). Markieren Sie dann das entsprechende Wort im Texteditor und wählen Sie das Tag „Schwärzung“. Beim Export des Dokuments wird der Text durch Sternchen ersetzt. Wenn Sie Ihr Dokument exportieren, stellen Sie sicher, dass "Schwärzen" ausgewählt ist. Bitte beachten Sie, dass in Mets- und Tei-Dateien das Wort oder der Satz geschwärzt ist, die Informationen hinter dem geschwärzten Abschnitt jedoch erhalten bleiben. Bei anderen Dateiformaten ist der Text hinter dem ausgeschwärzten Bereich vollständig verdeckt.

Textstile (fett, kursiv, tiefgestellt, hochgestellt, durchgestrichen, unterstrichen...) werden als Text-Tags hinzugefügt. Um den Textstil Ihres Textes zu ändern, verwenden Sie die Formatierungsleiste unter dem Texteditor.  

Es ist möglich, Tags und Eigenschaften zu trainieren, während ein HTR-Modell TRAINIERT wird. Das resultierende Modell transkribiert das Dokument und fügt die Text-Tags automatisch zur Transkription hinzu. Lesen Sie die Modellschulungsseite , um zu erfahren, wie die Schulungs-Tags-Funktion funktioniert.