Applica il riconoscimento del testo ai documenti per trascriverli automaticamente
Fase precedente: Caricamento dei file
Per trascrivere automaticamente i documenti, è necessario innanzitutto selezionare le pagine o i documenti che si desidera trascrivere. Quindi, cliccare su "Riconoscimento del testo" nel menu di sinistra, sotto "Tools".
Ora scegliete il modello di testo più appropriato per i vostri documenti.
Un modello di testo è un algoritmo di intelligenza artificiale addestrato su un certo numero di dati (immagini e trascrizioni), in grado di individuare la sequenza di caratteri più probabile per ogni riga di testo segmentata. Non esiste un modello generale per tutte le grafie, quindi è necessario scegliere quello più appropriato per la scrittura e la lingua dei documenti.
All'interno di Transkribus, è possibile selezionare sia i modelli pubblici messi a disposizione dalla comunità e dal team di Transkribus, sia i modelli privati formati da voi stessi. È possibile filtrare la ricerca in base alla lingua, al nome, al tipo di documenti...
Due opzioni aggiuntive che è possibile selezionare prima di lanciare il riconoscimento del testo sono:
- Smart Search: consente di eseguire un tipo di ricerca più avanzato e potente delle trascrizioni generate automaticamente. Per saperne di più, consultate la pagina Smart Search.
- Modello linguistico: viene creato automaticamente durante l'addestramento del modello e si basa sui dati di addestramento. L'effetto dei modelli linguistici deve essere testato nel singolo caso: in molti casi, sono in grado di migliorare il riconoscimento, ma finora ci sono anche casi in cui non lo fanno.
Dopo aver selezionato il modello e le eventuali opzioni, cliccare sul pulsante "Start" per avviare il riconoscimento. È possibile verificare lo stato del riconoscimento del testo facendo clic su "Lavori". Al termine del riconoscimento, aprire una pagina riconosciuta: la trascrizione generata automaticamente apparirà sul lato destro dello schermo.
Quando si avvia il riconoscimento del testo, le immagini vengono segmentate automaticamente in regioni e linee di testo. Questa fase, chiamata riconoscimento del layout, collega il testo e l'immagine. Se i documenti hanno un layout complesso (ad esempio, tabelle, giornali, cartoline, margini, colonne multiple...), potrebbe essere conveniente eseguire il riconoscimento del layout come fase separata per controllarlo e correggerlo prima del riconoscimento del testo. Se questo è il vostro caso, date un'occhiata alla sezione Riconoscimento del layout.
Le sezioni seguenti trattano in modo più dettagliato gli aspetti principali del riconoscimento testuale e come scegliere il modello migliore per i propri documenti.
La prossima sezione: Scelta del modello
Transkribus eXpert (deprecato)
Per trascrivere automaticamente i documenti, accedere alla scheda "Strumenti", sotto la sezione "Riconoscimento del testo" e fare clic sul pulsante "Esegui". Nella finestra a comparsa, scegliere le pagine/documenti da elaborare e fare clic su "Seleziona modello HTR". Qui è possibile scegliere il modello di testo più appropriato per i propri documenti.
Un modello di testo è un algoritmo di intelligenza artificiale addestrato su un certo numero di dati (immagini e trascrizioni), in grado di individuare la sequenza di caratteri più probabile per ogni riga di testo segmentata. Non esiste un modello generale per tutte le grafie, quindi è necessario scegliere quello più appropriato per la scrittura e la lingua dei propri documenti.
È possibile selezionare sia i modelli pubblici messi a disposizione dalla comunità e dal team di Transkribus, sia i modelli privati formati da voi stessi. È possibile filtrare la ricerca per motore, lingua e nome.
Le impostazioni avanzate che si possono selezionare sono:
- Usa poligoni di linea esistenti: utilizzare questa opzione se si sono corretti manualmente i poligoni di linea perché il calcolo dei poligoni dalle linee di base non ha funzionato bene sui documenti.
- Semplificare i poligoni: per ridurre il numero di punti dei poligoni di linea.
- Aggiungi le coordinate stimate delle parole: aggiungi dei riquadri di delimitazione approssimativi per ogni parola della riga (puoi poi decidere di mostrare/nascondere i riquadri delle parole con l'icona a forma di occhio nella barra principale in alto).
- Restrizione su tag struttura: limita il riconoscimento del testo solo alle regioni di testo etichettate con il tag strutturale selezionato. Si può decidere se mantenere o eliminare il testo nelle altre regioni.
Dopo aver selezionato il modello, fare clic su "OK" per avviare il riconoscimento. È possibile verificare lo stato del riconoscimento del testo facendo clic sul pulsante "Lavori" nella barra principale superiore. Al termine del riconoscimento, ricaricare la pagina: la trascrizione generata automaticamente apparirà nell'editor di testo,
Quando si avvia il riconoscimento del testo, le immagini vengono segmentate automaticamente in regioni e linee di testo. Questa fase, chiamata riconoscimento del layout, collega il testo e l'immagine. Se i documenti hanno un layout complesso (ad esempio, tabelle, giornali, cartoline, margini, colonne multiple...), potrebbe essere conveniente eseguire il riconoscimento del layout come fase separata per controllarlo e correggerlo prima del riconoscimento del testo. Se questo è il vostro caso, date un'occhiata a questa pagina.