1. Help Center
  2. Riconoscimento del testo

2. Scelta del modello

La selezione del miglior modello di riconoscimento del testo per i vostri documenti è fondamentale per ottenere buone trascrizioni automatiche


La cosa più importante per ottenere buone trascrizioni è selezionare un modello adatto ai vostri documenti. Non esiste un modello generale per tutte le grafie e per i prossimi anni si prevede che continueranno ad essere necessari modelli specializzati.

Quando si sceglie un modello di testo, è necessario considerare i seguenti aspetti:

  • il tipo di materiale, scritto a mano o a stampa;
  • la lingua;
  • il periodo;
  • il tipo di script;
  • il Character Error Rate (CER):
    le prestazioni di un modello sono determinate in base alla "distanza" tra una trascrizione perfetta e il testo riconosciuto automaticamente. È misurato dal tasso di errore dei caratteri, ossia la percentuale di caratteri trascritti in modo errato dal modello di riconoscimento del testo. Per saperne di più sul tasso di errore dei caratteri, consultare questa pagina.

Cliccando su "Ulteriori informazioni", è possibile leggere una descrizione del modello e dare un'occhiata alle statistiche (ad esempio, il numero di parole, righe e pagine su cui il modello è stato addestrato).

Tutti i modelli che possono essere utilizzati per il riconoscimento del testo sono stati addestrati con PyLaia, che è il motore di riconoscimento del testo scritto a mano attualmente disponibile in Transkribus. È stato sviluppato dalla UPVLC (Universitat Politècnica de València) ed è open-source

 

Passo successivo: Modelli pubblici

 


 

Transkribus eXpert (deprecato)

La cosa più importante per ottenere buone trascrizioni è selezionare un modello adatto ai vostri documenti. Non esiste un modello generale per tutte le grafie e per i prossimi anni si prevede che rimarranno necessari modelli specializzati.

Quando si fa clic su "Seleziona modello HTR", si apre una finestra: sul lato sinistro della finestra, si può vedere una panoramica dei modelli disponibili; sul lato destro superiore della finestra, vengono mostrati i dettagli del modello. 

Quando si sceglie un modello di testo, è necessario considerare quanto segue:

  • il tipo di materiale, scritto a mano o stampato;
  • la lingua;
  • il periodo;
  • il tipo di script;
  • il tasso di errore dei caratteri.

Tutti i modelli che possono essere utilizzati per il riconoscimento del testo sono stati addestrati con PyLaia, che è il motore di riconoscimento del testo scritto a mano attualmente disponibile in Transkribus. È stato sviluppato dalla UPVLC (Universitat Politècnica de València) ed è open-source