1. Help Center
  2. Entraîner des modèles de texte

1. Pourquoi entraîner un modèle de reconnaissance de texte ?

Les modèles publics sont bien adaptés à l’emploi général et fournissent des résultats rapides, tandis que les modèles personnalisés offrent la précision et l’adaptabilité nécessaires pour des projets spécialisés.

Transkribus propose des modèles publics pré-entraînés pour un usage général, couvrant différentes langues, types de documents et styles d’écriture. Cependant, si vous travaillez avec des écritures ou documents spécialisés, un modèle personnalisé peut considérablement améliorer la précision de transcription. Cet article vous explique les différences et les avantages des modèles personnalisés par rapport aux modèles publics.

1. Utiliser un modèle public

 

Les modèles publics sont pré-entraînés sur une large gamme de documents, ce qui en fait un excellent choix pour des activités de transcription générales. 

  • Prêts à l’emploi : Les modèles publics sont pré-entraînés et prêts à être appliqués immédiatement à vos documents.
  • Larges & robustes : Ils sont entraînés sur une large quantité de données, ce qui les rend efficaces pour une grande variété de types de texte.
  • Utilisation conviviale : Les modèles sont conçus pour être aussi accessibles que possible aux nouveaux·elles utilisateur·rices et peuvent être utilisés directement sans configuration.
  • Polyvalents pour les textes manuscrits et imprimés : De nombreux modèles publics ont été entraînés pour traiter à la fois des textes manuscrits et imprimés.

Application : Les modèles publics sont idéaux pour traiter des styles d’écriture courants, des documents imprimés ou pour des transcriptions rapides ne nécessitant pas une grande précision. Consultez cet article pour en savoir plus sur l’utilisation de modèles publics : Transcription automatique de documents

Public vs Custom Model-png-1

2. Entraîner un modèle personnalisé


Les modèles personnalisés sont parfaitement adaptés à vos documents spécifiques, permettant d’atteindre une précision accrue et des résultats plus cohérents lors du traitement de documents uniques ou complexes. Voici les principaux atouts des modèles personnalisés :

  • Une précision accrue : Étant entraînés sur vos propres documents, les modèles personnalisés apprennent à reconnaître les styles d’écriture et les mises en page spécifiques qu’ils contiennent, permettant ainsi d’obtenir des transcriptions plus précises.
  • Adaptabilité à vos documents : Les modèles personnalisés peuvent gérer un vocabulaire, une terminologie ou des mises en page uniques qui pourraient poser des difficultés aux modèles publics.
  • Contrôle des données d’entraînement : Vous choisissez quelles données inclure dans l’entraînement, ce qui vous permet d’ajuster le modèle précisément aux types de documents avec lesquels vous travaillez.
  • Ajustement précis à votre projet : Les modèles personnalisés peuvent être continuellement améliorés à l’aide de données supplémentaires, ce qui les rend parfaits pour des documents spécialisés, historiques ou rédigés par plusieurs auteurs.

Application : Les modèles personnalisés sont idéaux pour des projets spécialisés, des écritures uniques ou lorsque les modèles publics ne fournissent pas la précision nécessaire. Ils sont particulièrement utiles pour toutes les tâches qui demandent une transcription cohérente et de haute qualité. Pour en savoir plus sur l’entraînement d’un modèle de reconnaissance de texte personnalisé, passez à l’étape suivante.