Segmenta manualmente la griglia della tabella prima di eseguire il riconoscimento del layout per rilevare le linee
Fase precedente: Riconoscimento manuale del layout
Se i documenti presentano tabelle, il miglior approccio attuale consiste nel disegnare manualmente la griglia della tabella e poi eseguire il rilevamento automatico delle linee con l'opzione "Riconoscimento layout".
Se il layout delle tabelle di diverse pagine è simile, è possibile copiare e incollare la struttura tabellare da una pagina all'altra.
Prima di tutto, aprire una pagina e selezionare il pulsante "Aggiungi una tabella" a sinistra dell'immagine. Fare clic sull'immagine una volta per avviare la tabella e una volta per terminarla. Premere ESC o la modalità di selezione per uscire dalla modalità "Aggiungi una tabella".
Per creare le righe, selezionare la tabella e tenere premuto H mentre si sposta il cursore sulla pagina e si fa clic sul punto in cui si desidera creare una riga.
Per creare le colonne, tenere premuto V mentre si sposta il cursore sulla pagina e si fa clic sul punto in cui si desidera creare una colonna. Continuate in questo modo fino a quando tutte le celle sono state contrassegnate.
Se è necessario unire due celle adiacenti o tutte le celle di una riga/colonna, selezionare la forma e fare clic con il tasto destro del mouse: utilizzare le opzioni che appaiono nel menu contestuale per unire le celle.
A seconda del layout della tabella, si potrebbe trattare il dorso del libro come una colonna in più. È inoltre possibile contrassegnare questa colonna con un tag strutturale (ad esempio "rilegatura"): selezionare la colonna, fare clic con il pulsante destro del mouse e selezionare "Assegna tipo di struttura" nel menu contestuale. Leggere la pagina dei Tag strutturali per ulteriori informazioni sulla gestione e la creazione di nuovi tag strutturali.
Se la pagina presenta altre informazioni che non appartengono alla tabella (ad esempio, titolo, numero di pagina, annotazioni...), disegna delle regioni di testo intorno ad esse.
Spesso più pagine seguono lo stesso modello di tabella. Dopo aver disegnato la struttura della tabella sulla prima pagina, selezionatela insieme alle eventuali altre regioni di testo, premete CTRL+C per copiare le forme desiderate, spostatevi su un'altra pagina e premete CTRL+V per incollarle. Potrebbero essere necessari alcuni aggiustamenti: tenere premuto SHIFT per spostare e scalare le forme o spostare il cursore sulla linea che si desidera spostare, fare clic su di essa e rilasciarla nella nuova posizione.
Una volta creata la struttura delle tabelle in tutte le pagine, tornate alla vista Documento ed eseguire il comando Riconoscimento layout per aggiungere automaticamente le linee. Ricordatevi di deselezionare la casella "Find Text-Regions" nelle Impostazioni di configurazione per rilevare solo le linee.
Se le linee appartenenti a celle diverse sono molto vicine tra loro, il riconoscimento automatico del layout potrebbe riconoscerle come un'unica lunga linea. Per evitare questo inconveniente e fare in modo che le linee rispettino rigorosamente il bordo della celle, selezionare l'opzione "Split lines on region border" nelle Impostazioni di configurazione del riconoscimento del layout.
Al contrario, potrebbe accadere che le linee che si estendono su più celle vengano divise. È possibile unire queste linee parziali, ma prima è necessario spostarle nella stessa cella. Aprire l'albero del layout con il pulsante "Layout" nel menu di sinistra e selezionare, nell'immagine, la linea che appartiene alla cella sbagliata: automaticamente, verrà evidenziata la linea corrispondente nell'albero del layout. All'interno della struttura del layout, spostare la linea evidenziata nella cella di destra (probabilmente la cella precedente o successiva). Ora che entrambe le linee appartengono alla stessa cella, è possibile tenere premuto CTRL, selezionare entrambe le linee e premere M sulla tastiera per unirle.
Transkribus eXpert (deprecato)
Segmentando tabelle stampate o disegnate a mano con l'Editor tabelle di Transkribus si aggiungono linee grafiche all'immagine e si assegna una struttura tabellare al layout dei documenti.
Attualmente, le tabelle devono essere disegnate manualmente utilizzando l'Editor tabelle di Transkribus. Ma se più pagine seguono lo stesso modello di tabella, il markup della tabella può essere fatto nella prima pagina e poi copiato nelle altre pagine.
Prima di tutto, creare regioni di testo per qualsiasi informazione non appartenente alla tabella.
Si tratta di informazioni in alto, in basso o ai lati della pagina che chiaramente non fanno parte della tabella, come numeri di pagina, numeri di riga, date e qualsiasi altro segno o annotazione.
Poi si può creare la tabella. Nel menu Canvas, selezionate il pulsante "Aggiungi un altro elemento" e poi fate clic su "Aggiungi una tabella". Fare clic sull'angolo in alto a sinistra della tabella nell'immagine e poi fare clic sull'angolo in basso a destra
È ora possibile segmentare la tabella in righe e colonne. Per iniziare, assicurarsi di essere in "Modalità di selezione": premere il tasto "ESC" sulla tastiera o fare clic sul pulsante "Modalità di selezione" nel menu principale. Cliccare sulla tabella creata.
Per creare righe, fate clic sul pulsante H del Menu di disegno: spostate il cursore sulla pagina e fate clic ovunque vogliate creare una linea orizzontale.
Per creare colonne, fate clic sul pulsante V del Menu di disegno: spostate il cursore sulla pagina e fate clic ovunque vogliate creare una linea verticale. Continuare fino a quando tutte le celle della tabella sono contrassegnate.
In alcuni casi, può essere necessario unire le celle per riflettere le celle che si estendono su più righe o colonne. Per selezionare le celle da unire, tenete premuto il tasto "CTRL/CMD" sulla tastiera, fate clic sulle celle pertinenti della tabella e poi fate clic sul pulsante "Unisce le forme selezionate" nel menu Tela.
Se ci si concentra sulla segmentazione perfetta della tabella, potrebbe essere necessario correggere la forma di alcune celle della tabella. Le linee verdi segmentate devono corrispondere il più possibile alle linee della tabella. Per farlo, selezionare la cella della tabella che si desidera modificare, fare clic e trascinare i puntini verdi per spostare la posizione delle linee.
A seconda del layout della tabella, si potrebbe trattare il dorso del libro come una colonna in più. È inoltre possibile contrassegnare questa colonna a livello di cella della tabella utilizzando il tag "rilegatura" nella scheda "Metadati/Struttura".
Se il layout delle tabelle di diverse pagine è simile, è possibile trasferire il formato delle tabelle da una pagina all'altra. A tale scopo, aprire "Altri strumenti di segmentazione" nel menu di canvas; scegliere "Copia regioni (testi o tabelle) in altre pagine"; definire le pagine in cui copiare il layout nella finestra visualizzata e confermare con "OK". Il layout della tabella verrà copiato nelle pagine indicate. Per eseguire definitivamente lo strumento, deselezionare "Esecuzione a secco". È possibile che la posizione della tabella nelle nuove pagine debba essere corretta. Per farlo, selezionare l'intera tabella e spostarla tenendo premuto CTRL + MAIUSC sulla tastiera.
Prima di trascrivere manualmente o automaticamente la tabella, il passo successivo è l'aggiunta delle linee di base. Le linee di base devono riflettere il flusso logico del testo e possono quindi superare i bordi delle celle, se necessario. È possibile disegnare le linee di base a mano o utilizzare lo strumento automatico di analisi del layout.
Si può notare che lo strumento di layout automatico delle celle di tabella rispetta rigorosamente i bordi delle celle. Le linee di base che si estendono a più celle sono divise. È possibile utilizzare lo strumento di fusione per combinare queste linee di base parziali. Se si desidera unire linee di base che si estendono su più celle, è necessario spostarle prima nella stessa cella, selezionarle e utilizzare lo strumento di unione. Più in dettaglio, aprite la scheda "Layout" nella barra Strumenti&Gestione e selezionate, nell'immagine, la riga che appartiene alla cella sbagliata: automaticamente, verrà evidenziata la riga corrispondente nell'albero del layout. All'interno della struttura del layout, spostare la riga evidenziata nella cella di destra (probabilmente la cella precedente o successiva). Ora che entrambe le linee appartengono alla stessa cella, è possibile selezionarle entrambe e fare clic sul pulsante "Unisci le forme selezionate" nel menu Tela.