Acrobat Pro DC e l'OCR
Concludo (con un po' di ritardo sui programmi iniziali) la mia carrellata delle applicazioni per eseguire l'OCR sul Mac.
E concludo con IL programma per eccellenza: Acrobat Professional DC.
Adobe è la software house che ha sviluppato il formato PDF ed Acrobat è il programma ufficiale per la lettura e la manipolazione dei PDF.
Acrobat esiste in 3 versioni:
- Acrobat Reader DC: la versione nota a tutti e gratuita – permette la gestione di base dei PDF, non permette di modificare i PDF e, recentemente, ha aggiunto la possibilità di salvare, all'interno dei PDF, i commenti (utile per creare le attestazioni di conformità come vi ho spiegato qui);
- Acrobat Standard DC: la versione base ed a pagamento del programma (presente solo per la piattaforma Windows – ad 15,85€/mese);
- Acrobat Professional DC: la versione più avanzata e "professionale" dal costo maggiore (circa € 18 al mese).
1. L'interfaccia di Acrobat DC
Con l'avvento della versione DC (che sta per Document Cloud ovvero "documenti nella nuvola") Adobe ha modificato profondamente l'interfaccia del programma rispetto alle versioni precedenti.
Tendenzialmente abbiamo la barra degli strumenti (punto 1 dell'immagine che segue), l'anteprima del PDF (punto 2) ed il menù selettore degli strumenti (punto 3).
1.2 La barra laterale degli strumenti di Acrobat DC
In questo articolo non potremo soffermarci su tutte le funzioni di Acrobat. A fine articolo, sommariamente, vi parlerò di quelle che ritengo siano funzioni (a) da conoscere (b) utili per l'avvocato.
Dalla versione DC Acrobat ha, sulla destra, una barra degli strumenti. Quello che a noi interessa per la gestione dell'OCR è "Migliora acquisizioni" (come si vede nell'immagine sottostante cerchiata in rosso).
1.3 Ricerca all'interno della barra degli strumenti
La barra degli strumenti, oltre ad essere personalizzabile, permette anche di ricercare uno specifico strumento che non è visibile direttamente.
Nel nostro caso ho digitato nel campo di ricerca la parola "ocr" e, come si vede nell'immagine sottostante, sono emerse le funzioni principali collegate a tale ricerca: Riconosci testo; In più file …; Correggi testo riconosciuto.
Salvo "In più file …" che fa riferimento all'OCR di più documenti selezionati, tutte le altre voci sono auto-esplicativi e, per chi ha Acrobat Professional DC vi sprono a testarle personalmente.
2. Lo strumento: Migliora acquisizioni
Veniamo quindi alla parte centrale dell'articolo.
Anzitutto, come potete vedere dall'immagine che segue, una volta selezionato lo strumento "Migliora acquisizioni" la barra orizzontale degli strumenti si modifica presentando le opzioni specifiche dello strumento selezionato.
2.1 Opzioni Riconosci testo
Nel nostro caso, ovviamente, ci interessa la funzione di riconoscimento del testo.
Premendo sulla triangolo con la punta verso il basso si apre un menù a tendina di scelta che ci permette di attivare il riconoscimento del testo sul documento che abbiamo aperto, riconoscere il testo in più documenti o correggere il testo riconosciuto.
Per attivare il riconoscimento del testo basta poi premere il tasto in Blu "Riconosci testo" (nota: in parte il testo del pulsante è tagliato nell'immagine sottostante).
2.2 Riconosci testo In più file ...
Quest'opzione è molto utile se abbiamo più documenti da far riconoscere ad Acrobat.
Premendo su "Aggiungi file …" è possibile caricare più documenti, caricare più cartelle o applicare l'OCR ai documenti già aperti nelle varie finestre di Acrobat.
2.3 Migliora: Impostazioni
Premendo il tasto “Impostazioni” visibile nell'immagine di seguito a fianco della ruota dentata, è possibile aprire le impostazioni del riconoscimento testo. Come potete vedere nell'immagine che segue è possibile scegliere la lingua in cui si vuole riconoscere il testo, l'output (ovvero il risultato finale) che si vuole ottenere, nonché la risoluzione (Downsampling) dell'immagine finale. Quest'ultimo parametro è importante per le dimensioni finali del PDF con OCR. Riducendo i dpi infatti è possibile ridurre le dimensioni del documento ma, con esso, si riduce anche la "leggibilità" dell'atto.
2.4 Le opzioni di Migliora
Da ultimo Acrobat permette di migliorare le acquisizioni fatte. In questo caso possiamo scegliere tra l'opzione acquisita con scanner o da fotocamera.
Segnalo che questa funzione di Acrobat permette tra l'altro di raddrizzare le acquisizioni (il de-skrew di cui vi ho parlato qui - punto 2.1 lettera B).
3. Opzioni interessanti di Acrobat Pro DC
3.1 Ottimizza PDF
Questa funzione è simile a quella che abbiamo già visto ma utilizza degli strumenti automatici. Il risultato può non essere sempre il miglior ma la riduzione delle dimensioni di un PDF è veramente notevole. Vi consiglio di provarla nel caso in cui abbiate da fare un deposito telematico con un PDF particolarmente pesante.
Premendo "Ottimizzazione avanzata" potete modificare i parametri, ma sono tanti e consiglio l'uso di questa opzione solo a chi è esperto.
3.2 Confronta file
Una nuova e utile funzione di Acrobat Professional DC è la possibilità di confrontare due PDF l'uno con l'altro per valutarne le differenze.
Molto comodo per la revisione di documenti di cui esistono varie versioni.
3.3 Numerazione Bates (Aggiungere intestazione e piè di pagina)
La Numerazione Bates è tipicamente americana, tuttavia è interessante anche per l'avvocato italiano. Permette infatti di modificare i PDF inserendo in modo facile ed automatico in numeri delle pagine in un PDF, oppure un'intestazione, ovvero permette (ed è l'utilizzo tipico degli avvocati americani) di numerare i documenti come mezzi di prova (exibit 1, exibit 2 etc).
3.4 Anonimizzazione dei PDF
La funzione "Redigi" permette di estrapolare i dati sensibili di un PDF e cancellarli.
Non posso qui entrare nel merito (spero in un prossimo futuro di scrivere un articolo specifico) tuttavia Acrobat ha degli strumenti veramente avanzati per anonimizzare i PDF.
È infatti possibile cancellare oltre al testo / immagini anche i meta-dati contenuti all'interno del PDF. Cosa sono i meta-dati? Sono tutto un insieme di dati che, spesso senza che l'utente inesperto lo sappia, sono contenuti nel PDF. Ad esempio quando si crea un PDF con un programma di video-scrittura sono salvati i dati dell'autore oltre al programma con cui si è generato il PDF.
È utile in alcuni casi ripulire questi dati "nascosti".
4. Automazione con Acrobat Pro DC: le azioni
Come avrete notato, buona parte dell'interfaccia di Acrobat Pro DC è "punta e clicca". Tra l'altro, rispetto ad altri programmi, il menù di Acrobat è piuttosto ridotto e non tutte le funzioni sono reperibili all'interno dei menù.
Acrobat è infatti multipiattaforma (Windows, Mac ed anche Linux in parte) e la scelta dell'azienda è andata verso un sistema proprietario di automazione: le azioni.
Non posso entrare troppo nello specifico per ragioni di lunghezza e perché, lo ammetto, non sono un grosso utilizzatore di questo strumento, ma segnalo l'utilità di questa funzione.
Nell'immagine che segue vedere un esempio dello strumento Azione guidata e l'Elenco Azioni già pre-caricate in Acrobat.
4.1 Crea nuova azione
Le azioni Acrobat sono di fatto qualcosa di molto simile a come funziona Automator. è possibile concatenare una serie di compiti che Acrobat eseguirà uno dopo l'altro, evitandoci di selezionare varie voci del menù e riducendo i tempi di lavorazione di un documento. Nell'immagine che segue vedete l'interfaccia per creare una nuova azione.
Al link che segue trovate una guida su come creare un azione guidata.
4.2 Acrobat Actions Exchange - Adobe Acrobat
Se non volete spremervi le meningi, non preoccupatevi, c'è un'ulteriore soluzione.
Acrobat ha una grossa comunità do utenti ed ha creato un sistema di scambio delle azioni. Potete quindi cercare un'azione che faccia al caso vostro già preparata da un altro utente.
Trovate le azioni sul sito Action Exchange che è tuttavia solo in lingua inglese.
5. Risorse utili
Ad ultimo vi segnalo alcune risorse utili per approfondire l'uso di questo programma
- Acrobat in one hour - ibook - solo iTunesStore Usa : libro che ho acquistato in cartaceo e mi ha insegnato molti dei trucchi utili per un avvocato nell'uso di Acrobat;
- Paperlesschase: sito di Ernie Svenson l'autore del libro che vi ho appena citato;
- Acrobat for Legal Professionals: blog direttamente di Adobe per l'uso di Acrobat in ambito legale;
- Come utilizzare il Wizard per creare delle azioni - in inglese.
In conclusione
Abbiamo quindi concluso la carrellata dei software per Mac utili per il riconoscimento ottico dei caratteri.
Nel prossimo articolo vi spiegherò come ho digitalizzato il mio ufficio con lo Scansnap e nelle settimane a seguire vedremo alcuni programmi per iOS per utilizzare i nostri iPhone / iPad come scanner.