PDFpenPro 7 i suoi strumenti di OCR e tant'altro ...
Negli articoli scorsi abbiamo visto l'importanza del riconoscimento ottico del testo (c.d. OCR ed acronimo di Optical Character Recognition) ed il programma di solo OCR OCRKit.
Oggi esaminiamo un programma che, oltre ad avere funzioni di OCR, permette la gestione dei PDF a tutto tondo: PDFpenPro.
1 .Premessa
Come ho segnalato negli articoli scorsi le immagini che trovate in questo sono basate sulla versione 7 di PDFpenPro che ho acquistato tempo addietro sul Mac AppStore. Come accennavo altrove, PDFpenPro così come OCRKit non sono i miei strumenti quotidiani di lavoro – io utilizzo Acrobat Pro DC – ma ho acquistato PDFpenPro perché mi permette una manipolazione avanzata dei PDF su tutti i Mac in cui non ho installato la (costosa) licenza Adobe.
Nel momento in cui scrivo la versione più aggiornata di PDFpenPro è la 8.
1.2 PDFpen 8 e PDFpenPro 8
La Smile, la software house che sviluppa PDFpen vende due differenti distribuzioni, la versione base PDFpen 8 e la versione professionale PDFpenPro. Le due versioni si distinguono, oltre che per le funzioni, anche per il prezzo:
- PDFpen 8 (singolo utente) costa € 79,95;
- PDFpenPro 8 (singolo utente) costa € 129,95.
Le caratteristiche di PDFpen 8
La versione base PDFpen permette di:
- Aggiungere, rimuovere o modificare il testo di un PDF (per cui sia consentita la modifica);
- Annotari i PDF: evidenziare e disegnare, aggiungere note e commenti;
- Firmare (non con firma digitale avanzata però) e riempire i moduli predisposti come PDF;
- Condividere i documenti via email, o sincronizzare gli stessi con Dropbox o iCloud;
- Eseguire l'OCR sulle scansioni;
- Aggiungere, rimuovere e manipolare le immagini di un PDF;
- Possibilità di aggiungere, modificare, cancellare,combinare e numerare le pagine del PDF;
- Aggiungere una password per evitare l'accesso non autorizzato, visualizzare le annotazioni e la tavola dei contenuti dei PDF;
- Una libreria di oggetti usati frequentemente – molto comoda per le annotazioni di PDF a monitor (o su iPad se non avete un iPad Pro e l'Apple Pencil);
- Anonimizzare le informazioni sensibili di un PDF (molto utile quando si devono produrre documenti in giudizio od inviarli a controparti);
- Esportare i PDF in Microsoft® Word; possibilità di allegare File & audio
- Digital signatures con AATL o certificati self-signed
Le caratteristiche di PDFpenPro 8
PDFpenPro ha tutte le caratteristiche di PDFpen oltre alla possibilità di creare form (moduli da compilare), maggiori funzioni di esportazione (Microsoft Excel, PowerPoint, PDF/A), il controllo sui permessi e la possibilità di modificare le tavole dei contenuti (utile per ricercare velocemente parti importanti di un PDF di grosse dimensioni) creare Links da URLs ed, infine, la possibilità di creare PDF Portfolios.
1.3 Provare PDFpen
Qui trovate il link per scaricare una versione di prova per provare l'applicazione e decidere se fa per voi.
1.4 La differenza di acquistare da Mac AppStore o dal sito di Smile
Chiudo questa lunga premessa segnalando una cosa importante.
Se volete investire in questa applicazione vi consiglio caldamente di acquistarla dal sito del produttore che trovate qui. Infatti sul Mac AppStore non c'è possibilità di fare upgrade alle nuove versioni ed occorre acquistare ex novo l'ultima versione se invece acquistate dal produttore è possibile acquistare i prodotti futuri ad un prezzo più vantaggioso.
Come dicevo, ho fatto la scelta di un acquisto da Mac AppStore per poter usare il programma nelle situazioni di emergenza quando non sono sul mio Mac dell'ufficio ma credo sia opportuno per voi di ragionare sulla miglior strategia di acquisto.
2. Le funzioni di OCR di PDFpenPro
Entriamo quindi nel merito dell'articolo.
2.1 Apertura di un documento senza OCR
Quando apriamo un documento appena scansionato o, comunque, senza un livello di OCR in PDFpenPro, il programma da subito ci propone la possibilità di eseguire il Riconoscimento Ottico dei Caratteri, come si vede nell'immagine sottostante. È inoltre possibile scegliere la lingua di riconoscimento.
2.2 La procedura di riconoscimento
La procedura di riconoscimento è molto semplice anche se, dai miei test, non rapidissima.
2.3 I risultati del riconoscimento
Come potete vedere i risultati del riconoscimento sono buoni e la stragrande maggioranza del testo è stato riconosciuto correttamente.
Segnalo inoltre che premendo sul tasto "Livello OCR" è possibile visualizzare il livello nascosto del testo riconosciuto digitalmente e confrontarlo, in trasparenza, con l'immagine acquisita (altra funzione molto utile di PDFpenPro).
3. Un veloce esame alle preferenze di PDFpenPro
Come sempre diamo un'occhiata veloce alle preferenze di PDFpenPro.
Nel pannello "Generale" (raffigurato nell'immagine che segue) trovate le principali configurazioni dell'aspetto di PDFpenPro. Vi segnalo che è possibile bloccare i documenti PDF/A quando aperti (vedremo dopo il perché ci interessa).
3.1 Preferenze: OCR
Salto a piè pari le impostazioni denominate "Editazione" che, forse, sarebbe stato più corretto tradurre con "Opzioni di modifica" e passo al pannello "OCR".
Qui troviamo alcune opzioni interessanti che credo sia utile esaminare.
Il primo riquadro di spunta abilita e disabilita la funzione di PDFpenPro di rilevare e richiedere in automatico se vogliamo svolgere l'OCR su un documento scansionato.
La funzione "Disaltera pagine automaticamente durante OCR" è la funzione de-skew di cui vi ho parlato qui al punto 2.1 lettera B.
È poi possibile scegliere le lingue per cui si vuole eseguire l'OCR e, da ultimo, la possibilità di avere un suono a conclusione dell'OCR ed uno differente in caso di problemi. L'opzione è banale ma un utile strumento se state lavorando ad altro mentre viene svolto l'OCR.
3.2 Modifica del testo OCR
Chiudo il punto sull'OCR segnalandovi che, in caso di errori, è possibile modificare il testo riconosciuto da PDFpenPro. Per fare ciò occorre attivare il Livello OCR (scorciatoia a tastiera ⇧⌘O) e cliccare sulla parola che si vuole modificare. Non è un'attività utile da fare estensivamente ma se c'è una parola importante che si vuole modificare (casomai per applicare delle regole di Hazel al documento così riconosciuto) è un utile strumento.
4. Funzioni utili di PDFpenPro
Per motivi di spazio e di tempo (scrivo queste parole a ridosso della pubblicazione dell'articolo) non posso addentrarmi nel dettaglio di tutte le funzioni di PDFpenPro rispetto l'OCR, voglio tuttavia segnalarvi alcuni aspetti da considerare se volete acquistarlo / provarlo.
- Già dalla versione base, PDFpen ha degli strumenti di anonimizzazione dei documenti digitali. Permette cioè di oscurare parte del testo sensibile distruggendo non solo il dato visibile ma anche il dato invisibile (il livello di testo sottostante). Questa funzione è molto utile per gli avvocati e spesso, invece di utilizzare questa funzione (che è a pagamento su tutti i software di manipolazione dei PDF) si preferisce "oscurare" il testo evidenziandolo in nero. Questa operazione è controproducente perché, come detto, non cancella i dati memorizzati nel PDF e, con un semplice taglia e incolla è possibile leggere il testo così "nascosto".
- Come per OCRKit è possibile automatizzare con AppleScript il riconoscimento del testo nelle scansioni in quanto PDFpenPro ha il supporto ad AppleScript. Qui trovate una breve guida e l'AppleScript di Katie Floyd per automatizzare il riconoscimento con Hazel.
5. Salvataggio e filtri Quartz
Segnalo da ultimo che PDFpenPro ha la possibilità di utilizzare i filtri Quartz di sistema. Ve ne ho parlato in questo articolo.
6. Nota conclusiva: PDFpenPro 7 e la gestione dei PDF/A
Nel precedente articolo Francesco mi ha fatto una domanda interessante dal punto di vista dell'avvocato "telematico": i programmi sono compatibili con lo standard PDF/A?
Facciamo un passo indietro: il PDF/A non viene utilizzato come standard per i depositi del Processo Civile Telematico c.d. PCT ma è lo standard (ovvero è richiesto dalle regole tecniche) del Processo Telematico Tributario c.d. PTT ed in altri frangenti (ad esempio per il deposito delle relazioni fallimentari in Camera di Commercio).
Se vi state domandando cos'è il PDF/A e che differenza c'è tra un normale PDF vi segnalo che esistono vari "sapori" (flavor in inglese) di PDF. In particolare, quello di tipo A, è pensato per l'archiviazione del documento per lunghi periodi di tempo e quindi in ottica di retro-compatibilità ed è uno standard di fatto per quanto riguarda i depositi delle società in Camera di Commercio ed in ambito dei sistemi dell'Agenzia delle Entrate (indi per cui anche nel processo tributario telematico).
PDFpenPro ha una compatibilità parziale nel senso che è in grado di leggere i PDF/A e di esportare un normale PDF in formato PDF/A ma non lo può manipolare, come si vede dall'avviso che compare se si apre un PDF/A in PDFpenPro (immagine sottostante).
In conclusione
PDFpenPro è un utile strumento per svolgere il Riconoscimento Ottico dei Caratteri in una scansione così come per manipolare ed utilizzare i PDF nell'attività quotidiana. Ha un costo non esagerato e, se si sceglie la strada di acquistare il software dal produttore gli aggiornamenti con le nuove funzioni hanno un costo inferiore.
Come dicevo io non lo uso quotidianamente ma è uno strumento che, in caso di necessità, mi permette di lavorare senza troppi problemi.
La settimana prossima esamineremo l'ultimo (ma non a livello di importanza) programma per eseguire l'OCR ovvero Acrobat Pro DC.