Nicola D'Agostino (.net) - Articoli, traduzioni, grafica, web

Dal web al PDF

Come trasformare pagine HTML in PDF: ovunque, velocemente e a costo zero.

di Nicola D’Agostino

Il Portable Document Format, meglio noto come PDF, è un formato estremamente diffuso e comodo: una guida, un articolo o qualsiasi contenuto può diventare portabile e leggibile su qualsiasi computer o dispositivo. Grazie alla natura aperta del PDF ed a servizi disponibili sul web possiamo fare la conversione di pagine web a costo zero, in pochi secondi, su qualsiasi OS e senza essere legati a nessun software o driver: basta un browser e la connessione ad Internet.

Da pagina web a PDF

Il PDF via email

Una prima possibilità è quella di salvare la pagina che ci interessa in HTML in locale e di usare due servizi che trasformeranno il documento in PDF appoggiandosi alla posta elettronica. Document Converter eXPress, ad esempio, permette di convertire file da e verso parecchi formati e di vedersi recapitare via posta elettronica le coordinate per scaricare il risultato. Unico limite è al dimensione che non può superare 1Mb. Di funzionamento simile c’è PDFOnline con meno formati di input e con output esclusivamente in PDF. All’indirizzo email che forniremo ci verrà spedito direttamente il risultato che qui ha un limite massimo di 2Mb.

Per direttissima

ExpressPDF permette invece di saltare la fase intermedia e di operare la trasformazione in PDF (sempre da recapitare via e-mail) di un qualsiasi url. Sono disponibili anche impostazioni di formato e orientamento della pagina e ottimizzazioni per lo schermo, la stampa e fare un eBook.

Da url a PDF

Essenziale ma efficace è HTMLDOC PDF-o-matic che converte e fa scaricare istantaneamente (basta cambiare il nome del file che è generico) qualsiasi pagina web di cui avremo digitato l’indirizzo. Molto simile è HTML_ToPDF 3.4, che però ha dato problemi di elaborazione ed errori nella generazione del PDF finale.

PDF a là carte

Per gli utenti più smanettoni c’è infine RSS2PDF che usa un metodo diverso: si appoggia al feed RSS (o OPML) della pagina web.

Da feed a PDF

Si tratta di uno strumento davvero versatile che può generare vari tipi di PDF: integrale, digest, con o senza immagini. La conversione è attuabile sia dalla home page del progetto, sia tramite dei bookmarklet Javascript (basta premere per convertire la pagina che stiamo vedendo) ma anche a piacimento usando un url con la seguente sintassi:

http://rss2pdf.com?img=1&url=http://www.sito.xyz/feed.xml

Il feed può essere sia RSS che Atom. Dando valore 1 o 0 a img si includono o escludono le immagini dal PDF. L’url così creato lo possiamo usare dove e come vogliamo, magari come servizio da fornire ai visitatori del nostro sito come link testuale o tramite un caratteristico banner antipixel.

For bloggers only

Per chi ha un sito o blog basato sulla piattaforma WordPress è disponibile WP2PDF per convertire i post in PDF. WP2PDF ha una sua sintassi e comandi con cui si può specificare quante entry trasformare, cosa includere o escludere e permette di attuare la conversione anche aggiungendo semplicemente pdf/ dopo l’url.

Una versione di questo articolo è stata pubblicata su "Hacker Journal" n. 78 del 23 giugno 2005