Nicola D'Agostino (.net) - Articoli, traduzioni, grafica, web

Il feed è servito

Da web a RSS gratis ed in poche mosse. Grazie a script e servizi online e qualche sapiente hack.

di Nicola D’Agostino

I feed RSS sono diventati in pochi anni uno degli strumenti di trasmissione di Internet, diventandone la lingua franca e permettendo la diffusione di dati tra programmi e dispositivi. Ecco alcune soluzioni da smanettone su come creare online e con pochi sforzi un feed per le pagine web che non ne hanno uno: grazie a tool, servizi e trucchi vari ma anche due righe di codice ben assestato.

Le basi della conversione in RSS si trovano in un documento storico del W3C, il consorzio per gli standard del Web. È una guida del gennaio 2001 intitolata “RSS 1.0 News Feed Creation How-To”. Il sistema suggerito è quello di usare un XSLT, un linguaggio di trasformazione dei documenti XML. La prima fase è quella dell’ “HTML scraping” e cioè rastrellare il sorgente HTML per poi convertirlo in un feed che come visto su Hacker Journal 77 non è altro che un file XML. Un’idea pratica e comoda, soprattutto se qualcuno fa tutto il lavoro per noi.

Fuoco ai Feed

Uno tra i più vecchi servizi di conversione da HTML a RSS è FeedFire. Una volta registratisi sul sito e fatto login tra le opzioni abbiamo “create channel”: basta inserire l’indirizzo di una pagina web e viene creata una schermata di riassunto con link alla versione in RSS che possiamo diffondere o pubblicare . Agli utenti paganti è permesso il controllo di vari parametri per migliorare il risultato, tra cui la scelta di precisare cosa includere o meno nella conversione ma il risultato è usabile anche nella versione free, anche se un po’ stringato.

La home di FeedFire

Qualcosa di simile si può ottenere anche con FeedTier semplice ma efficace e completamente gratuito per uso personale (ma sono accette donazioni). FeeTier non necessita di registrazione e crea feed sintetici ma con titoli ed url. Volendo si può modificare il risultato includendo link della pagina web originaria.
La versione standard del feed è creabile anche senza andare sul sito con una semplice riscrittura dell’url seguendo questa elementare sintassi:
http://feedtier.somee.com/?http://www.sito.xyz/pag.html

La home di FeedTier

Sempre gratuito ma un po’ più macchinoso nella conversione c’è anche Ponyfish che si può usare anche senza registrazione.
Una volta digitato l’url della pagina da trasformare in RSS, Ponyfish ci guiderà passo passo e alla fine ci fornirà un indirizzo del tipo feed://www.ponyfish.com/feeds/7118RbRMpKhG (in questo caso la conversione di www.nicoladagostino.net/spam.html) da usare come vogliamo.

Gratuito e senza obbligo di creare un account c’è anche Feed43 che alla conversione da HTML a RSS aggiunge la possibilità di modificare e aggiustare il feed e, volendo, anche di proteggerlo con una password per impedire la modifica a chiunque tranne che all’autore.

HTML scraping avanzato

Per chi invece vuole un feed completo, personalizzato e paragonabile (o quasi) a quello prodotto in automatico da blog CMS la soluzione è mettere mano al sorgente delle pagine HTML e affidarsi alle magie di RSSify o RSSPECT.

RSSify è un form che trasforma le pagine web in RSS 0.92. Per usarlo bisogna aggiungere al markup della pagina web i tag <span class=”rss:item”> e </span> rispettivamente prima e dopo i blocchi di contenuto. Ecco un esempio:

<span class=”rss:item”>
<p>Nome del sito<br>data</p>
<p>http://www.karakas-online.de/myServices/rssify.php?url=http://www.sito.xyz/pagina.html
Questo indirizzo lo si può usare oltre che come link in lettori ed aggregatori anche in pagine web e incorporandolo nell’header inserendo

<link rel=”alternate” type=”application/rss+xml” href=”http://www.karakas-online.de/myServices/rssify.php? url=http://www.sito.xyz/pag.html” title=”titolo del feed”>

tra i tag e nel sorgente HTML.

Simile nell’uso c’è anche Rsspect che garantisce risultati esteticamente migliori ma è più laborioso e obbliga alla registrazione. A differenza di RSSify bisognerà inserire cinque tipi di tag, il primo obbligatorio (<span class=rss-content>) e gli altri (<span class=rss-newpost>, <span class=rss-title>, <span class=rss-link>, <span class=rss-id>) opzionali tutti ovviamente seguiti da </span>.
Ecco un esempio:

<span class=”rss-newpost”></span>
<p>Testo introduttivo</p>
<span class=”rss-content”>
<p><strong><a href=”http://www.sito.xyz/art.html”>Titolo dell’articolo</a> – data</strong><br>
<em>Descrizione dell’articolo o post.</em>
</span>

Una volta fatto si riempie anche qui un form per la generazione del feed e dei parametri e l’url risultante sarà del tipo feed://www.rsspect.com/rss/pag.xml

Italians do it first

Tra i primi servizi a fornire la conversione di pagine web in RSS ci sono due strumenti per la piattaforma di blogging Radio Userland. rssDistiller era un tool tutto italiano e commerciale che oltre a creare i feed da pagine html faceva anche da aggregatore. Abbiamo usato il passato perché rssDistiller al momento sembra scomparso e l’alternativa migliore è Stapler, gratuito e distribuito con la licenza permissiva BSD.

Anche i mercatini sindacano

I feed RSS sono un canale utile per “abbonarsi” e seguire uno canale di informazioni. C’è chi ha pensato di applicare il concetto al sito di aste più usato su Internet: ebay2rss è uno script freeware in PHP da mettere sul proprio server che crea e fornisce feed da pagine utente o categorie di oggetti. Basta scaricare lo script, impostare i parametri del caso (categoria, titolo, link, descrizioni e così via), metterlo online sul proprio server ed il feed di eBay è servito!

Una versione di questo articolo è stata (presumibilmente) pubblicata su "Hacker Journal" nel settembre o ottobre 2007