Nicola D'Agostino (.net) - Articoli, traduzioni, grafica, web

Quando l’antispam si fa furbo

La soluzione vincente contro la posta spazzatura è stata inventata quasi 300 anni fa: i filtri bayesiani si basano sul calcolo delle probabilità e “imparano” dalle mosse dell’utente.

di Nicola D’Agostino

Con la diffusione sempre maggiore della posta elettronica, sia in casa che sul posto di lavoro, il fenomeno dello spam, la posta spazzatura di Internet, si fa sempre più sentito. Statistiche diffuse nel 2002 riflettono una situazione preoccupante: secondo la britannica MessageLabs il 17 per cento delle e-mail, e cioé un messaggio su sei, è spam, mentre secondo la concorrente Brightmail la percentuale sarebbe addirittura di due messaggi su cinque.

Nell’attesa di un auspicato intervento legislativo più preciso e adeguato al problema, la soluzione sinora più diffusa è stata l’adozione di contromisure software. La lotta al dilagare dello spam è effettuata sia dai provider che dagli utenti. Tra le tecniche usate ci sono le blacklist, liste di mittenti spammer da bloccare, o il filtraggio dei messaggi in base a caratteristiche o informazioni specifiche. Queste tecniche hanno però diversi problemi: sono laboriose e dall’efficacia altalenante (l’eterna rincorsa per tentare di bloccare gli spammer che cambiano continuamente gli indirizzi e modificano i propri metodi di attacco, risulta estenuante e non risolutiva). Inoltre c’è il rischio concreto di eliminare per sbaglio anche i messaggi legittimi, come dimostrato pochi giorni fa da At&t, rea di un filtraggio troppo rigido sui suoi server.

In risposta a questa situazione di empasse, negli ultimi mesi si è fatta largo una nuova tecnica che sfrutta le regole della statistica e “impara” dall’utente: si tratta dei filtri bayesiani, dal matematico inglese Thomas Bayes (1702-1761).

A suggerirne l’uso è stato Paul Graham in un saggio dell’agosto 2002 in cui ha affermato che «è possibile fermare lo spam, e che i filtri basati sul contenuto sono il metodo per farlo. Il tallone d’Achille degli spammer sono i loro stessi messaggi». L’utente segnala come spam un gruppo di messaggi: i filtri bayesiani ne esaminano il contentuto (non solo il mittente e l’oggetto) attraverso metodi statistici e utilizzano questi messaggi per “imparare”, costruendo un database delle parole ricorrenti nella posta spazzatura. I vantaggi sono la notevole efficacia nel bloccare messaggi indesiderati, una bassa percentuale di errori e un’interazione minima e poco laboriosa da parte dell’utente.

Nel giro di poco tempo sono comparse numerose implementazioni software di questa tecnica, tra cui spiccano il browser tuttofare open source Mozilla) e il client di posta elettronica di Apple, Mail).
Per Windows sono disponibili SpamSieve e SpamBully, mentre Popfile si dichiara invece mutlipiattaforma così come Bogofilter.

Articolo originariamente pubblicato su Mytech.it