Nicola D'Agostino (.net) - Articoli, traduzioni, grafica, web

A caccia di privacy con IdentiFight

Un motore di ricerca che scandaglia Internet per controllare se un nostro indirizzo è pubblico (e quanto) e suggerisce come intervenire per aumentare il livello di privacy.

di Nicola D’Agostino

L’idea è venuta allo sviluppatore Alf Eaton giocando con Spokeo, un super-aggregatore di blog, foto, e video assemblati da social network e feed vari: Eaton è rimasto colpito di quanto spesso le email degli utenti dei vari siti e servizi fossero in bella vista ed ha deciso di fornire un piccolo quanto utile strumento per essere più consapevoli della propria identificabilità su Internet.

Chi cerca trova

Il risultato si chiama IdentiFight e, datogli in pasto un indirizzo e-mail, ricercherà quanti più siti possibili con profili alla ricerca dell’indirizzo di posta. I risultati non sono solo una lista di sterili avvertimenti ma contengono, quando possibile, voce per voce anche dettagli su come intervenire per modificare la visibilità delle informazioni personali in alcuni casi con la procedura passo passo nelle impostazioni del servizio.

La home di IdentiFight

IdentiFight riesce a indagare ed interagire con siti noti e molto usati come Flickr, Friendster, LiveJournal, Magnolia, Rapleaf, Spock, StumbleUpon, Vox, Yahoo! 360°e Yelp ma fornisce comunque informazioni e link utili su come viene gestita la privacy degli utenti in una ventina di siti tra cui troviamo Amazon.com, Pownce, Twitter, Last.fm, LinkedIn o Twitter.

Come funziona

Risultati di una ricerca su IdentiFight
L’indirizzo inserito viene sottoposto da IdentiFight al search form (o alle API, nel caso di Flickr) di più siti. Questa operazione viene fatta in contemporanea usando curl_multi_exec, una funzione della libreria libcurl in PHP. Se il sito lo richiede il motore fa login per poter ricercare l’indirizzo e-mail e poi, nelle pagine di risultati, fa lo scraping di nome, username, foto, un link e l’estratto del profilo.
Tutti i link ai profili vengono poi sottoposti alle API Social Graph di Google che fornisce eventuali altri indirizzi connessi per mezzo del microformato rel=”me”. Da questi risultati vengono selezionati i nomi e le username più usate che saranno chiavi ulteriori di ricerca su altri siti (come Google).
A questo punto il risultato viene sottoposto all’utente.

Risultati di una ricerca su Identifight

I limiti

Identifight è uno strumento di ricerca e di informazione: i suoi limiti ultimi derivano da quanto concedono Yahoo! e gli altri provider. Se un servizio non permette a client esterni di accedere ai profili personali (o lo rende tecnicamente complicato) Identifight non può garantire nulla, come nel caso di Facebook o di MySpace. Peggio ancora può succedere che i siti non contemplino il rimuovere o quantomeno nascondere i dati e, anche quando si chiude l’ account e si termina la fornitura del servizio, le informazioni personali rimangano al loro posto.

Privacy powered by… Drupal

IdentiFight è realizzato prevalentemente in PHP ma il sito poggia sul noto CMS Drupal. Gli indizi sono molteplici: dalla favicon ai tipici indirizzi con /node/ nel path fino a qualche pagina di errore 404 che è rimasta quella standard di Drupal come per la scheda informativa su LinkedIn.

Una versione di questo articolo è stata pubblicata su "Hacker Journal" n. 151 del 15 maggio 2008