L'informatico di Schrödinger

cat
12Jul/11Off

Foursquare UK “Check in”-Network

 

Da un paio di giorni sto raccogliendo dati per costruire una rete su Foursuqare.

Tramite le API del servizio è infatti possibile recuperare le informazioni su utenti e relativi amici sul noto social network (che al momento conta circa 10milioni di utenti).

Tali informazioni però, seppure utili alla ricostruzione della rete d'interazione sociale (o di parte di essa) espressa dal network, non sono esattamente quelle che mi interessano.. il mio fine è costruire una rete sui "check in" degli utenti.

Purtroppo tali dati non sono forniti per motivi di privacy (ma se sono anonimizzati gli utenti?!? bha..) quindi è toccato inventarsi una strategia "alternativa" per recuperarli. Ecco la mia idea:

  1. Recuperare una lista di venues (luoghi) registrati in 4Square per un particolare paese (UK nel mio caso)
    • Definire una "bounding box" tramite coordinate geografiche che contenesse lo stato
    • Suddividere l'area in sotto regioni (di 0.02 gradi di latitudine e longitudine)
    • Recuperare le venues per ogni regione definita
  2. Effettuare la richiesta per i "check in" attuali per ogni singola venue registrata
  3. Recuperare dati "check in" (luogo, timestamp, utente) e dati utente (id, sesso, paese di origine)
  4. Usare gli utenti come nodi della rete
  5. Collegare due utenti con un arco se hanno fatto "check in" in una stessa venue in un dato periodo temporale

Ovviamente il passo 3 è quello che andrà ripetuto più volte e porterà via discreto tempo per avere un quantitativo di dati discreto per una rete non banale.

Basti infatti pensare che ho raccolto solo 70000 venues con più di 5 "check in" in tutti gli UK e che solo 3500 di queste (se non erro) ne hanno più di 100... il lavoro sarà lungo e (fortunatamente) automatizzato :P

Nell'immagine di apertura è riportata una mappa delle venues raccolte: si noti la maggiore concentrazione nelle zone urbane.

Sarebbe carino verificare quanto la rete costruita sui "check in" si sovrapponga con quella sociale definita dagli utenti vero?
Secondo me, visto che gli aereoporti risultano i siti con più visite, le due non saranno correlate più di un 20% (almeno ad occhio..) ma chissà..

 

Enhanced by Zemanta
Comments (0) Trackbacks (0)

Sorry, the comment form is closed at this time.

Trackbacks are disabled.