IMDB: un interessante spunto di ricerca per la tesi ^_^

- Image via Wikipedia
Sembrerà un fuori tema clamoroso (perché questi post randomici hanno un tema per caso?!?) ma dopo 2 giorni di smattamenti è d'uopo presentarvi il mio nuovo compagno di giochi: IMDB!
IMDB (Internet Movie Database) è, come dice il nome, una raccolta pressoché completa sullo scibile cinematografico (e non solo visto che comprende anche informazioni su trasmissioni per il piccolo schermo..) consultabile online da un sito aggiornato quotidianamente.
Le informazioni che potete trovarci sono pressoché infinite (Titoli, trame, generi, cast - con relative biografie e filmografie di ciascun attore -, produttori, valutazioni, trivia, facts e quant'altro...) ed è molto interessante la possibilità di scaricarsi un simpaticissimo dump testuale di tutte le informazioni presenti sul sito.
Bello vero? Per me è spettacolare!
Appena vista tale opportunità non ho fatto altro che tirarmi giù il tutto e costruirmi un db adoch: per la mia tesi è manna! Adesso il mio scopo (già in parte realizzato a dire il vero) è costruirmi una bella rete multidimensionale su un sample di attori (ne ho scelti circa 60'000, e le dimensioni sono date dai 27 generi cinematografici) collegati se hanno partecipato nello stesso anno ad una stessa pellicola (ovviamente in ciascuna dimensione può esserci un collegamento tra 2 attori).
Fatto ciò (ho optato come periodo per la mia rete un arco temporale che comprende i film prodotti dal 1999 al 2008) valuterò la bontà dei miei predittori: vediamo quante compartecipazioni in film prodotti nel 2009 riuscirò a predire correttamente ^_^
Se tutto va bene per me d'ora in poi scegliere un film da vedere (considerando info varie come le valutazioni aggregate delle valutazioni per i vari membri del cast nei film precedenti et similia ) diventerà una scienza
(Chissà di non azzeccare l'uscita di qualche Megaproduzione dei prossimi anni XD )
No related posts.
Enjoy this article?
Follow me on Google+
What I'm Doing...
- Sono da Poste Piazza Della Vasca (Grosseto) http://t.co/ec5jqbEX 1 day ago
- Sono da ISTI CNR - Istituto di Scienza e Tecnologie dell'Informazione "A. Faedo" (Pisa, Toscana) http://t.co/Omwmjo5s 4 days ago
- @rinziv @gabriellilor @eccclissi @pappalardophd sarà quella "Popolare" in reply to rinziv 5 days ago
- @rinziv @gabriellilor @eccclissi @pappalardophd ma siete in un albergo cinese?!? #Cinesi .. #SputarePerTerraComeAbitudineCulturale in reply to rinziv 5 days ago
- More updates...
Speaker’s Corner
- La crisi della maggioranza Emanuele Roberto Bussi
- L’Euro e il referendum greco Emanuele Roberto Bussi
- La necessità di un’economia nuova Emanuele Roberto Bussi
- La speranza nel futuro Emanuele Roberto Bussi
- Il punto della situazione Emanuele Roberto Bussi
I’m watching it..
Iperuranio
Expecting privacy in an MMO is like expecting Santa Claus to come down your chimney on Christmas Day: it displays a charming naivete when children express it, and psychotic ignorance in an adult.
Anonimo sul webIo ce l’ho con la gente che ce l’ha con la gente
Chiara BuchettiNoi non siamo matematici perché facciamo funzionare le cose.
Pierpaolo Degano
Noi non siamo ingegneri perché capiamo come funzionano.The only baggage you can bring
U2 - Walk On
Is all that you can’t leave behindLascia dormire il futuro come merita: se lo svegli prima del tempo, otterrai un presente assonnato.
Franz Kafka


October 31st, 2010 - 16:47
Ma……..da dove puoi scaricare il database di IMDB? O.o E..Quanto pesa? hahaha
October 31st, 2010 - 16:59
IMDB da la possiblità di accedere al loro database tramite svariate interfacce (la pagina di riferimento è http://www.imdb.com/interfaces). Per costruire il database, che non è fornito direttamente come dump sql, devi scaricarti il dump testuale e ricostruirlo (ftp://ftp.fu-berlin.de/pub/misc/movies/database/).
Su questo sito (http://www.jmdb.de/) trovi un applicazione Java che si preoccupa, dati i file testuali che reperisci all’indirizzo precedente, di costruire il DB e di interrogarlo: ovviamente dopo che hai costruito il DB puoi interrogarlo come preferisci anche esulando dal programma che ti ho indicato.
Fai conto che a scaricare il tutto non ci metti molto ma a costruire il DB dai dump testuali ci vogliono svariate ore di calcolo…