L'informatico di Schrödinger

cat
15Oct/10Off

IMDB: un interessante spunto di ricerca per la tesi ^_^

The IMDb logo.
Image via Wikipedia

Sembrerà un fuori tema clamoroso (perché questi post randomici hanno un tema per caso?!?) ma dopo 2 giorni di smattamenti è d'uopo presentarvi il mio nuovo compagno di giochi: IMDB!

IMDB (Internet Movie Database) è, come dice il nome, una raccolta pressoché completa sullo scibile cinematografico (e non solo visto che comprende anche informazioni su trasmissioni per il piccolo schermo..) consultabile online da un sito aggiornato quotidianamente.

Le informazioni che potete trovarci sono pressoché infinite (Titoli, trame, generi, cast - con relative biografie e filmografie di ciascun attore -, produttori, valutazioni, trivia, facts e quant'altro...) ed è molto interessante la possibilità di scaricarsi un simpaticissimo dump testuale di tutte le informazioni presenti sul sito.

Bello vero? Per me è spettacolare!

Appena vista tale opportunità non ho fatto altro che tirarmi giù il tutto e costruirmi un db adoch: per la mia tesi è manna! Adesso il mio scopo (già in parte realizzato a dire il vero) è costruirmi una bella rete multidimensionale su un sample di attori (ne ho scelti circa 60'000, e le dimensioni sono date dai 27 generi cinematografici) collegati se hanno partecipato nello stesso anno ad una stessa pellicola (ovviamente in ciascuna dimensione può esserci un collegamento tra 2 attori).

Fatto ciò (ho optato come periodo per la mia rete un arco temporale che comprende i film prodotti dal 1999 al 2008) valuterò la bontà dei miei predittori: vediamo quante compartecipazioni in film prodotti nel 2009 riuscirò a predire correttamente ^_^

Se tutto va bene per me d'ora in poi scegliere un film da vedere (considerando info varie come le valutazioni aggregate delle valutazioni per i vari membri del cast nei film precedenti et similia ) diventerà una scienza :P  (Chissà di non azzeccare l'uscita di qualche Megaproduzione dei prossimi anni XD )

Enhanced by Zemanta
Comments (2) Trackbacks (0)
  1. Ma……..da dove puoi scaricare il database di IMDB? O.o E..Quanto pesa? hahaha

  2. IMDB da la possiblità di accedere al loro database tramite svariate interfacce (la pagina di riferimento è http://www.imdb.com/interfaces). Per costruire il database, che non è fornito direttamente come dump sql, devi scaricarti il dump testuale e ricostruirlo (ftp://ftp.fu-berlin.de/pub/misc/movies/database/).
    Su questo sito (http://www.jmdb.de/) trovi un applicazione Java che si preoccupa, dati i file testuali che reperisci all’indirizzo precedente, di costruire il DB e di interrogarlo: ovviamente dopo che hai costruito il DB puoi interrogarlo come preferisci anche esulando dal programma che ti ho indicato.
    Fai conto che a scaricare il tutto non ci metti molto ma a costruire il DB dai dump testuali ci vogliono svariate ore di calcolo…


Leave a comment

You must be logged in to post a comment.

Trackbacks are disabled.