2015-11-17 18 views
1

我已經下載了IMDB(MySQL的)的樣本轉儲所有名稱和標題: http://blog.secaserver.com/2013/08/importing-imdb-sample-data-set-mysql/imdb_id是NULL從imdbpy

安裝完所有數據後,我觀察到imdb_id在標題NULL並命名錶格。我在這裏有幾個疑問:

  1. 如何在這些表中填充imdb_id?
  2. 我的主要目的是爲演員獲取電影和爆頭的海報網址。有什麼簡單的方法可以在mysql數據庫中導入這些URL嗎?
  3. 在標題和名稱表中使用md5sum有什麼用?

回答

1

imdbID信息未與純文本數據文件一起分發,所以需要NULL值。當Movie對象被詢問它是imdbID時,該字段會自動填充,執行遠程查詢(使用標題匹配)。 我不知道有任何簡單快捷的方式來填充它,對不起。

所以,aswer您的問題:

  1. 只是做一個(遠程)查詢,如下所述:http://sourceforge.net/p/imdbpy/mailman/message/1053124/(不用說,你可以填寫完整的表格)。
  2. 爆頭和海報URL在純文本數據文件中不可用;你必須使用IMDbPY來訪問網站上的數據。
  3. 'long imdb canonical name'或'long imdb name'的校驗和,主要用於在升級現有數據庫(導入一組新的純文本數據文件)期間保留imdb_id值。