2012-01-08 19 views
2

我終於在Windows 7上運行了Python 2.7 minGW和pymsql運行的imbdpy2sql,它連接數據庫並罰款並創建所有表,但它一直卡在Flushind MoviesCache上,並且從未移動過去它。這是它的輸出:imdbpy2sql.py被卡在FLUSHING上MoviesCache

SAVING ImdbID values for ... DONE 
DROPPING current database ... DONE 
CREATING New tables ... DONE 
SCANNING movies 

,並列出了10001和20001,然後依此類推,直至90001,然後它說* FLUSHING MoviesCache

但它從來沒有移動過去吧。我應該讓它坐在這裏多久?如果不是兩個小時,我已經離開了至少一個小時,沒有任何進展。有什麼我可以做得到它的工作?或者它工作,我只需要讓它坐幾個小時?

同樣的情況下,這可以幫助我打開命令提示符,cding到C:\Python27\Scripts\bin\,然後使用這個命令來運行它:

imdbpy2sql.py -d C:\USers\Jordan\DEsktop\IMDB -u mysql://root:[email protected]/IMDB 

回答

1

不,這是不正常的:沖洗必須採取最多幾十秒鐘。

我會嘗試重現它;同時,您可以嘗試使用CSV導入系統:使用相同的選項再次運行imdbpy2sql.py,爲該目錄添加「-c C:\ Temp」(無引號或類似的內容:可能需要兩個反斜槓)分離器,在Windows系統上)。

如果您有權訪問linux/unix環境,則還可以使用docs/goodies /目錄中的reduce.sh腳本對部分數據集進行一些實驗。

+0

它跑了近一個星期,但最終完成,我還沒有玩數據,但雖然。 – Jordan 2012-01-24 01:57:57

+0

令人驚歎。 :-)這可能與pymsql有關。如果有人知道如何改善它的表現,請給我留言。謝謝! – 2012-01-25 15:11:00

0

[MySQL的]

在一般情況下,如果你得到一個尷尬的高numbero「太多的數據 ...分裂」線路,可考慮增加max_allowed_pa​​cket的(在你的MySQL服務器的 配置)至少8M或16M。 否則,插入數據將會非常緩慢,並且可能會丟失一些數據 。

這是寫在他們的文件:)