在Ubuntu上
1)安裝所有必需的軟件包。
sudo apt-get install -y gcc python python-dev libssl-dev libxml2-dev libxslt1-dev zlib1g-dev python-setuptools python-pip
easy_install -U SQLObject
pip install MySQL-python
2)安裝IMDBPY。
cd [IMDBPY_parent_directory]
wget http://prdownloads.sourceforge.net/imdbpy/IMDbPY-5.1.tar.gz
tar -xzf IMDbPY-5.1.tar.gz
cd IMDbPY-5.1
python setup.py install
3)在MySQL中,創建一個數據庫 「IMDB」,並授予所有的權限爲 「用戶」,密碼爲 「密碼」。
CREATE DATABASE imdb;
GRANT ALL PRIVILEGES ON imdb.* TO 'user'@'localhost' IDENTIFIED BY 'password';
FLUSH PRIVILEGES;
4)下載所有IMDB數據。
mkdir [imdb_data_directory]
cd [imdb_data_directory]
wget -r --accept="*.gz" --no-directories --no-host-directories --level 1 ftp://ftp.fu-berlin.de/pub/misc/movies/database/
5)將IMDB數據加載到mysql(使用myisam作爲存儲引擎)。
cd [IMDBPY_parent_directory]/IMDbPY-5.1/bin
python imdbpy2sql.py -d [imdb_data_directory] -u
'mysql://user:[email protected]/imdb' --mysql-force-myisam
從 「Import IMDb Data Set from Plain Text Files To MySQL Database」 借用一些小的修正。
謝謝一堆。那正是我想要的。花了大約4個小時,但現在我用IMDB獲得了一個不錯的3GB數據庫:-) – Mestika