gojomo的答案是正確的
gensim.models.KeyedVectors.load_word2vec_format("GoogleNews-vectors-negative300.bin.gz", binary=True)
嘗試升級gensim的所有相關性(如smart_open ),如果您仍然有以下錯誤
pip install --upgrade gensim
文件 「/home/liangn/PythonProjects/DeepRecommendation/Algorithm/Word2Vec.py」,線路18,在初始化 self.model = gensim.models.KeyedVectors.load_word2vec_format(w2v_path,二進制=真)
文件 「/home/liangn/PythonProjects/venvLiang/lib/python2.7/site-packages/gensim/models/keyedvectors.py」,線191,與utils.smart_open(FNAME)load_word2vec_format如鰭:
文件「/home/liangn/PythonProjects/venvLiang/lib/python2.7/site-packages/smart_open/smart_open_lib.py」,行138,在smart_open return file_smart_open(parsed_uri.uri_path,mode)
文件「/home/liangn/PythonProjects/venvLiang/lib/python2.7/site-packages/smart_open/smart_open_lib.py」,第642行,在file_smart_open中 return compression_wrapper(open(fname,mode),fname,模式)
文件 「/home/liangn/PythonProjects/venvLiang/lib/python2.7/site-packages/smart_open/smart_open_lib.py」,線路630,在compression_wrapper 回報make_closing(GzipFile中)(file_obj,模式)
文件 「/usr/lib64/python2.7/gzip.py」,線94,在初始化 FileObj文件= self.myfileobj = 內置。開(文件名,模式或 'RB')
類型錯誤:脅迫爲Unicode:我是新需要字符串或緩衝區,文件中發現
到gensim和使用1.0.0rc2。我嘗試使用KeyedVector: import keyedVectors KeyedVectors.load_word2vec_format(「GoogleNews-vectors-negative300.bin.gz」,binary = True) 但仍然出現錯誤。我使用Python 2.7,我應該升級到Anaconda,因爲有些軟件包在那裏很好用 –
你是如何安裝gensim的?我不相信'pip install gensim'會爲你提供預發佈版本。嘗試使用KeyedVector後會出現什麼樣的實際錯誤? (不可能出現同樣的錯誤,確切的消息對於解決問題很重要。) – gojomo