與樸素貝葉斯分類器打開（）聲明需要長

我有一個csv文件3483行和460K字符和65K字，我試圖用這個語料庫來訓練一個NaiveBayes分類器Scikit學習。與樸素貝葉斯分類器打開（）聲明需要長

問題是，當我在下面使用這個語句，需要太長時間（1小時，並沒有完成）。

from textblob import TextBlob 
from textblob.classifiers import NaiveBayesClassifier 
import csv 

with open('train.csv', 'r') as fp: 
    cl = NaiveBayesClassifier(fp, format="csv")

任何猜測我做錯了什麼？

在此先感謝。

來源

2017-02-12 Flavio

是您的CSV文件格式，像這樣：http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout

是@vendaTrout 這是該文件的一個例子： '''instagrama，Instagram的＃FB，臉譜 facebookio，FACEBOOK facebooktime信使iphone，FACEBOOK WhatsApp的COM，WHATSSUP facebooko＃FB，臉譜 facebookiokio＃FB，臉譜 instagramas：，Instagram的 Facebook的HTTPS：FB，臉譜 Facebook的＃FB，FACEBOOK ''' – Flavio

假設每列火車數據和標籤是分開的通過「\ n」，你可以剖析一個更小的csv或這個函數。請查看stdlib [profiling]（https://docs.python.org/3/library/profile.html）模塊。 – vendaTrout

這個庫存在問題。

它記錄在以下鏈接：

https://github.com/sloria/TextBlob/pull/136

https://github.com/sloria/TextBlob/issues/77

小故事：庫沒有交易以及大型數據集。

來源

2017-02-15 11:50:13 Flavio

與樸素貝葉斯分類器打開（）聲明需要長

回答

相關問題