0

我有一個csv文件3483行和460K字符和65K字,我試圖用這個語料庫來訓練一個NaiveBayes分類器Scikit學習。與樸素貝葉斯分類器打開()聲明需要長

問題是,當我在下面使用這個語句,需要太長時間(1小時,並沒有完成)。

from textblob import TextBlob 
from textblob.classifiers import NaiveBayesClassifier 
import csv 

with open('train.csv', 'r') as fp: 
    cl = NaiveBayesClassifier(fp, format="csv") 

任何猜測我做錯了什麼?

在此先感謝。

+0

是您的CSV文件格式,像這樣:http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout

+0

是@vendaTrout 這是該文件的一個例子: '''instagrama,Instagram的 #FB,臉譜 facebookio,FACEBOOK facebooktime信使iphone,FACEBOOK WhatsApp的COM,WHATSSUP facebooko#FB,臉譜 facebookiokio#FB,臉譜 instagramas:,Instagram的 Facebook的HTTPS:FB,臉譜 Facebook的#FB,FACEBOOK ''' – Flavio

+0

假設每列火車數據和標籤是分開的通過「\ n」,你可以剖析一個更小的csv或這個函數。請查看stdlib [profiling](https://docs.python.org/3/library/profile.html)模塊。 – vendaTrout

回答