0
我有一個csv文件3483行和460K字符和65K字,我試圖用這個語料庫來訓練一個NaiveBayes分類器Scikit學習。與樸素貝葉斯分類器打開()聲明需要長
問題是,當我在下面使用這個語句,需要太長時間(1小時,並沒有完成)。
from textblob import TextBlob
from textblob.classifiers import NaiveBayesClassifier
import csv
with open('train.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
任何猜測我做錯了什麼?
在此先感謝。
是您的CSV文件格式,像這樣:http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout
是@vendaTrout 這是該文件的一個例子: '''instagrama,Instagram的 #FB,臉譜 facebookio,FACEBOOK facebooktime信使iphone,FACEBOOK WhatsApp的COM,WHATSSUP facebooko#FB,臉譜 facebookiokio#FB,臉譜 instagramas:,Instagram的 Facebook的HTTPS:FB,臉譜 Facebook的#FB,FACEBOOK ''' – Flavio
假設每列火車數據和標籤是分開的通過「\ n」,你可以剖析一個更小的csv或這個函數。請查看stdlib [profiling](https://docs.python.org/3/library/profile.html)模塊。 – vendaTrout