我正在研究ML文檔分類問題。有沒有人知道如何在Azure ML中對Tfidf特徵提取和sublinear_tf縮放進行n-gram格式化。TfidfVectorizer和Azlinear_tf縮放在Azure中進行特徵提取ML
在過去,我在使用TfidfVectorizer(請參閱下面的示例)中瞭解了這個inSci-Kit的學習內容,但問題是在AzureML中,我無法使用python模塊顯式定義自己的方法或類,並且不會上傳壓縮的代碼。
我是一個python人,但如果有等價物,我可以使用R.市場上有R樣品,但它依賴於unigrams。
TfidfVectorizer(max_df=.67,min_df=.015,lowercase=False ,sublinear_tf=True,norm='l2',tokenizer=AbstractTokenizer())
最佳, -Ari