text-classification

    1熱度

    1回答

    早上好keras,我想訓練LSTM分類垃圾郵件和非垃圾郵件,我碰到下面的錯誤來了: ValueError: Input 0 is incompatible with layer lstm_1: expected ndim = 3, found ndim = 4 有人可以幫助我瞭解問題出在哪裏? 我的代碼: import sys import pandas as pd import numpy

    0熱度

    1回答

    所以我目前正在與布朗語料庫合作,而且我遇到了一個小問題。爲了應用標記化特徵,我首先需要將布朗語料庫加入句子。這是我到目前爲止有: from nltk.corpus import brown import nltk target_text = [s for s in brown.fileids() if s.startswith('ca01') or s.startswit

    14熱度

    2回答

    我試圖建立一層CNN,但我遇到了一些問題。 事實上,compilator說我 ValueError: Error when checking model input: expected conv1d_1_input to have 3 dimensions, but got array with shape (569, 30) 這是代碼 import numpy from keras.model

    3熱度

    2回答

    我正在做多標籤分類,我試圖根據問題預測正確的標籤: (X = questions,y =來自X的每個問題的標籤列表)。 我在想,哪個decision_function_shape爲sklearn.svm.SVC應該用OneVsRestClassifier? 從文檔,我們可以讀到decision_function_shape可以有兩個值'ovo'和'ovr': decision_function_s

    0熱度

    1回答

    我已經通過Scikit-SVM教程,並編寫了代碼來訓練和測試。但是我正面臨一個預測問題,它說「形狀應該和訓練形狀相同」。這是下面的代碼。 EDIT1:樣本數據 ERROR_DESC CLASSIFICATION_LABEL ERROR manager.SqlManager: Error executing statement: java.sql.SQLException: ORA-01017:

    0熱度

    1回答

    。我已經從here下載模型。我一直在使用GloVe進行句子分類。我正在分類的句子是特定於某個特定領域的,例如某些STEM科目。但是,由於現有的GloVe模型是在一般語料庫上進行培訓的,因此他們可能無法爲我的特定任務取得最佳結果。 所以我的問題是,我將如何去加載重新訓練的模型,並在我自己的語料庫上重新訓練它以學習我的語料庫的語義呢?這樣做是有可能的。

    -3熱度

    1回答

    我想對一組相互如此相似的句子執行二進制分類任務。我的問題是我不確定如何處理樣品之間的這種相似性問題。以下是我的一些問題: (1)。哪種分類技術在這種情況下更適合? (2)。在這種情況下會提供選擇幫助嗎? (3)。基於遞歸神經網絡(LSTM)的序列分類算法可能成爲一種潛在的方法嗎? 我很高興看到有關此問題的任何提示或幫助,謝謝!

    0熱度

    1回答

    我想要使用相似性(也許餘弦)聚類一些句子,然後可能使用分類器將文本放入預定義的類。 我的想法是使用tensorflow生成嵌入詞,然後爲每個句子取平均值。接下來使用聚類/分類算法。 tensorflow是否提供準備使用word2vec生成算法? 一包文字模型會產生一個好的輸出嗎?

    1熱度

    1回答

    我正在使用Weka對2000 IMBD電影評論進行分類。我正在關注tutroial:http://www.stefanoscerra.it/movie-reviews-classification-weka-data-mining/ 每當我做詞幹時,「awful」一詞就是「aw」。我甚至嘗試了包含的LovinsStemmer並得到了相同的結果。所提到的頁面中的陰影部分仍然在做詞幹部分,但他在屬性列

    -2熱度

    1回答

    我在短短的一句話分類問題,在這裏我得到了以下信息工作 輸入 年齡的人的人(1-100) 性別(男的或女)的句子 輸出 標籤(內容類型) 要句子模型的 內容我正在使用word2vec與tfidf結合。我還想添加年齡和性別作爲特徵以及嵌入到分類器中的句子。什麼是正確的方法來做到這一點?由於嵌入是一個n維陣列和年齡,性別是標量。我很困惑如何添加和可視化數據。