0
我試圖在R中使用文本數據進行邏輯迴歸。我已經構建了一個文檔矩陣和相應的潛在語義空間。根據我的理解,LSA用於從「術語」中導出「概念」,這可能有助於降低維度。這裏是我的代碼:如何將潛在語義分析的特徵作爲自變量納入預測模型
tdm = TermDocumentMatrix(corpus, control = list(tokenize=myngramtoken,weighting=myweight))
tdm = removeSparseTerms(tdm,0.98)
tdm = as.matrix(tdm)
tdm.lsa = lsa(tdm,dimcalc_share())
tdm.lsa_tk=as.data.frame(tdm.lsa$tk)
tdm.lsa_dk=as.data.frame(tdm.lsa$dk)
tdm.lsa_sk=as.data.frame(tdm.lsa$sk)
這使功能爲V1,V2,V3 .... V21。在邏輯迴歸中可以使用這些作爲自變量嗎?如果是這樣,我該怎麼做?