這實際上是一個完全有用的問題的副本,其答案是(部分)由提問者提供的。原標題:「R中用於文本分析的神經網絡模型具有超過512個字符的公式」。他最終解決了這個問題,雖然他給出的推理是錯誤的,他通過刪除問題並使評論和解決方案不可見來加重了這個錯誤。配方到神經網絡的錯誤
我試圖擬合一個神經網絡模型來分類2個桶中的一個網站。培訓數據特徵是網站上所有鏈接中的詞,例如,一個網站可能具有「家」,「約」,「聯繫人」,「產品」等特徵。數據的結構爲帶有類列的數據框,然後是培訓中每個單詞的列。每行都有該類別(合格或不合格)以及該網站上顯示的每個單詞的0和1。
顯示合理次數的單詞總數約爲1000,我希望將它們全部用作特徵。但是,公式似乎有225個字符限制,所以我無法這樣做。
我沒有一個好的數據集來給出可重複的輸出,但這裏是我的代碼和我得到的錯誤。
如果我嘗試做一個公式,它就會被切斷:
f <- as.formula(paste("class ~ ", paste(clean.features, collapse = "+", sep = "")))
Error in parse(text = x, keep.source = FALSE) : :2:0: unexpected end of input 1: ranty+recipes+contract+just+inventory+types+working+wine+hampshire+suppliers+rise+body+selection+laurel+trek+arlington+cabinet+citrus+advertisers+rhode+highway+intl+province+jewelers+cycles+wy
如果我嘗試使用所有的功能:如果我使用as.formula
nn.model <- neuralnet(paste("class ~ ", paste(clean.features, collapse = "+", sep = "")), data = training.data,
hidden = num.nodes)
)
Error in parse(text = x, keep.source = FALSE) : :2:0: unexpected end of input 1: ranty+recipes+contract+just+inventory+types+working+wine+hampshire+suppliers+rise+body+selection+laurel+trek+arlington+cabinet+citrus+advertisers+rhode+highway+intl+province+jewelers+cycles+wy
同樣的事情發生在數據集中,它表示沒有「數據」參數(即使存在):
nn.model <- neuralnet(class ~ . , data = training.data,
hidden = num.nodes, 0))
)
Error in terms.formula(formula) : '.' in formula and no 'data' argument
> sessionInfo()
R version 3.3.2 (2016-10-31) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows >= 8 x64 (build 9200)
任何變通辦法的想法?
鏈接到原始:http://stackoverflow.com/questions/42235474/formulas-with-more-than-512-characters-for-neuralnet-model-in-r-for-text-analysi –