2016-11-02 24 views
-1

我正在使用quanteda來創建文本語料庫並嘗試附加元數據,但我不斷收到錯誤。我之前在另一個數據集上使用過這個代碼,但由於某種原因,它不適用於我當前的數據集。該代碼是:如何使用quanteda將元數據附加到文本語料庫?

dfm.ineq1 <- corpus(df.ineq$speech, 
         docnames=df.ineq$speechID, 
         docvars=select(party)) 

我得到的錯誤是:

Error in select_(.data, .dots = lazyeval::lazy_dots(...)) : object 'party' not found

我也試圖把黨在引號和得到這個錯誤:

Error in UseMethod("select_") : no applicable method for 'select_' applied to an object of class "character"

黨柱是相當平直前鋒。值爲:

"Democratic" "Republican" "N/A"   "Independent" 

關於可能出錯的任何想法?

回答

0

我意識到我忘了把數據框放在選擇圓括號裏!

dfm.ineq1 <- corpus(df.ineq$speech, 
         docnames=df.ineq$speechID, 
         docvars=select(df.ineq, party)) 
1

更簡單的方法:使用該corpus構造方法是data.frame對象定義的事實。

dfm.ineq1 <- corpus(df.ineq, text_field = "speech") 

這將自動地正確加載文本字段中speech,並且包括speechIDparty作爲docvars。

相關問題