如何使用quanteda將元數據附加到文本語料庫？

-1

我正在使用quanteda來創建文本語料庫並嘗試附加元數據，但我不斷收到錯誤。我之前在另一個數據集上使用過這個代碼，但由於某種原因，它不適用於我當前的數據集。該代碼是：如何使用quanteda將元數據附加到文本語料庫？

dfm.ineq1 <- corpus(df.ineq$speech, 
         docnames=df.ineq$speechID, 
         docvars=select(party))

我得到的錯誤是：

Error in select_(.data, .dots = lazyeval::lazy_dots(...)) : object 'party' not found

我也試圖把黨在引號和得到這個錯誤：

Error in UseMethod("select_") : no applicable method for 'select_' applied to an object of class "character"

黨柱是相當平直前鋒。值爲：

"Democratic" "Republican" "N/A"   "Independent"

關於可能出錯的任何想法？

2016-11-02 tlev

我意識到我忘了把數據框放在選擇圓括號裏！

dfm.ineq1 <- corpus(df.ineq$speech, 
         docnames=df.ineq$speechID, 
         docvars=select(df.ineq, party))

2016-11-02 03:52:26 tlev

更簡單的方法：使用該corpus構造方法是data.frame對象定義的事實。

dfm.ineq1 <- corpus(df.ineq, text_field = "speech")

這將自動地正確加載文本字段中speech，並且包括speechID和party作爲docvars。

2016-11-02 12:18:18

回答