我正在對20個新聞組數據集進行一些文本分析,部分依賴於根據上述文章中的詞語對不同的文章進行分類。我目前能夠做的是解析一篇文章,然後編譯關於它的統計數據。我可以單獨爲每篇文章做到這一點,但將文章合併似乎是我的失敗。在R中合併數據幀 - 文本分析
什麼我期待能夠做到,在R爲以下幾點:
舉兩個(最好是任何數字)的解析和朵朵字頻率dataframes,並把它們合併起來以顯示兩篇文章中詞語的頻率作爲一個數據框。我希望能夠做到這一點,而無需將文章合併爲一個大型文檔。
拿這個數據幀,並通過頂部的頻率排序,只顯示前50
任何援助將不勝感激!
我想你正在尋找'merge'。 –