qdap

    1熱度

    1回答

    我一直在使用「qdap」包中的wfm函數將文本行值轉換爲列,並在數據包含數字和文本時遇到問題。例如,如果行值爲「abcdef」,則轉置正常工作,但如果值爲「ab1000」,則會發生數字截斷。任何人都可以提供有關如何解決此問題的建議嗎? 方法試過至今: input <- read.table(header=F, text="101 ab0003 101 pp6500 10

    3熱度

    1回答

    我已經運行的數目到錯誤 Error in checkForRemoteErrors(val) : one node produced an error: arguments imply differing number of rows: 3, 0 試圖在qdap包使用時check_spelling。提供的數字3和0與下面提供的數據相關,但這只是一個更大的拼寫檢查字符串的小樣本,並且當

    2熱度

    1回答

    假設我有一個看起來像這樣的列的數據幀: E <- data.frame( c("a brown fox"), c("something"), c("else") ) E <- as.data.frame(t(E)) V1 c..a.brown.fox.. a brown fox c..something.. something c..

    0熱度

    2回答

    我的工作情緒,並想用文字表達使用qdap在R. 的表情的情緒有人可以幫助我該怎麼辦呢更換表情。我將進一步使用輸出來獲得文本的整體情感。

    1熱度

    1回答

    我是R新手,與pos()函數的工作方式混淆。這裏的原因: 例子: library(qdap) s1<-c("Hello World") pos(s1) 這將產生正確的輸出稱字數 wrd.cnt - 2 NN -1(50%) UH-1(50%) ,而下面來操作引發錯誤: s2<-"Hello" pos(s2) Error in apply(pro, 2, paster, di

    1熱度

    1回答

    我試圖對報紙文章進行情感分析並且隨時間追蹤情緒水平。要做到這一點,基本上我會在一天內識別所有相關的新聞文章,將它們送入polar()函數並獲取所有文章的平均極性分數(更確切地說,是所有文章中所有句子的平均值)在那一天。 問題是,在某些日子裏,與其他日子相比,會有更多的文章,我認爲如果我們只是追蹤每日平均極性分數,這可能掩蓋了一些信息。例如,從30篇新聞文章中得分0.1應該比僅從3篇文章得到的0.1

    2熱度

    1回答

    我有一些產品名稱的兩個列表。我的問題是「操作系統」與「系統」,「冷卻系統」等匹配。但它只能與「操作」,「操作系統」相匹配。另一個例子是「Key Board」應該與「key」或「KB」匹配,但不能與「Mother Board」或「Board」匹配。 如何重視第一個詞而不是第二個詞? 我在R中使用了agrep()它也與第一個例子中的「系統」和「冷卻系統」相匹配。如何避免這種匹配? 是否有任何功能/方法

    1熱度

    1回答

    我正在使用qdap包進行極性分析。在CSV文件中,我有一個沒有標點符號的句子,例如「Sucks to not be removable」(無時間段)。 在數據幀上使用sentsplit後,此行顯示NA。 如何在R中的不完整句子添加結束符?有沒有辦法阻止它?

    2熱度

    1回答

    我有一個data.frame,它有周編號,week和文本評論text。我想將week變量作爲我的分組變量,並對其運行一些基本的文本分析(例如qdap::polarity)。一些評論文本有多個句子;然而,我只關心本週的「整體」極性。 如何在運行qdap::polarity之前將多個文本轉換鏈接在一起並遵守其警告消息?我能夠將變化鏈接到tm::tm_map和tm::tm_reduce - 在qdap中

    2熱度

    1回答

    我有一個短語列表和一個文檔語料庫。語料庫中有100k個短語和60k個文檔。短語可能/可能不存在於語料庫中。我期待着找到語料庫中每個短語的頻率。 一個例子數據集: Phrases <- c("just starting", "several kilometers", "brief stroll", "gradually boost", "5 miles", "dark night", "cold m