tm

    0熱度

    1回答

    我創建了一個PCorpus,其中據我瞭解存儲在HDD,用下面的代碼: pc = PCorpus(vs, readerControl = list(language = "pl"), dbControl = list(dbName = "pcorpus", dbType = "DB1")) 我怎麼可能會重新連接到數據庫,以後呢?

    0熱度

    1回答

    我有一個名爲train_dtm的DocumentTermMatrix,我想規範所有文檔中術語頻率的頻率計數。我現在面臨的問題是所產生的基質也應該是類型DocumentTermMatrix的,因爲我想歸一化矩陣傳遞給TopicModels包的另一種方法LDA在R. 下面是我使用的方法: docs_dtm <- DocumentTermMatrix(docs) 現在,我希望上面的documentt

    1熱度

    1回答

    我從數據庫中加載文本文檔,然後從它們創建語料庫,最後我設置了文檔的前綴ID(我需要使用前綴,因爲我有幾種類型的文檔)。 rs <- dbSendQuery(con,"SELECT id::TEXT, content FROM entry") entry.d = data.table(fetch(rs,n=-1)) entry.vs = VectorSource(entry.d$content)

    2熱度

    1回答

    我有一個短語列表和一個文檔語料庫。語料庫中有100k個短語和60k個文檔。短語可能/可能不存在於語料庫中。我期待着找到語料庫中每個短語的頻率。 一個例子數據集: Phrases <- c("just starting", "several kilometers", "brief stroll", "gradually boost", "5 miles", "dark night", "cold m

    -2熱度

    1回答

    其實我正在爲郵輪公司做評論分析。我不能告訴你整個程序,因爲它很長,但至少是一個快照。我把所有的評論,分成幾個句子,然後從評論中提取一些短語......例如, '美妙的小屋','優質的服務'。現在爲了情感分析,我必須將該短語的所有名詞映射到特定的主題。現在在那個映射中,我需要所有名詞的同義詞和所有關於這個詞的詞語。所以我的文本挖掘的最終結果將會更加高效。我想你對我正在做的事情有一點點想法。 我會重複

    0熱度

    1回答

    在從文本本體學習的情況下,假設我有兩個概念,我很感興趣,它們之間的關係: class <- c(animal.class, dog.class) individual <- "Snoopy" animal.class <- c("animal", "animals") dog.class <- c("dog", "dogs") sentence1 <- "Snoopy is an an

    1熱度

    2回答

    我正在嘗試做一個非常簡單的詞語,在R中產生非常意想不到的結果。在下面的代碼中,'complete'變量是'NA'。爲什麼我無法完成簡單的詞幹? library(tm) library(SnowballC) dict <- c("easy") stem <- stemDocument(dict, language = "english") complete <- stemCompletion

    0熱度

    1回答

    我目前正在嘗試做一些文本處理,並且希望在TermDocumentMatrix中獲得單個和兩個字母的單詞。 問題是,它似乎只顯示3個字母和更多的單詞。 library(tm) library(RWeka) test<-'This is a test.' testmyCorpus<-Corpus(VectorSource(test)) testTDF<-Te

    2熱度

    1回答

    我在專門用於客戶反饋的電子郵箱中進行情感分析和文本挖掘。我使用R進行這項工作。我基於Jeffrey Breen所做工作的情緒分析。它工作正常,但我想更進一步。在我的研究中,我遇到了SentiWordnet。 我搜索了能夠應用SentiWordNet但只提供Java和Python資源的R代碼/函數。我完全不熟悉這些。 有人在R中應用SentiWordNet嗎?我將不勝感激任何幫助。

    3熱度

    2回答

    我有一個包含商品類別和商品名稱的2列csv文檔。 例: Sl.No. Commodity Category Commodity Name 1 Stationary Pencil 2 Stationary Pen 3 Stationary Marker 4 Office Utensils Chair 5 Office Utensils Drawer 6 Hardw