tidytext

    1熱度

    2回答

    我有這樣的代碼正好與R wrapper for MALLET主題模型: docs <- mallet.import(DF$document, DF$text, stop_words) mallet_model <- MalletLDA(num.topics = 4) mallet_model$loadDocuments(docs) mallet_model$train(100) 我已經

    0熱度

    2回答

    在我的數據(這是文本)中,有縮寫。 是否有任何函數或代碼在文本中搜索縮寫?例如,檢測3-4-5大寫字母縮寫並讓我計算它們發生的頻率。 非常感謝!

    0熱度

    1回答

    我正在使用tidytext進行文本分析。我試圖計算一個語料庫的tf-idf。這樣做的標準方法是: book_words <- book_words %>% bind_tf_idf(word, book, n) 然而,在我的情況下,「文件」是不是由單一的列(如book)定義。是否可以調用bind_tf_idf,其中文檔由兩列(例如,book和chapter)定義?

    0熱度

    2回答

    我在R中是全新的,所以這個問題看起來很明顯。但是,我沒有管理,也沒有找到解決方案 如何計算我的令牌內的單詞數量,而它們是行(實際上是評論)? 因此,有與產品ID(ASIN)連接評論(reviewText)數據集 amazonr_tidy_sent = amazonr_tidy_sent%>%unnest_tokens(word, reviewText, token = "lines") amazo

    2熱度

    1回答

    我正在嘗試將一個pdf文件的文件夾讀入R中的數據框。我能夠使用pdftools庫和pdf_text(filepath)來讀取單個pdf文件。 理想情況下,我可以抓住一系列pdf的作者和標題,然後將其推入一個具有這些列的數據框,以便我可以在文本上使用基本的tidytext函數。 對於單個文件,現在,我可以只使用: library(pdftools) library(tidytext) libra

    1熱度

    1回答

    我正在使用tidytext。當我命令unnest_tokens。 [R返回錯誤 請提供列名 我怎樣才能解決這個問題? library(tidytext) library(tm) library(dplyr) library(stats) library(base) #~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~# #Build a

    0熱度

    1回答

    我試圖安裝包tidytext但得到了以下錯誤: install.packages("tidytext") Installing package into ‘\\dcn4pfsh404/home_8/TUT/Documents/R/win-library/3.3’ (as ‘lib’ is unspecified) trying URL 'https://cran.rstudio.com/bi

    0熱度

    1回答

    當我將整潔函數應用於數據集中LDA模型的結果時,出現以下錯誤「Error in eval(替代(expr),envir,enclos):未找到綁定:'Var1'「。在關聯的印刷機示例上使用時會出現相同的錯誤,如下所示。我試圖通過devtools :: install_github(「juliasilge/tidytext」)重新安裝tidytext,我仍然得到相同的結果。有什麼我可以嘗試嗎? 庫(

    1熱度

    1回答

    我想從Textmining with R web教科書創建一個繪圖,但使用我的數據。它主要搜索每年的頂級詞彙並對它們進行圖表(圖5.4:http://tidytextmining.com/dtm.html)。我的數據比他們開始使用的數據要乾淨一點,但我對R是新手。我的數據有一個2016-01-01格式的日期列(日期類)。我只是自2016年有數據,所以我希望做同樣的事情,但更精細,(按月或按天IE)

    0熱度

    1回答

    我想在OS X El Capitan(版本10.11.6)上的R 3.4.0上安裝tidytext包。但是這樣做是給帶包裝mnormt以下錯誤(我不明白「M」標誌!): * installing *source* package ‘mnormt’ ... ** package ‘mnormt’ successfully unpacked and MD5 sums checked ** libs