我試圖執行基於http://tidytextmining.com/sentiment.html#the-sentiments-dataset情感分析。在執行情感分析之前,我需要將我的數據集轉換爲整潔的格式。 我的數據集的形式: x <- c("test1" , "test2")
y <- c("this is test text1" , "this is test text2")
res <-
我正在轉換正在從PDF文件中讀取的文本。 特別是,我有一個字符向量,其中包含連字符(「 - 」),用於預製大綱,或將單詞分隔爲新行,但僅當發生時纔會出現。例如: text text text 123-
456 text text..
我想要做的就是刪除所有hypens和toghether粘貼這些話。 text text text 123456
text text..
我開始嘗試: li