stringi

    1熱度

    3回答

    我有一個字符串向量,需要檢查它們是否符合某個標準。例如,如果某個字符串,如"34|40|65"完全由這些模式組成:c("34", "35", "37", "48", "65"),那麼我想返回1,如果它們的字符串不包含任何這些模式,那麼我想返回-1。如果字符串包含一些模式,但並不完全由這些模式組成,那麼我想返回0.我已經成功實現了1和-1,但是在產生0的邏輯中遇到了問題。作爲立場,我的邏輯爲那些應該

    0熱度

    1回答

    我已經問了this similar之前的問題。我已經做了更多的挖掘工作,並且儘可能地減少了重複性問題: 首先,我創建了一個新包as described here,並構建了一個包含pkgdown的站點。這建立預期站點: pkgdown::build_site() Initialising site --------------------------------------------------

    0熱度

    1回答

    我有以下問題轉換ASCII到UTF-8 stringi: library(stringi) x_1<-"P N001361/01" x_2<-"Р N001361/01" x_1==x_2 [1] FALSE > stri_enc_mark(x_1) [1] "ASCII" > stri_enc_mark(x_2) [1] "UTF-8" 然後我嘗試: stri_encode

    1熱度

    2回答

    我有一個PDF文件,我正在閱讀的文本。 我遇到的問題與數字之間發生的音節化有關。 鏈接到github上的file。 library(pdftools) library(tidytext) library(readxl) library(dplyr) setwd("~/Automation - Official Guazzete") path <- getwd() pdf_file <

    2熱度

    1回答

    我想安裝stringi軟件包在R,但安裝永遠不會結束。下載和編譯後,我收到以下消息: Error in dyn.load(file, DLLpath = DLLpath, ...) : unable to load shared object '/home/marcus/R/x86_64-redhat-linux-gnu-library/3.3/stringi/libs/stringi.

    0熱度

    5回答

    我有一個字符串矢量看起來像這樣: G30(H).G3(M).G0(L).Replicate(1) 遍歷c("H", "M", "L"),我想提取G30(對於「H 」),G3(爲「 M 「)和G0(對於」L「)。 我的各種嘗試讓我感到困惑 - regex101.com調試器,例如,表明(\w*)\(M\)工作得很好,但該轉移至R失敗...

    1熱度

    1回答

    我有一個「文本」列的數據框。此列的每一行都填充了來自媒體文章的文本。 我想提取一個像這樣的字符串:「term」(包括術語的雙引號)。我想下面的正則表達式捕捉到的實例,其中被夾在兩個雙引號之間的單詞: stri_extract_all_regex(df$text, '"(.+?)"') 這似乎捕捉到了什麼我尋找某些情況下,但在其他情況下 - 在那裏我知道標準是會見 - 它沒有。它還捕獲了似乎只是

    0熱度

    2回答

    我正在寫這個,因爲它花了我幾天來得到這個結果。底線:stringi庫1.1.3版(2017年3月發佈)可能有涉及icudt的問題。您可以使用以下命令安裝stringi 1.1.2: packageurl <- "https://cran.r-project.org/src/contrib/Archive/stringi/stringi_1.1.2.tar.gz" install.packages

    1熱度

    1回答

    我有下面的文字和需要之前和 實施例的特定詞後,以提取特定的單詞: sometext <- "about us, close, products & services, focus, close, research & development, topics, carbon fiber reinforced thermoplastic, separators for lithium ion batt

    1熱度

    1回答

    我想計算出現在字符串中的字詞數量(如果它被空格包圍或者它在開始或結束處的字符串。 我使用this的回答是這樣的: library(stringi) testStr <- c("dutch dutch brown", "brown ", "AAdutch", "dutchAA", "AAbrown", "brownAA", "hello") stri_count_regex(te