string-matching

    0熱度

    1回答

    我有一個表,如下所示: yel <- data.table(id=c(1,2,3)) yel$names[1] <- "\"parking space\", \"dining\", \"3bh\"" yel$names[2] <- "\"parking\" , \"outdoor\"" yel$names[3] <- "\"Hello!\",\"dining room\",\"3bh\""

    0熱度

    2回答

    我有一個串聯字符串的數據框,其最後11位數字是人口普查通道。我有一個單獨的字符串列表,其中最後2位或5位數字分別代表州或縣。我已經在2或5位數字ID的末尾連接了一個*。我需要通過數據框並標記trans變量(人口普查通道)是否在patterns矢量(州或縣)中,允許*表示trans中剩餘的9或6位數字。 如下面的代碼所示,我已經通過將所有pattern s合併成一個字符串,其中collapse="|

    0熱度

    2回答

    我需要在我的代碼中將TV評級(針對電視節目)轉換爲該評級的案例對象。因此,我有一個匹配的情況下,像這樣: def fromString(s: String): Option[TvRating] = s.toLowerCase match { case "tvy" | "tv-y" | "tv y" | "y" => Some(tvY) case "tvg" | "tv-g" |

    0熱度

    3回答

    一些前綴可選的組這是我的模式正則表達式: "subcategory.html?.*id=(.*?)&.*title=(.+)?" 下面輸入 http://example.com/xyz/subcategory.html?id=3000080292&backTitle=Back&title=BabySale 我想capturebelow組 組一個(ID ):3000080292 第二組(標題):

    3熱度

    1回答

    我是lua腳本語言的新手,所以只是試着用這種語言。 我得到了一個解析瀏覽器用戶代理字符串並返回瀏覽器信息的任務。 雖然我已經在lua上做了很多R & D以獲得可靠的LUA庫,但是很不幸我找不到任何人。 所以我試圖通過在我的lua腳本中使用一些PHP UA代理庫邏輯來實現它。根據PHP庫(php us解析器),它對所有可能的用戶代理字符串都有自己的正則表達式文件,因此它實際上將所有這些字符串存儲在J

    -3熱度

    2回答

    我需要識別給定兩個字符串的所有子序列。最長的公共子序列將只識別最長的一個。但是在這裏我想要所有的子序列超過一個閾值。任何特定的算法或方法? 像這樣 Julie loves me more than Linda loves me Jane likes me more than Julie loves me 如果閾值是2,以下是這些2串的公共子序列 me more than loves me

    0熱度

    1回答

    我的數據框看起來是這樣的: (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) (1, 7) (1, 8) (1, 9) (1, 10) (1, 11) ... 2 3 4 5 6 7 8 9 10 11 0 0 1 0 1 1 1 1 0 1 0 ... 0.612544 0.727393 0.366578 0.631451 0.722980 0.772853 0.96498

    1熱度

    1回答

    我發現很多問題,其中人們希望匹配列表中的項目,但是我的問題略有不同,造成一些麻煩。我在Windows 7機器上使用Python 3.6。 假裝我是一家連鎖雜貨店的首席執行官,每個星期我都會爲每個商品獲得每個商店的庫存數量的excel文件。哪裏有2列,第一列是商店的城市和商品的名稱,第二列是商品的數量。每個項目在每個項目之前都有4個空白區域,而城市沒有空白區域,但兩者都在同一列。 |New York

    1熱度

    2回答

    我有兩個大型數據集,一個大約50萬條記錄,另一個大約70K。這些數據集具有地址。如果較小數據集中的任何地址存在於較大數據集中,我想匹配。正如你所想象的,地址可以用不同的方式和不同的案例/拼寫等書寫。除了這個地址可以複製,如果只寫到建築物的水平。所以不同的單位有相同的地址。我做了一些研究並找出了可以使用的packagedist。 我做了一些工作,並設法根據距離獲得最接近的匹配。但是,我無法返回地址匹

    0熱度

    1回答

    我有一個正則表達式,我用它來匹配各種花括號對,所以我可以在開發過程中對它們進行註釋。 我正則表達式是: /{{.+_includes\s*}}|[^>\s]*{{\s*|\s*}}[^<\s]*|{%.+%}/g 這符合我裹在#標誌子: 1. #{{ #builtin_body_classes# }}# 2. #"{{ #builtin_body_classes# }}# no-js"