我有兩個字符變量(對象的名稱),我想提取最大的公共子字符串。查找兩個字符變量之間的常見子字符
a <- c('blahABCfoo', 'blahDEFfoo')
b <- c('XXABC-123', 'XXDEF-123')
我想下面的結果:
[1] "ABC" "DEF"
這些載體作爲輸入應該給出相同的結果:
a <- c('textABCxx', 'textDEFxx')
b <- c('zzABCblah', 'zzDEFblah')
這些實施例是代表性的。這些字符串包含標識元素,每個向量元素中的其餘文本是常見的,但未知。
是否有解決方案,在下列地點之一(按優先順序排列):
基礎R
推薦套餐
封裝上CRAN
假設重複的答案是n不符合這些要求。
看看這個問題:http://stackoverflow.com/questions/ 1429476/longest-common-substring-problem – dave 2013-04-24 15:42:39
此外:http://finzi.psych.upenn.edu/R/Rhelp02a/archive/68013.html – 2013-04-24 15:45:21
http://svitsrv25.epfl.ch/R-doc/library /Biostrings/html/pmatchPattern.html,並且這個http://www.emoticode.net/r/longest-common-substring.html – 2013-04-24 15:46:21