我正在尋找從數據集中提取一系列3字母代碼。 每個條目都有一組3個不是「CCV」的大寫字母,但它們的 在每個條目中的位置有所不同。標識大寫字母三聯體
目前我正嘗試: (?!CCV)[A-Z]{3}
我有條目類似的數據集:
CCV_21123214_AAA CCV_02390394_AAC 094804958_AAA_ee9r80 BLAH_CCV_odfdkk_BBB
和希望:
AAA AAC AAA BBB
問題是我目前的做法一直在抓住其他首都的信件編輯的話不是像「BLAH」,3個字母長得到其中的一部分作爲像三胞胎:
AAA BLA LAH AAC
有沒有辦法找到唯一的大寫字母三胞胎?
您使用哪種語言或工具? –
我主要在R工作。 – Furmole
在兩端使用一對負向變量'(?<![AZ])(?!CCV)[AZ] {3}(?![AZ])' – revo