我想使用Boost.Tokenize
將字符串拆分爲令牌。要求引號或括號中的文字是單個整體標記。更具體地講,我需要一個像Boost.Tokenizer用於引號和圓括號
"one (two),three" four (five "six".seven) eight(nine, ten)
線分成令牌像
one (two),three
four
(five "six".seven)
eight
(nine, ten)
也許
one (two),three
four
(
five "six".seven
)
eight
(
nine, ten
)
我知道the way來標記中引號的文字,但我沒有同時想象如何在紀念章中標出文字。可能需要執行TokenizerFunction
。
如何按我描述的方式拆分字符串?
這不是簡單的詞法標記化,而是_parsing_。 – 2012-02-21 19:23:22
@LightnessRacesinOrbit:那麼,我需要'Boost.Spirit'來完成我的任務嗎? – Loom 2012-02-21 19:33:07
我不知道。這可能是你需要它來很好地完成你的任務。 – 2012-02-21 19:37:09