這個問題可能是以不同的方式提出來的,如果有的話請向我指出。我無法在搜索結果中找到它。跟蹤字符串中標記的最有效方法是什麼?
我想解析標記的文本,就像這裏的標記一樣。
- 例如,
* some string
for bullet list - eg。
*some string*
斜體文本 - 例如。
&some string&
對於一個URL - 例如。
&some string&specific url&
的URL字符串從
等
我能想到的兩種方法去處理一個字符串,找出特殊的加價順序不同:
一個。我可以繼續以字符爲中心的方式,即解析字符串尋找序列1,然後2等。然而,這似乎是低效的,因爲它將不得不多次解析字符串。
b。對字符串進行逐字處理似乎更好,並保留特殊字符及其位置的記憶。如果內存匹配上面的特殊序列,則字符串中的特殊字符被替換爲HTML。我不確定這是否是一個更好的主意,我也不確定如何實施它。
什麼是最好的方式去做這件事?正則表達式如何?它遵循模式a或b?有第三種選擇嗎?
P.S.我正在使用Python。 Python示例最受讚賞。
我認爲正則表達式可能是最簡單的方法。不是最高效的,但除非你正在處理幾百KB文件,否則你可能不應該有任何問題。 – Ryan 2012-04-22 17:40:08
您確定要這麼做嗎? – PeeHaa 2012-04-22 17:40:12
@minitech:我想用自己的標記存儲文檔,並希望能夠加載HTML翻譯而不會出現延遲。但頁面不應該變大(但其大小取決於最終用戶)。 – Benjamin 2012-04-22 17:46:15