我正在玩堆棧溢出數據轉儲,並試圖構造(我想象的是)一個簡單的正則表達式,以從<
和>
字符中提取標籤名稱。因此,對於每個問題,我有一個或多個標記列表,如<tagone><tag-two>...<tag-n>
,並試圖提取標記名稱列表。下面是從數據採取一些例如標籤字符串轉儲:正則表達式(Python)從< and >的內部提取文本字符串 - 例如<stringone><string-two>等
<javascript><internet-explorer>
<c#><windows><best-practices><winforms><windows-services>
<c><algorithm><sorting><word>
<java>
僅供參考,我不需要劃分標籤名稱爲的話,那麼像<best-practices>
例子,我想找回best-practices
(不是best
和practices
)。另外,對於它的價值,我使用Python,如果它有任何區別。有什麼建議麼?
什麼格式的數據轉儲? XML? JSON? – 2010-09-14 11:35:59