2010-05-04 157 views
1

我想將我從維基百科下載的對話轉換成XML。我使用特殊的導出來獲取XML格式的頁面......這很好,直到我進入主要對話。轉換成XML

<conversation> 
    {{PersonA|Cheese}} 
    {{PersonB|I like it too...}} 
    {{PersonA|Cheese?}} 
</conversation> 

那不是真正的交談......反正,我想知道什麼了大規模的談話轉換一樣,爲有效的XML的最簡單的方法?

<conversation> 
    <personA>Cheese</personA> 
    <personB>I like it too...</personB> 
    <personA>Cheese?</personA> 
</conversation> 

謝謝,這是太長了做手工。我猜測正則表達式可以幫助...不知何故。

+0

每行是否以{{PersonA |'或'{{PersonB |'? – Skilldrick 2010-05-04 19:32:24

+0

是的。他們似乎都是這樣開始的......唯一的其他例外是​​{{Action | – 2010-05-04 19:55:37

回答

2

模式:

\{\{(.*?)\|(.*?)\}\} 

替換:

<$1>$2</$1> 

這是一個簡單的解決方案,將適合你的樣品,而是取決於具體的格式,可能需要更復雜的表達式。例如,如果名稱包含管道,該怎麼辦?如果文本包含兩個大括號,該怎麼辦?文本可以跨越多行?

+0

謝謝麥克斯,我會試一試......所以我需要一個特殊的文本編輯器來執行該操作?另外,如何定義$ 1和$ 2變量? – 2010-05-04 19:58:25

+0

您需要支持正則表達式的文本編輯器。我想他們中的大多數都是現在做的,但是你必須告訴搜索/替換命令來使用它們。 「$ 1」(通常也寫爲「\ 1」)是反向引用,包含第一組括號中的匹配內容。 – 2010-05-04 20:06:56

+0

謝謝你們所有的幫助......保存了幾個小時的工作:P – 2010-05-04 20:40:39