2014-01-16 33 views
0

我有一個XML格式的文本文件,我使用Notepad ++來應用正確的標記,但我不知道如何在元素的開始處應用標記是獨特的數字和日期。 例如。以XML格式化文本文件,元素起始處缺少標記

10000 2014-01-10 <1> Hello </1> 
10001 2014-01-31 <1> Hey </1> 

溶液我需要上述兩個元件格式化等

<0 data="10000 2014-01-10"> <1> Hello </1> </0> 
<0 data="10001 2014-01-31"> <1> Hey </1> </0> 

有超過20000記錄我需要的格式。我會怎麼做?

+0

使用支持文件IO和正則表達式語言。 Ruby,Java,bash等 – eebbesen

+0

好吧,帶着這樣的問題:你有什麼,想要什麼,都是格式良好的XML文檔片段。除非您在整個事物中包裝另一個元素,否則它們都不是格式良好的XML文檔。 因此,您可以使用專門支持DocumentFragments的工具,或添加外部元素,或者對文件執行純文本操作(如其他人所建議的,使用正則表達式或等效的模式匹配和替換)。 – keshlam

+0

我有大約20000個元素,它們之間有可以分開的標籤,可以用於映射數據。但在開始時,我有Id&date,我需要一個獨特的起始標籤,例如 - ,並將標籤結束爲。我們怎樣才能找到這些ID及日期和地點<拍拍ID =「ID日期>起步?我使用記事本+ + 5.9.6.2。 – user3204086

回答

0

你需要寫一個正則表達式來實現這種情況。

下面提到是Find and Replace方法使用正則表達式:

正則表達式:(.*)(<1>(.*)</1>)

替換爲:<0 data="$1">$2</0>

Find N Replace

+0

這裏是我有103305 \t 2004-07-21 \t <0>注意:爲了試鏡片<3> PC的Tor<4> PC<5> 8.80<6> 8.80<9> -1.00 -0.75x080<10> -1.50需要的是<專利ID =「103305 \t 2004-07-21" > \t <0>注:爲了試鏡片<3> PC的Tor<4> PC<5> 8.80<6> 8.80<9> -1.00 -0.75x080<10> -1.50 user3204086