2012-05-02 71 views
1

因此,我編寫了一個URL文件,試圖解析某些字段......這是一個痛苦。雖然有一些「意想不到的」結果,但是除了這個之外,我已經擁有了一切運行得很好的東西。在URL中編碼的URL正則表達式解析問題

下面是結果的99.8%從Word的輸出的一個示例:

%13 + FORMTEXT +%01%14wes%15

通常,正則表達式我設置抓住所有對於上面的示例,這些字段完全符合我的需要。但下面的例子是一個奇怪的例子。試圖從底部的例子中解析出「wes」。

%13 + FORMTEXT +%01%15%86%15%9A%9C%9E%A0%F2%F4%0A%1A%1C%1E + 468%3A%3C%3E%40TVXZ%5C %15%60bvxz%FC%F0%E0%14%D4%C1%06%14wes%15

你要知道,這是一個大的字符串,所以它會繼續以這種方式:

%13+FORMTEXT+%01%15%86%15%9A%9C%9E%A0%F2%F4%0A%1A%1C%1E+468%3A%3C%3E%40TVXZ%5C%15%60bvxz%FC%F0%E0%14%D4%C1%06%14wes%15%13+FORMTEXT+%01%14wess%15 

注意%01和%14之間的巨大差距,然後是%14和%15之間的文本。通常%01%14是並排的,在這種情況下,它們之間是無意義的......很多,這個例子縮短了。

乾杯, 韋斯

+0

如果您願意,請提交您正在使用的正則表達式。因爲沒有它,做任何假設都是沒有意義的...... –

+0

我已經自己解決了這個問題,謝謝。 – wesside

+0

然後,您可以發佈您的答案並將問題標記爲已回答。 –

回答

0

走到不同的路線,轉換後的文檔給DOCX/OOXML和使用正則表達式的XML。