我想創建,這將能夠解析該文件的DOC/DOCX文件結構的應用波紋管顯示:.NET程序來解析doc文件
par-000.01 - some content
par-000.21 - some content
par-000.31 - some content
par-001.32 - some content
內容可以是多行不正規。我想要做的就是把這些內容放到數據庫中,我的意思是第一條記錄 - par-000.01
轉換成code
列和some content
轉換成文本列。
我無法手動執行此操作的原因是,我有大約15個文檔,其中每個文檔都包含大約10頁我想放入數據庫的段落。
我找不到任何文章我如何解析整個文檔文件,所以我相信如果我寫適當的正則表達式可能是可能的。任何人都可以重定向我的文章,我怎麼能做我想做的 - 我找不到任何適合我的東西,可能我使用了錯誤的關鍵詞。
到目前爲止你做了什麼? – w0051977 2013-03-12 18:26:08
實際上現在我可以逐行加載文件,並將其存儲在字符串生成器中。但這種使用正則表達式的方式並不是很有效。 – Mithrand1r 2013-03-12 18:27:28
如果您已經能夠逐行讀取doc,您爲什麼需要RegEx?只要找到段落中斷並保存它? – 2013-03-12 18:37:32