0
A
回答
0
我做了以下事情。我已經用officeXP打開了.doc文件,然後將其作爲博客發佈,之後我以過濾的網頁形式保存了該博客。這給你很好的HTML,你可以輕鬆解析。
2
我們也有類似的問題,結束了使用所謂的使用Aspose.Words第三方組件。 您可以在這裏找到它:http://www.aspose.com
它可用於.NET和Java。
0
你可以試着將文件導入到OpenOffice和看超鏈接是否被轉移。 OpenDocument只是一個帶有XML的ZIP文件,一旦掌握了它就很容易解析。
0
我知道這是你最初的問題後幾個月,但是,你也可以在.doc文件中穿過的Word自動化提取超鏈接。 API中有超鏈接對象,您可以輕鬆提取。
相關問題
- 1. 提取URL從超鏈接=()
- 2. 使用Yahoo Pipes從RSS提要中提取超鏈接
- 3. 提取PDF中的超鏈接到Excel
- 4. 從HTML中提取鏈接
- 5. 從DOC提取頁面到新的DOC
- 6. 如何從使用hpricot的超鏈接中提取網址?
- 7. 如何使用urllib2從html中提取超鏈接的hrefs
- 8. 如何從php docx文件中提取超鏈接?
- 9. Apache POI從word文檔中提取超鏈接
- 10. 使用Python從Excel中提取超鏈接(.xlsx)
- 11. 使用asp.net從excel單元格中提取超鏈接值
- 12. 使用XPath從超鏈接中提取文本
- 13. 從HYPERLINK字段代碼中提取超鏈接地址
- 14. 從pdf文件中讀取超鏈接
- 15. 自動超鏈接提取的文件
- 16. 如何使用php提取超鏈接
- 17. Excel的腳本超鏈接提取
- 18. 提取Apache POI HWPF超鏈接
- 19. 如何提取超鏈接信息PDFBOX
- 20. 從超鏈接
- 21. 使用rvest從表中的列中提取超文本和超鏈接
- 22. 從.doc文件中提取文本python
- 23. 從Word Doc Binary中提取文本
- 24. 從R中鏈接中提取標題
- 25. 從Powershell中的鏈接中提取值
- 26. PropertyGrid提示超鏈接?
- 27. 從文件中提取鏈接
- 28. 從文本文件中提取鏈接
- 29. php domDocument xpath從表中提取鏈接
- 30. 從JavaScript鏈接中提取XML數據?
哇,我想這一定是新的。幾年前,我搜索並搜索了一個不需要安裝Microsoft Office的解決方案。但是我找不到任何東西,所以我不得不使用Office自動化。我想這有點昂貴,但我更願意使用這樣的組件。 – 2009-10-16 22:19:20
我可以爲Aspose.Words擔保。它爲我們節省了數百小時的開發時間,並使我們能夠動態地創建Word文檔,超越通過簡單郵件合併完成的工作。我們也使用它來剝離Word文檔中的所有文本以進行索引。如果您必須使用許多MS Word文檔,我強烈建議您使用該產品。它也處理RTF,這是一個獎金。 – 2009-10-16 22:24:41