通常我在用grep -r --color word /path/dir
進行搜索,但是這對二進制文件不起作用。所以我想編寫一個類似Perl的腳本。因此,我正在搜索一個可以在Linux機器上讀取doc-files的模塊(可能類似於Spreadsheet :: ParseExcel for ms-word-documents)。有沒有一個模塊在Linux上搜尋msword doc-files?
3
A
回答
3
有很多文字轉換器(如antidoc,wv,catdoc,unoconv ...)。你可以通過他們的輸出grep。這也是msysgit爲編錄doc文件所做的。
1
沒有試圖聽起來那麼尖銳,這是使用閉源專利文檔的危險。您可能會被開發人員提供的工具卡住。
你的實際問題,有幾件事情可以做:
- 打開該文件,並保存爲RTF(富文本)甚至以純文本格式,這應該是更多的搜索。
- 公開賽的LibreOffice(在Oracle收購之前叫做OpenOffice的強制叉),這可能會允許更多的自定義搜索(如果有人提供了這樣一個插件),或可用於哪些是通過方法1
相關問題
- 1. 構建一個沒有源代碼的linux模塊
- 2. 在linux上安裝Azure Python api:importError:沒有名爲storage.blob的模塊
- 3. py2exe - 沒有一個系統模塊「pywintypes」
- 4. 有沒有一個rpm在Linux上安裝wxPython
- 5. Python:在windows 10上沒有模塊webkit
- 6. 在Linux上將MSword轉換爲XML/HTML
- 7. 在一個Pod中嵌入一個沒有模塊的框架
- 8. TkMessageBox - 沒有模塊
- 9. 沒有模塊Pycharm
- 10. fedora linux ---編譯第一個linux模塊
- 11. 如何在沒有sudo的情況下在Linux上安裝apache2模塊
- 12. 在沒有加號的情況下安裝Linux內核模塊+(在ARM上)
- 13. 搜尋有多個參數在SQL Server
- 14. 滑動模塊在觸發模塊上第一次觸發後沒有觸發
- 15. PHP有一個「模塊」類
- 16. 在linux中創建一個模塊
- 17. matlab:尋址一個索引沒有sub2ind
- 18. 如何讓一個linux模塊加載另一個模塊?
- 19. 有沒有成功的一個行塊
- 20. 有沒有一個Python模塊解析維基百科文章沒有MediaWiki?
- 21. Django的應用程序有一個沒有ImportError:沒有模塊名爲'django.core.context_processors'
- 22. 有沒有寫一個模塊的Drupal腳本的方式嗎?
- 23. 有沒有一個服務器的Python 3 websocket模塊?
- 24. 有沒有一個libnfc android可加載內核模塊?
- 25. 尋找一個沒有清晰模式的數據集合
- 26. 有沒有一種方法可以在Linux上使用C++
- 27. 您可以在一個頁面上有多個Require.JS模塊
- 28. 有沒有辦法讓一個symfony 1.4模塊有多個控制器?
- 29. 導入模塊元素在另一個沒有限定名
- 30. 沒有按鈕的滑塊 - 上/下一個li觸發滑塊
轉換您要求,究竟?請記住,.doc文件和較新的.docx文件是非常不同的文件格式。所以即使你發現了一個可以解析.doc文件的Perl模塊,它也許不支持.docx文件。 – knb
他們是'.doc'文件。 –