2014-03-30 124 views
0

有什麼方法可以使用Ruby從MS Word文檔中提取數據?我只需要知道給定文檔的頁數。通過Ruby從MS Word文檔中提取信息

我找不到這個庫。你知道有什麼辦法可以做到嗎?

在此先感謝。

+0

非常好的問題,這是.. –

回答

2

可以使用yomu寶石:

require 'yomu' 

data = File.read 'file.docx' 
metadata = Yomu.read :metadata, data 

puts metadata['Page-Count'] 
+0

不錯的寶石,但這顆寶石有定期更新嗎? –

+1

看起來像是這樣,最新版本是一個月前:http://rubygems.org/gems/yomu/versions –

1

如果您在Windows中,則可以使用win32ole。您可以打開該文件:

word = WIN32OLE.new('Word.Application') 
word.Visible = true 
document = word.Documents.Open('c:\WordDocs\MyWordFile.doc') 

而且,根據this答案,你可以得到與頁面的數量:

page_count = document.Range.ComputeStatistics(WdStatisticPages) 
+0

對於它的工作,但爲你的答案+1。 –