2013-02-18 68 views
0

我已經使用了「提取」命令,但它從來沒有找到與我正在處理的這些excel電子表格中發現的FOCA一樣多的信息。在Linux中提取excel元數據

例如,我正在使用FOCA應用程序從網上收集和下載文件。之後,它從所有文件中提取元數據。

關於excel文件,看起來這些文件比普通的pdf文件包含更多的元數據。這就是說,FOCA能夠檢測存儲在這個電子表格文件中的打印機名稱,電子郵件地址和其他一些東西。但是,我無法找到任何方式在Linux中使用「extract」命令獲取相同的信息。

任何人都知道一種方法來提取Linux內的文件,並抓住它的所有元數據?似乎提取命令可能會受到我所理解的限制。

感謝,

回答

0

Excel文件存儲大量元數據的文件中,這樣你就不得不解析文件本身得到它。由於您在Linux上並且無法使用Excel互操作,因此您可以嘗試使用類似ExcelWriter之類的Excel庫。 ExcelWriter是爲.Net編寫的,所以你必須使用mono。

+0

嗯,kk。不知道什麼是「單聲道」,但我要看看這個ExcelWriter庫。非常感謝! – LewlSauce 2013-02-18 21:55:38

+0

很糟糕,你會碰巧知道我可以從哪裏開始閱讀關於如何在Linux中提取元數據文件的內容?我看了一下你鏈接的ExcelWriter頁面,但我不明白這將與Python有什麼關係,甚至不知道如何在Linux中手動從excel文件中提取元數據。 – LewlSauce 2013-02-19 13:56:45