2015-11-17 75 views
0

在CKAN 2.4.1中,將datapusher和.csv文件上傳到數據存儲是正確的,但是當datapusher搜索文件字段時,將.xls或.xlsx文件上載到數據存儲失敗標頭,在datapusher.error.log:將.xls或.xlsx文件上傳到數據存儲時出錯

Fetching from: http://10.115.100.69:5000/dataset/b0c86ea3-d764-493b-b0e8-d4bb0c287474/resource/287e7041-2616-4223-a94b-ed23f2937f2b/download/testxls.xls 
[Tue Nov 17 18:38:38 2015] [error] Deleting "ead7be15-511f-4884-9f40-e12086d331b1" from datastore. 
[Tue Nov 17 18:38:38 2015] [error] Determined headers and types: [] 
[Tue Nov 17 18:38:38 2015] [error] Successfully pushed 0 entries to "ead7be15-511f-4884-9f40-e12086d331b1". 

在配置文件中: ckan.datapusher.formats = CSV XLS XLSX TSV應用/ CSV應用/ vnd.ms-Excel應用程序/ vnd.openxmlformats-officedocument.spr ckan.datapusher.url = http://0.0.0.0:8800/

+0

''[error]'正是apache爲所有日誌放的東西,所以這不是真的錯誤。所以它告訴你它沒有在XLS中找到任何頭文件。所以也許你的XLS不是第一行標題的好桌子。 –

+0

執行一組簡單測試:xls沒有格式,格式爲,凍結頭文件,以xls格式保存csv等等,所有測試都失敗了,但是在最後一次測試datapusher中插入了數據存儲區中文件的內容。查看兩個文件的差異,我發現問題出在M. Excel 2010的默認新文檔選項中,因爲ME2010在創建新文檔時添加了3個選項卡,並且刪除了沒有內容的選項卡可以解決問題。謝謝。 – jroig

+0

好的地方。我已經爲DataPusher添加了一個建議改進的問題:https://github.com/ckan/datapusher/issues/90任何人都可以提供此改進,提示提示... –

回答

0

注意,CKAN將會推動(僅)最後一個工作用excel文件打包多個工作表。當我們有多個工作表時,我們創建一個「Contents」工作表作爲我們的最後一個工作表,並有一個標題爲「Contents」的表格,然後是一些描述性的細節,例如下面。然後,我們將每個工作表上傳爲csv或tsv,這樣每個工作表上的數據也會被推送到數據存儲。

內容
標題
數據
的簡單描述包括該內容表,加上3個附加的工作表:
- Sheet 1中:等等等等
- 元數據:總體數據集和高級別信息(作者的描述,聯繫人,關鍵字等)
- ColMetadata:每個工作表上字段(列)的描述/定義