Q

從地板拼接文件讀取/寫入拼音張量

2017-10-17 660 views 1 likes

1

在pyarrow中，建議如何將pyarrow.Tensor（例如從numpy.ndarray創建）寫入Parquet文件？甚至可以不經過pyarrow.Table和pandas.DataFrame？從地板拼接文件讀取/寫入拼音張量

2017-10-17 Martin Studer

A

回答

2

Parquet的數據模型是表格式的，因此tensor/ndarray必須轉換爲表格形式。我們沒有任何內置的便利功能來幫助解決這個問題，但隨時對問題跟蹤器發出特定功能請求https://issues.apache.org/jira/projects/ARROW

2017-10-17 21:12:55

1

Parquet格式針對嵌套數據表進行了優化，即它預期數據是表示爲命名列。這與n維列的想法有點相反。對於張量，最好選擇不同的格式。

2017-10-18 05:47:02 xhochy

相關問題