在pyarrow中,建議如何將pyarrow.Tensor
(例如從numpy.ndarray
創建)寫入Parquet文件?甚至可以不經過pyarrow.Table
和pandas.DataFrame
?從地板拼接文件讀取/寫入拼音張量
1
A
回答
2
Parquet的數據模型是表格式的,因此tensor/ndarray必須轉換爲表格形式。我們沒有任何內置的便利功能來幫助解決這個問題,但隨時對問題跟蹤器發出特定功能請求https://issues.apache.org/jira/projects/ARROW
1
Parquet格式針對嵌套數據表進行了優化,即它預期數據是表示爲命名列。這與n維列的想法有點相反。對於張量,最好選擇不同的格式。
相關問題
- 1. Python和Java中的拼音拼寫
- 2. 如何拼接在tenforflow 2張量
- 3. torch7:如何拼合張量?
- 4. 如何將音頻文件(wav格式)拼接成python中的1秒拼接?
- 5. 音頻拼接剪輯
- 6. Haskell/Julius模板 - 不能拼接變量
- 7. 張量流中的拼合批量
- 8. 序言地板拼圖
- 9. 編碼拼音
- 10. 關於拼接文件
- 11. 如何寫入拼接Spark數據框?
- 12. iOS音頻:剪切和拼接音頻?
- 13. 加快拼接2張圖片?
- 14. 在opencv中拼接2張圖片
- 15. 如何拼寫excel中的文本,即使拼寫錯誤
- 16. 拼音漢字python
- 17. 拼寫檢查
- 18. 拼接假&類變量
- 19. 自動拼接成矢量
- 20. 平鋪拼接列向量
- 21. 德文的拼寫檢查
- 22. 拼寫檢查的文獻?
- 23. 如何直接從網頁讀取/寫入本地文件(html)
- 24. 拼寫檢查軟件
- 25. Upsert進入拼接機
- 26. 從字節中提取和拼接位
- 27. C++截取函數拼接
- 28. 拼寫檢查屬性文件
- 29. Vim使用錯誤的拼寫文件?
- 30. C#拼寫無效的文件句柄