wide-column-store

    0熱度

    2回答

    我正在進行分析任務,我們從大學圖書館獲得了包含近300.000.000行的部分數據集。 每一行包含: ID 日期 所有者 截止 CHECKOUT_DATE CHECKIN_DATE 我就把這一切MySQ內L表格,然後我開始詢問我的分析任務,但是簡單的查詢(SELECT * FROM table WHERE ID = something)需要9-10分鐘才能完成。所以我爲所有列創建了一個索引,這使得

    2熱度

    1回答

    熊貓數據框通常以long(很多行)或wide(很多列)格式表示。 我不知道哪種格式更快地讀取並佔據時保存爲HDF文件(df.to_hdf)的內存更少。 是否有一個通用規則或某些格式應該是首選的情況?