我有一個包含160萬行數據的CSV,大約150MB,它包含產品數據。我有另一個包含2000行的CSV文件,其中包含大CSV中的產品列表。它們通過唯一的ID相互關聯。這個想法是用2000行添加CSV格式的產品數據。使用160萬行(150MB)文件搜索CSV文件?
該databank.csv有標頭ID
,Product Name
,Description
,Price
。 sm_list.csv
的標題爲ID
。
結果是在sm_list.csv
中輸出帶有產品的csv,相應的數據爲databank.csv
... 2000行。
我的原始解決方案讀取所有sm_list
,並逐行讀取數據庫。它在sm_list
中搜索從數據庫讀入的行中的ID
。這導致了2000x1.6百萬= 3200萬的比較!
您能否提供一個基本的算法大綱以最有效的方式完成此任務?