解碼數據,我有以下csv文件:最快的方式編碼和斯卡拉
Name Age City Start Stop Point
Mike 29 Fuji 10 30 5
Mike 29 Fuji 0 10 7
Susan 26 Fuji 77 1000 9
我試圖訪問點,給出的姓名,年齡,城市和範圍
實例給出:
Mike, 29, Fuji, 15 will yield 5
Mike, 29, Fuji, 5 will yield 7
Susan, 26, Fuji, 990 will yield 9
Susan, 26, Fuji, 1500 will yield 0 since there's no match
我讀了CSV,並試圖構建一個斯卡拉地圖[字符串,地圖[詮釋,地圖[字符串,地圖[INT,INT]]]]但由於我有幾千條記錄,是不是很可擴展性。開始和結束範圍是不相交的,並且必須與其他行關聯。
如何在不使用SQL數據庫或KeyValue存儲的情況下高效地對這些數據進行編碼和解碼?任何幫助將不勝感激。
您可以發佈您的代碼嗎? – cheseaux
所有記錄之間的間隔是否不相交? – Laurent
@Laurent是的,它們在所有記錄之間是不相交的 – Amanda