我意識到這可能是一個相當異端的問題,但我不知道我是否可以通過System.IO.Posix.MMap將數據文件mmap,然後將生成的ByteString的cast
轉換爲其他類型的嚴格數組?例如。如果我知道該文件包含雙打,我可以以某種方式將此映射的數據導入到UArr Double中,以便我可以對它執行sumU等操作,並讓虛擬內存系統爲我處理IO?這基本上是我在C++代碼中處理多GB數據集的方式。另外更習慣的方式來做到這一點也讚賞,謝謝!將mmapped ByteString轉換爲其他類型?
我也可以對數據進行多核處理的方式的最高加分:-)不是我要求苛刻或任何事情。
謝謝;我擔心情況會是這樣。一旦他們需要被加載到任何語言的GC'd空間,我從來沒有太多的運氣操縱大數據集。我目前使用的只是mmap的方法通常沒問題。將複製一些減少的數據集,看看事情如何運作。 – billt 2009-09-21 17:57:48