我想通過使用它讀取CSV文件來了解更多關於FSharp.Data項目的信息。 CSV文件是Kaggle數字識別器競賽中數據的簡化版本。來自FSharp.Data的CSV typeprovider的性能問題
當我讀取包含785列和113行(包括標題行),則下面的代碼兩行的CSV文件,執行很慢:
type trainingSet = CsvProvider<"Data/trainSmall.csv", ",", CacheRows=false>
let data = trainingSet.Load("Data/trainSmall.csv")
當我發送的第一線到F#交互它會在大約10秒內返回,而當我將第二行代碼發送到F#交互時,交互式提示應答之前需要超過5分鐘。
我使用F#3.0和Xamarin Studio在2.6 GHz I5處理器和16GB RAM上運行我的MacBook Pro上的代碼。我已經嘗試了在相同硬件上的VM下運行的Windows7/VS2013的相同實驗。結果是可比的。當我使用同一臺機器並試圖用R完成同樣的事情時,它速度如此之快以至於我無法用普通手錶來計時。
請指教我正確使用Fsharp.Data中的CSV typeprovider!
謝謝。我在[GitHub]上創建了一個問題(https://github.com/fsharp/FSharp.Data/issues/547) – carstenj