我有一大組數據(一個250,000 X 1000雙倍的數據立方體,大約4個gig文件),我想用前面用Python編寫的一組OOP類來操縱它。目前數據集已經非常大,以至於讀入我的機器內存,我不得不至少將它分成兩半,所以計算開銷是一個問題。我的OOP類創建新對象(在這種情況下,我將需要250,000個新對象,每個對象是一個包含1,000個雙打的數組)來處理數據。在爲通用OOP語言創建對象所需的內存和計算方面的開銷是多少?在python中?在C++中怎麼樣?什麼是面向對象的編程計算開銷成本?
是的,我意識到我可以創建一個新的類是一個數組。但是1)我已經完成了這些類,並且2)我將創建的每個對象都放回到數組中供以後訪問。問題是教育
*更新:我想與時間,我的時間和電腦高效。我不想重寫我已經擁有的程序,如果我不必花時間優化代碼浪費時間,我不在乎那太多了,如果我浪費電腦時間。我實際上有一個4Gig ram的64位機器。該數據是一個圖像,我需要對每個像素做幾個過濾器。*
通常使用簡單的數據結構和針對大數據集優化的特定算法計算大數據。你在這裏似乎並沒有走上正確的道路。你想實現什麼? – Loki 2008-12-16 20:44:57