2010-01-08 20 views
1

我正在從網站收集數據。隨着時間的推移,我估計會得到10.000個數據點(時間 - 價值)乘以7。這很重要。用於存儲和繪製實時圖(通過jQuery flot)。 我正在尋找處理這類問題的文本。更確切地說:算法,尋找最不重要點(如果這是一個好主意)的統計數學,處理這類問題的一般想法。如果一個文本在網絡上可用,那就太棒了。參考一本書也可以。集合中的數據點太多。尋找修剪方法

+0

這看起來更像是一個數學/統計問題,而不是一個編程問題。嘗試數學溢出。 – avpx 2010-01-08 04:29:46

+1

或不:http://meta.stackexchange.com/questions/34570/mathoverflow-net-how-can-we-get-members-of-this-site-and-the-so-sf-su-sites- to-s – 2010-01-08 04:44:50

+0

我正在尋找解決問題的算法。提供開源的javaScript解決方案也可以。這對我來說是一個真實的編程問題。 – Afwas 2010-01-08 04:59:20

回答

1

閱讀維基百科中的apha beta修剪文章我提出了這個想法: 最不重要的一點是最小的變化發生的地步。在數據陣列中,這將是arr[i-1]arr[i+1]之間的差異。然後,它很容易找到i

var smallest = 10000; // large to start with 
var rememberI = 0; 
function prune(arr){ 
    for(i in arr){ 
     if(i > 0 && i < arr.length){ 
      var test = arr[i+1] - arr[i-1]; 
      if(test < smallest){ 
       smallest = test; 
       rememberI = i; 
      } 
     } 
    } 
    return rememberI; 
} 

我沒有測試過,但它看起來像一個有前途的想法。

+0

我測試了另一-similar-數據流看來工作不錯它修剪的;這將增加一倍我需要存儲的數據。。時間表現在它現在開始修剪最近添加的數據點,因爲它們彼此(沒有太大的變化有)後進行關閉。 – Afwas 2010-01-08 16:57:10