function-approximation

0熱度

1回答

某些值與組有很大不同，因爲缺少行並且數據不連續，所以我的diffVal異常。 > df Date diffVal1 diffVal2 1 2017-05-31 04:01:00 718 483 2 2017-05-31 05:01:00 704 477 3 2017-05-31 06:01:00 741 478 4 2017-05-31 07:01:00 8

0熱度

1回答

函數逼近算法中的誤差界限

假設我們有一組具有「m」位尾數和「e」位指數的浮點數。假設我們想要近似一個函數「f」。從理論上我們知道通常使用「範圍縮小函數」，然後從這個函數中導出全局函數值。例如讓x =（sx，ex，mx）（符號exp和尾數）then ... log2（x）= ex + log2（1.mx）所以基本上範圍縮小函數是「log2（ 1.mx）」。我已經實現了倒數，平方根，log2和exp2，最近我已經開始使

2熱度

1回答

R中的Newtonraphson代碼導致不同的結果

我需要近似Birnbaum-Saunders distr的樣本參數。這裏是我的代碼： x =c(6.7508, 1.9345, 4.9612, 22.0232, 0.2665, 66.7933, 5.5582, 60.2324, 72.5214, 1.4188, 4.6318, 61.8093, 11.3845, 1.1587, 22.8475, 8.3223, 2.6085, 24.0875,

1熱度

1回答

如何用強化學習更新函數逼近中的權重？

我的具有漸變下降的SARSA不斷使指數級別的權重升級。在第4集第17步價值已經楠 Exception: Qa is nan e.g： 6) Qa: Qa = -2.00890180632e+303 7) NEXT Qa: Next Qa with west = -2.28577776413e+303 8) THETA: 1.78032402991e+303 <= -0.1 + (

4熱度

1回答

Java-尋找關於計算函數的最小/最大值或步長間隔的導數的建議

尋找已經變成Java惡夢的數學問題的建議。我掃描了網頁並找不到解決方案。我看過類似的計劃，很遺憾找不到幫助。（我已經創建了計算Z（t）的代碼）的最小值或最大值。我想要在Java中實現一個方法，它可以找到Riemann-Siegel Z（t）函數的最小值或最大值（我已經創建了計算Z（t）的代碼）或其衍生物的價值。爲了顯示我想要做的事情，從0 < t < 100的Z（t）的圖看起來像這樣。直接審查

0熱度

1回答

函數逼近器和優化算法之間的區別？

我剛開始學習人工神經網絡和遺傳算法，發現他們之間的區別在於ANN是一個函數逼近器，而GA是一個優化算法（根據SO）。問題是我不是100％確定在哪裏以及如何劃定這些定義之間的界限;有沒有更簡單的方法來解釋差別在哪裏使用，例如類比（假設我是10歲）？我發現特別令人困惑的是，在某些情況下，這兩種類型似乎都能解決同樣的問題（例如旅行推銷員問題）。

1熱度

1回答

逼近一個簡單的sin（）函數與烤寬麪條

我正在嘗試烤寬麪條和nolearn NeuralNet函數來近似一個簡單的sin函數。畢竟，神經網絡被證明是通用的逼近器，所以我想通過一個簡單的非線性函數嘗試千層麪來實驗性地顯示這個事實。這是代碼： import lasagne import numpy as np from lasagne import layers from lasagne.updates import nesterov

0熱度

1回答

使用線性函數逼近的Q學習

我想獲得一些關於如何使用函數逼近的Q學習算法的有用說明。對於基本的Q學習算法，我找到了一些例子，我想我也明白它。如果使用函數逼近，我會遇到麻煩。有人可以通過一個簡短的例子來解釋它是如何工作的嗎？我所知道的： Istead使用矩陣，我們使用的功能和參數Q值的。使用派生函數和參數的線性組合近似。更新參數。我已經檢查本文：Q-learning with function approximatio

0熱度

1回答

動態環境下的強化學習與大型國家行動空間

我有一個500 * 500的網格有7個不同的懲罰值。我需要製作一個RL代理，其行動空間包含11個動作。（左，右，上，下，4個對角線方向，加速，減速和正常速度）。我怎麼解決這個問題？選擇的「執行操作」的概率爲0.8。否則，會選擇一個隨機動作。而且，懲罰值可以動態改變。