我有一個關於機器學習和決策樹的問題。我從事計算生物學(長RNA二級結構預測)。機器學習,決策樹
我有一個預測預測RNA二級結構準確性的程序。的輸入參數的程序是
- 莖長(L) - 的值從3,4,5,6,7和8
- 間隙尺寸(G) - 從0,1,2值3,4,5,6,7和8
- 塊長度(C) - 從60,70,80,90,100,120,130,140值,以及150
我想知道,對於給定的RNA序列長度(S),其中L,G,C組合給出最大精度。
我有一個包含50個序列長度爲S的序列文件的訓練數據集,並且對於每個這些序列文件,給出最大準確度輸出的L,G,C輸入參數組合是已知的。
有沒有一種方法可以知道要使用哪個特定的L,G和C參數以便找出所有L,G和C範圍值的最大精度?