我對python和numpy scipy包相當陌生。 我正在做一個類分配的迴歸分析,涉及在數據集上嘗試不同的迴歸技術,並查看哪一個工作。這涉及從數據集中刪除值,並查看哪個算法在減少數據集的情況下表現良好。現在我將索引達到數據集長度的一小部分。 有點像。刪除數據集的一小部分
data = np.loadtxt("filename")
to_be_used = data[0:int(0.6(len(data)))]
有沒有其他辦法可以做到這一點?說,我想隨機選擇60%的數據,而不是前60個元素。
subset = np.random.choice(data, int(len(data)*0.6), replace=False)
但是,如果你想創建多個非重疊隨機集,則應該洗你的數組,然後使用:
您應該創建一個新的縮小數組。無論如何,請顯示你的嘗試。初始數組和預期結果的一個簡短例子也很好。另外,只是幻想索引整個陣列有什麼問題? –
減少數組有一些規則? – guisantogui
對不起。我編輯了我的問題 –