如何通過組合多個CPU內核,例如在Google Compute Engine n1-highmem-64機器類型上培訓自定義神經網絡(不是tensorflow)來獲得單線程更快的處理速度, CPU核心?羣集電腦還是什麼?不知道從哪裏開始......謝謝!使用附加內核的CPU性能
-3
A
回答
0
那麼你是要求單線程,但多核心更快的速度。
讓一個單一線程擁有更快處理速度的唯一可行方法就是超頻。通過獲得更新的內核,您也可以獲得更好的芯片組。
要完成這個簡單的工作是不可行的,你可能需要將固件打補丁到幾個組件,以允許它們在一個線程上利用L3緩存或其他東西在cpus上進行通信....非常不可行。
與此相反的是要走的路。
多線程用於在多個內核上併發處理不同的數據。
通用GPU的用途是通過將計算遷移到GPU來對大量數據執行相同的操作。它增加了開銷時間,但是當輸入足夠大時會給出好的結果。
有趣的是,你提到不是TensorFlow,因爲它實際上實現了這兩個。
即使你能夠實現像這樣的東西,它可能只是對原子鎖進行打亂,除非你已經對它進行了線程化。
編輯
如果您正在尋找使用軟件即服務,亞馬遜(https://aws.amazon.com/tensorflow/和其他公司)有一系列能與出來的各種深學習/機器學習框架兼容的服務框。
相關問題
- 1. 添加附加內核或CPU不會改善性能的地方在哪裏?
- 2. 調用GPU內核後CPU性能下降
- 3. 多核CPU上的Redis性能
- 4. 使用ThreadPoolExecutor的CPU性能
- 5. CUDA內核與Julia集CPU版本的性能下降
- 6. 在CPU內核數
- 7. 限制Caffe CPU內核使用率?
- 8. 使用javac多個CPU內核
- 9. 使用附加的HTML性能改進
- 10. 增加與性能直接相關的CPU核心?
- 11. 如果我有不同類型的內核,如何測量CPU單核性能?
- 12. 多核CPU能力
- 13. 讀取多核CPU的CPU使用率
- 14. 的Node.js - 針對CPU內核
- 15. MySQL:慢日誌;附加CPU使用率
- 16. Python附加性能
- 17. 內核/用戶模式下的CPU
- 18. 性能問題:單個CPU核心與單個CUDA核心
- 19. 性能問題 - 越來越多的內存和CPU使用
- 20. 多核和CPU使用
- 21. Cassandra CPU性能
- 22. CPU usage_slow性能
- 23. cpu屏蔽和禁用內核中斷
- 24. 使用附加模塊交叉編譯Linux內核
- 25. 在Linux中使用pthread中的可用物理CPU內核
- 26. 安卓工作室性能與CPU內核數量的比例是否良好
- 27. spin_lock和spin_unlock是否會損害單CPU機器上SMP內核的性能?
- 28. 關於性能(內存或CPU)
- 29. 從MATLAB調用內核低性能
- 30. mysqld性能高cpu和內存使用率
好的,所以我運行的代碼有一個準備階段,在這個階段中數據被分類和清理,但是然後是更加強化的訓練階段,在整個時代非常重複,但計算只是總結輸出激活的分數......有沒有辦法從單線程開始,但是一旦到達這個訓練階段,通過將時期分成64個部分(或可用的CPU數量)來計算激活並將總和返回到單個線程?除了在訓練之前準備好並存儲在RAM中之外,時代節不相互依存...... –
如果您可以在python中實現數據清理,那麼您可以在Tensorflow中實施培訓,並且它會自動使用所有內核/超線程或gpus。如果不是,則必須在模型的前向和後向傳播步驟上實現多線程,然後對損失函數執行求和並使用該求和來調整權重矩陣。 – Zroach
絕對不使用Python,Node JS –