繼我的前兩個問題How to improve memory performance/data locality of 64-bit C/intel assembly program和Using C/Intel assembly, what is the fastest way to test if a 128-byte memory block contains all zeros?之後,我進一步
我想使用Vtune Profiler API來剖析Xeon Phi上運行的代碼(Linux,使用卸載執行)以查看執行的指令數量,L1緩存未命中的數量等。但是我找不到解釋如何使用這個庫的地方。 哪裏可以找到Linux文件庫文件和包含文件?如何編寫代碼來剖析在Xeon Phi上運行的短代碼? 我希望是這樣的: //this code will be executed on host processor