cortex-a8

    2熱度

    1回答

    問題:這個警告是什麼意思?如果沒有真實的後果,我可以忍受一段時間......但是我擔心如果我們的程序加載到其中一個錯誤的芯片上會發生什麼。 背景:隨着NDK R8C,X264編碼器的連接發出警告: cannot scan executable section 1 of libx264.a(dct-a.o) for Cortex-A8 erratum because it has no mappin

    5熱度

    1回答

    這是參照問題: Checksum code implementation for Neon in Intrinsics 打開鏈接中列出的子問題作爲單獨的個別問題。由於多個問題不會被要求作爲單線程的一部分。 反正來了一個問題: 能ARM和NEON(在ARM Cortex-A8的架構來說的)並行的實際工作?我怎樣才能做到這一點? 難道有人指向我或共享一些使用ARM-NEON操作系統的示例實現(僞代碼/

    0熱度

    1回答

    如果您在ARM presentations之一中看到ARM Cortex-A8的流行管線圖。很明顯,取指令階段需要3個週期,但第一個週期是種類的折扣。但爲什麼?有什麼想法嗎? 謝謝...

    5熱度

    1回答

    我對使用ARM cortex A8中的PLD指令有一些疑問。由於我在循環內部使用指令,因此存在訪存限制內存的可能性。我的疑問是,這是否會導致分段錯誤。我在ARM manual which states that 讀取由於PLD指令被緩存的所有水平的任何其它負載指令處理中,PLD指令遵循標準的數據依賴關係的規則和程序的驅逐。在PLD執行的任何階段,PLD指令在地址轉換錯誤,緩存命中或中止時被忽略。

    4熱度

    2回答

    就ARM Cortex-A8而言,ARM模塊在NEON執行指令時是否等待或繼續運行?這種同步如何實現?如果ARM和NEON在相同的數據/代碼段上工作,ARM和NEON內核如何同步?

    2熱度

    2回答

    我在q寄存器中有128位數據。我想總結這個q寄存器中的單個16位塊,最終得到一個16位的最終和(任何16位以上的進位都應該被採用並加到這個16位數的最低位)。 我想要實現的是: VADD.U16(一些16位變量){Q0 [0] Q0 [1] Q0 [2] ......... Q0 [7 ]} ,但使用內聯函數, 將不勝感激,如果有人能夠給我這個算法。 我嘗試使用成對的加法,而是我結束了,而一個笨拙

    5熱度

    2回答

    請參考@ auselen的答案:Using ARM NEON intrinsics to add alpha and permute,看起來armcc編譯器比gcc編譯器更適合NEON優化。這是真的嗎?我沒有真正嘗試armcc編譯器。但我使用帶有-O3優化標誌的gcc編譯器獲得了非常優化的代碼。但是現在我想知道armcc是否真的很棒?那麼考慮到所有因素,兩個編譯器哪一個更好?

    2熱度

    1回答

    我正在使用ARM Cortex-A8,並試圖通過彙編代碼從CCNT時間計數器讀取值。我正在關注這個帖子How to measure program execution time in ARM Cortex-A8 processor?。按照它,在我可以讀取定時器的值之前,我必須啓用計數器,啓用64位分頻器並清除溢出。這些操作通過在適當的寄存器(例如,PMCR(Performance Monitro控

    4熱度

    2回答

    我開發一個iOS應用程序需要圖片來自RGB轉換 - > BGRA相當迅速。如果可能,我想使用NEON內部函數。有沒有比簡單分配組件更快的方法? void neonPermuteRGBtoBGRA(unsigned char* src, unsigned char* dst, int numPix) { numPix /= 8; //process 8 pixels at a time

    0熱度

    1回答

    試圖獲得可用於基於運行Linux 2.6.35.3的i.MX53處理器(它是ARM Cortex-A8內核)的嵌入式系統的工作directfb(由飛思卡爾提供)。 我在我的i686 debian主機系統上安裝了交叉編譯器。交叉編譯器來自embedian.org存檔,並且是gcc-4.3-arm-linux-gnueabi包(arm-linux-gnueabi-gcc (Debian 4.3.2-1