2
我正在開發一個C++程序,它使用OpenCv分析來自WebCam的視頻並做一些動作跟蹤(試圖爲學校項目構建一個自動化氣槍炮彈炮塔的最終目標!)OpenMp與OpenCv和指針
我試圖做很多工作來優化我的處理過程,以便在分析視頻時獲得最高的幀速率。我試圖使用OpenMp來進行平行處理,但是我很難用我的代碼來實現它。這裏有一個循環,我想使用Openmp。
Mat differenceImage(frame1.size(), CV_8UC1);
long long* pf1 = reinterpret_cast<long long*>(grayImage1.ptr());
long long* pf2 = reinterpret_cast<long long*>(grayImage2.ptr());
long long* pf3 = reinterpret_cast<long long*>(differenceImage.ptr());
long long* pfe = pf1 + grayImage1.size().width*grayImage1.size().height * sizeof(uchar)/8;
long long a, b, r1, r2, r3, r4, r5, r6, r7, r8, s1, s2, s3, s4, s5, s6, s7, s8, t1, t2, t3, t4, t5, t6, t7, t8;
while (pf1 < pfe) {
a = *pf1;
b = *pf2;
s1 = a & 0xFF00000000000000 >> 56;
s2 = a & 0x00FF000000000000 >> 48;
s3 = a & 0x0000FF0000000000 >> 40;
s4 = a & 0x000000FF00000000 >> 32;
s5 = a & 0x00000000FF000000 >> 24;
s6 = a & 0x0000000000FF0000 >> 16;
s7 = a & 0x000000000000FF00 >> 8;
s8 = a & 0x00000000000000FF;
t1 = b & 0xFF00000000000000 >> 56;
t2 = b & 0x00FF000000000000 >> 48;
t3 = b & 0x0000FF0000000000 >> 40;
t4 = b & 0x000000FF00000000 >> 32;
t5 = b & 0x00000000FF000000 >> 24;
t6 = b & 0x0000000000FF0000 >> 16;
t7 = b & 0x000000000000FF00 >> 8;
t8 = b & 0x00000000000000FF;
r1 = s1 - t1;
r2 = s2 - t2;
r3 = s3 - t3;
r4 = s4 - t4;
r5 = s5 - t5;
r6 = s6 - t6;
r7 = s7 - t7;
r8 = s8 - t8;
if (r1 < 0) r1 = -r1;
if (r2 < 0) r2 = -r2;
if (r3 < 0) r3 = -r3;
if (r4 < 0) r4 = -r4;
if (r5 < 0) r5 = -r5;
if (r6 < 0) r6 = -r6;
if (r7 < 0) r7 = -r7;
if (r8 < 0) r8 = -r8;
*pf3 = (r1 << 56) | (r2 << 48) | (r3 << 40) | (r4 << 32) | (r5 << 24) | (r6 << 16) | (r7 << 8) | r8;
++pf1;
++pf2;
++pf3;
}
基本上,我將2幀放入墊圖像,我得到這兩個圖像之間的差異。 我試圖在這個循環上使用OpenCv,但沒有成功,我試圖改變我爲while循環使用「#pragma omp parallel for」的「for」循環,但它完全不起作用。
任何人都可以給我一些關於在這種情況下使用Openmp的建議嗎?你認爲這有助於提高性能嗎?
謝謝 菲爾
謝謝!事實上,我過度複雜的問題,我試圖通過減少內存訪問來提高處理速度。但是,採用並行處理的方式可以提高我的程序速度。在320x240下15幀/秒,現在是640x480下30幀/秒! –