我正在使用函數將字符序列壓縮爲3位。我的字母表包含字母ATGCN。我正在輸入一個測試字符串,並得到一個具有正確值的答案,但也有一些我並不期待的值。這裏是我的代碼:無法讓我的壓縮算法正常工作
#include <iostream>
#include <fstream>
#include <string>
#include <iomanip>
using namespace std;
#define A1 0x00 //0000-0 000
#define T1 0x01 //0000-0 001
#define G1 0x02 //0000-0 010
#define C1 0x03 //0000-0 011
#define N1 0x04 //0000-0 100
void bitcompress(int value, int bits, int end_flag);
int getHex(const char letter);
int main(int argc, const char * argv[])
{
string test = "GATGATGG";//compresses to 0x40a052 with my definitions
for (int i=0; i<test.size(); i++) {
int val = getHex(test.at(i));
bitcompress(val, 3, 0);
}
return 0;
}
void bitcompress(int value, int bits, int end_flag)
{
static char data = 0;
static int bitsused = 0;
int bytesize = 8;
int shift = bytesize - bitsused - bits;
//cout << "bitsused = " << bitsused << endl;
//cout << "shift = " << shift << endl << endl;
if(shift >= 0) {
data |= (value << shift);
bitsused += bits;
if(bitsused == bytesize) {
cout << hex << setw(2) << setfill('0') << (int)data;
data = 0;
bitsused = 0;
}
}
else {
data |= (value >> -shift);
cout << hex << setw(2) << setfill('0') << (int)data;
data = 0;
shift = bytesize + shift;
if(shift >= 0) {
data |= (value << shift);
bitsused = bytesize - shift;
} else {
data |= (value >> -shift);
cout << hex << setw(2) << setfill('0') << (int)data;
data = 0;
shift = bytesize + shift;
data |= (value << shift);
bitsused = bytesize - shift;
}
}
if(end_flag && bitsused != 0)
cout << hex << setw(2) << setfill('0') << (int)data;
}
int getHex(const char letter) {
if (letter == 'A')
return (int)A1;
else if (letter == 'T')
return (int)T1;
else if (letter == 'G')
return (int)G1;
else if (letter == 'C')
return (int)C1;
else
return (int)N1;
}
我期待0x40a052但這輸出:
40ffffffa052
我不能確定,所有的F公司的的來源。如果你在if語句之後註釋掉所有的couts,並且取消之前的註釋,你會發現shift和bitused的值是正確的。然而,如果你沒有注意到「shift」值,那麼得到fffffffe的賦值,而不是-2(這可以通過在if語句下注釋掉couts來看出)。我覺得這個問題可能與輸出到流中有關,但我不確定。任何幫助將不勝感激!
如果你知道你的整數不會小於0,那麼我建議你使用'unsigned char'。 –