2013-04-22 63 views
-1

我試圖在運行時打印一個函數的操作碼。爲此我寫了一個C程序,該程序應該在該地址打印地址和十六進制數據。 這裏試圖打印多功能的內容。在運行時檢查機器指令

#include <stdio.h> 

int add(int a, int b) 
{ 
    printf("Adding..\n"); 
    return a+b; 
} 

int sub(int a, int b) 
{ 
    printf("Subtracting...\n"); 
    return a-b; 
} 

int mul(int a, int b) 
{ 
    printf("Multiplying...\n"); 
    return add(a,b) * sub(a,b); 
} 

int main() 
{ 
    char *ptr; 
    int i; 
    char a; 

    int (*func)(int,int); 

    mul(4,3); 
    func = &mul; 
    ptr = (char *)func; 

    do 
    { 
     a = *ptr; 
     printf("%p %x\n",ptr,a); 
     ptr++; 
    }while (a != 0xffffffc3); 
    //op code for ret is c3, which specifies end of function 
    //however, i am not certain why it opcode is being padded by 0xffffff 
} 

它輸出它給是

Multiplying... 
Adding.. 
Subtracting... 
0x4005a4 55 
0x4005a5 48 
0x4005a6 ffffff89 
0x4005a7 ffffffe5 
0x4005a8 53 
0x4005a9 48 
0x4005aa ffffff83 
0x4005ab ffffffec 
0x4005ac 18 
0x4005ad ffffff89 
0x4005ae 7d 
0x4005af ffffffec 
0x4005b0 ffffff89 
0x4005b1 75 
0x4005b2 ffffffe8 
0x4005b3 ffffffbf 
0x4005b4 c 
0x4005b5 7 
0x4005b6 40 
0x4005b7 0 
0x4005b8 ffffffe8 
0x4005b9 63 
0x4005ba fffffffe 
0x4005bb ffffffff 
0x4005bc ffffffff 
0x4005bd ffffff8b 
0x4005be 55 
0x4005bf ffffffe8 
0x4005c0 ffffff8b 
0x4005c1 45 
0x4005c2 ffffffec 
0x4005c3 ffffff89 
0x4005c4 ffffffd6 
0x4005c5 ffffff89 
0x4005c6 ffffffc7 
0x4005c7 ffffffe8 
0x4005c8 ffffff90 
0x4005c9 ffffffff 
0x4005ca ffffffff 
0x4005cb ffffffff 
0x4005cc ffffff89 
0x4005cd ffffffc3 

輸出幾乎是我期望但一些操作碼正在被在左側0XFFFFFF填充和被讀爲負值。爲什麼這樣?

ELF文件的objdump的下面

00000000004005a4 <mul>: 
    4005a4: 55      push %rbp 
    4005a5: 48 89 e5    mov %rsp,%rbp 
    4005a8: 53      push %rbx 
    4005a9: 48 83 ec 18    sub $0x18,%rsp 
    4005ad: 89 7d ec    mov %edi,-0x14(%rbp) 
    4005b0: 89 75 e8    mov %esi,-0x18(%rbp) 
    4005b3: bf 0c 07 40 00   mov $0x40070c,%edi 
    4005b8: e8 63 fe ff ff   callq 400420 <[email protected]> 
    4005bd: 8b 55 e8    mov -0x18(%rbp),%edx 
    4005c0: 8b 45 ec    mov -0x14(%rbp),%eax 
    4005c3: 89 d6     mov %edx,%esi 
    4005c5: 89 c7     mov %eax,%edi 
    4005c7: e8 90 ff ff ff   callq 40055c <add> 
    4005cc: 89 c3     mov %eax,%ebx 
    4005ce: 8b 55 e8    mov -0x18(%rbp),%edx 
    4005d1: 8b 45 ec    mov -0x14(%rbp),%eax 
    4005d4: 89 d6     mov %edx,%esi 
    4005d6: 89 c7     mov %eax,%edi 
    4005d8: e8 a1 ff ff ff   callq 40057e <sub> 
    4005dd: 0f af c3    imul %ebx,%eax 
    4005e0: 48 83 c4 18    add $0x18,%rsp 
    4005e4: 5b      pop %rbx 
    4005e5: 5d      pop %rbp 
    4005e6: c3      retq 

給出的十六進制代碼是幾乎相同的,除了0XFFFFFF的填充。我無法弄清楚爲什麼?

回答

4

這是因爲在您的系統上,char已簽名。如果您使用的是C實現,請使用unsigned char或(如評論中所建議的)uint8_t。另外,由於你不能將函數指針移植到void *,所以我不認爲你可以輕易地認爲函數指針指向可讀的內存,該內存在機器代碼中保存函數的表示。

我意識到這是典型和有點合乎邏輯,但我不認爲C保證它。在這種情況下,該程序將觸發未定義的行爲。希望它不會做任何有害的事情,並且仍然具有啓發性(雙關語意)。

+1

甚至更​​好,標準化的8位無符號整數類型「uint8_t」。 – 2013-04-22 09:24:48

+0

@JoachimPileborg:'uint8_t'完全沒用 - 它存在的任何地方,'unsigned char'必須*也是一個8位無符號整數類型。 – caf 2013-04-22 09:27:23

+0

@caf uint8_t - 如果存在 - 保證是無符號的8位數量。如果只是爲了更好地編寫代碼,最好使用它,而不是使用隱式寬度的類型之一。 – JeremyP 2013-04-22 09:40:07