最短的崩潰程序
想寫個崩潰的C語言小程序,看起來是個奇怪的主意,不過在我曾經教過的一門實驗課上,這是作業之一!實際上,這是一件非常有教學意義的事情。
通常學生們要麼嘗試反向引用一個非法地址,要麼就是除0.除0會引發SIGFPE信號(浮點異常)。這裡有一個小例子程序,使用除零方法來使之崩潰:
int main()
{
return 1/0;
}
我們也可以刪掉return關鍵字,但是當我這麼做的時候gcc不會為這些語句生成可執行代碼,即便優化選項被disable掉了。我們還可以通過把上面的語句改成賦值語句,使上面的代碼改變一些特徵:
i;
int main()
{
i=1/0;
}
注意我聲明了一個沒有類型的i。這樣的代碼在C89標準里是有效的,因為所有的聲明都有隱形的預設類型int。在C99和其他一些C標準里這是一個錯誤。假定我們寫的是C89代碼,那麼我們甚至可以使用隱形int來聲明main函數:
i;
main()
{
i=1/0;
}
那是相當短的代碼了 — 如果我們不把用於縮進的空格計算進來,只有16個字元。然而,我們還可以做得更好!
當C程序在編譯的時候,編譯器會產生一個或更多對象文件,文件里有對於用到的庫和全程對象(函數和變數)的符號索引。然後這些對象文件會被進行鏈接,這時符號索引被地址所代替,就產生了一個可執行文件。
編譯器在一個對象文件里提供了一個調用main函數的入口點。調用main函數意味著我們試圖執行在存儲在main函數鏈接的位置所對應地址里的指令。
有趣的是,鏈接器對於不同對象的類型是沒有概念的,它只知道它們的地址。所以,如果我們用一個常規的全程變數替換main函數,編譯器會高興地build對象文件,因為它不關心對象main的類型是什麼;鏈接器也會高興地鏈接它,因為它只關心main函數對應的地址。
所以,考慮這個C程序:
int main=0;
這個程序會編譯成一個可執行文件,它會試圖調用地址0,而0並不是我們能夠訪問的地址,這樣我們會得到SIGSEGV信號(分段錯誤)。
更正:我前面關於這個程序崩潰的原因分析是錯的。這個程序會試圖按函數方式去執行main,而這樣不會奏效,因為編譯器把它放到了不可執行的數據段。所以變數main初始化為什麼值都無所謂了。(感謝Zack的糾正)
現在我們已經非常接近最小的崩潰的C程序了。我們可以利用這個技巧,配合隱形int類型,來把它進一步縮短。
main=0;
還有,C里的全局變數都會隱形地初始化為0,所以上面的代碼就等同於:
main;
好了,現在我們得到了最短的崩潰的C程序!
補充:
Hacker News用戶femto指出,編譯和鏈接一個空文件也是可能的。我沒有發布這個是因為gcc會拒絕編譯和鏈接這樣的程序,它會要求分開編譯和鏈接的過程。
另外,要是我們再學究一點,我應該指出我這裡的「全局」變數意思是說「靜態」變數。
特別推薦
※你中槍了嗎 PCB中常見錯誤大全
※指紋、虹膜、刷臉之外,現在竟有人用指尖靜脈來開鎖,據說更安全
※講道理!這個電路不應該這麼通啊……
※LoRa:能源計量領域的一匹黑馬
TAG:21ic電子網 |