C語言會同意一些"令人震驚"的結構,下面的結構是合法的嗎,我們來看看幾個例子。
c = a+++b;
以下代碼是合法的嗎,咋的一看不禁有這樣的疑問?
int a = 5, b = 7, c;
c = a+++b;
這個代碼確實不咋符合習慣的寫法,但是不管你相不相信,上面的例子是完全合乎語法的。問題是編譯器如何處理它?
根據最處理原則,編譯器應該能夠儘可能處理所有合法的用法。因此,上面的代碼會被處理成:
c = a++ + b;
我們來測試一下:
#include
int main()
{
int a = 5, b = 7, c;
c = a+++b;
printf("a = %d,b = %d,c = %d",a,b,c);
return 0;
}
輸出結果如下:
其執行順序:
b不變,c = a + b;,則c = 5 + 7 = 12
a++,那麼a = 6;
c = a+++++b;
上面那麼可能只是開胃菜,那麼這個表達式呢,有什麼想法?咱們二話不說,直接上代碼測試。
#include
int main()
{
int a = 5, b = 7, c;
c = a+++++b;
//c = (a++) + (++b);
//c = ((a++)++) + b;
printf("a = %d,b = %d,c = %d",a,b,c);
return 0;
}
編譯結果如下:
雖然一看就知道意思是(a++)+(++b);,但是編譯就通不過,我們把括號加上,c = (a++) + (++b);,編譯通過,那麼出錯信息大概是:括號影響了優先級?我們從側面以及原理來解析一下。
側面解析一下
對於a+++++b這一段代碼,編譯系統從左至右掃描整條語句,先遇到a++,判斷出來是一個a的後綴自加運算;
然後接著掃描,遇到一個+,+是一個二目運算符,它的左邊已經有一個運算數a++了,系統就向右搜索第二個運算數;
又遇到一個+,++比+的運算級別要高,這時,編譯系統就將兩個+看成一個整體來處理;
既然是++,編譯系統就認定,肯定它的左邊或右邊有一個變量,編譯系統先搜索左邊,發現++,不是變量;
再搜索右邊,發現+b,+b是什麼東西?編譯系統是無法搞明白的;
因此它就認為++是一個缺少左值的自增運算符,於是提示錯誤給用戶:lvalue required as increment operand
原理解析一下
C語言在這裡遵循詞法解析的貪婪匹配原則。優先匹配儘可能多字符的符號,無論是否有語法錯誤(因為詞法分析時還沒有語法檢查)。
於是a+++++b會被當作a ++ ++ + b,這是非法的表達式,因此產生編譯錯誤。
這個問題在ISO C99標準中直接以示例描述,原文如下:
「EXAMPLE 2 The program fragment x+++++y is parsed as x ++ ++ + y, which violates a constraint on increment operators, even though the parse x ++ + ++ y might yield a correct expression.
那麼,也許是c = ((a++)++) + b;這個意思呢?
我們編譯結果依然報錯,如下:
這涉及到「左值」的問題。百度百科定義如下:
「左值(lvalue) 是B語言/C語言/C++語言等類C語言中的一類表達式。「左」(left)的原意是指可以放在賦值符號「=」的左邊,但其實也表示能作為&和++等操作符的操作數(B語言中已經如此)。而且,現代C/C++中的含義已經不局限於此。lvalue的l被重新解釋為location。這也對應於ISO C11/ISO C++11的內存位置(memory location)。
總結:a存在左值,可以有表達式:a++。但是(a++)不存在左值,無法繼續執行(a++)++操作,所以最終報錯。
怎麼樣才能編譯正確呢?
a+++++b在編譯時會報錯,那麼a++ + ++b呢?來看以下代碼:
#include
int main()
{
int a = 5, b = 7, c;
c = a++ + ++b;
printf("a = %d,b = %d,c = %d",a,b,c);
return 0;
}
結果如下:
其代碼與c = (a++) + (++b);結果一樣,說明是正確的,其按照下面順序執行:
先執行b自加,b變為8;相當於:b = b+ 1;
求a與b之和,賦給c;相當於:c = a + b ;//c = 5+8;
執行第二步之後,a自加1:a++;
c=(++a,b++,a++,++b);
這個表達式看著爽不爽?我們知道自增自減運算,表示對自身進行a=a+1或者a=a-1的運算。
++a表示在調用前就a+1,a++表示在調用後+1。
int c=(++a,b++,a++,++b);這個逗號隔開的表示用最後一個式子對C進行賦值,測試如下:
#include
int main()
{
int a = 5, b = 7, c;
c=(++a,b++,a++,++b);
printf("a = %d,b = %d,c = %d",a,b,c);
return 0;
}
輸出的結果如下:
這段執行的順序如下
先執行++a,a=6;
再執行b++,b=8;
接下來a++,a=7;
再執行++b,b=9;
把最後一個的式子b=9的值賦給c,所以c等於9。如果改成c=(++a,b++,a++,b++);,那麼c就是等於8,因為是調用後再自增。
總結
我們看到這些有趣且不常見的代碼的時候,無需懷疑,只需要根據經驗一步一步分析,就會發現其中的玄妙之處。在此我總結以下幾點。
如果你一看就知道了答案,或猜出正確答案,說明基礎做得好,點個讚。
如果你很猶豫,不知道答案,這也是正常的,因為很少見到這樣寫代碼的,但是我們也需要去了解,才能究其根源。
我總結這個問題,是想提起一個關於代碼編寫風格,代碼的可讀性,代碼的可修改性的話題,這樣我們在寫代碼的時候才能夠注意到,更好的編碼。