之前寫過一篇《如何設計一個C++的類》,今天這裡繼續聊聊如何設計結構體,注意本文不介紹在C++中結構體和類具體有什麼區別,本文所說的結構體是指只有數據欄位不帶任何函數的那種結構體。
當創建結構體的實例時,結構體的數據成員會按其聲明的順序連續存儲。然而,這個聲明的順序也是有學問的,順序不同結構體的大小可能有很大差別,數據成員的訪問性能也可能會有很大區別!
這裡涉及一個概念:內存對齊。關於內存對齊我之前寫過一篇文章:《內存對齊》,這裡不深入討論,只是簡單介紹一下。
大多數編譯器會對齊數據成員,會以四捨五入地址方式來優化數據的訪問,如下表所示。
這種內存對齊可能會在成員大小混合的結構體中產生未使用字節的空洞。
例如:
struct S {
short int a; // 2位元組
// 6個空洞
double b; // 8
int d; // 4
// 4個空洞
};
S ArrayOfStructures[100];這裡,在a和b之間有6個未使用的字節,因為b必須從一個能被8整除的地址開始。
最後還有4個未使用的字節空洞。這樣做的原因是,數組中S的下一個實例必須從一個能被8整除的地址開始,以便將其b成員以8對齊。
然而,如果改變一下結構體中數據成員聲明的順序,通過將最小的成員放在最後,未使用的字節數可以減少到2:
struct S {
double b; // 8
int d; // 4
short int a; // 2
// 2個空洞
};
S ArrayOfStructures[100];這種重新排序使結構體變小了8個字節,那整個數組則變小了800個字節。
在此特性上,類和結構體相同。通過重新排序數據成員,結構體對象和類對象通常可以變得更小。如果類至少有一個虛成員函數,則在第一個數據成員之前或最後一個成員之後會有一個指向虛函數表的指針。該指針在32位系統中為4位元組,在64位系統中為8位元組。
如果不確定結構體或它的每個成員有多大,可以使用sizeof操作符進行一些測試。sizeof操作符返回的值包括對象末尾的任何未使用的字節(內存對齊後的字節數)。
還有一個知識點:
如果數據成員相對於結構體或類開頭的偏移量小於128,則訪問數據成員的代碼會更加緊湊,因為該偏移量可以使用8位有符號的數字來表示。如果相對於結構體或類的開頭的偏移量是128位元組或更多,那麼偏移量必須表示為一個32位數字(指令集在8位到32位之間沒有偏移量)。例如:
struct S {
int a[100]; // 400
int b; // 4
int read() { return b; }
};b成員的偏移量是400。任何通過指針或成員函數訪問b欄位的代碼都需要將偏移量編碼為32位數字。如果交換a和b,則兩者都可以通過編碼為8位有符號數字的偏移量來訪問,或者根本不需要偏移量。
這會使代碼更緊湊,方便更有效地使用代碼緩存。因此,建議在結構或類聲明中,大數組和其他大對象排在最後,最常用的數據成員排在前面。如果不能在前128個字節內包含所有數據成員,則將最常用的成員放在前128個字節中。
通過上面兩個小知識點可以使得將結構體設計的更小,訪問數據成員的速度更快,但是這有時往往會犧牲一些可讀性,比如這種結構體:struct S {
int deskA;
double deskB;
bool deskC;
int chairA;
double chairB;
bool chairC;
};可能這樣修改後結構體會更小:
struct S {
int deskA;
int chairA;
double deskB;
double chairB;
bool deskC;
bool chairC;
};但是我們一般情況下貌似希望同類的欄位放在一起,這樣代碼可讀性更高一些,易於讀懂代碼。至於這種結構體具體需不需要重新排序,那就需要大家自己權衡啦。
小總結:
128是個檻,常用的數據成員可考慮放在前128位元組中,不常用的或大的數據成員可考慮放在後面;
打完收工。
- EOF -
關注『CPP開發者』
看精選C++技術文章 . 加C++開發者專屬圈子
點讚和在看就是最大的支持❤️