深入理解C語言

2021-01-08 CSDN技術社區

導讀:Dennis Ritchie過世了,他發明了C語言,一個影響深遠並徹底改變世界的計算機語言。一門經歷40多年的到今天還長盛不訓的語言,今天很多語言都受到C的影響,C++,Java,C#,Perl,PHP,Javascript等等。但是,你對C了解嗎?相信你看過本站的《C語言的謎題》還有《誰說C語言很簡單?》。這裡,我再寫一篇關於深入理解C語言的文章,一方面是緬懷Dennis,另一方面是告訴大家應該如何學好一門語言。(順便註明一下,下面的一些例子來源於這個slides)。

文章內容如下:

首先,我們先來看下面這個經典的代碼:

int main()  {  int a = 42;  printf(「%d\n」, a);  }  

從這段代碼裡你看到了什麼問題?我們都知道,這段程序裡少了一個#include <stdio.h> 還少了一個return 0;的返回語句。

不過,讓我們來深入的學習一下,

這段代碼在C++下無法編譯,因為C++需要明確聲明函數

這段代碼在C的編譯器下會編譯通過,因為在編譯期,編譯器會生成一個printf的函數定義,並生成.o文件,連結時,會找到標準的連結庫,所以能編譯通過。

但是,你知道這段程序的退出碼嗎?在ANSI-C下,退出碼是一些未定義的垃圾數。但在C89下,退出碼是3,因為其取了printf的返回值。為什麼printf函數返回3呢?因為其輸出了』4′, 』2′,』\n』 三個字符。而在C99下,其會返回0,也就是成功地運行了這段程序。你可以使用gcc的 -std=c89或是-std=c99來編譯上面的程序看結果。

另外,我們還要注意main(),在C標準下,如果一個函數不要參數,應該聲明成main(void),而main()其實相當於main(…),也就是說其可以有任意多的參數。

我們再來看一段代碼:

#include <stdio.h> void f(void)  {  static int a = 3;  static int b;  int c;  ++a; ++b; ++c;  printf("a=%d\n", a);  printf("b=%d\n", b);  printf("c=%d\n", c);  }  int main(void)  {  f();  f();  f();  }   

這個程序會輸出什麼?

我相信你對a的輸出相當有把握,就分別是4,5,6,因為那個靜態變量。

對於c呢,你應該也比較肯定,那是一堆亂數。

但是你可能不知道b的輸出會是什麼?答案是1,2,3。為什麼和c不一樣呢?因為,如果要初始化,每次調用函數裡,編譯器都要初始化函數棧空間,這太費性能了。但是c的編譯器會初始化靜態變量為0,因為這只是在啟動程序時的動作。

全局變量同樣會被初始化。

說到全局變量,你知道 靜態全局變量和一般全局變量的差別嗎?是的,對於static 的全局變量,其對連結器不可以見,也就是說,這個變量只能在當前文件中使用。

我們再來看一個例子:

#include <stdio.h> void foo(void)  {  int a;  printf("%d\n", a);  }  void bar(void)  {  int a = 42;  }  int main(void)  {  bar();  foo();  }  

你知道這段代碼會輸出什麼嗎?A) 一個隨機值,B) 42。A 和 B都對(在「在函數外存取局部變量的一個比喻」文中的最後給過這個例子),不過,你知道為什麼嗎?

如果你使用一般的編譯,會輸出42,因為我們的編譯器優化了函數的調用棧(重用了之前的棧),為的是更快,這沒有什麼副作用。反正你不初始化,他就是隨機值,既然是隨機值,什麼都無所謂。

但是,如果你的編譯打開了代碼優化的開關,-O,這意味著,foo()函數的代碼會被優化成main()裡的一個inline函數,也就是說沒有函數調用,就像宏定義一樣。於是你會看到一個隨機的垃圾數。

下面,我們再來看一個示例:

#include <stdio.h> int b(void) { printf(「3」); return 3; }  int c(void) { printf(「4」); return 4; }  int main(void)  {  int a = b() + c();  printf(「%d\n」, a);  }  

這段程序會輸出什麼?,你會說是,3,4,7。但是我想告訴你,這也有可能輸出,4,3,7。為什麼呢? 這是因為,在C/C++中,表達的評估次序是沒有標準定義的。編譯器可以正著來,也可以反著來,所以,不同的編譯器會有不同的輸出。你知道這個特性以後,你就知道這樣的程序是沒有可移植性的。

我們再來看看下面的這堆代碼,他們分別輸出什麼呢?

示例一

int a=41; a++; printf("%d\n", a);  

示例二

int a=41; a++ & printf("%d\n", a);  

示例三

 int a=41; a++ && printf("%d\n", a);  

示例四

int a=41; if (a++ < 42) printf("%d\n", a);  

示例五

int a=41; aa = a++; printf("%d\n", a);  

只有示例一,示例三,示例四輸出42,而示例二和五的行為則是未定義的。關於這種未定義的東西又叫Sequence Points,因為這會讓編譯器不知道在一個表達式順列上如何存取變量的值。比如a = a++,a + a++,不過,在C中,這樣的情況很少。

下面,再看一段代碼:(假設int為4位元組,char為1位元組)

struct X { int a; char b; int c; };  printf("%d,", sizeof(struct X));  struct Y { int a; char b; int c; char d};  printf("%d\n", sizeof(struct Y));  

這個代碼會輸出什麼?

a) 9,10

b)12, 12

c)12, 16

答案是C,我想,你一定知道字節對齊,是向4的倍數對齊。

但是,你知道為什麼要字節對齊嗎?還是因為性能。因為這些東西都在內存裡,如果不對齊的話,我們的編譯器就要向內存一個字節一個字節的取,這樣一來,struct X,就需要取9次,太浪費性能了,而如果我一次取4個字節,那麼我三次就搞定了。所以,這是為了性能的原因。

但是,為什麼struct Y不向12 對齊,卻要向16對齊,因為char d; 被加在了最後,當編譯器計算一個結構體的尺寸時,是邊計算,邊對齊的。也就是說,編譯器先看到了int,很好,4位元組,然後是 char,一個字節,而後面的int又不能填上還剩的3個字節,不爽,把char b對齊成4,於是計算到d時,就是13 個字節,於是就是16啦。但是如果換一下d和c的聲明位置,就是12了。

另外,再提一下,上述程序的printf中的%d並不好,因為,在64位下,sizeof的size_t是unsigned long,而32位下是 unsigned int,所以,C99引入了一個專門給size_t用的%zu。這點需要注意。在64位平臺下,C/C++ 的編譯需要注意很多事。你可以參看《64位平臺C/C++開發注意事項》。

下面,我們再說說編譯器的Warning,請看代碼:

#include <stdio.h>  int main(void)   {   int a;   printf("%d\n", a);   }   

考慮下面兩種編譯代碼的方式 :

cc -Wall a.c

cc -Wall -O a.c

前一種是不會編譯出a未初化的警告信息的,而只有在-O的情況下,再會有未初始化的警告信息。這點就是為什麼我們在makefile裡的CFLAGS上總是需要-Wall和 -O。

最後,我們再來看一個指針問題,你看下面的代碼:

#include <stdio.h> int main(void)  {  int a[5];  printf("%x\n", a);  printf("%x\n", a+1);  printf("%x\n", &a);  printf("%x\n", &a+1);  }  

假如我們的a的地址是:0Xbfe2e100, 而且是32位機,那麼這個程序會輸出什麼?

第一條printf語句應該沒有問題,就是 bfe2e100

第二條printf語句你可能會以為是bfe2e101。那就錯了,a+1,編譯器會編譯成 a+ 1*sizeof(int),int在32位下是4位元組,所以是加4,也就是bfe2e104

第三條printf語句可能是你最頭疼的,我們怎麼知道a的地址?我不知道嗎?可不就是bfe2e100。那豈不成了a==&a啦?這怎麼可能?自己存自己的?也許很多人會覺得指針和數組是一回事,那麼你就錯了。如果是 int *a,那麼沒有問題,a == &a。但是這是數組啊a[],所以&a其實是被編譯成了 &a[0]。

第四條printf語句就很自然了,就是bfe2e114。

看過這麼多,你可能會覺得C語言設計得真拉淡啊。不過我要告訴下面幾點Dennis當初設計C語言的初衷:

1)相信程式設計師,不阻止程式設計師做他們想做的事。

2)保持語言的簡潔,以及概念上的簡單。

3)保證性能,就算犧牲移植性。

今天很多語言進化得很高級了,語法也越來越複雜和強大,但是C語言依然光芒四射,Dennis離世了,但是C語言的這些設計思路將永遠不朽。

文章出自:酷殼網

相關焦點

  • 深入理解Objective-C的Runtime機制
    Objective-C是基於C語言加入了面向對象特性和消息轉發機制的動態語言,這意味著它不僅需要一個編譯器,還需要Runtime系統來動態創建類和對象,進行消息發送和轉發。下面通過分析Apple開源的Runtime代碼(我使用的版本是objc4-646.tar)來深入理解Objective-C的Runtime機制。
  • 終於理解了編譯是怎麼回事!從C語言到機器語言的升華過程!
    1 對於同一個語句,有如下三種:高級語言、低級語言、機器語言的表示 C語言: a=b+1; 彙編語言: mov -0xc
  • go語言學習總結(四十八)深入理解 Go Channel
    channel 是 Go 語言中的一個非常重要的特性,這篇文章來深入了解一下 channel。1. CSP要想理解 channel 要先知道 CSP 模型。Go 語言實現了 CSP 部分理論,goroutine 對應 CSP 中並發執行的實體,channel 也就對應著 CSP 中的 channel。2. channel 基礎知識2.1 創建 channelchannel 使用之前需要通過 make 創建。
  • 如何理解c語言中的回調函數
    這段話不是那麼好理解,不同語言實現回調的方式有些許不同。其實可以這樣理解,回調就是在一個函數中調用另外一個函數。 在c語言中,回調是使用函數指針來實現的。 函數指針——顧名思義,是指向一個函數的指針。
  • 深度理解C語言的編譯機制和語言標準,萬物皆可C!
    因為 C語言是可以移植的,所以它在許多環境中可用,其中包括 UNIX,Linux,Windows等等 。  不過,讓我們首先來看一看許多環境所共有的一些方面。你完全不必知道運行一個 C 程序後面的事情,但了解一點是一個很好的背景知識。它還可以幫助你理解為什麼編寫一個 C 程序必須經過一些特定步驟。
  • C語言 C語言最新最全的全套教程,這位少俠你值得擁有
    想要更好的理解程式語言是如何和計算機進行交互的嗎?那還等什麼,趕緊行動吧!從零開始,一路修煉,為自己的編程行業奠定著實的基礎。本課程通過圖形與程序實驗,配合gdb調試工具,將c語言編程中最難理解的內存管理與指針形象的展示在大家面前。
  • C語言?c+?到底先學哪個才能更好的理解編程,這些你造嗎
    最近大一新生們剛剛結束第一個學期的學習,接踵而來的問題也越來越多,不同的學校有不同的學習節奏,但是基本上都是從C語言或者c++開始學起。現在越來越多的人對於「學習C語言還有必要嗎?」這件事比較糾結。
  • 初學C語言,有什麼好書推薦?
    C語言是一種通用的,面向過程的高級程式語言,他以易於理解,簡潔靈活,語法易讀,成為了目前世界上最流行和最具影響力的語言之一。那麼新手在學習c語言的入門階段,該怎麼快速鞏固基礎?在語言藝術這方面,是登峰造極,讓人不得不佩服作者的才華和用心。只不過內容並不深入,對已經有基礎的人進階或者鞏固幫助不大。
  • c語言和Java哪一個好一些?
    C語言近幾年在社區排行榜中排名沒怎麼動過比較靠前,很多人初學喜歡學c語言,而且做底層開發的時候很多人傾向於c語言,比彙編好理解,速度也僅次於彙編。而且c可作為學習其他語言的基礎,很多驅動和系統內核都是用C語言寫的。 Java近幾年很火,社區排行榜也一直排前幾。
  • 理解C語言  字符串處理函數
    理解C語言 字符串處理函數在C語言中並沒有顯示的字符串類型,它有如下兩種風格的字符串:字符串常量: 以雙引號擴起來的字符序列,規定所有的字符串常量都由編譯器自動在末尾添加一個空字符字符數組: 末尾添加了&39;的字符數組,一般需要顯示在末尾添加空字符。
  • C語言入門有哪些書籍可以參考?
    C語言作為學編程最好的入門語言,對一個初進程序大門的小白來說是很有幫助的。此外,學習編程能培養一個人的邏輯思維,而C語言則是公認的最符合人們對程序的認知的一款計算機語言,很多大學都選擇了使用C語言作為大學生編程的啟蒙語言。
  • C語言,C++,C ,Java之間的關係
    C語言,C++,C#,Java,這幾種語言,應該說是當前最流行,也是最基礎的計算機語言。是不是有些人看著會頭大,大腦會不叫混亂,一個計算機怎麼會有那麼的的語言呢?看著就頭大。現在,小編先來給大家說下計算機語言的發張,一臺計算機最本質的語言是機器語言,由01010101的代碼組成,CPU處理的也是由由010101的代碼組成的數據。但是,這種語言太簡單了,不好理解。就來個數字組成的語言,可以用來表達一句話,一個數字,圖像,字母......也許只有計算機可以理解,反正小編是不知道什麼意思。
  • 深入理解JavaScript的閉包
    前言:JavaScript中有幾個非常重要的語言特性——對象、原型繼承、閉包。其中閉包對於那些使用傳統靜態語言C/C++的程式設計師來說是一個新的語言特性。本文將以例子入手來介紹JavaScript閉包的語言特性,並結合一點ECMAScript語言規範來使讀者可以更深入的理解閉包。
  • c語言程序設計自學教程
    如果您不甘落後,那麼請自製自控,自學c語言程序設計也是完全可能的。c語言十分依賴於計算機思維,而思維的培養不是一日之功,而是一個日積月累的過程一:準確把握語法語句概念1、編譯預處理不是C語言的一部分,不佔運行時間,不要加分號。C語言編譯的程序稱為源程序它以ASCII數值存放在文本文件中。
  • C語言學習篇(32)——為什麼C語言不能函數重載
    在C++中原生支持了函數重載, 而在C語言中並不支持,只能通過一些技巧來變相解決, 如定義flag形參, 根據flag值不同,進行不同的處理。使用objdump工具反彙編 大家都知道了在C語言中不能函數重載, 究其原因是否思考過呢?接下來我們以下c和c++代碼為例子,分別用gcc和 g++編譯, 然後再用objdump工具反彙編看看得到的彙編代碼有什麼區別。
  • C語言深入淺出 :回味經典
    【IT168 資訊】Dennis Ritchie 過世了,他發明了C語言,一個影響深遠並徹底改變世界的計算機語言。一門經歷40多年的到今天還長盛不衰的語言,今天很多語言都受到C的影響,C++,Java,C#,Perl, PHP, Javascript, 等等。但是,你對C了解嗎?
  • 通過.git 目錄深入理解 Git!
    如果程式設計師們能夠真正花時間去理解 Git 的構成,將會避免很多不必要的麻煩。作者 | Pierre de Wulf譯者 | 明明如月,責編 | 郭芮出品 | CSDN(ID:CSDNnews)以下為譯文:初學 Git 就像一個不懂當地語言的人來到一個陌生的國家——如果你知道自己在哪,該去哪裡,那還好。一旦你迷路了,那麻煩就大了。
  • 掌握C語言的必知要點
    溫故而知新,可以為師矣,初學一門語言的時候,我們會躍躍欲試,並沒有真正深入的理解,經過一段時間的實踐,會產生困惑,學而不思則殆,這時回過頭來看書,會有意想不到的收穫,會豁然開朗,會讓你在以後的實踐中更加運用自如,下面再來看看一些C語言的知識要點及注意事項
  • 為什麼學c語言及其計算機語言的原理
    而其技能當然不僅僅是做表或是寫文檔怎麼簡單,而我們就很難以外行人身份去研究計算機硬體及其工作原理,所以學會一門計算機程式語言就成了我們掌握計算機技能的突破口。既可以相對了解硬體的基本情況,也清楚軟體系統在計算機內部運作的過程。計算機語言的發展,是從機器語言、彙編語言、高級語言。而機器語言也就是計算機運行的原理。
  • 跟光磊學C語言-C語言概述與開發環境搭建
    理解語言和計算機語言語言:人和人之間信息交流的工具計算機語言:人和計算機之間信息交流的工具,這裡的人特指的開發者語言和計算機語言的區別是計算機語言只要語法沒有問題就會無條件執行。C語言可以寫網站後臺程序C語言可以專門針對某個主題寫出功能強大的庫C語言可以寫出大型遊戲引擎C語言可以寫另外一個語言出來(C++,Objective-C)C語言可以寫作業系統和驅動程序、並且只能由C語言編寫任何設備只要配備了微處理器(微處理器的接口是C語言編寫),都支持C語言,從微波爐到手機都是由