作者簡介:
陳彬是一名程序語言愛好者,認證技術教練,致力於軟體開發團隊的技術能力提升和項目的軟體質量改善。隨著Docker、k8s等應用的火熱,其開發語言Go也受到越來越多的關注。本文對Go和Python、Erlang做了一些有趣的分析對比,相信大家能從中感受到Go語言的強大和與眾不同。
本文主要是介紹Go,從語言對比分析的角度切入。之所以選擇與Python、Erlang對比,是因為做為高級語言,它們語言特性上有較大的相似性,不過最 主要的原因是這幾個我比較熟悉。 Go的很多語言特性借鑑與它的三個祖先:C,Pascal和CSP。Go的語法、數據類型、控制流等繼承於C,Go的包、面對對象等思想來源於Pascal分支, 而Go最大的語言特色,基於管道通信的協程並發模型,則借鑑於CSP分支。
Go/Python/Erlang語言特性對比
如《 程式語言與範式 》一文所說,不管語言如何層出不窮,所有語言的設計離不開2個基本面:控制流和數據類型。為了提升語言描述能力,語言一般都提供控制抽象和數據抽象。本小節的語言特性對比也從這4個維度入手,詳見下圖( 點擊見大圖 )。
圖中我們可以看出,相比於Python的40個特性,Go只有31個,可以說Go在語言設計上是相當克制的。
比如,它沒有隱式的數值轉換,沒有構造函數和 析構函數,沒有運算符重載,沒有默認參數,也沒有繼承,沒有泛型,沒有異常,沒有宏,沒有函數修飾,更沒有線程局部存儲。
但是Go的特點也很鮮明,比如,它擁有協程、自動垃圾回收、包管理系統、一等公民的函數、棧空間管理等。
Go作為靜態類型語言,保證了Go在運行效率、內存用量、類型安全都要強於Python和Erlang。
Go的數據類型也更加豐富,除了支持表、字典等複雜的數據結構,還支持指針和接口類型,這是Python和Erlang所沒有的。特別是接口類型特別強大, 它提供了管理類型系統的手段。
而指針類型提供了管理內存的手段,這讓Go進入底層軟體開發提供了強有力的支持。
Go在面對對象的特性支持上做了很多反思和取捨,它沒有類、虛函數、繼承、泛型等特性。
Go語言中面向對象編程的核心是組合和方法(function)。
組合很類似於C語言的struct結構體的組合方式,方法類似於Java的接口(Interface),但是使用方法上與對象更加解耦,減少了對對象內部的侵入。
Erlang 則不支持面對對象編程範式,相比而言,Python對面對對象範式的支持最為全面。
在函數式編程的特性支持上,Erlang作為函數式語言,支持最為全面。
但是基本的函數式語言特性,如lambda、高階函數、curry等,三種語言都支持。 控制流的特性支持上,三種語言都差不多。
Erlang支持尾遞歸優化,這給它在函數式編程上帶來便利。而Go在通過動態擴展協程棧的方式來支持深度遞 歸調用。Python則在深度遞歸調用上經常被爆棧。 Go和Erlang的並發模型都來源於CSP,但是Erlang是基於actor和消息傳遞(mailbox)的並發實現,Go是基於goroutine和管道(channel)的並發實 現。
不管Erlang的actor還是Go的goroutine,都滿足協程的特點:由程式語言實現和調度,切換在用戶態完成,創建銷毀開銷很小。
至於Python,其多 線程的切換和調度是基於作業系統實現,而且因為GIL的大坑級存在,無法真正做到並行。
而且從筆者的並發編程體驗上看,Erlang的函數式編程語法風格和其OTP behavior框架提供的晦澀的回調(callback)使用方法,對大部分的程式設計師, 如C/C++和Java出身的程式設計師來說,有一定的入門門檻和挑戰。而被稱為「網際網路時代的C」的Go,其類C的語法和控制流,以及面對對象的編程範式, 編程體驗則好很多。
Go/Python/Erlang語言語法對比
所有的語言特性都需要有形式化的表示方式,Go、Python、Erlang三種語言語法的詳細對比如下(點擊見完整大圖 第一部分 , 第二部分 , 第三部 分 )。
正如Go語言的設計者之一Rob Pike所說,「軟體的複雜性是乘法級相關的」。
這充分體現在語言關鍵詞(keyword)數量的控制上,Go的關鍵詞是最少 的,只有25個,而Erlang是27個,Python是31個。
從根本上保證了Go語言的簡單易學。
Go語言將數據類型分為四類:基礎類型、複合類型、引用類型和接口類型。
基礎類型包括:整型、浮點型、複數、字符串和布爾型。
複合數據類型有數 組和結構體。引用類型包括指針、切片、字典、函數、通道。
其他數據類型,如原子(atom)、比特(binary)、元組(tuple)、集合(set)、記錄 (record),Go則沒有支持。
Go對C語言的很多語法特性做了改良,正如Rob Pike在《 Less is Exponentially More 》中提到,Go的「起點: C語言,解決一些明顯的瑕疵、刪除雜 質、增加一些缺少的特性。」
比如,switch/case的case子程序段默認break跳出,case語句支持數值範圍、條件判斷語句;所有類型默認初始化為0, 沒有未初始化變量;把類型放在變量後面的聲明語法( 連結 ),使複雜聲明更加清晰易懂;沒有頭文件,文件的編譯以包組織,改善封裝能力;用空接 口(interface {})代替void *,提高類型系統能力等等。
Go對函數,方法,接口做了清晰的區分。
與Erlang類似,Go的函數作為第一公民。
函數可以讓我們將一個語句序列打包為一個單元,然後可以從程序中 其它地方多次調用。
函數和方法的區別是指有沒有接收器,而不像其他語言那樣是指有沒有返回值。
接口類型具體描述了一系列方法的集合,而空接口 interfac{}表示可以接收任意類型。
接口的這2中使用方式,用面對對象編程範式來類比的話,可以類比於subtypepolymorphism(子類型多態)和ad hoc polymorphism(非參數多態)。
從圖中示例可以看出,Go的goroutine就是一個函數,以及在堆上為其分配的一個堆棧。所以其系統開銷很小,可以輕鬆的創建上萬個goroutine,並且 它們並不是被作業系統所調度執行。
goroutine只能使用channel來發送給指定的goroutine請求來查詢更新變量。這也就是Go的口頭禪「不要使用共享 數據來通信,使用通信來共享數據」。channel支持容量限制和range迭代器。
Go/Python/Erlang語言詞法對比
TDD Go編程示例
本小節以TDD方式4次重構開發一個斐波那契算法的方式,來簡單展示Go的特性、語法和使用方式,如Go的單元測試技術,並發編程、匿名函數、閉包 等。 首先,看一下TDD最終形成的單元測試文件:
基於遞歸的實現方案:
測試結果:
基於goroutine實現的並發方案:
測試結果:
基於迭代的實現方案:
測試結果:
基於閉包的實現方案:
測試結果:
作者:陳彬