MySQL的COUNT語句,竟然都能被面試官虐的這麼慘!?

2021-02-20 Hollis

△Hollis, 一個對Coding有著獨特追求的人△

這是Hollis的第 232篇原創分享

作者 l Hollis

來源 l Hollis(ID:hollischuang)

資料庫查詢相信很多人都不陌生,所有經常有人調侃程式設計師就是CRUD專員,這所謂的CRUD指的就是資料庫的增刪改查。

在資料庫的增刪改查操作中,使用最頻繁的就是查詢操作。而在所有查詢操作中,統計數量操作更是經常被用到。

關於資料庫中行數統計,無論是MySQL還是Oracle,都有一個函數可以使用,那就是COUNT

但是,就是這個常用的COUNT函數,卻暗藏著很多玄機,尤其是在面試的時候,一不小心就會被虐。不信的話請嘗試回答下以下問題:

1、COUNT有幾種用法?

2、COUNT(欄位名)和COUNT(*)的查詢結果有什麼不同?

3、COUNT(1)和COUNT(*)之間有什麼不同?

4、COUNT(1)和COUNT(*)之間的效率哪個更高?

5、為什麼《阿里巴巴Java開發手冊》建議使用COUNT(*)

6、MySQL的MyISAM引擎對COUNT(*)做了哪些優化?

7、MySQL的InnoDB引擎對COUNT(*)做了哪些優化?

8、上面提到的MySQL對COUNT(*)做的優化,有一個關鍵的前提是什麼?

9、SELECT COUNT(*) 的時候,加不加where條件有差別嗎?

10、COUNT(*)、COUNT(1)和COUNT(欄位名)的執行過程是怎樣的?

以上10道題,如果您可以全部準確無誤的回答的話,那說明你真的很了解COUNT函數了,如果有哪些知識點是不了解的,那麼本文正好可以幫你答疑解惑。

關於COUNT函數,在MySQL官網中有詳細介紹:

簡單翻譯一下:

1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不為NULL的數量。結果是一個BIGINT值。

2、如果查詢結果沒有命中任何記錄,則返回0

3、但是,值得注意的是,COUNT(*) 的統計結果中,會包含值為NULL的行數。

即以下表記錄

create table 
insert 
insert 
insert 
insert 
insert 
insert 
insert 

使用語句count(*),count(id),count(id2)查詢結果如下:

select count(*),count(id),count(id2)
from 
results 7 3 2

除了COUNT(id)和COUNT(*)以外,還可以使用COUNT(常量)(如COUNT(1))來統計行數,那麼這三條SQL語句有什麼區別呢?到底哪種效率更高呢?為什麼《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代 COUNT(*)呢?



COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別

前面我們提到過COUNT(expr)用於做行數統計,統計的是expr不為NULL的行數,那麼COUNT(列名)、 COUNT(常量) 和 COUNT(*)這三種語法中,expr分別是列名、 常量 和 *。

那麼列名、 常量 和 *這三個條件中,常量 是一個固定值,肯定不為NULL。*可以理解為查詢整行,所以肯定也不為NULL,那麼就只有列名的查詢結果有可能是NULL了。

所以, COUNT(常量) 和 COUNT(*)表示的是直接查詢符合條件的資料庫表的行數。而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數。

除了查詢得到結果集有區別之外,COUNT(*)相比COUNT(常量) 和 COUNT(列名)來講,COUNT(*)是SQL92定義的標準統計行數的語法,因為他是標準語法,所以MySQL資料庫對他進行過很多優化。

SQL92,是資料庫的一個ANSI/ISO標準。它定義了一種語言(SQL)以及資料庫的行為(事務、隔離級別等)。


COUNT(*)的優化

前面提到了COUNT(*)是SQL92定義的標準統計行數的語法,所以MySQL資料庫對他進行過很多優化。那麼,具體都做過哪些事情呢?

這裡的介紹要區分不同的執行引擎。MySQL中比較常用的執行引擎就是InnoDB和MyISAM。

MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的COUNT(*)有關,那就是MyISAM不支持事務,MyISAM中的鎖是表級鎖;而InnoDB支持事務,並且支持行級鎖。

因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要串行進行,所以,MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT(*)進行查詢的時候,可以直接返回這個記錄下來的數值就可以了,當然,前提是不能有where條件。

MyISAM之所以可以把表中的總行數記錄下來供COUNT(*)查詢使用,那是因為MyISAM資料庫是表級鎖,不會有並發的資料庫行數修改,所以查詢得到的行數是準確的。

但是,對於InnoDB來說,就不能做這種緩存操作了,因為InnoDB支持事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被並發修改,那麼緩存記錄下來的總行數就不準確了。

但是,InnoDB還是針對COUNT(*)語句做了些優化的。

在InnoDB中,使用COUNT(*)查詢行數的時候,不可避免的要進行掃表了,那麼,就可以在掃表過程中下功夫來優化效率了。

從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT(*) FROM tbl_name語句,確實在掃表的過程中做了一些優化。前提是查詢語句中不包含WHERE或GROUP BY等條件。

我們知道,COUNT(*)的目的只是為了統計總行數,所以,他根本不關心自己查到的具體值,所以,他如果能夠在掃表的過程中,選擇一個成本較低的索引進行的話,那就可以大大節省時間。

我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。

所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表。所以,當我們建表的時候,除了主鍵索引以外,創建一個非主鍵索引還是有必要的。

至此,我們介紹完了MySQL資料庫對於COUNT(*)的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。


COUNT(*)和COUNT(1)

介紹完了COUNT(*),接下來看看COUNT(1),對於,這二者到底有沒有區別,網上的說法眾說紛紜。

有的說COUNT(*)執行時會轉換成COUNT(1),所以COUNT(1)少了轉換步驟,所以更快。

還有的說,因為MySQL針對COUNT(*)做了特殊優化,所以COUNT(*)更快。

那麼,到底哪種說法是對的呢?看下MySQL官方文檔是怎麼說的:

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點:same way , no performance difference。所以,對於COUNT(1)和COUNT(*),MySQL的優化是完全一樣的,根本不存在誰比誰快!

那既然COUNT(*)和COUNT(1)一樣,建議用哪個呢?

建議使用COUNT(*)!因為這個是SQL92定義的標準統計行數的語法,而且本文只是基於MySQL做了分析,關於Oracle中的這個問題,也是眾說紛紜的呢。


COUNT(欄位)

最後,就是我們一直還沒提到的COUNT(欄位),他的查詢就比較簡單粗暴了,就是進行全表掃描,然後判斷指定欄位的值是不是為NULL,不為NULL則累加。

相比COUNT(*),COUNT(欄位)多了一個步驟就是判斷所查詢的欄位是否為NULL,所以他的性能要比COUNT(*)慢。

總結

本文介紹了COUNT函數的用法,主要用於統計表行數。主要用法有COUNT(*)、COUNT(欄位)和COUNT(1)。

因為COUNT(*)是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT(*)查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然,這些優化的前提都是沒有進行where和group的條件查詢。

在InnoDB中COUNT(*)和COUNT(1)實現上沒有區別,而且效率一樣,但是COUNT(欄位)需要進行欄位的非NULL判斷,所以效率會低一些。

因為COUNT(*)是SQL92定義的標準統計行數的語法,並且效率高,所以請直接使用COUNT(*)查詢表的行數!

參考資料:

https://dev.mysql.com/doc/refman/8.0/en/group-by-functions.html#function_count 

《極客時間——MySQL實戰45講》

歡迎大家關注Java之道公眾號,也會定期發布原創的Java技術文章~

- MORE | 更多精彩文章 -


如果你喜歡本文,

請長按二維碼,關注 Hollis.

好文章,我在看❤️

相關焦點

  • 不就是 SELECT COUNT 語句嗎,竟然能被面試官虐的體無完膚
    關於資料庫中行數統計,無論是MySQL還是Oracle,都有一個函數可以使用,那就是COUNT。但是,就是這個常用的COUNT函數,卻暗藏著很多玄機,尤其是在面試的時候,一不小心就會被虐。不信的話請嘗試回答下以下問題:1、COUNT有幾種用法?2、COUNT(欄位名)和COUNT(*)的查詢結果有什麼不同?
  • 面試官:談談你對MySQL事務的認識?
    那麼重啟後,數據能夠根據redo log進行恢復,但是binlog沒記錄這個語句。那麼,我們在利用這個binlog恢復數據的時候,就會出現丟失數據的情形!mysql怎麼解決的?這裡考察的是mysql的內部XA事務!俗稱日誌的兩階段提交協議!也就是說,將事務提交分為了兩個階段,prepare階段和commit階段!
  • mysql大表中count()的用法以及mysql中count()的優化
    本篇文章給大家帶來的內容是關於mysql大表中count()的用法以及mysql中count()的優化,有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。一個單表中包含有6000w+的數據,然而你又不能拆分.需要分別統計表中有多少數據,A產品有多少,B產品有多少這幾個數據.
  • MySql面試題及答案大全
    隨著技術的進步和發展,面試官們對面試者的要求越來越高,現在只要是後端開發的職位,面試肯定會問資料庫的相關知識,而mysql作為目前最為流行的免費的關係型資料庫管理系統,肯定是很多公司面試必問的重點,今天阿偉就為大家總結一下mysql的面試題;
  • 面試官:MySQL表設計要注意什麼?
    引言這篇文章的很多問題,都是面試中實打實會問到的!比如OK,具體有下面這些問題其實上面這些問題,我最早想法是,每個問題都可以囉嗦出一篇文章。後來由於良心發現,煙哥就決定用一篇文章將這些問題都講明白。當然,我給的回答可能並非標準答案,畢竟是自己的一些工作總結。各位讀者有更好的回答,也歡迎交流!
  • mysql┃多個角度說明sql優化,讓你吊打面試官!
    sql優化,最近moon一直在寫關於mysql的文章,包括之前寫的索引相關,其實也都是為了這篇文章做個鋪墊,所以你懂了嗎,今天我將從表結構、索引、查詢語句、分庫分表這四個維度來和大家聊聊,在工作中,怎麼進行sql優化?
  • mysql批量語句,怎麼保證操作都成功?
    doesn't match value count at row.....欄位不匹配,但是,數據表第一條已經插入成功,只是第二條語句出錯了!$transaction->commit();} catch (Exception $e) { $transaction->rollBack(); }結果同樣出錯,錯誤信息和第一種情況一致,但是這次數據表一條記錄也沒有,不難理解,我們都知道,在一個事務中,多個操作,要麼都失敗,要麼都成功。
  • 學習MySQL的select語句
    select語句可 以用回車分隔$sql="select * from article where id=1"和  $sql="select * from article where id=1">都可以得到正確的結果,但有時分開寫或許能 更明了一點,特別是當sql語句比較長時。
  • 小王:MySQL count(1) 真的比 count(*) 快麼?
    來源公眾號:碼匠筆記MySQL count(1) 真的比 count(*) 快麼? 反正同事們都是這麼說的,我也姑且覺得對吧,那麼沒有自己研究一下究竟?如果我告訴你他們一樣,你信麼?在 MySQL 5.5 以後默認引擎切換為 InnoDB,InnoDB 因為增加了版本控制(MVCC)的原因,同時有多個事務訪問數據並且有更新操作的時候,每個事務需要維護自己的可見性,那麼每個事務查詢到的行數也是不同的,所以不能緩存具體的行數,他每次都需要 count 一下所有的行數。那麼 count(1) 和 count(*)有區別麼?
  • mysql中count(*)是最慢的嗎?
    count如何實現的:在mysql中,當數據表數據比較少的時候,使用count可以很快進行返回需要統計的數據行數,當數量比較大的時候,count的返回結果的速度就變慢的很多,出現這種情況時,使用的mysql存儲引擎大概率是InnoDB。因為在MyISAM引擎中,對每個表的總行數都會進行記錄,並存在磁碟上。
  • MySQL資料庫Insert語句7種寫法
    簡介很多開發人員工作了幾年之後,都會自嘲,自己啥技術都沒學到,就會CRUD,可是我要說的是,CRUD你真的都會嗎,你在MySQL資料庫中,會幾種insert語句寫法呢。在這裡我會7種寫法,下面我就來給大家分別介紹一下。
  • MySQL的SQL語句 - 數據操作語句(15)- UPDATE 語句
    [LIMIT row_count]value: {expr | DEFAULT}assignment: col_name = valueassignment_list: assignment [, assignment] ...
  • MySQL的SQL語句 - 資料庫管理語句 - 帳戶管理語句 - CREATE USER 語句(3)
    要這麼做,可以使用 WITH 子句指定一個或多個 resource_option 值。WITH 選項的順序無關緊要,但如果多次指定給定的資源限制,則最後一個實例優先。CREATE USER 允許以下這些 resource_option 值:● MAX_QUERIES_PER_HOUR count, MAX_UPDATES_PER_HOUR count, MAX_CONNECTIONS_PER_HOUR count對於語句指定的所有帳戶,這些選項限制在一小時內允許每個帳戶對伺服器進行多少查詢、更新和連接。如果 count 為0(默認值),則表示該帳戶沒有限制。
  • MySQL 優化案例 - select count-愛可生
    ,可以看到確實運行很慢,要 40 多秒左右,確實很不正常~mysql> select count(*) from api_runtime_log;++| count(*) |++| 5718952 |++1 row in set (42.95 sec)我們再去看下表結構,看上去貌似也挺正常的~存在主鍵,表引擎也是 InnoDB,字符集也沒問題。
  • MYSQL資料庫操作案例
    Enter password:******mysql> use RUNOOB;Database changedmysql>注意:所有的資料庫名,表名,表欄位都是區分大小寫的。多個 SELECT 語句會刪除重複的數據。
  • mysql常用sql語句總結
    > create table t9(-> id int not null default 0,-> name char(10) not null default ''-> );主鍵primary key 是能區分每一行的列。
  • MySQL中只會count(),sum()?累加運算沒聽過?
    這個統計sql還是花了我一小段時間的。mysql統計這個還是需要一定的技巧的。sql如下: select reg_time, count(user_id) daily_quantityfrom user_infogroup by reg_time通過上面的sql我們很容易得出以下列表:reg_timedaily_quantity2019-09-03
  • 月薪3W,面試官問:詳細聊聊MySQL中 聚簇、非聚簇索引和覆蓋索引
    千萬不要像下面這麼回答,這麼回答和脫褲子放P沒啥區別。答:索引就像書的目錄一樣,可以加快數據的檢索速度……,難道人家建立索引會不清楚這一點?其實面試官問你的是平衡樹,說白了就是B樹和B+樹,Hash這些數據結構。
  • mysql中count()太慢,我該怎麼辦
    中,count()實現原理,以及count()的各種使用方式,和他們之間的差異,以及執行效率的比較,看完之後,想必你不會在說,count(*)執行效率是最慢的了吧,經過mysql優化後的count(*)的執行效率和count(1)已經不相上下了,但是當表中的數據量很大的時候,無論何種形式的count(),執行的效率都會很低,畢竟需要逐行統計計數。
  • 面試被問:JDBC底層是如何連接資料庫的?|sql|mysql|數據源|java|...
    背景  前兩天一個小夥伴面試的時候,被問JDBC底層是如何連接資料庫的?  他頓時一臉懵逼,因為大部分人只知道JDBC的幾個步驟,至於底層到底是怎麼連接資料庫的,還真不知道。  由於小夥伴是面試高級開發,問這種問題倒也不能說面試官過分,如果是初級或者中級,那問著問題就確實有些過分了。