(點擊上方公眾號,可快速關注)
來源:十字螺絲釘
blog.chinaunix.net/uid-23284114-id-5775352.html
如有好文章投稿,請點擊 → 這裡了解詳情
同事諮詢MySQL MEMORY引擎的細節,能否滿足需求。沒有太多了解,這裡做個系統總結。
MEMORY存儲引擎創建的表數據只能保存在內存。
MySQL宕機、硬體故障或者意外掉電,都會造成MEMORY引擎表丟失數據。所以,MEMORY表中的數據來源於其他表(可落盤永久保存)用於只讀適用,或者用於臨時工作起到數據周轉。
MEMORY 存儲引擎特性
[a] Implemented in the server (via encryption functions). Data-at-rest tablespace encryption is available in MySQL 5.7 and later.
[b] Implemented in the server, rather than in the storage engine.
[c] Implemented in the server, rather than in the storage engine.
來源: https://dev.mysql.com/doc/refman/5.6/en/memory-storage-engine.html
何時使用MEMORY
性能特性
內存表受限於單線程執行和表級鎖引起的爭用。在負載增加時限制了可擴展性,特別是寫操作。
儘管內存表在內存中處理,在繁忙的服務網上,並不一定比InnoDB表更快,如一般查詢或者讀寫場景。特別是,多個會話執行update操作會造成性能低下。
根據不同的SQL查詢,需要創建內存表的默認hash索引(基於唯一鍵的單個值查詢),或者B-tree索引(等值查詢、不等值查詢或者範圍查詢)。
內存表的物理特性
每張內存表會在硬碟上創建一個文件,用於保存表結構(沒有數據)。文件名為以內存表名開始,.frm結尾。
特性
內存表的DDL操作
創建臨時表
CREATE TABLE t (i INT) ENGINE = MEMORY;
基於非內存表創建內存表,並將數據拉入到內存表中
mysql> CREATE TABLE test ENGINE=MEMORY
-> SELECT ip,SUM(downloads) AS down
-> FROM log_table GROUP BY ip;
mysql> SELECT COUNT(ip),AVG(down) FROM test;
mysql> DROP TABLE test;
內存表的最大受限於 max_heap_table_size 參數,默認為16MB。根據場景需自己調整該參數。
索引
MEMORY存儲引擎支持HASH和BTREE索引。
CREATE TABLE lookup
(id INT, INDEX USING HASH (id))
ENGINE = MEMORY;
CREATE TABLE lookup
(id INT, INDEX USING BTREE (id))
ENGINE = MEMORY;
每張內存表可創建64個索引,每個索引最大支持16個列,一個key的長度最大值為3072bytes。
如果一個內存表hash索引的鍵值有很高的重複度,更新鍵值、刪除操作速度都會顯著降低。這種速度下降的程度與鍵值重複度成正比。您可以使用BTREE索引來規避這個問題。
內存表可以有非唯一鍵(這是hash索引不常用的功能)。
索引列中可包含NULL值。
加載數據
MySQL啟動時,加入--init-file選項,將下列命令加入到這個文件中,保證啟動後內存表中有數據。
INSERT INTO ... SELECT
LOAD DATA INFILE
內存表和複製(Replication)
伺服器重啟會導致內存表數據丟失。如果是主庫,從庫沒有意識到主庫表中數據已被情況,所以在從庫你看到的是過期數據。
重啟後,主從庫如何同步內存表數據?
當主庫使用內存表,主庫啟動後,一條DELETE語句會寫入到主庫的binary log中,從庫接到命令後清空內存表。
主庫重啟期間,從庫還是有讀取到過期數據的情況。為了避免這種情況,主庫啟動時加入--init-file參數,這樣主庫啟動自動將數據加載到內存表中。(官方文檔寫的不嚴謹,我認為僅限於內存表只讀場景。如果不是只讀,即使加入--init-file參數也無法保證主庫內存表數據一致)。
管理內存使用情況
伺服器必須有足夠內存,來滿足多張內存表的使用。
如果從內存表中刪除單獨的行,並不會回收內存。當整個內存表刪除時,才回收內存。同一張內存表,之前刪除行佔用的空間,會被新的行復用。執行DELETE、TRUNCATE TABLE來釋放內存表佔用空間,如果表不在使用可使用DROP TABLE命令。釋放正在使用的內存表佔用的內存,可以使用 ALTER TABLE XX ENGINE=MEMORY 強制重建表。
內存表1行記錄佔用內存計算公式
SUM_OVER_ALL_BTREE_KEYS(max_length_of_key + sizeof(char*) * 4)
+ SUM_OVER_ALL_HASH_KEYS(sizeof(char*) * 2)
+ ALIGN(length_of_row+1, sizeof(char*))
ALIGN()表示一個round-up因子,其會導致行長度等於char指針大小的精確倍數。sizeof(char*)在32位機器上是4,64位則為8。
前面提到, max_heap_table_size 系統變量決定了內存表的最大尺寸。在創建內存之前,可設置該變量控制每個內存表的最大尺寸。(不建議修改全局 max_heap_table_size 的大小,否則所有會話的內存表最大尺寸都為該值 )。
下面的例子創建了2個內存表,最大尺寸為1M和2M
mysql> SET max_heap_table_size = 1024*1024;
Query OK, 0 rows affected (0.00 sec)
mysql> CREATE TABLE t1 (id INT, UNIQUE(id)) ENGINE = MEMORY;
Query OK, 0 rows affected (0.01 sec)
mysql> SET max_heap_table_size = 1024*1024*2;
Query OK, 0 rows affected (0.00 sec)
mysql> CREATE TABLE t2 (id INT, UNIQUE(id)) ENGINE = MEMORY;
Query OK, 0 rows affected (0.00 sec)
伺服器重啟後,每個表的尺寸都變成了全局 max_heap_table_size 變量的值大小。
壓測結果
通過sysbench壓測,InnoDB 寫性能完爆MEMORY引擎,MEMORY的讀性能略高於InnoDB。InnoDB的綜合性能更好,足夠滿足日常使用。考慮到MEMORY引擎的雷點太多,建議不使用MEMORY引擎。
看完本文有收穫?請轉發分享給更多人
關注「資料庫開發」,提升 DB 技能