文章詳情頁(yè)

MySQL Group by的優(yōu)化詳解

瀏覽：62日期：2023-10-05 09:58:31

一個(gè)標(biāo)準(zhǔn)的 Group by 語(yǔ)句包含排序、分組、聚合函數(shù)，比如 select a,count(*) from t group by a ; 這個(gè)語(yǔ)句默認(rèn)使用 a 進(jìn)行排序。如果 a 列沒(méi)有索引，那么就會(huì)創(chuàng)建臨時(shí)表來(lái)統(tǒng)計(jì) a和 count(*)，然后再通過(guò) sort_buffer 按 a 進(jìn)行排序。

標(biāo)準(zhǔn)的執(zhí)行流程

結(jié)構(gòu)：

create table t1(id int primary key, a int, b int, index(a));delimiter ;;create procedure idata()begin declare i int; set i=1; while(i<=1000)do insert into t1 values(i, i, i); set i=i+1; end while;end;;delimiter ;call idata();

函數(shù)就是向 t1 中插入1000條語(yǔ)句，從(1,1,1) 到(1000,1000,1000)。

執(zhí)行 select id%10 as m, count(*) as c from t1 group by m;

解析：

MySQL Group by的優(yōu)化詳解

Using index，表示這個(gè)語(yǔ)句使用了覆蓋索引，選擇了索引 a，不需要回表；Using temporary，表示使用了臨時(shí)表；Using filesort，表示需要排序。

過(guò)程：

1、創(chuàng)建內(nèi)存臨時(shí)表，表里有兩個(gè)字段 m 和 c，主鍵是 m；2、掃描表 t1 的索引 a，依次取出葉子節(jié)點(diǎn)上的 id 值，計(jì)算 id%10 的結(jié)果，記為 x；1）如果臨時(shí)表中沒(méi)有主鍵為 x 的行，就插入一個(gè)記錄 (x,1);2）如果表中有主鍵為 x 的行，就將 x 這一行的 c 值加 1；

第2 步如果發(fā)現(xiàn)內(nèi)存臨時(shí)表存儲(chǔ)的總字段長(zhǎng)度到達(dá)參數(shù) tmp_table_size 設(shè)置的大小，那么就會(huì)將內(nèi)存臨時(shí)表升級(jí)為磁盤(pán)臨時(shí)表，然后重新開(kāi)始遍歷計(jì)算。3、遍歷完成后，再根據(jù)字段 m 做排序，得到結(jié)果集返回給客戶(hù)端。

MySQL Group by的優(yōu)化詳解

最后的排序就是下圖虛線框中的操作，如果 sort_buffer 設(shè)置的大小不夠大，那么就會(huì)使用臨時(shí)表來(lái)輔助排序。

MySQL Group by的優(yōu)化詳解

優(yōu)化

未優(yōu)化（也就是分組列沒(méi)有索引）的 group by 的總過(guò)程可以概括為：因?yàn)閿?shù)據(jù)是無(wú)序的，所以需要?jiǎng)?chuàng)建臨時(shí)表，然后一個(gè)一個(gè)判斷屬于哪個(gè)分組，最后再根據(jù)分組列進(jìn)行排序。所以，優(yōu)化可以有兩個(gè)思路：

去掉排序

在明確返回的數(shù)據(jù)不需要排序的情況下，可以禁止排序，也就是將上面的語(yǔ)句改成 select a,count(*) from t group by a order by null。

順序排列

如果記錄都按照排序字段排序，那么數(shù)據(jù)就變成了下面的結(jié)構(gòu)：

MySQL Group by的優(yōu)化詳解

這樣在實(shí)際獲取要返回的字段或計(jì)算聚合函數(shù)時(shí)，只需要按順序依次訪問(wèn)，等到列值變成下一個(gè)就知道當(dāng)前組訪問(wèn)結(jié)束，將之前統(tǒng)計(jì)的數(shù)據(jù)直接返回。這樣就避免了創(chuàng)建臨時(shí)表，同時(shí)排序也不需要使用 sort_buffer 進(jìn)行額外排序。這樣就極大地提高了執(zhí)行的效率。

實(shí)現(xiàn)

1、如果分組字段適合創(chuàng)建索引就直接為分組字段創(chuàng)建索引。

MySQL 5.7 版本支持了 generated column 機(jī)制，用來(lái)實(shí)現(xiàn)列數(shù)據(jù)的關(guān)聯(lián)更新。你可以用下面的方法創(chuàng)建一個(gè)列 z，然后在 z 列上創(chuàng)建一個(gè)索引（如果是 MySQL 5.6 及之前的版本，你也可以創(chuàng)建普通列和索引，來(lái)解決這個(gè)問(wèn)題）

alter table t1 add column z int generated always as(id % 100), add index(z);

然后解析：

MySQL Group by的優(yōu)化詳解

這時(shí)沒(méi)有用到臨時(shí)表和額外排序，所以性能提升。

2、如果分組字段不適合（使用率很低），那么可以使用 SQL_BIG_RESULT 來(lái)嘗試優(yōu)化。

在 group by 語(yǔ)句中加入 SQL_BIG_RESULT 這個(gè)提示（hint），就可以告訴優(yōu)化器：這個(gè)語(yǔ)句涉及的數(shù)據(jù)量很大，請(qǐng)直接用磁盤(pán)臨時(shí)表。MySQL 的優(yōu)化器一看，磁盤(pán)臨時(shí)表是 B+ 樹(shù)存儲(chǔ)，存儲(chǔ)效率不如數(shù)組來(lái)得高。所以，既然使用SQL_BIG_RESULT來(lái)說(shuō)明數(shù)據(jù)量很大，那從磁盤(pán)空間考慮，還是直接用數(shù)組來(lái)存吧。所以在使用 SQL_BIG_RESULT 后優(yōu)化器會(huì)使用數(shù)組結(jié)構(gòu)的磁盤(pán)臨時(shí)表。

但是如果在未達(dá)到磁盤(pán)臨時(shí)表的使用條件是不會(huì)使用磁盤(pán)臨時(shí)表的，也就是在 sort_buffer 空間能夠存儲(chǔ)要返回和排序的總字段長(zhǎng)度時(shí)，就使用數(shù)組結(jié)構(gòu)的 sort_buffer ，如果總字段超過(guò) sort_buffer 大小，那么就再加上數(shù)組結(jié)構(gòu)的磁盤(pán)臨時(shí)表來(lái)幫助排序。

那么在 sort_buffer 空間足夠的情況下， sort_buffer 內(nèi)部就會(huì)對(duì)數(shù)據(jù)進(jìn)行排序，這樣也就起到了索引的作用，

還是以上面的例子來(lái)看，使用 SQL_BIG_RESULT

alter table t1 add column z int generated always as(id % 100), add index(z);

具體過(guò)程如下：

1、初始化 sort_buffer，確定放入一個(gè)整型字段，記為 m；2、掃描表 t1 的索引 a，依次取出里面的 id 值, 將 id%10 的值存入 sort_buffer 中；3、掃描完成后，對(duì) sort_buffer 的字段 m 做排序（如果 sort_buffer 內(nèi)存不夠用，就會(huì)利用磁盤(pán)臨時(shí)文件輔助排序）；4、排序完成后，就得到了一個(gè)有序數(shù)組。

MySQL Group by的優(yōu)化詳解

解析：

MySQL Group by的優(yōu)化詳解

可以看到此時(shí)就沒(méi)有使用臨時(shí)表了，而是直接使用 sort_buffer 進(jìn)行排序，這樣就省去了使用臨時(shí)表帶來(lái)的性能消耗。

總結(jié)

1、如果對(duì) group by 語(yǔ)句的結(jié)果沒(méi)有排序要求，要在語(yǔ)句后面加 order by null；那么一般情況就不需要使用臨時(shí)表了（上面兩個(gè)優(yōu)化都是在要求排序的前提下提出的優(yōu)化方式）2、盡量讓 group by 過(guò)程用上表的索引，確認(rèn)方法是 explain 結(jié)果里沒(méi)有 Using temporary 和 Using filesort；3、如果 group by 需要統(tǒng)計(jì)的數(shù)據(jù)量不大，盡量只使用內(nèi)存臨時(shí)表；也可以通過(guò)適當(dāng)調(diào)大 tmp_table_size 參數(shù)，來(lái)避免用到磁盤(pán)臨時(shí)表；4、如果數(shù)據(jù)量實(shí)在太大，使用 SQL_BIG_RESULT 這個(gè)提示，來(lái)告訴優(yōu)化器直接使用排序算法得到 group by 的結(jié)果。

以上就是詳解MySQL Group by 優(yōu)化的詳細(xì)內(nèi)容，更多關(guān)于MySQL Group by 優(yōu)化的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

上一條：Mysql 索引該如何設(shè)計(jì)與優(yōu)化下一條：詳解MySQL kill 指令的執(zhí)行原理

相關(guān)文章：

1. 一文帶你了解MySQL的左連接與右連接2. Sql server數(shù)據(jù)庫(kù)開(kāi)發(fā)常用匯總3. 關(guān)于Oracle數(shù)據(jù)庫(kù)熱備份腳本深入剖析4. ORACLE中如何實(shí)現(xiàn)ASCII字符串和16進(jìn)制串互相轉(zhuǎn)換5. Access數(shù)據(jù)庫(kù)安全的幾個(gè)問(wèn)題6. Oracle的PDB數(shù)據(jù)庫(kù)創(chuàng)建DIRECTORY時(shí)遇到ORA-65254問(wèn)題及解決方法7. MySQL 的啟動(dòng)選項(xiàng)和系統(tǒng)變量實(shí)例詳解8. 如何遠(yuǎn)程調(diào)用ACCESS數(shù)據(jù)庫(kù)9. MySQL雙主（主主）架構(gòu)配置方案10. mysql-bin.000001文件的來(lái)源及處理方法

排行榜

					
					一文帶你了解MySQL的左連接與右連接
Sql server數(shù)據(jù)庫(kù)開(kāi)發(fā)常用匯總
Access數(shù)據(jù)庫(kù)安全的幾個(gè)問(wèn)題
ORACLE中如何實(shí)現(xiàn)ASCII字符串和16進(jìn)制串互相轉(zhuǎn)換
關(guān)于Oracle數(shù)據(jù)庫(kù)熱備份腳本深入剖析
mysql-bin.000001文件的來(lái)源及處理方法
如何遠(yuǎn)程調(diào)用ACCESS數(shù)據(jù)庫(kù)
MySQL存儲(chǔ)過(guò)程例子（包含事務(wù)、參數(shù)、嵌套調(diào)用、游標(biāo)循環(huán)等）
MySQL雙主（主主）架構(gòu)配置方案
Oracle的PDB數(shù)據(jù)庫(kù)創(chuàng)建DIRECTORY時(shí)遇到ORA-65254問(wèn)題及解決方法
MySQL 的啟動(dòng)選項(xiàng)和系統(tǒng)變量實(shí)例詳解
				

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

MySQL Group by的優(yōu)化詳解