mysql怎么顯示結果窗口_mysql8中窗口函數

在以前的MySQL版本中是沒有窗口函數的,直到MySQL8.0才引入了窗口函數。窗口函數是對查詢中的每一條記錄執行一個計算,并且這個計算結果是用與該條記錄相關的多條記錄得到的。

1.窗口函數與聚合函數

窗口函數與聚合函數很像,他們都是在一組記錄而不是整張表上執行的。但是,一個聚合函數在一組記錄執行后只返回一條結果而窗口函卻會對改分組內的每行記錄都返回一個結果。

2.常見的窗口函數

MySQL8.0中定義的窗口函數主要有以下幾種:

函數名

參數

描述

cume_dist()

累計分布值。即分組值小于等于當前值的行數與分組總行數的比值。取值范圍為(0,1]。

dense_rank()

不間斷的組內排序。使用這個函數時,可以出現1,1,2,2這種形式的分組。

first_value()

是;first_value(expr)

返回分組內截止當前行的第一個值。

lag()

是;lag(expr,[N,[default]])

從當前行開始往前取第N行,如果N缺失默認為1。若沒有沒有,則默認返回default。default默認值為NULL

last_value()

是;last_value(expr)

返回分組內截止當前行的最后一個值。

lead()

是;lead(expr,[N,[default]])

從當前行開始往后取第N行。函數功能與lag()相反,其余與lag()相同。

nth_value()

是;nth_value(expr,N)

返回分組內截止當前行的第N行。first_value\last_value\nth_value函數功能相似,只是返回分組內截止當前行的不同行號的數據。

ntile()

是;ntile(N)

返回當前行在分組內的分桶號。在計算時要先將改分組內的所有數據劃分成N個桶,之后返回每個記錄所在的分桶號。返回范圍從1到N

percent_rank()

累計百分比。該函數的計算結果為:小于該條記錄值的所有記錄的行數/該分組的總行數-1. 所以改記錄的返回值為[0,1]

rank()

間斷的組內排序。其排序結果可能出現如下結果:1,1,3,4,4,6

row_number()

當前行在其分組內的序號。不管其排序結果中是否出現重復值,其排序結果都為:1,2,3,4,5

注:‘參數’列說明該函數是否可以加參數。“否”說明該函數的括號內不可以加參數。expr即可以代表字段,也可以代表在字段上的計算,比如sum(col)等。以下相同。

3. over子句

over子句可以指定如何將記錄劃分分區以供窗口函數處理。如果over()為空,則是將整個查詢記錄作為一個分組。如果over子句不為空,則其可以指定查詢記錄劃分分組的方式以及記錄在分組內部的排序方式。除此之外,over子句也可以和聚合函數一起用。如果聚合函數后出現over子句,那么這些聚合函數也就變成了窗口函數。如果沒有over子句,則他們仍然是聚合函數。可以使用over子句的聚合函數主要有以下幾種:

avg()、bit_and()、bit_or()、bit_xor()、count()、max()、min()、stddev_pop()、stddev()、std()、stddev_samp()、sum()、var_pop()、variance()、var_samp()

而對于前一部分中介紹的窗口函數來說,over()子句是強制必須要有的。

over子句中常見的語法形式為:

over_clause:

{OVER (window_spec) | OVER?window_name}

其中:

window_spec:

[window_name] [partition_clause] [order_clause] [frame_clause]

window_name: 是指在查詢語句定義的window子句。如果遇到group by、having子句order by子句,那么window子句要放到having子句和order by子句中間。其語法如下:

WINDOW?window_name?AS (window_spec)

[,?window_name?AS (window_spec)] ...

window_spec:

[window_name] [partition_clause] [order_clause] [frame_clause]

從語法結構可以看出來window子句其實只是把放在over()括號中的內容單獨抽出來。

partition_clause:即parittion by expr子句。用來指定記錄分組方式。語法中的expr不僅可以是字段本身,也可以是計算表達式。比如,記錄中有個timestramp類型的字段 ts,在MySQL中,partition by ts 和partition by hour(ts)都是有效的。

order_clause: 即?order by expr desc|asc,expr desc|asc。 用來指定分組內的排序方式。

frame_clause: 用來指定當前分組中的子集劃分方式。frame可以在依據當前行的位置在每個分組內移動。使用frame來計算流水流水總和(從分區開始到當前行)及滾動平均(rolling averages)。

其語法結構如下:

frame_clause:

frame_units?frame_extent

frame_units:

{ROWS | RANGE}

frame_extent:

{frame_start?|?frame_between}

frame_between:

BETWEEN?frame_start?AND?frame_end

frame_start,?frame_end:

{ CURRENT ROW

| UNBOUNDED PRECEDING

| UNBOUNDED FOLLOWING

|expr?PRECEDING

|?expr?FOLLOWING

}

其中:

frame_units用來指示當前行和frame的關系

ROWS: 用來定義frame的開始行和結束行(偏移量依據的是位置);RANGE: 定義frame的區間。(偏移量的基準為當前行的值)

frame_entent用來指示frame的開始行和結束行。一種是通過指定start和end(frame_start,frame_end。frame_end可以不指定,沒有明確給出的話當前行默認為結束行),另一種使用between(frame_between)。frame_between的語法很簡單。下面來看frame_start和frame_end。

current row:和rows一起用時,邊界就是當前行。和range一起用時,邊界是當前行的對等點(個人理解,這里所說的對等點應為與當前行的值相等的所有記錄)。

unbounded precceding:使用它時,每個分區的第一行即為邊界。

unbounded following:使用它時,每個分區的第一行即為邊界。

expr preceding\expr following: 可以由expr個性化的設置向上(preceding)向下(following)的偏移量。

4.代碼示例

表結構如下:

2344dbe5457d1998e06b7dd20f4039bb.png

4.1 row_number\dense_rank\?rank

select order_date,sum(quantity) as quantity,

rank()over(ORDER BY sum(quantity) desc) as rank_result,

dense_rank()over(ORDER BY sum(quantity) desc) as dense_result,

row_number()over(ORDER BY sum(quantity) desc) as row_result

from spm_order

group by order_date

-- 限定一部分數據,沒有實際意義,能展示出這三個函數的區別就可以了

having quantity>=98

order by quantity desc

運行結果如下:

0461da96c45bc45e941655e71df33513.png

從上面結果看出:

rank()函數一旦遇到重復值,序號會斷。比如2個7之后下個出現的序號是9。

dense_rank()函數中即使有重復值,但是序號是連續的。2個7之后下個出現的序號是8。

row_number()不會出現相同的序號。

4.2 cume_dist\percent_rank

select order_date,num,

cume_dist()over(order by num asc) as cume_result,

percent_rank()over(order by num asc) as percent_result

from (select order_date,count(1) as num

from spm_order

group by order_date

having num>=27)a

order by num asc

代碼運行結果如下

c299229fb35f1e2e3335a5aba1626958.png

分析如下:

cume_dist():首先總的記錄有10條。當num=27時,num小于等于27的值共有5個,所以其cume_dist()值為0.5;當num=28時,小于等于28的值共有7個,所以cume_dist()值為0.7; 以此類推。

percent_rank().當num=27時,num小于27的記錄數為0,所以percent_rank()為0;當num=28時,num<28的記錄數共有5個,所以percent_rank()的值為5/9; 而當num=29時,其cume_dist()=7/9;以此類推,直到最大值36對應的值為1.

這兩個函數的作用有點像計算中位數。

4.3 first_value\last_value\nth_value

select sales_name,year_date,num,

first_value(num)over(PARTITION by sales_name order by year_date asc) as first_result,

last_value(num)over(PARTITION by sales_name order by year_date asc) as last_result,

nth_value(num,2)over(PARTITION by sales_name order by year_date asc) as nth_result

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('楊健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代碼運行結果如下(要注意,這三個函數計算結果都是截止當前行)

7af70ece6dfe0ea660d3cc52b049c777.png

4.4 ntile()

select sales_name,year_date,num,

ntile(8)over(order by num asc) as n_bin

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('楊健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代碼運行結果如下:

d3b14a7cbf8683481b08412600821ad8.png

從結果上進行分析:

首先,分桶號從1到N,都會出現;

其次,關于每個桶應該有多少條記錄。可以假設有N個桶,m個球(球數為總記錄數),標號從1到N,依次往1號桶到N號桶里投球,每次只投1個球。循環往復,直到m個球全都投入到N個桶中。最后每個桶里有多少球,現在每個桶里就有多少條記錄。

4.5 lag\lead

select sales_name,year_date,num,

lag(num,2)over(PARTITION by sales_name order by year_date asc) as lag_result,

lead(num,2)over(PARTITION BY sales_name order by year_date asc) as lead_result

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('楊健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代碼運行結果如下:

e6787af63a0b5bbbcc54b4a806c8251f.png

注意,lag()和lead()函數中出現的字段可以與over()子句中order by中出現的字段不一致。在代碼lag(num,2)中2代表的想要取數的那一行相比當前行的偏移量(lead中也類似)。

4.6 聚合函數

select sales_name,year_date,num,

sum(num)over(PARTITION by sales_name) as sum_order,

avg(num)over(PARTITION by sales_name) as mean_order

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('楊健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代碼運行結果如下:

a97530c92d379eab0b03420f7287e5c0.png

4.7 order by子句

select sales_name,year_date,num,

sum(num)over(partition by sales_name) as count_1,

count(num)over(partition by sales_name order by num) as count_2

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('楊健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代碼運行結果如下:

32adac98012d9867bc8e855353deb52e.png

當frame_clause不存在的時候,默認的frame與order by子句是否存在有關:

如果有order by子句,則默認的frame是從當前分區第一行到當前行。即在此種情況下,默認的frame為 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW

如果沒有order by子句,則默認的frame是指該分區。如果此時也沒有partition by子句,則相當于全部數據。

4.8?window子句

select sales_name,year(order_date) as year_1,count(1) as num,

sum(count(1)) over w as sales_order,

sum(count(1)) over (w_1) as year_order,

rank()over(w order by count(1) desc) as rank_order

-- 三種寫法都是符合語法規范的

from spm_order

where sales_name in ('楊健','楚杰','洪光')

group by sales_name,year(order_date)

window w as (PARTITION by sales_name),

w_1 as (PARTITION by year(order_date))

order by sales_order

代碼運行結果如下:

80cb1cb529576c3778ffb1493497ea19.png

4.9?rows和range

rows和range是不能單獨使用的,但是因為實在不理解這兩個用法上的區別,所以就進行了單獨的驗證。

select sales_name,month_1,rn_1,num,

sum(num)over(order by month_1 rows between 2 preceding and 1 preceding) as month_row,

sum(num)over(order by month_1 range between 2 preceding and 1 preceding) as month_range,

sum(num)over(order by rn_1 range between 2 preceding and 1 preceding) as rn_range

from (SELECT sales_name,month(order_date) as month_1,count(1) as num,

-- 由于rank()over()返回的是unsigned,當相減結果為負時(between子句會用到減法)會報錯,所以這里轉成signed類型

cast(rank()over(order by month(order_date)) as signed) as rn_1

from spm_order

where sales_name in ('洪光','范彩')

group by sales_name,month(order_date))a

order by month_1 asc

代碼運行結果如下:

e650743b9f7645045b96c25fdea9c0da.png

對以上代碼分析:

首先,在這里我新建了一個rn_1列。rn_1列和month_1的區別在于,month_1的數據是連續的,而rn_1列是有中斷的(兩個1之后出現的是3,我是故意要創建一個中斷的序列,來分析一下range的作用范圍)

先來看month_row的區別,month_row列的計算結果為當前行在分區中按month_1升序排序之后排在其前面的兩行(between and限定的)的sum求和值。所以rows后面的between and限定的偏移量是基于他們在分區中的排列位置的。

再來看month_range,通過分析其實驗結果可以發現,month_range列的計算為分區內month_1=當前行-1和month_1=當前行-2(-1,-2是由between an子句決定的。preceding代表負,following代表正)所有列的sum求和值。再來看rn_range, rn_range列的計算結果為分區內month_1=當前行-2的所有里列的sum求和值。所以,rang后面的between and限定的偏移量依據的是當前行的數值。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/532086.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/532086.shtml
英文地址,請注明出處:http://en.pswp.cn/news/532086.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python控制臺輸入字符串作為參數_Python-如何將字符串傳遞到subprocess.Popen(使用stdin參數)?...

小編典典Popen.communicate() 說明文件&#xff1a;請注意&#xff0c;如果要將數據發送到進程的stdin&#xff0c;則需要使用stdin PIPE創建Popen對象。同樣&#xff0c;要在結果元組中獲得除None以外的任何內容&#xff0c;你還需要提供stdout PIPE和/或stderr PIPE。替換…

log4jdbc mysql_[簡單]log4jdbc-log4j2配置簡記_MySQL

log4jdbc-log4j2&#xff0c;就不多說了&#xff0c;不了解的可以谷歌&#xff0c;附上log4jdbc-log4j2的官方鏈接&#xff1a;https://code.google.com/p/log4jdbc-log4j2/ &#xff0c;上面有非常詳細的介紹。簡單的貼下配置文件&#xff0c;其他的見附件&#xff1a;databas…

vb實時錯誤6 溢出_java內存溢出系列(6): Out of swap space?

本文是java內存溢出系列第6小篇。JVM啟動參數指定了最大內存限制。如 -Xmx 以及相關的其他啟動參數. 假若JVM使用的內存總量超過可用的物理內存, 操作系統就會用到虛擬內存。錯誤信息 java.lang.OutOfMemoryError: Out of swap space? 表明, 交換空間(swap space,虛擬內存) 不…

java備份還原mysql數據庫_Java備份還原Mysql數據庫

///實體類package com.ews.util;/*** 系統備份展示對象** */public class DataFile {private String fileName;//備份文件的名稱private String fileDate;//備份文件的日期private String filePath;//備份文件的地址private String fileSize;//備份文件的大小public String get…

學pyqt5之前需要學python嗎_快速學習pyqt5(1)--入門

學習于&#xff1a;PyQt5圖形界面編程 想要系統學習的同學建議可以去這個專欄好好學習&#xff0c;沒有任何語言基礎和計算機基礎的也建議直接去看那個專欄。我這里是有java基礎了&#xff0c;所以就不重復&#xff0c;針對快速學習使用。學習這個的目的是完成學校的SIT項目&am…

reboot mysql fail_mysql 5.7.18,在系統重啟后,為什么無法啟動?

度娘也不給力&#xff0c;只好自己研究了。先把結論寫出來吧。把pid文件換個位置&#xff0c;就好了。問題是&#xff0c; mysqld.servce的文件是從mysql的安裝目錄拷貝的&#xff0c;導致沒有懷疑pid文件位置的問題。一開始還懷疑是不是自己在一些文件里拼寫有誤。后來&#x…

mysql 查看鎖_別吵吵,分布式鎖也是鎖

Tomcat是這個系統的核心組成部分&#xff0c; 每當有用戶請求過來&#xff0c;Tomcat就會從線程池里找個線程來處理&#xff0c;有的執行登錄&#xff0c;有的查看購物車&#xff0c;有的下訂單&#xff0c;看著屬下們盡心盡職地工作&#xff0c;完成人類的請求&#xff0c;Tom…

php解析js的 arraybuffer_JS的所謂的第七種數據類型Symbol

首先&#xff0c;為什么說叫所謂呢&#xff1f;因為在2007年之前Js給予我們typeof解析數據類型的一共有六種(一直有爭議&#xff0c;但是我們暫時就按typeof來算)functionNumberObjectbooleanStringundefined但當我們去 typeof Symbol () 的時候&#xff0c;會驚奇的發現&#…

JAVA MYSQL從數據庫中提取圖片_java web將圖片存到儲數據庫和從數據庫中讀取圖片...

(Notice&#xff1a;以下所有經驗也是我根據網上的經驗整理的&#xff0c;如有侵權可以聯系我刪除&#xff0c;Wx:IT_Ezra&#xff0c;QQ 654303408。 有問題討論也可聯系我&#xff0c;QQ同上。)一、分析一下基本流程從前臺頁面獲取圖片&#xff0c;后臺接收圖片文件轉化成數據…

Ubuntu系統如何安裝和卸載CUDA和CUDNN

背景 最近在學習PaddlePaddle在各個顯卡驅動版本的安裝和使用&#xff0c;所以同時也學習如何在Ubuntu安裝和卸載CUDA和CUDNN&#xff0c;在學習過程中&#xff0c;順便記錄學習過程。在供大家學習的同時&#xff0c;也在加強自己的記憶。本文章以卸載CUDA 8.0 和 CUDNN 7.05 …

session.merge 緩存不更新_如何保證緩存與數據庫雙寫時的數據一致性?

在做系統優化時&#xff0c;想到了將數據進行分級存儲的思路。因為在系統中會存在一些數據&#xff0c;有些數據的實時性要求不高&#xff0c;比如一些配置信息。基本上配置了很久才會變一次。而有一些數據實時性要求非常高&#xff0c;比如訂單和流水的數據。所以這里根據數據…

java替換圖片中文字_Java 添加、替換、刪除Word中的圖片

文檔中&#xff0c;可以通過圖文混排的方式來增加內容的可讀性&#xff0c;相比純文本文檔&#xff0c;在內容展現方式上也更具美觀性。在給文檔添加圖片時&#xff0c;可設置圖片的文本環繞方式、旋轉角度、圖片高度/寬度等&#xff1b;另外&#xff0c;也可對文檔中已有的圖片…

kafka如何保證不重復消費又不丟失數據_Kafka寫入的數據如何保證不丟失?

我們暫且不考慮寫磁盤的具體過程&#xff0c;先大致看看下面的圖&#xff0c;這代表了 Kafka 的核心架構原理。Kafka 分布式存儲架構那么現在問題來了&#xff0c;如果每天產生幾十 TB 的數據&#xff0c;難道都寫一臺機器的磁盤上嗎?這明顯是不靠譜的啊!所以說&#xff0c;這…

不允許輸入特殊字符的正則表達式_JavaScript正則表達式常用技巧

正則表達式是用于匹配字符串中字符組合的模式。在 JavaScript 中&#xff0c;正則表達式也是對象。這些模式被用于 RegExp 的 exec 和 test 方法, 以及 String 的 match、matchAll、replace、search 和 split 方法。正則表達式的掌握程度能粗略地看出程序員的技術底子&#xff…

latex 算法_GitHub項目awesome-latex-drawing新增內容(四):繪制貝葉斯網絡

近期&#xff0c;我們整理和開源了一個基于LaTeX的科技繪圖項目&#xff0c;并將其取名為awesome-latex-drawing&#xff08;GitHub網址為&#xff1a;https://github.com/xinychen/awesome-latex-drawing&#xff09;&#xff0c;案例包括貝葉斯網絡、圖模型、矩陣/張量示意圖…

python123動物重量排序_python進階

面向對象oopclass Student(object):def __init__(self,name,score)self.name nameself.score scoredef print_score(self)print(%s: %s % (self.name,self.score))給對象發消息實際上就是調用對象對應的關聯函數&#xff0c;我們稱之為對象的方法(Method)。面向對象的程序寫出…

mysql中的生日應該是什么類型_MySQL中的定點數類型

上一篇文章我們嘮叨了浮點數&#xff0c;知道了浮點數存儲小數是不精確的。本篇繼續嘮叨一下MySQL中的另一種存儲小數的方式 —— 定點數。浮點數文章閃現&#xff1a;什么, 0.3 - 0.2 ≠ 0.1 ? 什么鬼定點數類型正因為用浮點數表示小數可能會有不精確的情況&#xff0c;在一些…

python怎么制作圖像_python數字圖像處理(5):圖像的繪制

實際上前面我們就已經用到了圖像的繪制&#xff0c;如&#xff1a;io.imshow(img)這一行代碼的實質是利用matplotlib包對圖片進行繪制&#xff0c;繪制成功后&#xff0c;返回一個matplotlib類型的數據。因此&#xff0c;我們也可以這樣寫&#xff1a;importmatplotlib.pyplot …

axios代理跨域 cli4_vuecli 3.0之跨域請求代理配置及axios路徑配置 莫小龍

vue-cli 3.0之跨域請求代理配置及axios路徑配置問題&#xff1a;在前后端分離的跨域請求中&#xff0c;報跨域問題配置&#xff1a;vue.config.js&#xff1a;module.exports {runtimeCompiler: true,publicPath: /, // 設置打包文件相對路徑devServer: {// open: process.pla…

string轉為char數組_StringBuilder的區別是什么?String是不可變?一點課堂(多岸學院)...

String和StringBuffer、StringBuilder的區別可變性簡單的來說&#xff1a;String 類中使用 final 關鍵字字符數組保存字符串&#xff0c;private final char value[]&#xff0c;所以 String 對象是不可變的。而StringBuilder 與 StringBuffer 都繼承自 AbstractStringBuild…