成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

SQL案例分析:移動平均值與累計求和

數據庫 SQL Server
許多常見的聚合函數也可以作為窗口函數使用,包括AVG()、SUM()、COUNT()、MAX()以及MIN()函數等。

許多常見的聚合函數也可以作為窗口函數使用,包括AVG()、SUM()、COUNT()、MAX()以及MIN()函數等。

關于聚合函數的語法可以參考這篇文章。

示例表sales_monthly中存儲了不同產品(蘋果、香蕉以及桔子)每個月份的銷量情況,以下是該表的創建腳本和數據:

-- 創建銷量表sales_monthly
-- product表示產品名稱,ym表示年月,amount表示銷售金額(元)
CREATE TABLE sales_monthly(product VARCHAR(20), ym VARCHAR(10), amount NUMERIC(10, 2));

-- 生成測試數據
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201801',10159.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201802',10211.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201803',10247.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201804',10376.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201805',10400.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201806',10565.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201807',10613.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201808',10696.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201809',10751.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201810',10842.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201811',10900.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201812',10972.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201901',11155.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201902',11202.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201903',11260.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201904',11341.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201905',11459.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201906',11560.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201801',10138.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201802',10194.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201803',10328.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201804',10322.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201805',10481.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201806',10502.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201807',10589.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201808',10681.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201809',10798.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201810',10829.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201811',10913.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201812',11056.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201901',11161.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201902',11173.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201903',11288.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201904',11408.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201905',11469.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201906',11528.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201801',10154.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201802',10183.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201803',10245.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201804',10325.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201805',10465.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201806',10505.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201807',10578.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201808',10680.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201809',10788.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201810',10838.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201811',10942.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201812',10988.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201901',11099.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201902',11181.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201903',11302.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201904',11327.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201905',11423.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201906',11524.00);

移動平均值

AVG()函數作為窗口函數使用時,可以用于計算隨著當前行移動的窗口內數據行的平均值。例如,以下語句用于查找不同產品截止到每個月份為止、最近3個月的平均銷量:

SELECT product AS "產品", ym "年月", amount "銷量",
       AVG(amount) OVER (
         PARTITION BY product
         ORDER BY ym
         ROWS BETWEEN 2PRECEDING AND CURRENT ROW
       ) AS "最近平均銷量"
FROM sales_monthly
ORDER BY product, ym;

AVG()函數OVER子句中的PARTITION BY選項表示按照產品進行分區,ORDERBY選項表示按照月份進行排序,ROWS BETWEEN 2 PRECEDING AND CURRENT ROW表示窗口從當前行的前2行開始直到當前行結束。

該查詢返回的結果如下:


產品|年月   |銷量     |最近平均銷量     
---|------|--------|------------
桔子|201801|10154.00|10154.000000
桔子|201802|10183.00|10168.500000
桔子|201803|10245.00|10194.000000
桔子|201804|10325.00|10251.000000
桔子|201805|10465.00|10345.000000
桔子|201806|10505.00|10431.666667
...

對于“桔子”,第一個月份的分析窗口只有1行數據,因此平均銷量為10154。第二個月份的分析窗口為第1行和第2行數據,因此平均銷量為10168.5((10154+10183)/2)。第三個月份的分析窗口為第1行到第3行數據,因此平均銷量為10194((10154+10183+10245)/3)。

依此類推,直到計算完“桔子”所有月份的平均銷量,然后開始計算其他產品的平均銷量。

累計求和

SUM()函數作為窗口函數時,可以用于統計指定窗口內的累計值。例如,以下語句用于查找不同產品截止到當前月份為止的累計銷量:


SELECT product AS "產品", ym "年月", amount "銷量",
       SUM(amount) OVER (
         PARTITION BY product
         ORDER BY ym
         ROWS BETWEENUNBOUNDED PRECEDING AND CURRENT ROW
       ) AS "累計銷量"
FROM sales_monthly
ORDER BY product, ym;

SUM()函數OVER子句中的PARTITION BY選項表示按照產品進行分區,ORDERBY選項表示按照月份進行排序,ROWS BETWEENUNBOUNDED PRECEDING AND CURRENT ROW表示窗口從當前分區第1行開始直到當前行結束。

該查詢返回的結果如下:


產品|年月   |銷量      |累計銷量    
---|------|--------|---------
桔子|201801|10154.00| 10154.00
桔子|201802|10183.00| 20337.00
桔子|201803|10245.00| 30582.00
桔子|201804|10325.00| 40907.00
桔子|201805|10465.00| 51372.00
桔子|201806|10505.00| 61877.00
...

對于“桔子”,第一個月份的分析窗口只有1行數據,因此累計銷量為10154。第二個月份的分析窗口為第1行和第2行數據,因此累計銷量為20337(10154+10183)。第三個月份的分析窗口為第1行到第3行數據,因此累計銷量為30582(10154+10183+10245)。

依此類推,直到計算完“桔子”所有月份的累計銷量,然后開始計算其他產品的累計銷量。

提示:對于聚合窗口函數,如果我們沒有指定ORDER BY選項,默認的窗口大小就是整個分區。如果我們指定了ORDERBY選項,默認的窗口大小就是分區的第一行直到當前行。因此,以上示例語句的中ROWSBETWEEN UNBOUNDED PRECEDING AND CURRENT ROW選項可以省略。

除了使用ROWS關鍵字以數據行為單位指定窗口的偏移量之外,我們也可以使用RANGE關鍵字以數值為單位指定窗口的偏移量。

示例表transfer_log中記錄了一些銀行賬號的交易日志,以下是該表創建腳本:

-- 創建銀行交易日志表transfer_log
-- Oracle、MySQL、PostgreSQL以及SQLite
CREATE TABLE transfer_log
( log_id    INTEGER NOT NULL PRIMARY KEY, -- 交易日志編號
  log_ts    TIMESTAMP NOT NULL, -- 交易時間
  from_user VARCHAR(50) NOT NULL, -- 交易發起賬號
  to_user   VARCHAR(50), -- 交易接收賬號
  type      VARCHAR(10) NOT NULL, -- 交易類型
  amount    NUMERIC(10) NOT NULL -- 交易金額(元)
);

-- SQL Server
CREATE TABLE transfer_log
( log_id    INTEGER NOT NULL PRIMARY KEY, -- 交易日志編號
  log_ts    DATETIME2 NOT NULL, -- 交易時間
  from_user VARCHAR(50) NOT NULL, -- 交易發起賬號
  to_user   VARCHAR(50), -- 交易接收賬號
  type      VARCHAR(10) NOT NULL, -- 交易類型
  amount    NUMERIC(10) NOT NULL -- 交易金額(元)
);

-- 生成測試數據
-- Oracle 需要執行以下ALTER語句
-- ALTER SESSION SET nls_timestamp_format = 'YYYY-MM-DD HH24:MI:SS';
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (1,'2021-01-02 10:31:40','62221234567890',NULL,'存款',50000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (2,'2021-01-02 10:32:15','62221234567890',NULL,'存款',100000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (3,'2021-01-03 08:14:29','62221234567890','62226666666666','轉賬',200000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (4,'2021-01-05 13:55:38','62221234567890','62226666666666','轉賬',150000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (5,'2021-01-07 20:00:31','62221234567890','62227777777777','轉賬',300000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (6,'2021-01-09 17:28:07','62221234567890','62227777777777','轉賬',500000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (7,'2021-01-10 07:46:02','62221234567890','62227777777777','轉賬',100000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (8,'2021-01-11 09:36:53','62221234567890',NULL,'存款',40000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (9,'2021-01-12 07:10:01','62221234567890','62228888888881','轉賬',10000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (10,'2021-01-12 07:11:12','62221234567890','62228888888882','轉賬',8000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (11,'2021-01-12 07:12:36','62221234567890','62228888888883','轉賬',5000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (12,'2021-01-12 07:13:55','62221234567890','62228888888884','轉賬',6000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (13,'2021-01-12 07:14:24','62221234567890','62228888888885','轉賬',7000);
INSERT INTO transfer_log (log_id,log_ts,from_user,to_user,type,amount) VALUES (14,'2021-01-21 12:11:16','62221234567890','62228888888885','轉賬',70000);

以下語句用于查找短期之內(5天)累計轉賬超過一百萬元的賬號:


-- Oracle、MySQL以及PostgreSQL
SELECT log_ts, from_user,total_amount
FROM (
    SELECT log_ts, from_user,
    SUM(amount) OVER (
      PARTITION BY from_user
      ORDER BY log_ts
      RANGE INTERVAL '5' DAYPRECEDING
      ) AS total_amount
    FROM transfer_log
    WHERE TYPE = '轉賬'
    ) t
WHERE total_amount >= 1000000;

其中,SUM()函數OVER子句中的RANGE選項指定了一個5天之內的時間窗口。該查詢返回的結果如下。


log_ts               |from_user      |total_amount
-------------------|--------------|------------
2021-01-10 07:46:02|62221234567890|     1050000

賬號“62221234567890”截止2021年01月10日07點46份02秒在最近5天之內累計轉賬105萬。

SQLite不支持INTERVAL時間常量,我們可以將時間戳數據轉換為整數后使用。例如:

-- SQLite
WITH tl(log_ts, unix, from_user,amount) AS (
  SELECT log_ts, CAST(STRFTIME('%s',log_ts) AS INT), from_user, amount
  FROM transfer_log
  WHERE type = '轉賬'
)
SELECT log_ts, from_user, total_amount
FROM (
    SELECT log_ts, from_user,
    SUM(amount) OVER (
      PARTITION BY from_user
      ORDER BY unix
      RANGE 5 * 86400PRECEDING
      ) AS total_amount
    FROM tl
    ) t
WHERE total_amount >= 1000000;

我們首先定義了一個CTE,字段unix是將log_ts轉換為1970年1月1日以來的整數秒。然后我們在SUM()函數中通過RANGE選項指定了一個5天(5*86400秒)之內的時間窗口。

Microsoft SQL Server中的RANGE窗口大小選項只能指定UNBOUNDED PRECEDING、UNBOUNDED FOLLOWING或者CURRENT ROW,不能指定一個具體的數值,因此無法實現以上查詢。

責任編輯:華軒 來源: SQL編程思想
相關推薦

2010-11-09 11:23:35

sql server查

2009-05-20 11:46:31

2021-03-09 08:39:24

數據結構化分析

2014-07-03 09:53:04

應用應用調查

2023-08-02 08:47:55

聚合框架MongoDB

2022-12-28 08:16:16

metric聚合java

2012-06-13 10:56:48

移動云計算移動信息化

2022-02-14 09:53:26

微軟代碼技術

2010-09-10 14:05:12

SQL聚合函數

2010-11-01 09:04:15

Flipboard案例分析

2012-08-15 10:06:20

移動營銷

2024-06-26 09:29:53

2021-05-12 15:38:08

勒索軟件攻擊贖金

2021-05-17 21:30:06

Python求均值中值

2023-05-29 16:11:37

數據偏度數據集中

2011-04-11 15:33:47

DB2聚集目標表

2020-01-16 18:30:07

技術SQL優化

2011-03-01 09:23:47

移動Web應用開發成本

2010-11-09 09:43:20

SQL Server查

2012-07-06 15:51:35

全國網速藍汛ChinaCache
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品一区二区三区免费视频 | 久久久久久久一区二区三区 | 日韩av在线中文字幕 | 成人在线观看免费 | 久久99精品久久久久久 | 蜜桃视频一区二区三区 | 亚洲av毛片 | 亚洲成人av | 亚洲 欧美 日韩在线 | 精品伊人| 久久综合国产 | 国产乱精品一区二区三区 | 精品一区二区三区在线观看国产 | 久久精品视频在线免费观看 | 成人做爰999 | 精品毛片 | 国产精品久久久久久久久久久久久久 | 91色视频在线观看 | 自拍偷拍第一页 | 欧美成人激情 | 国产精品高潮呻吟久久 | 国产精品美女久久久久久免费 | 国产在线观看免费 | 曰批视频在线观看 | 黄色小视频入口 | 福利视频一二区 | 国产91网址 | 久久伊 | 中文字幕第三页 | 成人欧美一区二区三区 | 精品一区二区三区在线观看 | 欧美视频 亚洲视频 | 日本天堂一区二区 | 天堂色| 成人av免费在线观看 | 亚洲激精日韩激精欧美精品 | 精品网站999www | 久久机热 | 国产美女黄色片 | 天天碰夜夜操 | 在线日韩欧美 |