詳解 SQL 中連續N天都出現的問題
在我們日常統計過程中,像這種要統計連續N天都出現的問題比較普遍。比如統計連續三天銷售額大于10萬的是哪幾天,連續一周客流量大于100的是哪幾天等等。
今天我們用一個示例,來告訴大家該如何求解類似的問題。
有一個體育館,每日人流量信息被記錄在這三列信息中:序號 (id)、日期 (date)、 人流量 (people)。請編寫一個查詢語句,找出高峰期時段,要求連續三天及以上,并且每天人流量均不少于100。例如,表 stadium:
對于上面的示例數據,輸出為:
題目和想要的結果都已經知曉了,該如何求解呢?下面提供兩種解題思路
測試環境
SQL Server 2017
思路一:求日期差
通過求解某一日期前后日期差分別為1和-1可以得知這個日期的前后三條記錄都是連續的。說的通俗一點就是今天減去前一天的差為1,今天減去明天的差為-1,那么昨天今天明天的日期就是連續三天都連續。
具體解法如下:
- SELECT DISTINCT d.*
- FROM stadium d,stadium a
- WHERE ABS(DATEDIFF(DAY,d.date,a.date))<2 --求解時間差絕對值為1或0的日期
- AND a.date IN
- (
- SELECT a.date
- FROM stadium a,stadium b,stadium c
- WHERE
- DATEDIFF(DAY,a.date ,b.date)=1 --今天減去昨天
- AND DATEDIFF(DAY,a.date,c.date)=-1 --今天前去明天
- AND a.people >99
- AND b.people > 99
- AND c.people >99
- )
思路二:排列組合
按id的連續性,這里要分三種情況:分成三個表s1,s2,s3的組合判斷,
(1)s1.id-s2.id=1,s2.id-s3.id=1,相當于s3 s2 s1 的順序三個連續的
(2)s2.id-s1.id=1,s1.id-s3.id=1,相當于s3 s1 s2 的順序三個連續的
(3)s3.id-s2.id=1,s2.id-s1.id=1,相當于s1 s2 s3 的順序三個連續的
具體解法如下:
- select DISTINCT s1.*
- from stadium s1, stadium s2, stadium s3
- where s1.people >= 100 and s2.people>= 100 and s3.people >= 100
- and
- (
- (s1.id - s2.id = 1 and s2.id - s3.id =1)
- or
- (s2.id - s1.id = 1 and s1.id - s3.id =1)
- or
- (s3.id - s2.id = 1 and s2.id - s1.id = 1)
- ) order by s1.id;
但這種方法對適合的場景有限,如果超過3天,連續的排列組合就會增多,效果不是很好。
以上兩種思路均可求出結果,小伙伴們部分自己動手試一下。