用戶號碼 登陸時間
13000000002010-01-01
13000000012010-01-01
13000000022010-01-02
13000000012010-01-02
13000000032010-01-03
13000000022010-01-03
13000000042010-01-04
13000000032010-01-04
13000000042010-01-02
13000000062011-01-04
13000000012011-01-04
剔除重復登陸的用戶,只計算統計時間內用戶的第一次登陸記錄。然后每天累加用戶數。
select b.statusdate,
sum(times) over(partition by trunc(b.statusdate, 'mm') order by b.statusdate)
from (select a.statusdate, count(1) times
from (select phone, trunc(min(statusdate), 'dd') statusdate
from test_table t
where t.statusdate >= to_date('20100101', 'yyyymmdd') --統計開始時間
and t.statusdate < to_date('20100201', 'yyyymmdd')
group by phone) a --取用戶第一條記錄時間
group by a.statusdate) b
由統計開始和結束時間控制數據源。trunc(b.statusdate, 'mm') 控制累加的范圍,如果是月則表示按月累計,也就是每月的第一次重新統計。
由于受到trunc(b.statusdate, 'mm') 只能按年,月,日累加所以如果數據源跨年則不能一累加。如果需要一直累加則:
select b.statusdate,
sum(times) over(partition by b.part order by b.part,b.statusdate)
from (select a.part,a.statusdate, count(1) times
from (select 1 part,phone, trunc(min(statusdate), 'dd') statusdate
from test_table t
where t.statusdate >= to_date('20100101', 'yyyymmdd') --統計開始時間
and t.statusdate < to_date('20110201', 'yyyymmdd')
group by phone) a --取用戶第一條記錄時間
group by a.statusdate,a.part) b
增加一個臨時字段表示累加范圍,例如:1表示數據統計第一次進行累加數據統計,然后按這一次的所有數據進行去重和累叫。