db.log_events.find()? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?# 查找log_events里的所有數據
db.log_events.createIndex( { "LogDT": 1 }, { expireAfterSeconds: 3600 } )? ? ? ? ? ? ? ? ? ? ? ? ? ? ? #設置log_events里的TTL過期索引清理時間為3600秒
db.runCommand( { collMod: "log_events",index: { keyPattern: { LogDT: 1 },expireAfterSeconds: 10800 }})? ? ? ?#修改過期索引時間,建議最好還是先drop在新建
db.log_events.getIndexes()? ? ? ? ? ? ? ? ?#查找log_events里的所有索引
TTL索引是MongoDB中一種特殊的索引, 可以支持文檔在一定時間之后自動過期刪除,目前TTL索引只能在單字段上建立,
并且字段類型必須是date類型或者包含有date類型的數組(如果數組中包含多個date類型字段,則取最早時間為過期時間)
官網介紹鏈接:https://docs.mongodb.com/v3.2/core/index-ttl/
當你在集合中某一個字段建立TTL索引后,后臺會有一個單線程,通過不斷查詢(默認60s一次)索引的值來判斷document是否有過期,
并且刪除文檔的動作還依據mongod實例的負載情況,如果負載很高,可能會稍微延后一段時間再刪除。
還有一個需要注意的地方,在復制集成員中,TTL后臺線程只刪除primary的過期數據,如果此實例變為secondary角色,則后臺線程閑置
限制條件:
有一下集中情況是無法使用TTL索引的
①TTL索引是單字段索引,混合索引不支持TTL,并且也會忽略expireAfterSeconds屬性
②在_id 主鍵上不能建立TTL索引
③在capped collection中不能建立TTL索引,因為MongoDB不能從capped collection中刪除文檔
④你不能使用createIndex()去更改已經存在的TTL索引的expireAfterSeconds值,如果想更改expireAfterSeconds,可以使用collMod命令,
否則你只能刪除索引,然后重建了
⑤你不能在已有索引的字段上再創建TTL索引了,如果你想把非TTL索引改為TTL索引,那就只能刪除重建索引了
驗證:
雖然已經實現了晚上集中自動刪除的功能,但是還是擔心刪除過大數量時負荷問題,隨進行了簡單測試,一查看TTL索引在億級別集合中刪除140萬過期數據的消耗
測試配置:
OS:Vm虛擬機
CPU: 4
內存:8
集合數據量:
> db.t1.count()
104273617
因為我制造測試數據時,_id是順序增加的,所以我直接查看_id=1500000的那筆數據的createTime,然后自己計算一下此createTime和當前時間的時間差,
隨后根據這個時間差來更改expireAfterSeconds的值,以讓這150萬數據5分鐘后過期并刪除。
在修改完expireAfterSeconds后,就嚴密延時“?vmstat 1 ”?命令的輸出數據;
我的測試結果:
刪除操作整個過程在90秒左右完成;
CPU最高占用90%,平均在50%
內存占用3G
這個也是特別準確的模擬情況,只是粗略的了解一下TTL索引的資源消耗,以決定是不是需要這樣的方式來實現刪除過期數據
監控vmstat的截圖:
?
創建TTL索引方法:
和普通索引的創建方法一樣,只是會多加一個屬性而已
例:在log_events的集合中,createTime 字段上建立一小時后過期的TTL索引
- ?>db.log_events.createIndex(?{?"createTime":?1?},?????---字段名稱???
- ????????????????????????????????{?expireAfterSeconds:?60*60?}?)?????---過期時間(單位秒)??
- >db.log_events.getIndexes()?????---查看索引??
- [??
- ????????{??
- ????????????????"v"?:?1,??
- ????????????????"key"?:?{??
- ????????????????????????"_id"?:?1??
- ????????????????},??
- ????????????????"name"?:?"_id_",??
- ????????????????"ns"?:?"tt.t1"??
- ????????},??
- ????????{??
- ????????????????"v"?:?1,??
- ????????????????"key"?:?{??
- ????????????????????????"createTime"?:?1??
- ????????????????},??
- ????????????????"name"?:?"createTime_1",??
- ????????????????"ns"?:?"tt.t1",??
- ????????????????"expireAfterSeconds"?:?3600??
- ????????}??
- ]??
注:如果想更改過期時間expireAfterSeconds,可以使用collMod方法,要不然你只能只用dropIndex(),createIndex()方法重建索引了,我想這樣的方法在億級數據量下是很頭疼的
- db.runCommand(?{?collMod:?"log_events",?????---集合名??
- ????????????????index:?{?keyPattern:?{?createTime:?1?},?????---createTime為具有TTL索引的字段名??
- ??????????????????????????expireAfterSeconds:?7200??????????---修改后的過期時間(秒)??
- ????????????????????????}})??
方法如下:
增加一個expireTime字段(用于指定過期時間),expireAfterSeconds屬性值設置為0,
注:上面的createTime字段就不需要再有TTL索引了,這個expireTime的時間就需要在插入時指定上
- >db.log_events.createIndex(?{?"expireTime":?1?},?????---字段名稱??
- ????????????????????????????????{?expireAfterSeconds:?0?}?)?????---過期時間(單位秒)??
- >db.log_events.insert(?{??
- ??"expireTime":?new?Date('Jan?22,?2016?23:00:00'),?????---此文檔將在2016-1-22的23點自動刪除??
- ??"logEvent":?2,??
- ??"logMessage":?"Success!"}?)??
這樣我們就實現了,指定時間自動刪除的動作了
一、TTL索引
創建方法db.collection.createIndex(keys, options)options:expireAfterSeconds 指定多少秒或者包含日期值的數組創建示例db.eventlog.createIndex( { "lastModifiedDate": 1 }, { expireAfterSeconds: 3600 } ) 何時失效 在指定的時間達到后失效,也即是索引字段的值加上一個特定的秒數之后 如果索引字段是一個數組,即索引字段上存在著多個日期值,此時MongoDB取最小值加上失效時間(lowest()) 對于非日期字段或不包含日期數組的索引字段,文檔不會失效 對于不包含索引字段的文檔,文檔不會失效 刪除操作 mongod的一個后臺線程會讀取索引的值并將失效的文檔從集合移除 當TTL線程被激活后,可以從db.currentOp()或者從profile觀察到刪除操作 何時刪除 當基于后臺方式創建索引時,TTL線程能夠在索引創建期間開始刪除失效文檔 當基于前臺方式創建索引時,TTL線程在索引創建完成后開始刪除失效文檔 TTL索引的刪除不能完全保證失效期后一定刪除,存在一定延遲(取決于mongod的工作負載) TTL刪除文檔后臺線程每60s移除失效文檔(因此可能存在已過失效期,文檔還在的情形) 在副本集環境中,TTL后臺線程僅僅在主副本上工作,輔助副本上由復制操作實現 在使用TTL索引查詢時,與使用非TTL索引一樣 一些限制 不能基于已經存在索引的字段創建TTL索引以及非日期字段創建TTL索引,文檔不會失效 TTL索引不支持基于多個字段的復合索引 不支持定長集合
二、TTL索引示例
# mongo --shell localhost:27000 TTLData.js
MongoDB shell version: 3.2.11 connecting to: localhost:27000/test repSetTest:PRIMARY> addTTLTestData() //添加集合數據 Create three records in database each with a create time that is 1 minute apart Created three test documents, oldest being 4 mins old Now create a TTL index with expiry of 5 mins on the createDate field as follows db.ttlTest.ensureIndex({createDate:1}, {expireAfterSeconds:300}) repSetTest:PRIMARY> db.ttlTest.find() //當前向集合里插入了3個文檔 { "_id" : 1, "createDate" : ISODate("2017-03-10T03:23:01.169Z") } { "_id" : 2, "createDate" : ISODate("2017-03-10T03:24:01.169Z") } { "_id" : 3, "createDate" : ISODate("2017-03-10T03:25:01.169Z") } //下面為測試集合上的文檔添加索引,即5分鐘后索引失效 repSetTest:PRIMARY> db.ttlTest.createIndex({createDate:1}, {expireAfterSeconds:300}) { "createdCollectionAutomatically" : false, "numIndexesBefore" : 1, // Author : Leshami "numIndexesAfter" : 2, // Blog : http://blog.csdn.net/leshami "ok" : 1 } //查找文檔 repSetTest:PRIMARY> db.ttlTest.find() { "_id" : 1, "createDate" : ISODate("2017-03-10T03:23:01.169Z") } { "_id" : 2, "createDate" : ISODate("2017-03-10T03:24:01.169Z") } { "_id" : 3, "createDate" : ISODate("2017-03-10T03:25:01.169Z") } //當指定時間到期后,文檔被刪除,如下,查詢不到任何文檔 repSetTest:PRIMARY> db.ttlTest.find()
?