Mongodb聚合函數

?

插入測試數據

for(var j=1;j<3;j++){    
for(var i=1;i<3;i++){    var person={Name:"jack"+i,Age:i,Address:["henan","wuhan"],Course:[{Name:"shuxue",Score:i},{Name:"wuli",Score:i}]}db.DemoTest.Person.insert(person)     
}
}

Count

db.DemoTest.Person.count({Name:"jack1"})

返回數量

?distinct

db.DemoTest.Person.distinct("Name")

返回不重復的Name值。

?group

例子：按照Name分組，條件是Age大于46

db.DemoTest.Person.group({"key":{"Name":true}, -----分組的keky"initial":{"Person":[]},-------每組分享的一個”初始化函數“"$reduce":function(cur,prev){   ------這個函數的第一個參數是當前的文檔對象，第二個參數是上一次function操作的累計對象，第一次為initial中的{”person“：[]}。有多少個文檔， $reduce就會調用多少次

        prev.Person.push(cur);

},"finalize":function(prev){   ---返回每組的數量     prev.count=prev.Person.length;  },"condition":{"Age":{"$lt":46}}   -----過濾條件})

返回結果如下：

?返回的json

?mapReduce

?mapReduce其實是一種編程模型，用在分布式計算中，其中有一個“map”函數，一個”reduce“函數。

? ?map：

? ? ? ? ? 這個稱為映射函數，里面會調用emit(key,value)，集合會按照你指定的key進行映射分組。

? ?reduce：

? ? ? ? ?這個稱為簡化函數，會對map分組后的數據進行分組簡化，注意：在reduce(key,value)中的key就是

? ? ? emit中的key，vlaue為emit分組后的emit(value)的集合，這里也就是很多{"count":1}的數組。

? ?mapReduce:

? ? ? ? ? 這個就是最后執行的函數了，參數為map，reduce和一些可選參數。

在MongoDB存儲的文檔上執行聚合操作非常有用，這種方式的一個限制是聚合函數（比如，SUM、AVG、MIN、MAX）需要通過mapper和reducer函數來定制化實現。

MongoDB沒有原生態的用戶自定義函數（UDFs）支持。但是它允許使用db.system.js.save命令來創建并保存JavaScript函數，JavaScript函數可以在MapReduce中復用。

第一種統計方式--對應集合直接統計

1.在MongoDB javascript Shell中對Array對象進行了一些擴展，其中新增sum方法，以方便統計數據之用的。

Array.sum=function(arr){
if(arr.length == 0)
return null;
var s = arr[0];
for(var i = 1; i < arr.length; i++)
s += arr[i];
return s;
}

2.例子：按照名稱分組，統計每組年齡的和，條件是年齡小于2.

如果統計數量：var map = function(){ emit(this.Name, 1); } ? 其實是讓值永遠為1

var map = function(){ emit(this.Name, this.Age); }
var reduce = function( key, values ){ return Array.sum(values); }
var options = {query: { Age: {$lt: 2} }, out: { inline : 1 }}
db.Person.mapReduce(map,reduce,options)

結果如下

?結果json

分析一下：
1. map部分
作用：用于分組的。
emit(param1, param2)
param1：需要分組的字段，this.字段名。
param2：需要進行統計的字段，this.字段名。

2. reduce部分
作用：處理需要統計的字段
var reduce = function(key, values){
......統計字段處理
}
key：指分組字段（emit的param1）對應的值
values：指需要統計的字段（emit的param2）值組成的數組

簡單介紹統計常用的方法：
* 對數值類型進行求和

 <span style="font-size: 16px;">var?reduce = function(key, values){
return?Array.sum(values);
}
</span>

* 對字符串類型進行拼湊

 <span style="font-size: 16px;">var?reduce = function(key, values){
return?values.join(', ');
}</span>

3. options部分
{ query: { age: {$lt: 25} }, out: "name_totals" }
query：先篩選符合條件的記錄出來，再進行分組統計。
out：將分組統計后的結果輸出到哪個集合當中。
默認情況下，out所指定的集合在數據庫斷開連接后再次打開時，依舊存在，并保留之前的所有記錄的。

4. 執行分組統計
>db.集合名.mapReduce( map, reduce, options )

第二種統計方式--命令統計

1.命令如下：

注意：out參數?out:"Person_Name" 代表會創建一個臨時表Person_Name 然后再從臨時表中查找，out:{inline:1} 代表直接顯示在當前命令執行的結果中

var map = function(){ emit(this.Name, this.Age); }
var reduce = function( key, values ){ return Array.sum(values); }
db.runCommand({mapreduce:"Person",map:map,reduce:reduce,out:"Person_Name",keeptemp: false,query: { Age:{ $lt: 2 }},sort:{ Name:1},
    limit:3
})

?解析：
mapreduce：
分組統計的集合名
eg：
mapreduce: 'mythings'
不能寫成mapreduce: mythings，否則報異常：mythings is not defined

map,reduce ：
同上，不做闡述

out ：
將分組統計結果輸出到某個集合。
注意：不能缺省，必須指定名稱，否則報錯，報錯如下：
“exception: 'out' has to be a string or an object”

keeptemp ：
是否保留臨時集合（指out指定的集合）
keeptemp：false時會在數據庫斷開連接后，MongoDB會移除該集合的所有記錄。而不是刪除。
keeptemp：true時即使數據庫斷開連接后，再次連接上，該臨時集合依舊保持之前所有記錄。
keeptemp默認值為true。

query ：
篩選記錄后，再進行分組統計
eg:
query: { age:{ $lt: 25 }}

sort ：
對分組統計的集合進行排序，也即先排序，后再執行分組統計的。
注意：這里的排序需要用到索引，必須先創建索引。

limit ：

對分組統計的集合先進行限制返回記錄的條數，然后再去進行統計操作。注意：不要理解成對統計后的結果進行限制返回記錄條數。

verbose ：
顯示時間統計信息，取值為true/false

轉載于:https://www.cnblogs.com/wangjing666/p/6837131.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/541396.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/541396.shtml
英文地址，請注明出處：http://en.pswp.cn/news/541396.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！