MongoDB 高級教學

MongoDB 關係

MongoDB 資料庫引用

MongoDB 覆蓋索引查詢

MongoDB 查詢分析

MongoDB 原子操作

MongoDB 高級索引

MongoDB 索引限制

MongoDB ObjectId

MongoDB Map Reduce

MongoDB 全文檢索

MongoDB 正則運算式

MongoDB 管理工具

MongoDB GridFS

MongoDB 固定集合

MongoDB 自動增長

MongoDB 聚合

MongoDB中聚合(aggregate)主要用於處理數據(諸如統計平均值,求和等)，並返回計算後的數據結果。有點類似sql語句中的 count(*)。

aggregate() 方法

MongoDB中聚合的方法使用aggregate()。

語法

aggregate() 方法的基本語法格式如下所示：

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

實例

集合中的數據如下：

{
   _id: ObjectId(7df78ad8902c)
   title: 'MongoDB Overview',
   description: 'MongoDB is no sql database',
   by_user: 'xuhuhu.com',
   url: 'http://www.xuhuhu.com',
   tags: ['mongodb', 'database', 'NoSQL'],
   likes: 100
},
{
   _id: ObjectId(7df78ad8902d)
   title: 'NoSQL Overview',
   description: 'No sql database is very fast',
   by_user: 'xuhuhu.com',
   url: 'http://www.xuhuhu.com',
   tags: ['mongodb', 'database', 'NoSQL'],
   likes: 10
},
{
   _id: ObjectId(7df78ad8902e)
   title: 'Neo4j Overview',
   description: 'Neo4j is no sql database',
   by_user: 'Neo4j',
   url: 'http://www.neo4j.com',
   tags: ['neo4j', 'database', 'NoSQL'],
   likes: 750
},

現在我們通過以上集合計算每個作者所寫的文章數，使用aggregate()計算結果如下：

> db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
{
   "result" : [
      {
         "_id" : "xuhuhu.com",
         "num_tutorial" : 2
      },
      {
         "_id" : "Neo4j",
         "num_tutorial" : 1
      }
   ],
   "ok" : 1
}
>

以上實例類似sql語句：

 select by_user, count(*) from mycol group by by_user

在上面的例子中，我們通過字段 by_user 字段對數據進行分組，並計算 by_user 字段相同值的總和。

下表展示了一些聚合的運算式:

運算式	描述	實例
$sum	計算總和。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg	計算平均值	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min	獲取集合中所有文檔對應值得最小值。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max	獲取集合中所有文檔對應值得最大值。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push	在結果文檔中插入值到一個數組中。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet	在結果文檔中插入值到一個數組中，但不創建副本。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first	根據資源文檔的排序獲取第一個文檔數據。	db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last	根據資源文檔的排序獲取最後一個文檔數據	db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

管道的概念

管道在Unix和Linux中一般用於將當前命令的輸出結果作為下一個命令的參數。

MongoDB的聚合管道將MongoDB文檔在一個管道處理完畢後將結果傳遞給下一個管道處理。管道操作是可以重複的。

運算式：處理輸入文檔並輸出。運算式是無狀態的，只能用於計算當前聚合管道的文檔，不能處理其他的文檔。

這裏我們介紹一下聚合框架中常用的幾個操作：

$project：修改輸入文檔的結構。可以用來重命名、增加或刪除域，也可以用於創建計算結果以及嵌套文檔。
$match：用於過濾數據，只輸出符合條件的文檔。$match使用MongoDB的標準查詢操作。
$limit：用來限制MongoDB聚合管道返回的文檔數。
$skip：在聚合管道中跳過指定數量的文檔，並返回餘下的文檔。
$unwind：將文檔中的某一個數組類型字段拆分成多條，每條包含數組中的一個值。
$group：將集合中的文檔分組，可用於統計結果。
$sort：將輸入文檔排序後輸出。
$geoNear：輸出接近某一地理位置的有序文檔。

管道操作符實例

1、$project實例

db.article.aggregate(
    { $project : {
        title : 1 ,
        author : 1 ,
    }}
 );

這樣的話結果中就只還有_id,tilte和author三個字段了，默認情況下_id字段是被包含的，如果要想不包含_id話可以這樣:

db.article.aggregate(
    { $project : {
        _id : 0 ,
        title : 1 ,
        author : 1
    }});

2.$match實例

db.articles.aggregate( [
                        { $match : { score : { $gt : 70, $lte : 90 } } },
                        { $group: { _id: null, count: { $sum: 1 } } }
                       ] );

$match用於獲取分數大於70小於或等於90記錄，然後將符合條件的記錄送到下一階段$group管道操作符進行處理。

3.$skip實例

db.article.aggregate(
    { $skip : 5 });

經過$skip管道操作符處理後，前五個文檔被"過濾"掉。

MongoDB 高級教學

MongoDB 聚合

aggregate() 方法

語法

實例

管道的概念

管道操作符實例

HTML / CSS

腳本語言

高級語言

Java技術

XML技術

大數據

開發工具

框架

軟體測試

前端技術

資料庫

其他技術