MongoDB 正則運算式

正則運算式是使用單個字串來描述、匹配一系列符合某個句法規則的字串。

許多程式設計語言都支持利用正則運算式進行字串操作。

MongoDB 使用 $regex 操作符來設置匹配字串的正則運算式。

MongoDB使用PCRE (Perl Compatible Regular Expression) 作為正則運算式語言。

不同於全文檢索,我們使用正則運算式不需要做任何配置。

考慮以下 posts 集合的文檔結構,該文檔包含了文章內容和標籤:

{
   "post_text": "enjoy the mongodb articles on zaixian",
   "tags": [
      "mongodb",
      "zaixian"
   ]
}

使用正則運算式

以下命令使用正則運算式查找包含 zaixian 字串的文章:

>db.posts.find({post_text:{$regex:"zaixian"}})

以上查詢也可以寫為:

>db.posts.find({post_text:/zaixian/})

不區分大小寫的正則運算式

如果檢索需要不區分大小寫,我們可以設置 $options 為 $i。

以下命令將查找不區分大小寫的字串 zaixian:

>db.posts.find({post_text:{$regex:"zaixian",$options:"$i"}})

集合中會返回所有包含字串 zaixian 的數據,且不區分大小寫:

{
   "_id" : ObjectId("53493d37d852429c10000004"),
   "post_text" : "hey! this is my post on  zaixian",
   "tags" : [ "zaixian" ]
}

數組元素使用正則運算式

我們還可以在數組字段中使用正則運算式來查找內容。 這在標籤的實現上非常有用,如果你需要查找包含以 run 開頭的標籤數據(ru 或 run 或 zaixian), 你可以使用以下代碼:

>db.posts.find({tags:{$regex:"run"}})

優化正則運算式查詢

  • 如果你的文檔中字段設置了索引,那麼使用索引相比於正則運算式匹配查找所有的數據查詢速度更快。

  • 如果正則運算式是首碼運算式,所有匹配的數據將以指定的首碼字串為開始。例如: 如果正則運算式為 ^tut ,查詢語句將查找以 tut 為開頭的字串。

這裏面使用正則運算式有兩點需要注意:

正則運算式中使用變數。一定要使用eval將組合的字串進行轉換,不能直接將字串拼接後傳入給運算式。否則沒有報錯資訊,只是結果為空!實例如下:

var name=eval("/" + 變數值key +"/i"); 

以下是模糊查詢包含title關鍵字, 且不區分大小寫:

title:eval("/"+title+"/i")    // 等同於 title:{$regex:title,$Option:"$i"}