MongoDB 正則運算式
正則運算式是使用單個字串來描述、匹配一系列符合某個句法規則的字串。
許多程式設計語言都支持利用正則運算式進行字串操作。
MongoDB 使用 $regex 操作符來設置匹配字串的正則運算式。
MongoDB使用PCRE (Perl Compatible Regular Expression) 作為正則運算式語言。
不同於全文檢索,我們使用正則運算式不需要做任何配置。
考慮以下 posts 集合的文檔結構,該文檔包含了文章內容和標籤:
{ "post_text": "enjoy the mongodb articles on zaixian", "tags": [ "mongodb", "zaixian" ] }
使用正則運算式
以下命令使用正則運算式查找包含 zaixian 字串的文章:
>db.posts.find({post_text:{$regex:"zaixian"}})
以上查詢也可以寫為:
>db.posts.find({post_text:/zaixian/})
不區分大小寫的正則運算式
如果檢索需要不區分大小寫,我們可以設置 $options 為 $i。
以下命令將查找不區分大小寫的字串 zaixian:
>db.posts.find({post_text:{$regex:"zaixian",$options:"$i"}})
集合中會返回所有包含字串 zaixian 的數據,且不區分大小寫:
{ "_id" : ObjectId("53493d37d852429c10000004"), "post_text" : "hey! this is my post on zaixian", "tags" : [ "zaixian" ] }
數組元素使用正則運算式
我們還可以在數組字段中使用正則運算式來查找內容。 這在標籤的實現上非常有用,如果你需要查找包含以 run 開頭的標籤數據(ru 或 run 或 zaixian), 你可以使用以下代碼:
>db.posts.find({tags:{$regex:"run"}})
優化正則運算式查詢
- 如果你的文檔中字段設置了索引,那麼使用索引相比於正則運算式匹配查找所有的數據查詢速度更快。
- 如果正則運算式是首碼運算式,所有匹配的數據將以指定的首碼字串為開始。例如: 如果正則運算式為 ^tut ,查詢語句將查找以 tut 為開頭的字串。
這裏面使用正則運算式有兩點需要注意:
正則運算式中使用變數。一定要使用eval將組合的字串進行轉換,不能直接將字串拼接後傳入給運算式。否則沒有報錯資訊,只是結果為空!實例如下:
var name=eval("/" + 變數值key +"/i");
以下是模糊查詢包含title關鍵字, 且不區分大小寫:
title:eval("/"+title+"/i") // 等同於 title:{$regex:title,$Option:"$i"}