Regular Expression trong MongoDB

Regular Expression được sử dụng thường xuyên trong tất cả ngôn ngữ để tìm kiếm một pattern hoặc một từ trong bất cứ chuỗi nào. MongoDB cũng cung cấp tính năng Regular Expression để so khớp mẫu (Pattern matching) trong chuỗi bởi sử dụng toán tử $regex. MongoDB sử dụng PCRE (Perl Compatible Regular Expression) như là ngôn ngữ Regular Expression. Không giống như Text Search, chúng ta không cần thực hiện bất cứ lệnh nào hoặc cấu hình nào để sử dụng Regular Expression. Bạn theo dõi cấu trúc của Document dưới posts collection chứa các trường post_text và tags như sau:

{
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": [
      "mongodb",
      "tutorialspoint"
   ]
}

Sử dụng regex trong MongoDB

Truy vấn regex sau tìm kiếm tất cả posts mà chứa chuỗi tutorialspoint trong đó:

>db.posts.find({post_text:{$regex:"tutorialspoint"}})

Truy vấn tương tự có thể viết như sau:

>db.posts.find({post_text:/tutorialspoint/})

Sử dụng regex với tùy chọn không phân biệt kiểu chữ

Để làm cho việc tìm kiếm là không phân biệt kiểu chữ, bạn sử dụng tham số $options với giá trị $i. Lệnh sau sẽ tìm kiếm các chuỗi mà có từ tutorialspoint, không quan tâm nó là chữ hoa hay thường.

>db.posts.find({post_text:{$regex:"tutorialspoint",$options:"$i"}})

Một trong các kết quả của truy vấn này là Document sau mà chứa từ tutorialspoint trong các kiểu chữ khác nhau:


{
   "_id" : ObjectId("53493d37d852429c10000004"),
   "post_text" : "hey! this is my post on TutorialsPoint", 
   "tags" : [ "tutorialspoint" ]
} 

Sử dụng regex cho các phần tử mảng

Chúng ta cũng có thể sử dụng khái niệm regex trên trường mảng. Điều này đặc biệt quan trọng khi chúng ta triển khai tính năng của các tags. Vì thế, nếu bạn muốn tìm kiếm tất cả các post có tags bắt đầu với từ tutorial, bạn có thể sử dụng code sau:

>db.posts.find({tags:{$regex:"tutorial"}})

Tối ưu hóa các truy vấn Regular Expression

  • Nếu các trường của Document là đã được lập chỉ mục, truy vấn sẽ sử dụng các giá trị đã lập chỉ mục này để so khớp với các Regular Expression. Điều này làm cho việc tìm kiếm nhanh hơn khi so sánh với việc quét toàn bộ Collection.
  • Nếu Regular Expression là một Prefix expression, tất cả so khớp là bắt đầu với một chuỗi ký tự cụ thể. Ví dụ, nếu regex là ^tut, thì truy vấn sẽ chỉ tìm các chuỗi bắt đầu với tut.

Bình luận