Regular Expression trong C#

Một regular expression là một pattern mà có thể được so khớp với một văn bản đầu vào. .Net Framework cung cấp một phương tiện regular expression mà cho phép so khớp với như thế. Trong C#, một pattern gồm một hoặc nhiều hằng ký tự, toán tử, hoặc construct.

Construct cho định nghĩa Regular Expression trong C

Có nhiều loại ký tự, toán tử và construct đa dạng mà giúp bạn định nghĩa Regular Expression trong C#. Bạn theo các link sau để có chi tiết về các construct này.

  • Character escape
  • Lớp Character
  • Anchor
  • Grouping construct
  • Quantifier
  • Backreference construct
  • Alternation construct
  • Substitution
  • Miscellaneous constructs

Lớp Regex trong C

Lớp Regex trong C# được sử dụng để biểu diễn một Regular Expression. Nó có các phương thức được sử dụng phổ biến sau:

STTPhương thức
1public bool IsMatch(string input)

Chỉ rằng có hay không Regular Expression đã cho trong Regex constructor này tìm thấy một match trong chuỗi đầu vào đã xác định

2public bool IsMatch(string input, int startat)

Chỉ rằng có hay không Regular Expression đã cho trong Regex constructor này tìm thấy một match trong chuỗi đầu vào đã xác định, bắt đầu tại vị trí startat đã cho trong chuỗi

3public static bool IsMatch(string input, string pattern)

Chỉ rằng có hay không Regular Expression đã cho tìm thấy một match trong chuỗi đầu vào đã xác định

4public MatchCollection Matches(string input)

Tìm kiếm chuỗi đầu vào đã xác định về tất cả sự xuất hiện của một Regular Expression

5public string Replace(string input, string replacement)

Trong một chuỗi đầu vào đã xác định, thay thế tất cả chuỗi mà so khớp với một Regular Expression pattern với một chuỗi thay thế đã cho

6public string[] Split(string input)

Chia một chuỗi đầu vào thành một mảng các chuỗi phụ tại vị trí được định nghĩa bởi một Regular Expression pattern đã xác định trong Regex constructor

Để có danh sách đầy đủ các phương thức và thuộc tính, bạn vui lòng đọc Microsoft Documentation về C#.

Ví dụ 1

Ví dụ sau so khớp với các từ mà bắt đầu với 'S':

using System;
using System.Text.RegularExpressions;


namespace HoclaptrinhCsharp
{
    class TestCsharp
    {
        private static void showMatch(string text, string expr)
        {
            Console.WriteLine("Expression: " + expr);
            MatchCollection mc = Regex.Matches(text, expr);
            foreach (Match m in mc)
            {
                Console.WriteLine(m);
            }
        }


        static void Main(string[] args)
        {
            Console.WriteLine("Vi du minh hoa Regular Expression trong C#");
            Console.WriteLine("-----------------------------------------");


            string str = "Sao hom nay lai thay sao suyen son sang";


            Console.WriteLine("So khop voi cac tu bat dau bang chu cai 'S': ");
            showMatch(str, @"\bS\S*");
            Console.ReadKey();
        }
    }
}

Nếu bạn không sử dụng lệnh Console.ReadKey(); thì chương trình sẽ chạy và kết thúc luôn (nhanh quá đến nỗi bạn không kịp nhìn kết quả). Lệnh này cho phép chúng ta nhìn kết quả một cách rõ ràng hơn.

Biên dịch và chạy chương trình C# trên sẽ cho kết quả sau:

Ví dụ 2

Ví dụ sau so khớp với các từ mà bắt đầu với 's' và kết thúc với 'n':

using System;
using System.Text.RegularExpressions;


namespace HoclaptrinhCsharp
{
    class TestCsharp
    {
        private static void showMatch(string text, string expr)
        {
            Console.WriteLine("Expression: " + expr);
            MatchCollection mc = Regex.Matches(text, expr);
            foreach (Match m in mc)
            {
                Console.WriteLine(m);
            }
        }


        static void Main(string[] args)
        {
            Console.WriteLine("Vi du minh hoa Regular Expression trong C#");
            Console.WriteLine("-----------------------------------------");


            string str = "Sao hom nay lai thay sao suyen son sang";


            Console.WriteLine("So khop voi tu bat dau bang 's' va ket thuc bang 'n':");
            showMatch(str, @"\bs\S*n\b");
            Console.ReadKey();
        }
    }
}

Biên dịch và chạy chương trình C# trên sẽ cho kết quả sau:

Ví dụ 3

Ví dụ sau thay thế các white space:

using System;
using System.Text.RegularExpressions;


namespace HoclaptrinhCsharp
{
    class TestCsharp
    {
        static void Main(string[] args)
        {
            Console.WriteLine("Vi du minh hoa Regular Expression trong C#");
            Console.WriteLine("-----------------------------------------");


            string str1 = "Hello   World   ";
            string pattern = "\\s+";
            string str2 = " ";
            Regex rgx = new Regex(pattern);
            string result = rgx.Replace(str1, str2);


            Console.WriteLine("Chuoi ban dau: {0}", str1);
            Console.WriteLine("Chuoi sau khi da thay the: {0}", result);


            Console.ReadKey();
        }
    }
}

Biên dịch và chạy chương trình C# trên sẽ cho kết quả sau:


Bình luận