Giới thiệu CDATA trong XML

Chương này giới thiệu phần CDATA trong XML. Khái niệm CDATA nghia là dữ liệu ký tự (Character Data). CDATA được định nghĩa như là các khối text mà không được phân tích bởi Parser, nhưng được nhận ra khi đánh dấu.

Các thực thể được định nghĩa trước như <, >, và & cần phải gõ từ bàn phím và nói chung là khó để đọc trong đánh dấu. Trong các trường hợp như vậy, khu vực CDATA có thể được sử dụng. Bằng việc sử dụng khu vực CDATA, bạn đang chỉ lệnh cho Parser rằng khu vực này trong tài liệu không cần đánh dấu, nên được bỏ qua (hay giữ nguyên), và nên được đối xử như là phần text thông thường. Điều này rất cần thiết khi chúng ta viết các đoạn Script trong tài liệu.

Cú pháp của khu vực CDATA trong XML là:

<![CDATA[
   characters with markup
]]>

Cú pháp trên bao gồm ba phần:

  • Phần bắt đầu CDATA - CDATA bắt đầu với một delimiter gồm 9 ký tự <![CDATA[
  • Phần kết thúc CADTA - Khu vực CDATA kết thúc với delimiter là ]]>.
  • Khu vực CDATA - Các ký tự ở giữa hai phần trên được thông dịch như là các ký tự, không đánh dấu. Khu vực này có thể chứa các ký tự đánh dấu (như <, >, và &), nhưng chúng được bỏ qua bởi XML Processor.

Ví dụ

Ví dụ sau minh họa CDATA. Ở đây, mỗi ký tự bên trong khu vực CDATA bị bỏ qua bởi Parser.

<script>
<![CDATA[
   <message> Welcome to TutorialsPoint </message>
]] >
</script >

Trong cú pháp trên, mọi thứ ở giữa và được đối xử như là dữ liệu ký tự và không đánh dấu.

Qui tắc cho CDATA trong XML

Một số qui tắc sau là bắt buộc khi sử dụng CDATA trong XML:

  • CDATA không thể chứa chuỗi "]]>" ở bất cứ đâu trong tài liệu XML.
  • Việc lồng là không được cho phép trong khu vực CDATA.

Bình luận