如何加載有外國和特殊字符的文檔? 文檔可以包含外國字符,例如:
其他字符是保留在 XML 中的,并且需要以不同的方式處理。下面的 XML:
This & that
此處的單引號既用作屬性定界符,又在屬性值自身中。為了糾正這個問題,可以將屬性定界符換成雙引號: 或者可以將單引號轉義為實體 ' 上述兩種方式都將通過 XML 對象模型中的 getAttribute 方法返回屬性值 John\'s Stuff。同樣,對于雙引號,您可以使用實體 在本例子中,XML 對象模型將 CDATA 節點顯示 xml 節點的子節點,它將返回字符串 This & that is just "text" content. 如何在 Visual Studio 6.0 C++ 中使用 MSXML COM 組件? 在 Visual C++ 6.0 中使用 MSXML COM 組件的最簡便方式是使用 #import 指令: #import "msxml.dll" named_guids no_namespace#import "msxml.dll" named_guids no_namespace 如何在 XML 中使用 HTML 實體? 下面的 XML 包含 HTML 實體:
它產生下列錯誤:
這是因為 XML 只有五個內置實體。關于內置實體的詳細信息,請參閱如何加載有外國和特殊字符的文檔 [page_break]要使用 HTML 實體,需要用 DTD 定義它們。有關 DTD 的詳細信息,請參閱 W3C XML 建議(英文)。要使用該 DTD,請將它直接包括在 DOCTYPE 標記中,如下所示:
如果已經完成了 DTD 驗證,那么必須將作為參數實體的 HTML 實體包括在現有的 DTD 中,如下所示:
它將定義所有 HTML 實體,以便在 XML 文檔中使用它們。 在元素內容中如何處理空白字符? XML DOM 有三種訪問元素文本內容的方式: 屬性 行為 注意: 空白字符包括新行、tab 和空格。 nodeValue 屬性通常返回原始文檔中的內容,與文檔如何加載和當前 xml:space 范圍無關。 文本屬性連接指定子樹中的所有文本并擴展實體。這與文檔如何加載、preserveWhiteSpace 開關的當前狀態和當前 xml:space 范圍有關,請看如下所示: preserveWhiteSpace = true when the document is loaded
preserveWhiteSpace = false when the document is loaded
此處的保留表示和原始 XML 文檔中完全相同的原始文本內容,截斷意味著前導和尾部空格已經刪除,半保留意味著保留了“重要的空白字符”并規范化了“不重要的空白字符”。重要的空白字符是文本內容內部的空白字符。不重要的空白字符是標記之間的空白字符,請看如下所示:
在本示例中,紅色是可以忽略的不重要的空白字符,而綠色是重要的空白字符,因為它是文本內容的一部分,因此有不可忽略的重要含義。所以在本例中,文本屬性返回下列結果: 狀態 返回值 請注意“半保留”將規范化不重要的空白字符,例如,新行和 tab 字符將退化為單個空格。如果更改 xml:space 屬性和 preserveWhiteSpace 開關,那么文本屬性將返回相應的不同值。 CDATA and xml:space="preserve" subtree boundaries
在這種情況下,CDATA 節點內部的空白字符不再與“不重要”空白字符“合并”,并且不會截斷。因此“半保留并截斷”情況將返回下列內容: "Jane Smith " 在此, 和 標記之間的不重要的空白字符將包括在內,與 CDATA 節點的內容無關。如果用下列內容代替 CDATA,那么將返回相同結果: Smith 實體是作為 DTD 的一部分加載和分析的,并且顯示在 DOCTYPE 節點下。它們不一定要有任何 xml:space 范圍。例如:
假定 preserveWhiteSpace=false(在 DOCTYPE 標記范圍內),在分析實體時不重要的空白字符丟失。實體將不會有空白字符節點。樹將類似于:
請注意,在 DOCTYPE 內部 ENTITY 節點下顯露的 DOM 樹不包含任何 WHITESPACE 節點。這意味著 ENTITYREF 節點的子節點也沒有 WHITESPACE 節點,即使實體引用在 xml:space="preserve" 的范圍內也是這樣。 給定文檔中引用的每個 ENTITY 的實例通常都有相同的樹。 如果實體必須絕對保留空白字符,那么它必須在自己內部指定自己的 xml:space 屬性,或者文檔 preserveWhiteSpace 開關必須設置為 true。 如何處理屬性中的空白字符? 有幾種方式可以訪問屬性值。IXMLDOMAttribute 接口有 nodeValue 屬性,它等價于作為 Microsoft 擴展的 nodeValue 和 text 屬性。這些屬性返回: 屬性 返回的文本
“XML 語言”規范為 XML 應用程序定義了下列行為: 屬性類型 返回的文本 CDATA ID、IDREF、IDREFS、ENTITY、ENTITIES、NOTATION、枚舉 半規范化 全規范化 在此半規范化代表將新行和 tab 字符轉換為空格,但是多個空格不會退化為一個空格。 |
溫馨提示:喜歡本站的話,請收藏一下本站!