文章詳情頁
xml中的空格之完全解說
瀏覽:341日期:2022-06-04 14:16:48
提示:我提取了《xslt從入門到精通》中關(guān)于空格解釋的核心部分,借以拋磚引玉,希望大家踴躍參與討論。談?wù)勀銓崭竦睦斫狻?
只適合對xml文件結(jié)構(gòu)有一定了解的學(xué)者,不適合初學(xué)者。請按從上至下的順序閱讀。
對html文件而言,空格不重要;然而,對xml而言,默認立場就是要保留空格結(jié)點(空格結(jié)點的解釋見下文)。
根據(jù)xml規(guī)范的規(guī)定,所謂空格是四種字符的任意組合序列:
-----------------------
空格字符(space),對應(yīng)字符值為 #x20
返回字符(Carriage Return),對應(yīng)字符值為 #xD
新行字符(Newline),對應(yīng)字符值為 #xA
跳格字符(Tab),對應(yīng)字符值為 #x9。
xml文件的空格也會形成結(jié)點,也就是空格結(jié)點。空格結(jié)點屬于文字結(jié)點類型。
對xml和xslt而言,空格結(jié)點會牽涉到兩個議題:
-----------------------
1。在xml輸入文件中決定哪些空格是重要的,xslt處理器要看見這些空格結(jié)點。而決定的密鑰就是xml:space屬性。
2。在xsl模板文件中決定哪些空格是重要的,xslt處理器應(yīng)將它復(fù)制到結(jié)果樹中,而決定的密鑰就是xsl:strip-space
和xsl:preserve-space這兩個命令。
“重要和不重要的空格結(jié)點”
-----------------------
若某組件的內(nèi)容只能放組件,則該組件中的空格結(jié)點就是不重要的(Insignificant);
如果某組件的內(nèi)容是#PCDATA的類型,則其內(nèi)的空格結(jié)點應(yīng)視為重要的(Signficant)。
至于組件內(nèi)容混雜了文字內(nèi)容和組件的情況則無從評判,應(yīng)視組件及其內(nèi)容之語意而定。
xslt處理器接觸到xml輸入文件之前,會先由xml分析器進行分析
-----------------------
(1)xml:space屬性可以改變后續(xù)接手的xml應(yīng)用程序處理空格結(jié)點的模式,例如,xslt處理器就會受xml:space屬性影響。
(2)xml文件中任何一列標記或內(nèi)容尾端的結(jié)尾的結(jié)尾符號全部會換成單一新行字符(#xA)。
(3)屬性值交給xml應(yīng)用程序之前,xml分析器也應(yīng)該先對屬性值做規(guī)范化的操作。這是因為不同的操作系統(tǒng)每一行文字列的結(jié)尾字符有不同的組合,例如,windows系統(tǒng)會由返回字符呵新行字符組成結(jié)尾符號,而Unix系統(tǒng)則僅由新行字符組
成結(jié)尾符號。xml分析器在讀取xml文件之后,便先行將所有結(jié)尾符號換成單一新行字符,不僅統(tǒng)一了不同系統(tǒng)間不同結(jié)尾符號設(shè)計的差異性,同時也簡化了后續(xù)xml應(yīng)用程序的的操作難度。這樣一個處理過程稱為“規(guī)范化(Normalization)”。
a,每一文字列的結(jié)尾符號都要規(guī)范化成單一的新行字符(#xA)。
b,任何一個空格符(#x20、#xD、#xA、#x9)都應(yīng)換成一個空格字符(#x20)。
c,屬性值中若含有字參碼,則應(yīng)替換成該參考字符,例如,
會換成新行字符(#xA)。
d,屬性值若含有實體參考,則應(yīng)以其替換文字替換。
e,除此之外,任何字符都應(yīng)直接放入規(guī)范化屬性值中。
f,最后,如果屬性類型不是CDATA,則xml分析器應(yīng)該再進一步把屬性值前后的空格字符序列刪除,而且屬性值中間若有空格序列,也應(yīng)該替換成單一空格字符。
xslt處理器把xml輸入文件和xsl模板文件的結(jié)構(gòu)樹建好之后,會現(xiàn)把組件中相鄰的文字結(jié)點合并成單一的文字結(jié)點,然后再把一些文字結(jié)點抽掉。然而,如果文字結(jié)點符合下列條件之一,就會被保留下來:
-----------------------
(1)文字結(jié)點的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結(jié)點中至少有一個非空格符。
(3)文字結(jié)點的某個祖先組件中有xml:space屬性,其值為preserve,而且較近的祖先組件中沒有其他xml:space屬性值為default。除此之外的文字結(jié)點逗會被抽掉。
對xsl模板而言,所謂的空格保留組件名稱集只有一個xsl:text組件可用。xsl模板文件的空格結(jié)點都會被刪除,但是,如果空格結(jié)點出現(xiàn)在xsl:text組件中就會被保留下來。
只適合對xml文件結(jié)構(gòu)有一定了解的學(xué)者,不適合初學(xué)者。請按從上至下的順序閱讀。
對html文件而言,空格不重要;然而,對xml而言,默認立場就是要保留空格結(jié)點(空格結(jié)點的解釋見下文)。
根據(jù)xml規(guī)范的規(guī)定,所謂空格是四種字符的任意組合序列:
-----------------------
空格字符(space),對應(yīng)字符值為 #x20
返回字符(Carriage Return),對應(yīng)字符值為 #xD
新行字符(Newline),對應(yīng)字符值為 #xA
跳格字符(Tab),對應(yīng)字符值為 #x9。
xml文件的空格也會形成結(jié)點,也就是空格結(jié)點。空格結(jié)點屬于文字結(jié)點類型。
對xml和xslt而言,空格結(jié)點會牽涉到兩個議題:
-----------------------
1。在xml輸入文件中決定哪些空格是重要的,xslt處理器要看見這些空格結(jié)點。而決定的密鑰就是xml:space屬性。
2。在xsl模板文件中決定哪些空格是重要的,xslt處理器應(yīng)將它復(fù)制到結(jié)果樹中,而決定的密鑰就是xsl:strip-space
和xsl:preserve-space這兩個命令。
“重要和不重要的空格結(jié)點”
-----------------------
若某組件的內(nèi)容只能放組件,則該組件中的空格結(jié)點就是不重要的(Insignificant);
如果某組件的內(nèi)容是#PCDATA的類型,則其內(nèi)的空格結(jié)點應(yīng)視為重要的(Signficant)。
至于組件內(nèi)容混雜了文字內(nèi)容和組件的情況則無從評判,應(yīng)視組件及其內(nèi)容之語意而定。
xslt處理器接觸到xml輸入文件之前,會先由xml分析器進行分析
-----------------------
(1)xml:space屬性可以改變后續(xù)接手的xml應(yīng)用程序處理空格結(jié)點的模式,例如,xslt處理器就會受xml:space屬性影響。
(2)xml文件中任何一列標記或內(nèi)容尾端的結(jié)尾的結(jié)尾符號全部會換成單一新行字符(#xA)。
(3)屬性值交給xml應(yīng)用程序之前,xml分析器也應(yīng)該先對屬性值做規(guī)范化的操作。這是因為不同的操作系統(tǒng)每一行文字列的結(jié)尾字符有不同的組合,例如,windows系統(tǒng)會由返回字符呵新行字符組成結(jié)尾符號,而Unix系統(tǒng)則僅由新行字符組
成結(jié)尾符號。xml分析器在讀取xml文件之后,便先行將所有結(jié)尾符號換成單一新行字符,不僅統(tǒng)一了不同系統(tǒng)間不同結(jié)尾符號設(shè)計的差異性,同時也簡化了后續(xù)xml應(yīng)用程序的的操作難度。這樣一個處理過程稱為“規(guī)范化(Normalization)”。
a,每一文字列的結(jié)尾符號都要規(guī)范化成單一的新行字符(#xA)。
b,任何一個空格符(#x20、#xD、#xA、#x9)都應(yīng)換成一個空格字符(#x20)。
c,屬性值中若含有字參碼,則應(yīng)替換成該參考字符,例如,
會換成新行字符(#xA)。
d,屬性值若含有實體參考,則應(yīng)以其替換文字替換。
e,除此之外,任何字符都應(yīng)直接放入規(guī)范化屬性值中。
f,最后,如果屬性類型不是CDATA,則xml分析器應(yīng)該再進一步把屬性值前后的空格字符序列刪除,而且屬性值中間若有空格序列,也應(yīng)該替換成單一空格字符。
xslt處理器把xml輸入文件和xsl模板文件的結(jié)構(gòu)樹建好之后,會現(xiàn)把組件中相鄰的文字結(jié)點合并成單一的文字結(jié)點,然后再把一些文字結(jié)點抽掉。然而,如果文字結(jié)點符合下列條件之一,就會被保留下來:
-----------------------
(1)文字結(jié)點的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結(jié)點中至少有一個非空格符。
(3)文字結(jié)點的某個祖先組件中有xml:space屬性,其值為preserve,而且較近的祖先組件中沒有其他xml:space屬性值為default。除此之外的文字結(jié)點逗會被抽掉。
對xsl模板而言,所謂的空格保留組件名稱集只有一個xsl:text組件可用。xsl模板文件的空格結(jié)點都會被刪除,但是,如果空格結(jié)點出現(xiàn)在xsl:text組件中就會被保留下來。
標簽:
XML/RSS
相關(guān)文章:
1. Intellij IDEA 2020.3 配置教程詳解2. idea給項目打war包的方法步驟3. IntelliJ IDEA刪除類的方法步驟4. IntelliJ IDEA設(shè)置編碼格式的方法5. 使用 kind 和 Docker 啟動本地的 Kubernetes環(huán)境6. 兩行Javascript代碼生成UUID的方法7. Python importlib模塊重載使用方法詳解8. ASP基礎(chǔ)入門第八篇(ASP內(nèi)建對象Application和Session)9. 解決python中import文件夾下面py文件報錯問題10. XML入門精解之結(jié)構(gòu)與語法
排行榜
