当前位置: 首页 > news >正文

BizTalk开发系列(十四) XML空白字符(WhiteSpace)

更多内容请查看:BizTalk动手实验系列目录

                      BizTalk 开发系列

      最近在做一个BizTalk项目,对XML文件的处理很复杂。本来是想找有没有方法可以一次性去除XML文件中节点和属性的值的空格。但是找了很久没有看到相关的方法。如果有知道该方法的麻烦跟我讲一下:cbcye@live.com 不过下面我整理了一下与之相关的XML空白字符(WhiteSpace)。

      先来看看这个问题比较一下这两个XML是否一样?

      XML(一)

< AddBook >
  
< Name />
  
< Mobile />
</ AddBook >  

      XML(二)

< AddBook >< Name />< Mobile /></ AddBook >  

      如果你觉得一样的话,那么我们来进行如下。我们使用的是XSLT(XML转换语言)读取整个XML文档。此XSLT文件的作用是拷贝整个源XML文档中的节点到目标XML文件中。

<? xml version="1.0" encoding="UTF-8"  ?>
< xsl:stylesheet  version ="1.0"  xmlns:xsl ="http://www.w3.org/1999/XSL/Transform" >
  
< xsl:output  method ="xml"  indent ="yes" />
  
< xsl:template  match ="node()" >
    
< xsl:copy >
      
< xsl:apply-templates  select ="node()" />
    
</ xsl:copy >
  
</ xsl:template >
</ xsl:stylesheet >  

    测试时在Visual Studio的XSLT调试界面设置断点。在监视窗口使用Xpath函数:node()来查看XML文档中的节点变化情况。

XML(一)的节点:

 image 

XML(二)的节点:

image

       从以上的测试数据可以看出当XML处于不同行的时候XML会多一些类型为whitespace的节点。由此可见XML(一)与XML(二)是不相同的。那为什么它们之间不相同呢?那为什么我们使用IE之类的XML解析器打开两个文件的话看到的效果是一样的?当然我们这里不讨论IE之类的是如何处理的(事实上是我也不知道IE是如何处理的:)。我们主要来看看这两个XML之间为什么不一样。也就是本文要涉及的Whitespace。 

       首先我们来了解一下在XML里什么叫WiteSpace。XML 将以下四种字符归为空白字符:回车符(\r 或 ch(13))、换行符(\n 或 ch(10))、制表符 (\t) 以及空格 (' ')。在 XML 文档中,空白字符分为两类:
有意义空白字符 是文档内容的一部分,应予以保留。
无意义空白字符 在编辑 XML 文档时使用,以增加可读性。这些空白字符一般在文档交付时不予保留。

       由此可见XML文档有时根据处理需要会增加一些回车、换行之类的特殊字符。但是如果这些字符在处理XML时不先清除(如果有必要的话)。那么就会造成一些错误。比如在XSLT文件中有如下表达式的话那么XML文件中的空白字符就有可能引用转换处理错误。因为空白字符是不能作为节点名称的。

< xsl:element  name ="{local-name()}" >

      了解了XML文件中有无空白字符的区别与XML文件中空白字符的用处之后我们来了解一下XML处理器是如果处理空白字符的。该如何根据需要处理空白字符。

      XML 分析:XML 规范提供了一个内置属性 xml:space 来告知 XML 分析器其是否应忽略空白字符。该属性由其根元素的子元素来继承。声明时,必须将其指定为枚举类型,其可能的值只能是“default”和“preserve”。如果指定为“preserve”,则所定义元素内的空白字符必须保留。

      示例:

  • XML数据
<? xml version="1.0" encoding="utf-8" ?>
< root  xmlns ="http://quicklearn.cn" />
  
< part1 >
    
< ns0:books  xmlns:ns0 ="http://books.quicklearn.cn" />
      
< ns0:book >
        
< name > BizTalk Develop </ name >
        
< ISDN > 0101010101010 </ ISDN >
      
</ ns0:book >
    
</ ns0:books >
  
</ part1 >
  
< part2 >
    
< ns1:customers  xmlns:ns1 ="customers.quicklearn.cn" >
      
< customer  xml:space ="preserve" >
        
< name > Zhang San </ name >
        
< mobile > 133333333333 </ mobile >
        
< address >
          
< province > Guang Dong </ province >


          
< city > Shen Zhen      </ city >
        
</ address >
      
</ customer >
    
</ ns1:customers >
  
</ part2 >
</ root >

 

  • C#代码   
XmlDocument xmlDoc  =   new  XmlDocument();
xmlDoc.PreserveWhitespace 
=   false ;
xmlDoc.Load(
@" D:\Projects\Temp\XSLTTest\XSLTTest\XSLTTest\XMLData2.xml " );
this .richTextBox1.Text  =  xmlDoc.OuterXml;

 

  • 输出效果
<? xml version="1.0" encoding="utf-8" ?> < root  xmlns ="http://quicklearn.cn" />< part1 >< ns0:books  xmlns:ns0 ="http://books.quicklearn.cn" />< ns0:book >< name > BizTalk Develop </ name >< ISDN > 0101010101010 </ ISDN ></ ns0:book ></ ns0:books ></ part1 >< part2 >< ns1:customers  xmlns:ns1 ="customers.quicklearn.cn" >< customer  xml:space ="preserve" >
        
< name > Zhang San </ name >
        
< mobile > 133333333333 </ mobile >
        
< address >
          
< province > Guang Dong </ province >


          
< city > Shen Zhen      </ city >
        
</ address >
      
</ customer ></ ns1:customers ></ part2 ></ root >

     XSLT 转换。W3C XSLT 规范提供了两个元素(即 xsl:strip-space 和 xsl:preserve-spacea€”)来处理空白字符。xsl:strip-space 指定了应删除空白字符文本节点(即文本节点完全由空白字符组成)的 XML 元素。请注意,xsl:strip-space 只有影响纯空白字符的节点。xsl:strip-space 可以列为一组由空白字符或使用通配符(例如 *)隔开的元素。xsl:preserve-space 具有类似的语法,但执行的结果却与 xsl:strip-space 正好相反。

    使用方法:在XSLT文件声明全局属性 <xsl:strip-space elements="*"/>或 <xsl:strip-space elements="element1 element2…"/>

   输出的效果与XML分析器相同。

总结

   了解了XML空白字符的作用及XML分析与处理器处理方式。那么在处理XML空白字符字符的时候,如果XML是给后台应用程序处理的话在处理之前最好先去除XML空白字符。如果XML是给用户阅读的话则保留相关的空白字符。

转载于:https://www.cnblogs.com/cbcye/archive/2008/10/10/1307690.html

相关文章:

  • MEF——.NET中值“.NET研究”得体验的精妙设计
  • SCUT - 271 - CC 非诚勿扰 - FFT
  • Silverlight 2.5D RPG游戏“.NET研究”技巧与特效处理:(六)流光追影
  • EdoJs之时间显示与转换
  • Eclipse开发Android应用程序入“.NET研究”门:重装上阵
  • 实现局部或全部页面内容不能选中的效果
  • .NET Framework Client Profile - a Subset of the .NET Framework Redistribution
  • Android使用自定义AlertDialog(退出提示框)
  • 如何在三个月掌握三年的经验
  • 利用vue-meta管理头部标签
  • Codeforces - 1198D - Rectangle Painting 1 - dp
  • 强化网络互连设备安全配置脚本
  • Codeforces - 1198C - Matching vs Independent Set - 贪心
  • 如何编写实施方案
  • 智能家居-思维的又一次跳跃
  • 【翻译】Mashape是如何管理15000个API和微服务的(三)
  • 【译】理解JavaScript:new 关键字
  • Android 控件背景颜色处理
  • Apache的80端口被占用以及访问时报错403
  • LeetCode刷题——29. Divide Two Integers(Part 1靠自己)
  • MaxCompute访问TableStore(OTS) 数据
  • NLPIR语义挖掘平台推动行业大数据应用服务
  • Redis 中的布隆过滤器
  • SpiderData 2019年2月25日 DApp数据排行榜
  • Vue组件定义
  • 从0搭建SpringBoot的HelloWorld -- Java版本
  • 搭建gitbook 和 访问权限认证
  • 力扣(LeetCode)21
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​configparser --- 配置文件解析器​
  • ​TypeScript都不会用,也敢说会前端?
  • ​猴子吃桃问题:每天都吃了前一天剩下的一半多一个。
  • !!Dom4j 学习笔记
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #Linux(make工具和makefile文件以及makefile语法)
  • $.ajax()
  • (LNMP) How To Install Linux, nginx, MySQL, PHP
  • (企业 / 公司项目)前端使用pingyin-pro将汉字转成拼音
  • (切换多语言)vantUI+vue-i18n进行国际化配置及新增没有的语言包
  • (学习日记)2024.01.19
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)Android学习笔记 --- android任务栈和启动模式
  • .gitignore
  • .net 程序 换成 java,NET程序员如何转行为J2EE之java基础上(9)
  • .NET 将多个程序集合并成单一程序集的 4+3 种方法
  • .Net各种迷惑命名解释
  • .NET项目中存在多个web.config文件时的加载顺序
  • .Net中ListT 泛型转成DataTable、DataSet
  • /etc/skel 目录作用
  • /usr/local/nginx/logs/nginx.pid failed (2: No such file or directory)
  • @for /l %i in (1,1,10) do md %i 批处理自动建立目录
  • [AIGC] 使用Curl进行网络请求的常见用法
  • [Android] Android ActivityManager
  • [BZOJ4554][TJOI2016HEOI2016]游戏(匈牙利)
  • [CISCN2019 华东南赛区]Web11