免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 8023 | 回复: 0
打印 上一主题 下一主题

[zz]python expat 解析xml [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-02-19 23:42 |只看该作者 |倒序浏览

来源:
http://bluecrystal.javaeye.com/blog/116915
   
主题: 解析xml文本
        环境: winxp pro + sp2 + python2.5
        备注: 请注意,凡是在源代码文件中使用了中文字符,请最好保存为utf-8格式
                     测试用例sample.xml也请用utf-8格式保存
        代码:
        
python 代码

# parsexml.py   
  • # 本例子参考自python联机文档,做了适当改动和添加   
       
  • import xml.parsers.expat   
       
  • # 控制打印缩进   
    level = 0   
  •    
    # 获取某节点名称及属性值集合   
  • def start_element(name, attrs):   
        global level   
  •     print '  '*level, 'Start element:', name, attrs   
        level = level + 1   
  •    
    # 获取某节点结束名称   
  • def end_element(name):   
        global level   
  •     level = level - 1   
        print '  '*level, 'End element:', name   
  •       
    # 获取某节点中间的值   
  • def char_data(data):   
        if(data == '\n'):   
  •         return   
        if(data.isspace()):   
  •         return   
        global level   
  •     print '  '*level, 'Character data:', data   
       
  • p = xml.parsers.expat.ParserCreate()   
       
  • p.StartElementHandler = start_element   
    p.EndElementHandler = end_element   
  • p.CharacterDataHandler = char_data   
    p.returns_unicode = False   
  •    
    f = file('sample.xml')   
  • p.ParseFile(f)   
    f.close()   
            测试用例:
    xml 代码:sample.xml

    xml version="1.0"?>   
  • contacts id="bluecrystal">   
    item name="keen" fff="ddd">   
  •     telephone type="phone">222222222telephone>   
        telephone type="mobile">134567890telephone>   
  • item>   
    item name="bcm">   
  •     telephone type="phone">11111111telephone>   
        telephone type="mobile">15909878909telephone>   
  • item>   
    contacts>           
            测试结果:
    Start element: contacts {'id': 'bluecrystal'}  
  •   Start element: item {'fff': 'ddd', 'name': 'keen'}  
        Start element: telephone {'type': 'phone'}  
  •       Character data: 222222222  
        End element: telephone  
  •     Start element: telephone {'type': 'mobile'}  
          Character data: 134567890  
  •     End element: telephone  
      End element: item  
  •   Start element: item {'name': 'bcm'}  
        Start element: telephone {'type': 'phone'}  
  •       Character data: 11111111  
        End element: telephone  
  •     Start element: telephone {'type': 'mobile'}  
          Character data: 15909878909  
  •     End element: telephone  
      End element: item  
  • End element: contacts  


    本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/107145/showart_2182590.html
  • 您需要登录后才可以回帖 登录 | 注册

    本版积分规则 发表回复

      

    北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
    未成年举报专区
    中国互联网协会会员  联系我们:huangweiwei@itpub.net
    感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

    清除 Cookies - ChinaUnix - Archiver - WAP - TOP