免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3181 | 回复: 1
打印 上一主题 下一主题

JAVA正则表达式问题请教 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2018-11-14 19:21 |只看该作者 |倒序浏览
<%@page contentType="text/html;charset=gbk" pageEncoding="gbk"%>
<%@ page contentType="text/xml" pageEncoding = "gbk" %> //其它GBK不要替换
请问如何在JAVA中通过正则表达式的技术将上述gbk全替换为UTF-8?
1、只有charset=gbk 或 pageEncoding="gbk" 这样的情况的 GBK才替换
2、gbk 大小写无关
3、=号左右允许有空格
4、charset= 后的gbk左右无双引号,pageEncoding="gbk" 的GBK左右有双引号
谢谢!

论坛徽章:
0
2 [报告]
发表于 2018-11-14 20:12 |只看该作者
代码:
                Pattern p=Pattern.compile("((?:charset|encoding|pageEncoding)\\s*=\\s*\\\"?)gbk",Pattern.CASE_INSENSITIVE);
                String str="<?xml version=\"1.0\" encoding=\"GBK\" ?>// encoding = \"gbk\"//\n"+
                "<%@ page language=\"java\" contentType=\"text/html; charset=GBK\" pageEncoding=\"gbk\"%>\n" +
                "<%@ page contentType=\"text/html; charset=Gbk\" pageEncoding=gbK %>";
                Matcher m=p.matcher(str);
        String result = m.replaceAll("$1UTF-8");
        System.out.println("--- result=\n"+result);
结果:
--- result=
<?xml version="1.0" encoding="UTF-8" ?>// encoding = "UTF-8"//
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>
<%@ page contentType="text/html; charset=UTF-8" pageEncoding=UTF-8 %>
不符合第4点要求
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP