免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 8010 | 回复: 29
打印 上一主题 下一主题

[文本处理] 取第一个和最后一个字段 [复制链接]

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2023-08-17 20:00 |只看该作者 |倒序浏览
本帖最后由 unix520 于 2023-08-23 16:15 编辑

a.txt
#
n楼.
n楼..
n楼+
n楼..&楼...
n层#
n层....

Sorry 再补充一下多一些栗子
n顶#
n楼.+
n楼.++
n楼+..
n楼..&楼...++
n层#+
n层....+
awk '/楼|层/' a      这似乎会输出匹配到字段


如何能取到第一个 匹配的字段 "楼"  和最后一个匹配字段  "层"     
b.txt
n楼.
n层....
n楼.+
n层....+






论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
2 [报告]
发表于 2023-08-18 10:00 |只看该作者
  1. [root@test-02 tmp]# cat a
  2. 层#
  3. 楼..
  4. 楼.
  5. 楼+
  6. 楼..&楼...
  7. 层#
  8. 层....
  9. [root@test-02 tmp]# awk 'BEGIN{found=0} /楼/{if(found==0){print $0; found=1}} /层/{lastLine=$0} END{if(lastLine!=""){print lastLine}}' a
  10. 楼..
  11. 层....
复制代码

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
3 [报告]
发表于 2023-08-18 13:54 |只看该作者
本帖最后由 unix520 于 2023-08-23 16:16 编辑

回复 2# baby_神
Thanhs
Sorry  大佬 我在顶楼补充多一些行
如果文本中有很多这样的行,   不是只要仅2行  需要按这规律输出所有这些行,  









论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
4 [报告]
发表于 2023-08-18 15:33 |只看该作者
  1. perl -00nE'say/(^楼\N*\R)\X+(^层\N*\R)/mg' file
复制代码

想用awk的话,照着这思路改一下也行,或者用临时变量计数法之类的都可以,建议你给出的例子不要把“层”放每段的最后一行,如果每一段的最后不一定就是你想要的内容的话。
你这样的文本样例,别人也可以只找第一个“楼”开头的行,然后再打印每段最后一行,你确定这样是你想要的吗?

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
5 [报告]
发表于 2023-08-18 16:38 |只看该作者
本帖最后由 unix520 于 2023-08-18 16:46 编辑

回复 4# legs


如果匹配字段前后有字符或空格不行  



论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
6 [报告]
发表于 2023-08-18 16:39 |只看该作者
本帖最后由 unix520 于 2023-08-18 16:47 编辑

回复 4# legs



perl -0nE'say$1,$+while/(^\N+楼\N+\n)((?!\N*\n).)*(^\N+层\N+\n)/msg' file


我用的就是你以前写的代码,  很正确           只不过他是取后一个,   而不是第一个     但现在需要取第一个,  我改不好  不会prel


论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
7 [报告]
发表于 2023-08-18 16:40 |只看该作者
本帖最后由 unix520 于 2023-08-18 16:41 编辑

Sorry发多了

论坛徽章:
0
8 [报告]
发表于 2023-08-21 03:31 |只看该作者
不知道你解决了,我试了一下,没有问题:
awk 'BEGIN{x=0;buffer=""}{if(substr($0,1,3)=="楼" && x==0){print $0;x=1}}{if($0=="" && buffer!=""){print buffer;print $0;x=0}}{buffer=$0} END{if($0!=""){print $0}}' 1.log

论坛徽章:
0
9 [报告]
发表于 2023-08-21 03:32 |只看该作者
不知道你解决了没有,我试了一下,没有问题,share给你:
awk 'BEGIN{x=0;buffer=""}{if(substr($0,1,3)=="楼" && x==0){print $0;x=1}}{if($0=="" && buffer!=""){print buffer;print $0;x=0}}{buffer=$0} END{if($0!=""){print $0}}' 1.log

论坛徽章:
0
10 [报告]
发表于 2023-08-21 03:33 |只看该作者
不知道你解决了没有,I tried it with no problem, share with you:
awk 'BEGIN{x=0;buffer=""}{if(substr($0,1,3)=="楼" && x==0){print $0;x=1}}{if($0=="" && buffer!=""){print buffer;print $0;x=0}}{buffer=$0} END{if($0!=""){print $0}}' 1.log
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP