免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2198 | 回复: 0
打印 上一主题 下一主题

[文本处理] 求助看下这段awk代码 [复制链接]

论坛徽章:
4
15-16赛季CBA联赛之青岛
日期:2018-07-09 14:17:2815-16赛季CBA联赛之八一
日期:2018-08-06 15:30:0515-16赛季CBA联赛之广东
日期:2018-08-09 09:11:2115-16赛季CBA联赛之佛山
日期:2019-02-14 09:26:31
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2018-05-14 13:37 |只看该作者 |倒序浏览
本帖最后由 christmas1102 于 2018-05-14 19:32 编辑

原文件:a1.txt
  1. Bacteria        0.001294883        0.003301197        0.002344941        0.002723813        0.003755733        0.002683822        0.006859545        0.008077043        0.007712926        0.009756361        0.009024885        0.011141175
  2. Bacteria|Acidobacteria|Acidobacteria|Acidobacteriales|Acidobacteriaceae_(Subgroup_1)        0.017988381        0.029448175        0.021260796        0.030242339        0.031707053        0.036942022        0.012391437        0.012736875        0.023138778        0.009918068        0.01361743        0.019258316
  3. Bacteria|Acidobacteria|Acidobacteria|Acidobacteriales|Acidobacteriaceae_(Subgroup_1)|Acidobacterium        0.000699937        0.000750272        0.001094306        0.001361907        0.001119497        0.001420847        0        0.000207104        5.47E-05        5.39E-05        0        0
复制代码
然后处理文本使用的awk代码:
  1. awk '{for(i=2;i<=NF;i++){a[$1,i]+=$i}b[$1]}END{for(i in b){printf(i);for(j=2;j<=NF;j++){printf " "a[i,j]};print ""}}'  a1.txt
复制代码
求解答下这段代码是什么意思,for(i=2;i<=NF;i++) 是从第2个NF开始遍历,然后就看不懂了,a[$1,i] 没赋值,那就是 0 或者空,但是 0+a 或 ""+a 都 =0 啊,再往后的就更看不懂了,整段大概就是个 二维数组的赋值,打印过程吧?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP