linux awk删除文本重复行需要注意强制类型转换的问题
发布日期:2022-01-04 14:11 | 文章来源:源码中国
希望删除IP地址前三段相同的多余重复行。测试文本如下:
# cat 1.txt 2.1.10.1 2.1.10.2 2.11.0.1 2.11.0.2
如果数组下标不加引号,在这个特殊的情况下会被强制转换为数字,最终导致统计失败:
# awk 'BEGIN{FS=OFS="."}{if(!a[$1.$2.$3]++)print}' 1.txt 2.1.10.1 # awk -F '.' '{a[$1.$2.$3]++;}END{for(i in a)print i" "a[i]}' 1.txt 2110 4
数组下标加上引号之后,一切恢复正常:
# awk 'BEGIN{FS=OFS="."}{if(!a[$1"."$2"."$3]++)print}' 1.txt 2.1.10.1 2.11.0.1 # awk -F '.' '{a[$1"."$2"."$3]++;}END{for(i in a)print i" "a[i]}' 1.txt 2.11.0 2 2.1.10 2
扩展阅读:
http://www.gnu.org/software/gawk/manual/html_node/Variable-Typing.html
版权声明:本站文章来源标注为YINGSOO的内容版权均为本站所有,欢迎引用、转载,请保持原文完整并注明来源及原文链接。禁止复制或仿造本网站,禁止在非www.yingsoo.com所属的服务器上建立镜像,否则将依法追究法律责任。本站部分内容来源于网友推荐、互联网收集整理而来,仅供学习参考,不代表本站立场,如有内容涉嫌侵权,请联系alex-e#qq.com处理。
相关文章