Linux 不排序去除重复行和不排序统计重复行

Linux awk About 547 words

一般在去除或统计重复行时使用sort及uniq对文件进行排序后uniq操作。

现使用awk命令实现不需要排序即可去重及统计重复行。

示例文本`1.txt`

aaa
bbb
ccc
xxx
aaa
ccc
zzz

此处因为a[$0]++在取反运算前还是0，为假，取反后为真，输出。第二次再有相同key则不输出。

awk '!a[$0]++' 1.txt

输出：

aaa
bbb
ccc
xxx
zzz

awk '{x[$0]++}END{for(i in x)print i,x[i]}' 1.txt

输出：

aaa 2
ccc 2
xxx 1
zzz 1
bbb 1

awk中的数组无需初始化，并且任意命名，上述两个例子中的a、x即代表数组名。

Views: 9,336 · Posted: 2019-08-26

——— Thanks for Reading ———

Give me a Star, Thanks:)

https://github.com/fendoudebb/LiteNote

扫描下方二维码关注公众号和小程序↓↓↓