新聞中心
linux 系統(tǒng)作為一款著名的開源操作系統(tǒng),用它來完成類似數(shù)據(jù)分析任務(wù)是再自然不過的事情了。本文即介紹在Linux系統(tǒng)下,如何快速而輕松地統(tǒng)計(jì)重復(fù)行。

首先,要統(tǒng)計(jì)文件中的重復(fù)行,可以使用UNIX 下的sort命令,即`sort -k2 filename`,假設(shè)文件中,有兩列字段,現(xiàn)在要按照第二列字段進(jìn)行排序。-k2 指定按照第二字段排序,用空格隔開,filename為待排序的文件。
接下來,要統(tǒng)計(jì)排序后的文件中的重復(fù)行了,使用“uniq”命令,即`uniq -c filename`, -c 指定統(tǒng)計(jì)每行重復(fù)次數(shù)。filename為排序后的文件。執(zhí)行命令后,會(huì)出現(xiàn)類似這樣的結(jié)果:
*1 apple
*2 orange
*3 banana
表明文件里有1次出現(xiàn)“apple”,2次出現(xiàn)“orange”,3次出現(xiàn)“banana”。
有些情況下,可能要先刪除重復(fù)行,再按照其它條件篩選數(shù)據(jù),此時(shí)可以結(jié)合排序與uniq命令,使用“uniq -u filename”,只刪除不重復(fù)的行,留下重復(fù)行,處理過程為sort+uniq+grep。首先`sort -k2 filename`,對(duì)文件進(jìn)行排序,`uniq -u filename` ,刪除文件中的不重復(fù)行,然后用 grep 命令先相應(yīng)條件,獲取篩選后的數(shù)據(jù),如`grep pattern filename`,即可得到需要的比較準(zhǔn)確而且可信的結(jié)果。
綜上所述,本文介紹了如何在Linux下輕松統(tǒng)計(jì)重復(fù)行。在實(shí)際處理過程中,只要結(jié)合sort、uniq和grep等命令,就可以快速得到準(zhǔn)確的結(jié)果。
香港服務(wù)器選創(chuàng)新互聯(lián),2H2G首月10元開通。
創(chuàng)新互聯(lián)(www.cdcxhl.com)互聯(lián)網(wǎng)服務(wù)提供商,擁有超過10年的服務(wù)器租用、服務(wù)器托管、云服務(wù)器、虛擬主機(jī)、網(wǎng)站系統(tǒng)開發(fā)經(jīng)驗(yàn)。專業(yè)提供云主機(jī)、虛擬主機(jī)、域名注冊(cè)、VPS主機(jī)、云服務(wù)器、香港云服務(wù)器、免備案服務(wù)器等。
網(wǎng)頁題目:『Linux下輕松統(tǒng)計(jì)重復(fù)行』(linux統(tǒng)計(jì)重復(fù)行)
當(dāng)前網(wǎng)址:http://m.fisionsoft.com.cn/article/coighjj.html


咨詢
建站咨詢
