批处理实现过滤重复行

时间:2021-05-22

a.txt内容如下:
123
456
789
123
123
789

获取重复的行,并且重复的行只保留一次,处理后得到b.txt内容如下:
123
789

方法1:

@echo offREM 缺点1:无法处理特别大的文件REM 缺点2:需要使用文件中没有出现的字符来标记变量(本例中使用的是下划线)setlocalfor /f "delims=" %%i in (a.txt) do ( set /a _%%i+=1)(for /f "tokens=1-2 delims=_=" %%i in ('set _') do ( if %%j gtr 1 ( echo,%%i )))>b.txtendlocal

方法2:

@echo offsetlocal enabledelayedexpansionset "PriLine="set "DupNum=1"(for /f "delims=" %%i in ('sort a.txt') do ( if "!PriLine!" equ "%%i" ( set /a DupNum+=1 ) else ( if !DupNum! gtr 1 ( echo,!PriLine! ) set DupNum=1 ) set "PriLine=%%i"))>b.txtif !DupNum! gtr 1 ( >>b.txt echo,!PriLine!)

方法3:

gawk "{a[$0]++}END{for(i in a)if(a[i]>1)print i}" a.txt > b.txt

方法4:(更加简洁)

gawk "a[$0]++" a.txt>b.txt

方法5:

@echo offfor /f "tokens=*" %%i in (a.txt) do set #%%i=%%i(for /f "tokens=2 delims==" %%i in ('set #') do echo %%i)>b.txt

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章