Linux下如何处理文本文件内容中的^M

时间:2021-05-24

Windows上写好的文件,在Linux或者Unix下打开,每一行都会出多出^M这样的字符,这是因为Windows与*nix的换行符不同所致,我们看看文件格式有什么不同。

在Linux下查看文件格式:

# file filename

# 20140304110001.csv: ISO-8859 text //不带有^M

# 20140304110002.csv: ISO-8859 text, with CRLF line terminators //带有^M

Windows下处理的文件就带有CRLF行终止符。

以下有几种处理方式:

1. vi命令行模式下输入

:%s/^M$//g# 去掉行尾的^M。
:%s/^M//g# 去掉所有的^M。
:%s/^M/[ctrl-v]+[enter]/g# 将^M替换成回车。
:%s/^M/\r/g# 将^M替换成回车。

2. 使用sed命令。和vi的用法相似:

# sed -e 's/^M/\n/g'filename

3. 使用命令

使用dos2unix命令,一般的*nix发布版本都带有这个小工具,即Windows - *nix文件转换。

格式: dos2unix filename

转换多个文件

格式:dos2unix file1 file2 file3 ….

上面转换文件的时候都会修改原来的文件,使用 -k参数,或者 -n参数可以不改变文件属性。

格式:dos2unix -n oldfile newfile //新建一个文件,保持源文件不变

格式:dos2unix -k filename //保持文件时间戳不变

同样工具提供了*nix - windows文件格式转换命令:unix2dos,参数同dos2unix。

*注:"^M",需要使用Ctrl + V + Ctrl + M键入,而不是数字6上面的^+字母M。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章