批量转换文件编码

发表于 2016-09-22 分类于 Linux 阅读次数：

批量转换文件编码

Linux上可以使用enca查看和转换文件编码。

查看文件编码

1	enca [-L LANGUAGE] [FILE]...

以下命令可以查看一个中文文档采用了什么编码格式。

1	enca -L zh_CN file.txt

输出如下：

1 2	fify@fify-Vostro-3902:~$ enca -L zh_CN password.txt Universal transformation format 8 bits; UTF-8

这个命令并不能100%正确的检测到文件编码，当文件中的汉字较少的时候就可能无法判断文件编码格式。（由此可见，enca命令也是根据文件中出现的特殊文字的编码范围“猜测”文件编码格式的。）

无法判断编码时输出如下：

1	./src/main/res/layout/activity_base_time_range_layout.xml: Unrecognized encoding

1	enca [-L LANGUAGE] -x <charset> [FILE]

单个转换一个文件的编码时：

1	enca -L zh_CN -x UTF-8 file.txt

批量转换某个目录下所有.java文件的编码：

1	find . -name *.java \| xargs enca -L zh_CN -x UTF-8

enca还有一个好处就是如果文件本来就是你要转换的那种编码，它不会报错，还是会print出结果来。

虽然enca会跳过已经是目标编码的文件，但是多次转换同一个文件还是有出错的风险，转换完成之后记得检查。

转载请注明出处：批量转换文件编码
原文地址：https://www.xiaotanzhu.com/linux/2016-09-22-convert-file-charsets-batch.html