时间:2021-05-20
1、前提
以读取编码是GBK的文件为案例,文件内容只有中文和中文符号
2、原因
FileInputStream读中文乱码是因为一个中文对应两个字节存储(负数),也就是说,读取对应中文的字节数应该是偶数; 而英文对应一个字节存储。FileInputStream每次读取一个数组长度的字节时,读取的中文字节数可能是奇数,也就是只读到中文的一半字节,出现乱码。
3、解决方法
一次读取所有字节,此方法不靠谱,因为不确定总字节数。
在输出时进行判断,遍历数组判断负数的个数,如果是奇数,说明读取到中文的一半字节,对数组进行扩容再输出;否则正常输出
4、代码案例
package 第二题;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.UnsupportedEncodingException;import java.util.Arrays;public class MainTest { public static void main(String[] args) throws UnsupportedEncodingException { // 创建File对象 File file = new File("D:\\filetest\\file4.txt"); FileInputStream fileInputStream = null; try { // 新建一个FileInputStream对象 fileInputStream = new FileInputStream(file); // 新建一个字节数组 byte[] buf = new byte[2]; // read(buf):此方法的返回值就是当前读取的字节个数,将数据读取到buf数组 // 将readLen变量也就是read方法的返回值,当此变量等于-1,则读到文件末尾 int readLen = -1; //读取文件数据 while ((readLen = fileInputStream.read(buf)) != -1) { int pos=0;//记录负数的个数 for(byte v:buf) { if(v<0) { pos++; } } //负数个数为偶数,读取完整,没有读取到半个中文 if(pos%2==0) { // 将字节数组转换成字符串 String content = new String(buf, 0, readLen); System.out.print(content); }else {//负数个数为奇数,读取不完整,会乱码 //再读取下一位字节 int nextByteValue=fileInputStream.read(); int nextLen=readLen+1; //字节数组扩容一位 buf= Arrays.copyOf(buf,nextLen); buf[readLen]= (byte) nextByteValue; String content=new String(buf,0,nextLen); System.out.print(content); //奇数,字节补全 //针对数组扩容一个字节单元 } } } catch (FileNotFoundException e) { // 输出堆栈信息 e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } finally { try { // 文件输入流关闭(释放资源) fileInputStream.close(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }}以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Get中文乱码问题解决方案:修改Tomcat根目录下conf/server.xml文件,代码如下:复制代码代码如下:但是,使用IE浏览器会发现,中文乱码问题仍然
最近两天做项目总是被乱码问题困扰着,这不刚把mysql中文乱码问题解决了,下面小编把我的解决方案分享给大家,供大家参考,也方便以后自己查阅。首先:用showva
gedit中文乱码问题解决,windows下的文档在linux下乱码问题解决:打开终端输入以下命令:复制代码代码如下:gsettingssetorg.gnome
java中FileOutputStream中文乱码问题解决办法使用FileOutputStream序列化可以直接向文件写入文本内容,代码如下:FileOutpu
这篇文章主要介绍了pyftplib中文乱码问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下采用py