Windows与Linux下InputStream读取字节与字符的不同
2012-01-27 21:42
429 查看
近做了一个报文发送接收解析的客户端,发现了这样的问题:
某程序:
Java代码
con = new Socket(ip, port);//一个socket
InputStream socketIn = con.getInputStream();
InputStreamReader isr=new InputStreamReader(socketIn,"UTF-8");
while ((headchar = isr.read()) != -1) {//
读取报文头 用字符流来读取
headres += (char) headchar;
......//一些逻辑 处理报文头
}
...
//报文头读完了 获取了报文体的大小等内容 开始读报文体
byte tempbuf[] =newbyte[buffsize];
int start =0;
int tem = -1;
//用字节流来读报文体
while ((tem = socketIn.read(tempbuf, start, buffsize)) != -1) {
log.info("从"+start+"开始读"+buffsize);
log.info("实际读取" + tem);
if (tem < outparamsizes[i]) {
start = start + tem;
buffsize = buffsize - tem;
...//一些逻辑 处理报文体 读取完毕
}
这样的程序,在windows下正常工作,再放到linux下,读完报文头开始读取报文体的时候,并没有从报文体的开头开始读取,而是丢失了报文体前面的一些数据,导致读不到足够的数据直到超时。
经过一番调试和请教后发现原因:在linux下一个InputStream不能用字符流和字节流分段读取,因为linux下的字符由于utf8编码会多加几位,用字符读完报文头后其实就已经多读了许多位,再用字节读就丢掉多读的那部分了。
因此,只要将读取报文头的部分也改成字节流读取就可以了
Java代码
while ((headchar = socketIn.read()) != -1) {
...}
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
某程序:
Java代码
con = new Socket(ip, port);//一个socket
InputStream socketIn = con.getInputStream();
InputStreamReader isr=new InputStreamReader(socketIn,"UTF-8");
while ((headchar = isr.read()) != -1) {//
读取报文头 用字符流来读取
headres += (char) headchar;
......//一些逻辑 处理报文头
}
...
//报文头读完了 获取了报文体的大小等内容 开始读报文体
byte tempbuf[] =newbyte[buffsize];
int start =0;
int tem = -1;
//用字节流来读报文体
while ((tem = socketIn.read(tempbuf, start, buffsize)) != -1) {
log.info("从"+start+"开始读"+buffsize);
log.info("实际读取" + tem);
if (tem < outparamsizes[i]) {
start = start + tem;
buffsize = buffsize - tem;
...//一些逻辑 处理报文体 读取完毕
}
con = new Socket(ip, port);//一个socketInputStream socketIn = con.getInputStream();InputStreamReader isr=new InputStreamReader(socketIn, "UTF-8");while ((headchar = isr.read()) != -1) {// 读取报文头 用字符流来读取headres += (char) headchar;......//一些逻辑 处理报文头}...//报文头读完了 获取了报文体的大小等内容 开始读报文体byte tempbuf[] = new byte[buffsize];int start = 0;int tem = -1;//用字节流来读报文体while ((tem = socketIn.read(tempbuf, start, buffsize)) != -1) {log.info("从"+start+"开始读"+buffsize);log.info("实际读取" + tem);if (tem < outparamsizes[i]) {start = start + tem;buffsize = buffsize - tem;...//一些逻辑 处理报文体 读取完毕}
这样的程序,在windows下正常工作,再放到linux下,读完报文头开始读取报文体的时候,并没有从报文体的开头开始读取,而是丢失了报文体前面的一些数据,导致读不到足够的数据直到超时。
经过一番调试和请教后发现原因:在linux下一个InputStream不能用字符流和字节流分段读取,因为linux下的字符由于utf8编码会多加几位,用字符读完报文头后其实就已经多读了许多位,再用字节读就丢掉多读的那部分了。
因此,只要将读取报文头的部分也改成字节流读取就可以了
Java代码
while ((headchar = socketIn.read()) != -1) {
...}
while ((headchar = socketIn.read()) != -1) {...}
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
相关文章推荐
- java文件读取(按字符读+按字节读+缓冲读取)FileReader FileInputStream BufferedReader
- linux和windows不同OS环境下VNC的使用方法(20060111)
- 不同平台windows、linux、mac 上换行符的问题
- 在不同平台获取机器名(windows or linux)
- 利用net-snmp读取windows,linux,snmp设备数据(cpu,内存,网卡)
- InputStream的read方法读取字节不完全的问题
- [C] 跨平台使用TCHAR——让Linux等平台也支持tchar.h,解决跨平台时的格式控制字符问题,多国语言的同时显示(兼容vc/gcc/bcb,支持Windows/Linux/Mac)
- Java文件夹操作,判断多级路径是否存在,不存在就创建(包括windows和linux下的路径字符分析),兼容Windows和Linux
- 局域网内linux系统读取windows的共享目录
- windows和linux下读取文件乱码的终极解决办法!
- linux,串口读取指定数目的字节,串口读取数据错误
- <BIO>以字节的方式(写入,读取)文本,以字符的方式(写入,读取)文本和<NIO>的写入,读取
- Windows与Linux系统比较 相似与不同
- Io流字节字符流九种方式读取和写入总结!
- 关于Windows和Linux文件盘符的不同的代码块
- 文件写入读取和宽字符多字节字符间转换
- UNIX下是\n,Windows下是\r\n (Linux & Windows中Enter键的不同解释)
- 在Windows下使用TinyXML-2读取UTF-8编码包含中文字符的XML文件
- JAVA读取classess下的.properties配置文件封装类,linux和windows上都可以使用
- Linux,Windows,Mac OS下换行的不同表示