对Windows磁盘写操作的理解
2016-01-13 23:52
344 查看
最近做的项目有个问题,非法关机。以前的板子没有OS也就那么着了,现在上了Windows,一关机就会出现问题:数据损坏和数据丢失。
数据损坏:一幅60M左右的图像,前半部分是正常的,后面都是0x00。
数据丢失:有的图像只有文件名,占用空间是0kB,有的连文件名都没有。
WTF?
先说几个概念:
1. allocation unit size:也就是Cluster size(下图中的分配单元大小),意思是Cluster size represents the smallest amount of disk space that can be used to hold a file.
对于不同容量的盘,默认值不同,对于NTFS系统,16TByte以下的默认值都是4K(具体见微软官方说明。如果你打开一个文件的属性,会发现它有两个属性:大小和占用空间。而占用空间肯定是4Kbyte的倍数:
用C#简单写了一个写磁盘的程序(每100ms写入一组系统本地时间),然后你会发现磁盘容量是以4KB为步长递增的,代码如下:
在windows下通过“磁盘管理”去查看磁盘的策略,可以发现:
这是神马意思? 其实在windows里,操作系统向application返回的”写操作“已完成只是将数据写到了System Cache里面(见下图),等到一定时间间隔以后,操作系统才会将数据写入磁盘里,这种写入方式成为write-back,而这个延迟的时间间隔取决于文件在cache中存放的时间和该文件上一次被读取的时间。这样做的目的是尽可能的使频繁读的数据尽量久的放在cache中。这里是关于File Cache的官方说法。
write-back的另外一个好处就是提高I/O性能,试想,如果很多小文件频繁的写磁盘,势必是非常低效,Cache把它们集中起来一起写,解决了这个问题。
如果此时发生断电,那么在Cache中的数据就会丢失。
但对于较大的文件,Cache可能就是负作用了。如果想取消这个延迟写的方式,微软建议的方法是在CreateFile的dwFlagsandAttributes参数中传入FILE_FLAG_NO_BUFFERING。但CreateFile是Windows的一个API函数,如果用C#怎么办?
关于Write-back机制的另一篇好文:http://flylib.com/books/en/4.491.1.101/1/。作者是Mark E. Russinovich(Azure的CTO)。
未完待续....
数据损坏:一幅60M左右的图像,前半部分是正常的,后面都是0x00。
数据丢失:有的图像只有文件名,占用空间是0kB,有的连文件名都没有。
WTF?
先说几个概念:
1. allocation unit size:也就是Cluster size(下图中的分配单元大小),意思是Cluster size represents the smallest amount of disk space that can be used to hold a file.
对于不同容量的盘,默认值不同,对于NTFS系统,16TByte以下的默认值都是4K(具体见微软官方说明。如果你打开一个文件的属性,会发现它有两个属性:大小和占用空间。而占用空间肯定是4Kbyte的倍数:
用C#简单写了一个写磁盘的程序(每100ms写入一组系统本地时间),然后你会发现磁盘容量是以4KB为步长递增的,代码如下:
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.IO; using System.Timers; namespace Test_SystemIO { class Program { static FileStream aFile = new FileStream("temp.txt", FileMode.Create); static StreamWriter sw = new StreamWriter(aFile); public static void Main(string[] args) { Timer aTimer = new Timer(); aTimer.Interval = 100; aTimer.Elapsed += new ElapsedEventHandler(DisplayTimerEvent); aTimer.Start(); aTimer.Enabled = true; while (Console.ReadKey().KeyChar != 'q') { } sw.Close(); return; } public static void DisplayTimerEvent(object source, ElapsedEventArgs e) { string s = DateTime.Now.ToString(); Console.WriteLine(s); sw.WriteLine(s, "\r"); } } }2. write-back
在windows下通过“磁盘管理”去查看磁盘的策略,可以发现:
这是神马意思? 其实在windows里,操作系统向application返回的”写操作“已完成只是将数据写到了System Cache里面(见下图),等到一定时间间隔以后,操作系统才会将数据写入磁盘里,这种写入方式成为write-back,而这个延迟的时间间隔取决于文件在cache中存放的时间和该文件上一次被读取的时间。这样做的目的是尽可能的使频繁读的数据尽量久的放在cache中。这里是关于File Cache的官方说法。
write-back的另外一个好处就是提高I/O性能,试想,如果很多小文件频繁的写磁盘,势必是非常低效,Cache把它们集中起来一起写,解决了这个问题。
如果此时发生断电,那么在Cache中的数据就会丢失。
但对于较大的文件,Cache可能就是负作用了。如果想取消这个延迟写的方式,微软建议的方法是在CreateFile的dwFlagsandAttributes参数中传入FILE_FLAG_NO_BUFFERING。但CreateFile是Windows的一个API函数,如果用C#怎么办?
关于Write-back机制的另一篇好文:http://flylib.com/books/en/4.491.1.101/1/。作者是Mark E. Russinovich(Azure的CTO)。
未完待续....
相关文章推荐
- 行处理——运算
- 两个小时搭建一个自己的人脸识别App
- 查询score中选学一门以上课程的同学中分数为非最高分成绩的记录
- CentOS 7.0,启用iptables防火墙
- C# partial 说明
- 【iOS开发】原生XML解析
- (一一二)名称空间
- JDK配置
- javascript变量作用域
- 高性能之《图片浏览器和引导页》的窥视
- 【python学习笔记】浅探编码
- 人脸识别
- SAR数据下载网站
- linux下使用 ffmpeg 实现MP4转gif
- java基础-java反射机制
- 转换成二进制
- 2015年度总结
- request response
- python get、post提交表单(headers)
- Linux扩展权限