您的位置:首页 > 其它

对Windows磁盘写操作的理解

2016-01-13 23:52 344 查看
最近做的项目有个问题,非法关机。以前的板子没有OS也就那么着了,现在上了Windows,一关机就会出现问题:数据损坏和数据丢失。

数据损坏:一幅60M左右的图像,前半部分是正常的,后面都是0x00。

数据丢失:有的图像只有文件名,占用空间是0kB,有的连文件名都没有。

WTF?

先说几个概念:

1. allocation unit size:也就是Cluster size(下图中的分配单元大小),意思是Cluster size represents the smallest amount of disk space that can be used to hold a file.



对于不同容量的盘,默认值不同,对于NTFS系统,16TByte以下的默认值都是4K(具体见微软官方说明。如果你打开一个文件的属性,会发现它有两个属性:大小和占用空间。而占用空间肯定是4Kbyte的倍数:



用C#简单写了一个写磁盘的程序(每100ms写入一组系统本地时间),然后你会发现磁盘容量是以4KB为步长递增的,代码如下:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.IO;
using System.Timers;

namespace Test_SystemIO
{
class Program
{

static FileStream aFile = new FileStream("temp.txt", FileMode.Create);
static StreamWriter sw = new StreamWriter(aFile);
public static void Main(string[] args)
{
Timer aTimer = new Timer();
aTimer.Interval = 100;
aTimer.Elapsed += new ElapsedEventHandler(DisplayTimerEvent);
aTimer.Start();
aTimer.Enabled = true;
while (Console.ReadKey().KeyChar != 'q')
{
}
sw.Close();
return;
}

public static void DisplayTimerEvent(object source, ElapsedEventArgs e)
{
string s = DateTime.Now.ToString();
Console.WriteLine(s);
sw.WriteLine(s, "\r");
}
}
}
2. write-back

在windows下通过“磁盘管理”去查看磁盘的策略,可以发现:



这是神马意思? 其实在windows里,操作系统向application返回的”写操作“已完成只是将数据写到了System Cache里面(见下图),等到一定时间间隔以后,操作系统才会将数据写入磁盘里,这种写入方式成为write-back,而这个延迟的时间间隔取决于文件在cache中存放的时间和该文件上一次被读取的时间。这样做的目的是尽可能的使频繁读的数据尽量久的放在cache中。这里是关于File Cache的官方说法

write-back的另外一个好处就是提高I/O性能,试想,如果很多小文件频繁的写磁盘,势必是非常低效,Cache把它们集中起来一起写,解决了这个问题。

如果此时发生断电,那么在Cache中的数据就会丢失。



但对于较大的文件,Cache可能就是负作用了。如果想取消这个延迟写的方式,微软建议的方法是在CreateFile的dwFlagsandAttributes参数中传入FILE_FLAG_NO_BUFFERING。但CreateFile是Windows的一个API函数,如果用C#怎么办?

关于Write-back机制的另一篇好文:http://flylib.com/books/en/4.491.1.101/1/。作者是Mark E. Russinovich(Azure的CTO)。

未完待续....
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: