您的位置:首页 > 编程语言 > C语言/C++

(转)VC++ 2005 -- ANSI & MBCS & UNICODE

2010-02-12 17:27 309 查看
我们在编写VisualC++2005程序时候经常会碰到(如下错误),很迷惑,下面让我来解释以下。。。

'CreateWindowExW':cannotconvertparameter2from'constchar[7]'to'LPCWSTR'

UNICODE
计算机发明后,为了在计算机中表示字符,人们制定了一种编码,叫ASCII码。ASCII码由一个字节中的7位(bit)表示,范围是0x00-0x7F共128个字符。他们以为这128个数字就足够表示abcd....ABCD....1234这些字符了。
咳......说英语的人就是“笨”!后来他们突然发现,如果需要按照表格方式打印这些字符的时候,缺少了“制表符”。于是又扩展了ASCII的定义,使用一个字节的全部8位(bit)来表示字符了,这就叫扩展ASCII码。范围是0x00-0xFF共256个字符。
咳......说中文的人就是聪明!中国人利用连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312。后来,日文、韩文、阿拉伯文、台湾繁体(BIG-5)......都使用类似的方法扩展了本地字符集的定义,现在统一称为MBCS字符集(多字节字符集。既:有2个字节的字符,也有1个字节的字符)。这个方法是有缺陷的,因为各个国家地区定义的字符集有交集,因此使用GB-2312的软件,就不能在BIG-5的环境下运行(显示乱码,因为:阿拉伯人在机器上编写的阿拉伯文字,经过机器的字符编码,变成了一个特定的0xXXXX,而这个特定的0xXXXX字符到中国人的机器上却不存在相对应的汉字,或者是相对应出的汉字根本就与原来阿拉伯文字文章一点关系没有的,所以出现乱码),反之亦然。
咳......说英语的人终于变“聪明”一些了。为了把全世界人民所有的所有的文字符号都统一进行编码,于是制定了UNICODE标准字符集。UNICODE使用2个字节表示一个字符(unsignedshorint、WCHAR、_wchar_t、OLECHAR)。这下终于好啦,全世界任何一个地区的软件,可以不用修改地就能在另一个地区运行了。虽然我用IE浏览日本网站,显示出我不认识的日文文字,但至少不会是乱码了。UNICODE的范围是0x0000-0xFFFF共6万多个字符,其中光汉字就占用了4万多个。嘿嘿,中国人赚大了。
在程序中使用各种字符集的方法:

constchar*p="Hello";//使用ASCII字符集
constchar*p="你好";//使用MBCS字符集,由于MBCS完全兼容ASCII,多数情况下,我们并不严格区分他们
LPCSTRp="Hello,你好";//意义同上

constWCHAR*p=L"Hello,你好";//使用UNICODE字符集
LPCOLESTRp=L"Hello,你好";//意义同上

//如果预定义了_UNICODE,则表示使用UNICODE字符集;如果定义了_MBCS,则表示使用MBCS
constTCHAR*p=_T("Hello,你好");
LPCTSTRp=_T("Hello,你好");//意义同上

在上面的例子中,T是非常有意思的一个符号(TCHAR、LPCTSTR、LPTSTR、_T()、TEXT()、_TEXT()...),它表示使用一种中间类型,既不明确表示使用MBCS,也不明确表示使用UNICODE。那到底使用哪种字符集那?嘿嘿......编译的时候决定吧。设置条件编译的方式是:VC6中,"Project\Settings...\C/C++卡片Preprocessordefinitions"中添加或修改_MBCS、_UNICODE;VC.NET中,"项目\属性\配置属性\常规\字符集"然后用组合窗进行选择。使用T类型,是非常好的习惯,严重推荐!

举个例子:
"abc"是非Unicodestring,
L"abc"是Unicodetring.L用来定义UNICODE字符串,L就是转换成宽字符
其次:.NET的平台CLR(CommonLanguageRunTime库中用定义(#define)_UNICODE来表示使用Unicode;

在Win32API中是用定义(#define)UNICODE来表示使用Unicode。

而大多数应用程序(Application)都是既使用CLR又使用Win32API的,所以一般地,_UNICODE和UNICODE应该在工程中同时定义或同时不定义。
_T("abc")在_UNICODE已定义时解释成L"abc",是Unicodestring;
在_UNICODE未定义时则解释成"abc",非Unicodestring。

TEXT("abc")类似,不过它是根据UNICODE的定义与否来决定的。

再说以下:
如果有下面三句话:
TCHARszStr1[]=TEXT("str1");
charszStr2[]="str2";
WCHARszStr3[]=L("str3");
那么第一句话在定义了UNICODE时会解释为第三句话,没有定义时就等于第二句话。
第二句话无论是否定义了UNICODE都是生成一个ANSI字符串,而第三句话总是生成UNICODE字符串。
为了程序的可移植性,建议都用第一种表示方法。

MultiByteToWideChar函数与_T、TEXT()这两个宏都可以选择ASNI(MBCS)还是UNICODE字符

第一个函数转换的对象可以是常量、变量;第二、三只能转换常量。

补充:

LPSTR==char*
LPCSTR==constchar*
LPCTSTR==constchar*//Notdefined_UNICODE,suchaswin9x
LPCTSTR==constwchar_t*//defined_UNICODE,suchaswin2k
LPWSTR==wchar_t*

即:

LPCSTRA32-bitpointertoaconstantcharacterstring.
LPSTRA32-bitpointertoacharacterstring.
LPCTSTRA32-bitpointertoaconstantcharacterstringthatisportableforUnicodeandDBCS.
LPTSTRA32-bitpointertoacharacterstringthatisportableforUnicodeandDBCS.

部分可参见:http://www.vckbase.com/document/viewdoc/?id=1488

转载自:http://www.tongji.net/index.php/uid-160994-action-viewspace-itemid-12415
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: