您的位置：首页 > 其它

关于中文字符UNICODE编码的三个问题（基于此可以求中文字符的笔划和首拼）

2006-10-20 16:17 639 查看

问题一：怎么知道中文字符的UNICODE编码是从19968到40870的

select code=identity(int,1,1) into #t from
(select top 100 a=1 from syscolumns) as a,
(select top 100 a=1 from syscolumns) as b,
(select top 10 a=1 from syscolumns) as c

--得到1-100000的连续自然数

select nchar(code),code from #t order by code
--可以发现，中文字符就是UNICODE编码从19968到40870

知道了以后，就可以直接这么写了，得到所有汉字及对应unicode码
select top 20902 code=identity(int,19968,1) into #t from
(select top 165 a=1 from syscolumns) as a,
(select top 165 a=1 from syscolumns) as b
--得到所有汉字

select nchar(code),code
from #t

问题二：
怎么知道按照笔划排序中文是
‘一’，‘丁’，‘万’等是一笔，两笔，三笔的第一个的

select nchar(code),code
from #t
order by nchar(code) COLLATE Chinese_PRC_Stroke_ci_as
就可以看出来，同笔划的汉字，是按unicode码排列的。
如是：

declare @s nvarchar(100)
declare @n int

set @s = ''
set @n = 9999999

select @s = case when @n > code then @s+chn else @s end,
@n = code from (
select top 21000 chn=nchar(code),code
from #t
order by nchar(code) COLLATE Chinese_PRC_Stroke_ci_as) as a

select @s
--一丁万不且丞丣并临丵乾亁乱仙僵亸偿儭儳儶俪亹儽儾
--囔圞灥囖爨厵滟灪爩齾齉靐

问题三：
怎么知道按照拼音排序中文是
‘吖’‘八’‘嚓’等是A，B，C发音的第一个的

我是一个个找的：
select chn=nchar(code),code from #t
order by nchar(code) COLLATE Chinese_PRC_CI_AS

从原理来讲，可以根据j9988老总已有的求首拼码的函数得出来： http://expert.csdn.net/Expert/topic/1266/1266960.xml?temp=.2896234 select chn=min(nchar(code)),singlepy=dbo.getfirstpy(nchar(code))
from #t
where dbo.getfirstpy(nchar(code)) <> ''
group by dbo.getfirstpy(nchar(code))
order by dbo.getfirstpy(nchar(code))

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航