Rss订阅

首页 »数据库 » sql语句实例讲解:讲解SQL 2000的Collection排序规则 »正文

sql语句实例讲解:讲解SQL 2000的Collection排序规则

来源: 发布时间:星期日, 2009年8月16日浏览:0次评论:0

　　SQL Server

排序规则很多人使用

并不是很多

对于初学者来讲会感觉特别陌生

但其中有

个

很多人都是经常碰到

: SQL Server数据库

在跨库多表连接查询时

若两数据库默认

集区别

系统就会返回这样

:

　　“无法解决 equal to 操作

排序规则冲突

”

　　

、

分析:

　　这个

是

排序规则不

致造成

测试如下:

　　create table #t1(
　　name varchar(20) collate Albanian_CI_AI_WS,
　　value

)
　　create table #t2(
　　name varchar(20) collate Chinese_PRC_CI_AI_WS,
　　value

)

　　表建好后

再来执行连接查询:

　　select * from #t1 A inner join #t2 B _disibledevent=>

　　此时

就出现了:

　　服务器: 消息 446

级别 16

状态 9

行 1

　　无法解决 equal to 操作

排序规则冲突

　　要排除这个

最简单思路方法是

表连接时指定它

排序规则

这样

就不再出现了

语句这样写:

　　select *
　　from #t1 A inner join #t2 B
　　on A.name=B.name collate Chinese_PRC_CI_AI_WS

　　 2.排序规则介绍:

　　什么叫排序规则呢?MS是这样描述

:"在 Microsoft SQL Server 2000 中

串

物理存储由排序规则控制

排序规则指定表示每个

位模式以及存储和比较

所使用

规则

"在查询分析器内执行下面语句

可以得到SQL　SERVER支持

所有排序规则

　　select * from ::fn_helpcollations

　　排序规则名称由两部份构成

前半部份是指本排序规则所支持

集

如:

　　Chinese_PRC_CS_AI_WS

　　前半部份:指UNICODE

集

Chinese_PRC_指针对大陆简体字UNICODE

排序规则

后半部份即后缀含义:

　　_BIN 2进制排序

　　_CI(CS) 是否区分大小写

CI不区分

CS区分

　　_AI(AS) 是否区分重音

AI不区分

AS区分

　　_KI(KS) 是否区分假名类型,KI不区分

KS区分

　　_WI(WS) 是否区分宽度 WI不区分

WS区分

　　区分大小写:如果想让比较将大写字母和小写字母视为不等

请选择该选项

　　区分重音:如果想让比较将重音和非重音字母视为不等

请选择该选项

如果选择该选项

　　比较还将重音区别

字母视为不等

　　区分假名:如果想让比较将片假名和平假名日语音节视为不等

请选择该选项

　　区分宽度:如果想让比较将半角

和全角

视为不等

请选择该选项

　　 3.排序规则

应用:

　　SQL Server提供了大量

Windows和SQLSERVER专用

排序规则

但它

应用往往被开发人员所忽略

其实它在实战中大有用处

　　例1:让表NAME列

内容按拼音排序:

　　create table #t(id

,name varchar(20))
　　insert #t select 1,'中'
　　union all select 2,'国'
　　union all select 3,'人'
　　union all select 4,'阿'
　　select * from #t order by name collate Chinese_PRC_CS_AS_KS_WS
　　drop table #t
　　/*结果:
　　id name
　　----------- --------------------
　　4 阿
　　2 国
　　3 人
　　1 中
　　*/

　　例2:让表NAME列

内容按姓氏笔划排序:

　　create table #t(id

,name varchar(20))
　　insert #t select 1,' 3'
　　union all select 2,'乙'
　　union all select 3,' 2'
　　union all select 4,'

'
　　union all select 5,'十'
　　select * from #t order by name collate Chinese_PRC_Stroke_CS_AS_KS_WS
　　drop table #t
　　/*结果:
　　id name
　　----------- --------------------
　　4

　　2 乙
　　3 2
　　5 十
　　1 3
　　*/

　　 4.在实战中排序规则应用

扩展

　　SQL Server汉字排序规则可以按拼音、笔划等排序

那么我们如何利用这种功能来处理汉字

些难题呢?我现在举个例子:　用排序规则

特性计算汉字笔划

　　要计算汉字笔划

我们得先做准备工作

我们知道

Windows多国汉字

UNICODE目前收录汉字共20902个

简体GBK码汉字UNICODE值从19968开始

　　首先

我们先用SQLSERVER思路方法得到所有汉字

不用字典

我们简单利用SQL语句就可以得到:

　　select top 20902 code=identity(

,19968,1)

o #t from syscolumns a,syscolumns b

　　再用以下语句

我们就得到所有汉字

它是按UNICODE值排序

:

　　select code,nchar(code) as CNWord from #t

　　然后

我们用Select语句

让它按笔划排序

　　select code,nchar(code) as CNWord
　　from #t
　　order by nchar(code) collate Chinese_PRC_Stroke_CS_AS_KS_WS,code

　　结果:

　　code CNWord
　　----------- ------
　　19968

　　20008 丨
　　20022 丶
　　20031 丿
　　20032 乀
　　20033 乁
　　20057 乙
　　20058 乚
　　20059 乛
　　20101 亅
　　19969 丁
　　..........

　　从上面

结果

我们可以清楚

看到

笔

汉字

code是从19968到20101

从小到大排

但到了 2笔汉字

第

个字“丁”

CODE为19969

就不按顺序而重新开始了

有了这结果

我们就可以轻松

用SQL语句得到每种笔划汉字归类

第

个或最后

个汉字

　　下面用语句得到最后

个汉字:

　　create table #t1(id

identity,code

,cnword nvarchar(2))
　　insert #t1(code,cnword)
　　select code,nchar(code) as CNWord from #t
　　order by nchar(code) collate Chinese_PRC_Stroke_CS_AS_KS_WS,code
　　select A.cnword
　　from #t1 A
　　left join #t1 B _disibledevent=>　　where B.code is null
　　order by A.id

　　得到36个汉字

每个汉字都是每种笔划数按Chinese_PRC_Stroke_CS_AS_KS_WS排序规则排序后

最后

个汉字:

　　亅阝马风龙齐龟齿鸩龀龛龂龆龈龊龍龠龎龐龑龡龢龝齹龣龥齈龞麷鸞麣龖龗齾齉龘

　　上面可以看出:“亅”是所有

笔汉字排序后

最后

个字

“阝”是所有 2笔汉字排序后

最后

个字......等等

　　但同时也发现

从第33个汉字“龗(33笔)”后面

笔划有些乱

不正确

但没关系

比“龗”笔划多

只有 4个汉字

我们手工加上:齾35笔

齉36笔

靐39笔

龘64笔

　　建汉字笔划表(TAB_HZBH):

　　create table tab_hzbh(id

identity,cnword nchar(1))

　　--先插入前33个汉字

　　insert tab_hzbh
　　select top 33 A.cnword
　　from #t1 A
　　left join #t1 B _disibledevent=>　　where B.code is null
　　order by A.id

　　--再加最后 4个汉字

　　

identity_insert tab_hzbh _disibledevent=>　　select top 1 id
　　from tab_hzbh
　　where cnword>=@a collate Chinese_PRC_Stroke_CS_AS_KS_WS
　　order by id
　　id
　　-----------
　　8

　　(结果:汉字“国”笔划数为8)

　　上面所有准备过程

只是为了写下面这个

这个

撇开上面建

所有临时表和固定表

为了通用和代码转移方便

把表tab_hzbh

内容写在语句内

然后计算用户输入

串汉字

总笔划:

　　create function fun_getbh(@str nvarchar(4000))
　　

　　as
　　begin
　　declare @word nchar(1),@n

@n=0
　　while len(@str)>0
　　begin
　　

@word=left(@str,1)

　　--如果非汉字

笔划当0计

　　

@n=@n+(

when unicode(@word) between 19968 and 19968+20901
　　then (select top 1 id from (
　　select 1 as id,N'亅' as word
　　union all select 2,N'阝'
　　union all select 3,N'马'
　　union all select 4,N'风'
　　union all select 5,N'龙'
　　union all select 6,N'齐'
　　union all select 7,N'龟'
　　union all select 8,N'齿'
　　union all select 9,N'鸩'
　　union all select 10,N'龀'
　　union all select 11,N'龛'
　　union all select 12,N'龂'
　　union all select 13,N'龆'
　　union all select 14,N'龈'
　　union all select 15,N'龊'
　　union all select 16,N'龍'
　　union all select 17,N'龠'
　　union all select 18,N'龎'
　　union all select 19,N'龐'
　　union all select 20,N'龑'
　　union all select 21,N'龡'
　　union all select 22,N'龢'
　　union all select 23,N'龝'
　　union all select 24,N'齹'
　　union all select 25,N'龣'
　　union all select 26,N'龥'
　　union all select 27,N'齈'
　　union all select 28,N'龞'
　　union all select 29,N'麷'
　　union all select 30,N'鸞'
　　union all select 31,N'麣'
　　union all select 32,N'龖'
　　union all select 33,N'龗'
　　union all select 35,N'齾'
　　union all select 36,N'齉'
　　union all select 39,N'靐'
　　union all select 64,N'龘'
　　) T
　　where word>=@word collate Chinese_PRC_Stroke_CS_AS_KS_WS
　　order by id ASC)

0 end)
　　

@str=right(@str,len(@str)-1)
　　end
　　

@n
　　end

　　

例子:

　　select dbo.fun_getbh('中华人民共和国'),dbo.fun_getbh('中華人民共和國')

　　执行结果:笔划总数分别为39和46

简繁体都行

　　当然

你也可以把上面“UNION　ALL”内

汉字和笔划改存在固定表内

在汉字列建CLUSTERED INDEX

列排序规则设定为:

　　Chinese_PRC_Stroke_CS_AS_KS_WS

　　这样速度更快

如果你用

是BIG5码

操作系统

你得另外生成汉字

思路方法

样

但有

点要记住:这些汉字是通过SQL语句Select出来

不是手工输入

更不是查字典得来

新华字典毕竟区别于UNICODE

集

查字典

结果会不正确

　　用排序规则

特性得到汉字拼音首字母

　　用得到笔划总数相同

思路方法

我们也可以写出求汉字拼音首字母

如下:

　　create function fun_getPY(@str nvarchar(4000))
　　

s nvarchar(4000)
　　as
　　begin
　　declare @word nchar(1),@PY nvarchar(4000)
　　

@PY=''
　　while len(@str)>0
　　begin
　　

@word=left(@str,1)

　　--如果非汉字

返回原

@PY=@PY+(

when unicode(@word) between 19968 and 19968+20901
　　then (select top 1 PY from (
　　select 'A' as PY,N'驁' as word
　　union all select 'B',N'簿'
　　union all select 'C',N'錯'
　　union all select 'D',N'鵽'
　　union all select 'E',N'樲'
　　union all select 'F',N'鰒'
　　union all select 'G',N'腂'
　　union all select 'H',N'夻'
　　union all select 'J',N'攈'
　　union all select 'K',N'穒'
　　union all select 'L',N'鱳'
　　union all select 'M',N'旀'
　　union all select 'N',N'桛'
　　union all select 'O',N'漚'
　　union all select 'P',N'曝'
　　union all select 'Q',N'囕'
　　union all select 'R',N'鶸'
　　union all select 'S',N'蜶'
　　union all select 'T',N'籜'
　　union all select 'W',N'鶩'
　　union all select 'X',N'鑂'
　　union all select 'Y',N'韻'
　　union all select 'Z',N'咗'
　　) T
　　where word>=@word collate Chinese_PRC_CS_AS_KS_WS
　　order by PY ASC)

@word end)
　　

@str=right(@str,len(@str)-1)
　　end
　　

@PY
　　end

　　

例子:

　　select dbo.fun_getPY('中华人民共和国'),dbo.fun_getPY('中華人民共和國')

　　结果都是:ZHRMGHG

　　大家如果有兴趣

可以使用相同

思路方法

扩展得到汉字全拼

甚至你还可以得到全拼

读音声调

不过全拼分类大多了

得到全拼最好还是用对照表

两万多汉字搜索速度显然很快

另外

用对照表还可以充分利用表

索引

标签：sql按时间排序 sql排序语句 sql排序 sql语句实例讲解

下载文章的 PDF文档电子版离线看

我顶

专注于互联网--专注于架构

首页 »数据库 » sql语句实例讲解:讲解SQL 2000的Collection排序规则 »正文

sql语句实例讲解:讲解SQL 2000的Collection排序规则

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章