Rss订阅

首页 »数据库 » 统计字符串长度:分拆统计字符串 »正文

统计字符串长度:分拆统计字符串

来源: 发布时间:星期四, 2009年2月12日浏览:83次评论:0

在数据库表tbl1中有

个字段Keywords

它是nvarchar类型

长度为1000

该字段

内容是所要分析

论文

关键字
id keywords
-----------------------------------------------------------
1 kw1;kw2;kw3
2 kw2;kw3
3 kw3;kw1;kw4

问题1

对于在keywords字段中出现

所有关键字集合(上例中关键字集合为{kw1,kw2,kw3,kw4})中

任意

个关键字

要统计它出现

次数(也就是包含该关键字

纪录

条数)

然后写到另

张表中

最后

效果就是
keywords count
-------------------------
kw1 2
kw2 2
kw3 3
kw4 1

问题2

在此基础上

要进行组合查询

也就是说在整个关键字集合中任意抽出两个关键字

统计它们在数据库表纪录中同时出现

次数

对于上题

最后效果要是:
keywords count
----------------------------------
kw1;kw2 1
kw1;kw3 2
kw1;kw4 1
kw2;kw3 2
kw2;kw4 0
kw3;kw4 1

--------------------------------------------------------------------------------------

--统计举例

--为统计处理专门做

序数表
select top 1000 id=identity(

,1,1)

o 序数表 from syscolumns a,syscolumns b
alter table 序数表 add constra

pk_id_序数表 primary key(id)
go

--举例数据
create table tbl1(id

,keywords nvarchar(1000))
insert tbl1 select 1,\'kw1;kw2;kw3\'
union all select 2,\'kw2;kw3\'
union all select 3,\'kw3;kw1;kw4\'
go

--第

种统计(计数)
select keyword=sub

(a.keywords,b.id,charindex(\';\',a.keywords+\';\',b.id)-b.id)
,[count]=count(distinct a.id)
from tbl1 a,序数表 b
where b.id<=len(a.keywords)
and sub

(\';\'+a.keywords,b.id,1)=\';\'
group by sub

(a.keywords,b.id,charindex(\';\',a.keywords+\';\',b.id)-b.id)
go

--第 2种统计(组合统计)
select keyword=sub

(a.keywords,b.id,charindex(\';\',a.keywords+\';\',b.id)-b.id)
,[count]=count(distinct a.id),a.id

o #t
from tbl1 a,序数表 b
where b.id<=len(a.keywords)
and sub

(\';\'+a.keywords,b.id,1)=\';\'
group by sub

(a.keywords,b.id,charindex(\';\',a.keywords+\';\',b.id)-b.id),a.id

select keyword=a.keyword+\';\'+b.keyword,[count]=sum(

a.id when b.id then 1

0 end)
from #t a,#t b
where a.keyword<b.keyword
group by a.keyword,b.keyword
order by keyword

drop table #t
go

--删除测试环境
drop table tbl1,序数表

/*--测试结果

--统计1
keyword count
---------- --------
kw1 2
kw2 2
kw3 3
kw4 1

(所影响

行数为 4 行)

--统计2
keyword count
----------------------- -----------
kw1;kw2 1
kw1;kw3 2
kw1;kw4 1
kw2;kw3 2

kw2;kw4 0
kw3;kw4 1

(所影响

行数为 6 行)
--*/

标签：连接字符串未结束的字符串常量字符串统计字符串长度

下载文章的 PDF文档电子版离线看

我顶

专注于互联网--专注于架构

首页 »数据库 » 统计字符串长度:分拆统计字符串 »正文

统计字符串长度:分拆统计字符串

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章