Rss订阅

首页 »数据库 » sqlserver索引:SQL Server中索引使用及维护 »正文

sqlserver索引:SQL Server中索引使用及维护

来源: 发布时间:星期六, 2008年12月20日浏览:51次评论:0

="t18">在应用系统中,尤其在联机事务处理系统中,对数据查询及处理速度已成为衡量应用系统成败

标准

而采用索引来加快数据处理速度也成为广大数据库用户所接受

优化思路方法

在良好

数据库设计基础上

能有效地使用索引是SQL Server取得高性能

基础

SQL Server采用基于代价

优化模型

它对每

个提交

有关表

查询

决定是否使用索引或用哪

个索引

查询执行

大部分开销是磁盘I/O

使用索引提高性能

个主要目标是避免全表扫描

全表扫描需要从磁盘上读表

每

个数据页

如果有索引指向数据值

则查询只需读几次磁盘就可以了

所以如果建立了合理

索引

优化器就能利用索引加速数据

查询过程

但是

索引并不总是提高系统

性能

在增、删、改操作中索引

存在会增加

定

工作量

因此

在适当

地方增加适当

索引并从不合理

地方删除次优

索引

将有助于优化那些性能较差

SQL Server应用

实战表明

合理

索引设计是建立在对各种查询

分析和预测上

只有正确地使索引和

结合起来,才能产生最佳

优化方案

本文就 SQL Server索引

性能问题进行了

些分析和实战

、聚簇索引(clustered indexes)

使用

聚簇索引是

种对磁盘上实际数据重新组织以按指定

个或多个列

值排序

由于聚簇索引

索引页面指针指向数据页面

所以使用聚簇索引查找数据几乎总是比使用非聚簇索引快

每张表只能建

个聚簇索引

并且建聚簇索引需要至少相当该表 120%

附加空间

以存放该表

副本和索引中间页

建立聚簇索引

思想是:

1、大多数表都应该有聚簇索引或使用分区来降低对表尾页

竞争

在

个高事务

环境中

对最后

页

封锁严重影响系统

吞吐量

2、在聚簇索引下

数据在物理上按顺序排在数据页上

重复值也排在

起

因而在那些包含范围检查(between、<、<=、>、>=)或使用group by或order by

查询时

旦找到具有范围中第

个键值

行

具有后续索引值

行保证物理上毗连在

起而不必进

步搜索

避免了大范围扫描

可以大大提高查询速度

3、在

个频繁发生插入操作

表上建立聚簇索引时

不要建在具有单调上升值

列(如IDENTITY)上

否则会经常引起封锁冲突

4、在聚簇索引中不要包含经常修改

列

码值修改后

数据行必须移动到新

位置

5、选择聚簇索引应基于where子句和连接操作

类型

聚簇索引

侯选列是:

1、主键列,该列在where子句中使用并且插入是随机

2、按范围存取

列

如pri_order > 100 and pri_order < 200

3、在group by或order by中使用

列

4、不经常修改

列

5、在连接操作中使用

列

2、非聚簇索引(nonclustered indexes)

使用

SQL Server缺省情况下建立

索引是非聚簇索引

由于非聚簇索引不重新组织表中

数据

而是对每

行存储索引列值并用

个指针指向数据所在

页面

换句话说非聚簇索引具有在索引结构和数据本身的间

个额外级

个表如果没有聚簇索引时,可有250个非聚簇索引

每个非聚簇索引提供访问数据

区别排序顺序

在建立非聚簇索引时

要权衡索引对查询速度

加快和降低修改速度的间

利弊

另外

还要考虑这些问题:

1、索引需要使用多少空间

2、合适

列是否稳定

3、索引键是如何选择

扫描效果是否更佳

4、是否有许多重复值

对更新频繁

表来说

表上

非聚簇索引比聚簇索引和根本没有索引需要更多

额外开销

对移到新页

每

行而言

指向该数据

每个非聚簇索引

页级行也必须更新

有时可能还需要索引页

分理

从

个页面删除数据

进程也会有类似

开销

另外

删除进程还必须把数据移到页面上部

以保证数据

连续性

所以

建立非聚簇索引要非常慎重

非聚簇索引常被用在以下情况:

1、某列常用于集合

(如Sum,....)

2、某列常用于join,order by,group by

3、查寻出

数据不超过表中数据量

20%

3、覆盖索引(covering indexes)

使用

覆盖索引是指那些索引项中包含查寻所需要

全部信息

非聚簇索引

这种索引的所以比较快也正是

索引页中包含了查寻所必须

数据,不需去访问数据页

如果非聚簇索引中包含结果数据,那么它

查询速度将快于聚簇索引

但是由于覆盖索引

索引项比较多,要占用比较大

空间

而且update操作会引起索引值改变

所以如果潜在

覆盖查询并不常用或不太关键

则覆盖索引

增加反而会降低性能

4、索引

选择技术

p_detail是住房公积金管理系统中记录个人明细

表

有890000行

观察在区别索引下

查询运行效果

测试在C/S环境下进行

客户机是IBM PII350(内存64M),服务器是DEC Alpha1000A(内存128M),数据库为SYBASE11.0.3

1、 select count(*) from p_detail where op_date>’19990101’ and op_date<’ 19991231’ and pri_surplus1>300 2、 select count(*),sum(pri_surplus1) from p_detail where op_date>’19990101’ and pay_month between‘199908’ and’199912’　　不建任何索引查询1 1分15秒　　查询2 1分7秒　　在op_date上建非聚簇索引查询1 57秒　　查询2 57秒　　在op_date上建聚簇索引查询1 <1秒　　查询2 52秒　　在pay_month、op_date、pri_surplus1上建索引查询1 34秒　　查询2 <1秒　　在op_date、pay_month、pri_surplus1上建索引查询1 <1秒　　查询2 <1秒

从以上查询效果分析

索引

有无

建立方式

区别将会导致区别

查询效果

选择什么样

索引基于用户对数据

查询条件,这些条件体现于where从句和join表达式中

般来说建立索引

思路是:

(1)、主键时常作为where子句

条件

应在表

主键列上建立聚簇索引

尤其当经常用它作为连接

时候

(2)、有大量重复值且经常有范围查询和排序、分组发生

列

或者非常频繁地被访问

列

可考虑建立聚簇索引

(3)、经常同时存取多列

且每列都含有重复值可考虑建立复合索引来覆盖

个或

组查询

并把查询引用最频繁

列作为前导列

如果可能尽量使关键查询形成覆盖查询

(4)、如果知道索引键

所有值都是唯

那么确保把索引定义成唯

索引

(5)、在

个经常做插入操作

表上建索引时

使用fillfactor(填充因子)来减少页分裂

同时提高并发度降低死锁

发生

如果在只读表上建索引

则可以把fillfactor置为100

(6)、在选择索引键时

设法选择那些采用小数据类型

列作为键以使每个索引页能够容纳尽可能多

索引键和指针

通过这种方式

可使

个查询必须遍历

索引页面降到最小

此外

尽可能地使用整数为键值

它能够提供比任何数据类型都快

访问速度

5、索引

维护

上面讲到,某些不合适

索引影响到SQL Server

性能,随着应用系统

运行,数据不断地发生变化,当数据变化达到某

个程度时将会影响到索引

使用

这时需要用户自己来维护索引

索引

维护包括:

1、重建索引

随着数据行

插入、删除和数据页

分裂

有些索引页可能只包含几页数据

另外应用在执行大块I/O

时候

重建非聚簇索引可以降低分片

维护大块I/O

效率

重建索引实际上是重新组织B-树空间

在下面情况下需要重建索引:

(1)、数据和使用模式大幅度变化

(2)、排序

顺序发生改变

(3)、要进行大量插入操作或已经完成

(4)、使用大块I/O

查询

磁盘读次数比预料

要多

(5)、由于大量数据修改

使得数据页和索引页没有充分使用而导致空间

使用超出估算

(6)、dbcc检查出索引有问题

当重建聚簇索引时,这张表

所有非聚簇索引将被重建

2、索引统计信息

更新

当在

个包含数据

表上创建索引

时候

SQL Server会创建分布数据页来存放有关索引

两种统计信息:分布表和密度表

优化器利用这个页来判断该索引对某个特定查询是否有用

但这个统计信息并不动态地重新计算

这意味着

当表

数据改变的后

统计信息有可能是过时

从而影响优化器追求最有工作

目标

因此

在下面情况下应该运行update statistics命令:

(1)、数据行

插入和删除修改了数据

分布

(2)、对用truncate table删除数据

表上增加数据行

(3)、修改索引列

值

6、结束语

实战表明

不恰当

索引不但于事无补

反而会降低系统

执行性能

大量

索引在插入、修改和删除操作时比没有索引花费更多

系统时间

例如下面情况下建立

索引是不恰当

:

1、在查询中很少或从不引用

列不会受益于索引

索引很少或从来不必搜索基于这些列

行

2、只有两个或 3个值

列

如男性和女性(是或否)

从不会从索引中得到好处

另外

鉴于索引加快了查询速度

但减慢了数据更新速度

特点

可通过在

个段上建表

而在另

个段上建其非聚簇索引

而这两段分别在单独

物理设备上来改善操作性能

标签：sqlserver2005使用 sqlserver使用 sqlserver建索引 sqlserver索引

下载文章的 PDF文档电子版离线看

顶一下

专注于互联网--专注于架构

首页 »数据库 » sqlserver索引:SQL Server中索引使用及维护 »正文

sqlserver索引:SQL Server中索引使用及维护

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章