SQLServer2000里自动重建索引
8 \& r* Z# C( rSQLServer2000里自动重建索引
( P) t( T, \6 v: r8 X- u--王成辉翻译整理,转贴请注明出自微软BI开拓者www.windbi.com & h0 c' o- p# e+ h) U2 `
--原帖地址
/ H7 {- `* r0 j0 M3 y5 u9 u3 g在所有的OLTP环境里,实质上所有的索引都将随着时间产生碎片。几乎所有的UPDATE、INSERT、DELETE活动都将引起索引比最初创建时变得更无组织。页拆分更多,大量的页上只有很少的数据,因此满足每个SELECT需要更多的I/O。数据和索引的碎片越多,应用程序就会更慢,数据花费的空间就更多。对此你能做什么呢?你可以定期的重建索引。 p1 e0 y l6 [8 ^) b: J
那么什么可以立即使用呢? ' T4 f7 S' T6 M. {0 e
基本上你可以使用数据库维护向导来执行索引重建,创建维护计划来完成。如果你原意接受它固有的缺陷,这也可以使用。首先,用维护向导来配置和完成索引重建是不慎重的。它将重建每一个索引,不管它是否需要重建。如果你有一个有很多大表和大量索引的大数据库,这会出问题,因为不加区别的重建整个数据库的索引会花费很长的时间,会使你的维护窗口不可用。问题在于,要么全部重建,要么全部不重建,你根本不能以任何方式分批处理数据库的表。 9 n, | E, ^3 \6 O! ?: x! g
6 O) E/ z6 k- M; P
* L4 X& l! Y4 a% ^: x- ?- E. h8 e那么有什么别的能做吗?你可以写一个脚本来重建选择的表的索引。这样你能对数据库分批处理以减少在重建索引时你维护窗口执行的时间。你需要将这个时间减小到最少,因为重建索引会对表执行排它锁,在重建索引期间禁止用户访问。所以你可以每周的每个工作日的晚上重建五分之一表的索引,所有的索引至少一周做一次。然而,这也是不慎重的――你将重建所有表的索引而不论数据和索引是否是有碎片。 8 j& v& I/ d( j( G: y& n
这里推荐选择性的重建索引。你需要检查表的索引和数据的碎片,保留数据,据此操作,重建索引要用确定的且区别对待的方式。仅仅通过这样系统的方法,你可以仅重建那些实际需要重建的表的数据和索引。而且也只有这种方式能最小化索引重建的时间。在整个索引重建期间,如果你不想影响你的用户的话,减少索引重建的时间是至关重要的。
& w% m( h- {4 G那么我们怎样可以解决呢?
7 g+ K' a! n2 u5 j+ c" l& X4 ]可以使用命令
4 W6 A- e2 b+ M, U9 ZDBCC SHOWCONTIG()
* z+ t( ^2 F5 z2 r% E l. G& y0 BSQLServer2000比以前版本有一个大的改进就是这个简单而又至关重要的命令。DBCC SHOWCONTIG是SQLServer提供来检查索引碎片情况的工具。在以前的版本里(7.0和更早的版本),这个命令只输出文本,如果手工处理这个命令很好,然而,要实现自动化目的,它会带来严重的问题。那意味着你要循环执行每一个表并将结果输出到文本文件,然后为了读和解释原文的输出结果以便获得你寻找的信息,需要进行烦人的结构化处理。
+ D1 K( {; }4 B& G- {; zSQLServer2000对DBCC SHOWCONTIG()命令引进了一个关键子句,名为WITH TABLERESULTS。这意味着你能运行这个命令然后将捕获的数据直接输出到表里,而不是还需要使用XP_CMDSHELL来操作的文本文件里。 ' l' i1 k+ n7 h) ]# y
在SQLServer2000里,这意味着你能结构化的循环处理表,通过在它们上面运行DBCC SHOWCONTIG命令以将捕获碎片信息插入表中。然后你能循环使用这个结果,根据碎片的情况,选择性的进行碎片整理。可以用下面的存储过程实现: `" `; W, n. }& ~6 Y) z3 G
CREATE PROCEDURE sp_defragment_indexes @maxfrag DECIMAL % I3 A+ ?8 ^6 k0 L
AS --王成辉翻译整理,转贴请注明出处
* H6 @; Z, w* h* s/ y) j--声明变量
! ^8 I3 M2 L4 A9 S8 Z% C. _4 KSET NOCOUNT ON ) j+ |. E( K6 S$ U S/ D" x8 A
DECLARE @tablename VARCHAR (128)
; S" Z2 b5 }9 [3 R7 n5 ADECLARE @execstr VARCHAR (255)
' v' ?4 N K3 u6 z9 X" NDECLARE @objectid INT 4 Y+ l% f4 X- ^2 Q
DECLARE @objectowner VARCHAR(255) 1 F5 A8 I! L# B7 L3 g' v$ p
DECLARE @indexid INT
# m* D+ F) U( ?6 l' @DECLARE @frag DECIMAL 0 z$ y0 q# Q: x# f
DECLARE @indexname CHAR(255) # `) {" k4 v+ C& b' K. G' Y
DECLARE @dbname sysname " q3 S3 o% W3 W1 ?- |+ G4 e
DECLARE @tableid INT 2 ? a1 e" s( F, E1 z- U: [. }2 t
DECLARE @tableidchar VARCHAR(255)
, Y1 e2 ^/ b9 s! z. i--检查是否在用户数据库里运行
# a" ^) A, g. s# I+ R" s: Y; |SELECT @dbname = db_name() % b" a, l7 C8 q. H! k3 x' L9 o
IF @dbname IN ('master', 'msdb', 'model', 'tempdb') / w. h. C! q9 \8 }
BEGIN ; f' D; t, \4 _0 @5 k5 ] `
PRINT 'This procedure should not be run in system databases.'
" J' d& ^. h# W, x8 _RETURN ; d U" x; m& v
END 8 f) N6 S4 B6 a3 n# K
--第1阶段:检测碎片
: d I/ f Y: m8 _- w( ^" n--声明游标
$ i7 n+ R9 }! p4 L3 A* Z; jDECLARE tables CURSOR FOR z( I x- A$ U u4 |
SELECT convert(varchar,so.id)
) Q: [9 }* s3 t5 `FROM sysobjects so % y$ m( J, j3 \. R; O) n2 I+ Z s" t
JOIN sysindexes si & l7 c' P7 z1 S$ m% g
ON so.id = si.id ! \* o6 T! k5 K% H* m
WHERE so.type ='U' & ^" a9 e* g9 l) j( C/ H: q4 B
AND si.indid < 2
6 ], e) ]. N, ~4 C- z+ cAND si.rows > 0
& r$ c, Q8 U( u0 C) y6 `-- 创建一个临时表来存储碎片信息 / f2 R+ l5 D, F" Q' O- q. p
CREATE TABLE #fraglist ( ) U; W3 i# b4 j/ x4 L
ObjectName CHAR (255),
, l0 u# y( W7 ]. F3 t* u' cObjectId INT,
, v' t6 r+ K6 X" F4 q: aIndexName CHAR (255),
8 k6 o* n6 X( l' |/ e6 `8 P/ UIndexId INT,
* U) n8 y, a( K+ @# V0 h iLvl INT, * M ~1 P7 ~3 b9 @9 \
CountPages INT, * U4 Y9 V! b, q3 ?& {
CountRows INT,
' k L( v/ e0 `MinRecSize INT, 9 I: U, f+ c- s X
MaxRecSize INT, & R' u' h5 a% r2 X0 N* B
AvgRecSize INT, , _# b; [% i# }9 Z6 y- g; q) {
ForRecCount INT, & d+ y) R; A- M( A+ ^
Extents INT, - T. f' A* J4 |; `& {. k% {5 G+ V* d) _
ExtentSwitches INT,
5 Q% m7 j! q1 _. U6 NAvgFreeBytes INT,
. _! M( d4 `5 A! L+ U5 ~AvgPageDensity INT,
9 i, I6 o: k4 f5 ~$ wScanDensity DECIMAL,
; q( i( O$ L- w4 ~; tBestCount INT, ) w S! g3 J4 e$ @/ F& N1 M
ActualCount INT, * r5 `7 @4 F' E+ c
LogicalFrag DECIMAL, * L8 E' B: f* _; _/ E
ExtentFrag DECIMAL)
7 X7 O/ u" z" q: b1 ]# L+ R J--打开游标 2 k) g1 t- l# @
OPEN tables " a. b# w" U( M# i# {
-- 对数据库的所有表循环执行dbcc showcontig命令 7 q& q- t5 A% O3 _8 w
FETCH NEXT " q5 T7 y- I" H D: S9 T) I
FROM tables 8 A+ x* C* G; ` }9 v
INTO @tableidchar " n* ~3 \1 c7 k, T5 R" u- D |, V( V
WHILE @@FETCH_STATUS = 0
" c. _( C x; ?" ~+ Q7 A6 o! sBEGIN
5 f4 o/ n' N6 ^5 d% @--对表的所有索引进行统计
0 H; c3 D7 Q# y- M. v4 OINSERT INTO #fraglist
/ b" e+ P7 \# s R! f1 BEXEC ('DBCC SHOWCONTIG (' + @tableidchar + ') WITH FAST, TABLERESULTS, ALL_INDEXES, NO_INFOMSGS')
1 r5 |! [' D) b2 ZFETCH NEXT % v; W5 ~- O/ H9 P
FROM tables
' n* e* Q+ C6 lINTO @tableidchar
! m* m' g/ h5 O$ p. h3 Y2 ~0 [END 9 z: l, H( e4 t: J5 B
-- 关闭释放游标
8 t: ~+ Y2 s6 uCLOSE tables ! W4 t3 h3 t4 n. t6 L
DEALLOCATE tables : m) Q4 t$ y. ~. X: B! O
-- 为了检查,报告统计结果 - c3 _# T* z' l I9 L) Z
SELECT * FROM #fraglist
% [% C- L4 W1 @ T1 {* k! D) r--第2阶段: (整理碎片) 为每一个要整理碎片的索引声明游标
7 Z4 ?* W& g. h+ w+ y aDECLARE indexes CURSOR FOR
9 q/ e3 m4 \( Z: C+ ]4 l, d9 ySELECT ObjectName, ObjectOwner = user_name(so.uid), ObjectId, IndexName, ScanDensity
+ ^- a$ p6 j# y& I2 {$ CFROM #fraglist f
* u9 S* @% G1 X0 F& ZJOIN sysobjects so ON f.ObjectId=so.id
+ U X# I, N& p, k5 O4 gWHERE ScanDensity <= @maxfrag & e; b& O4 [1 H/ \- U) S
AND INDEXPROPERTY (ObjectId, IndexName, 'IndexDepth') > 0
% u( D6 n& F* M& B4 z# H-- 输出开始时间
0 P! c# ~+ I' s' e4 RSELECT 'Started defragmenting indexes at ' + CONVERT(VARCHAR,GETDATE()) 5 N, Y9 Y9 N V. W$ O
--打开游标 8 Y/ M( m" A0 z, ~
OPEN indexes
8 p! D1 U3 T8 Z1 w3 k--循环所有的索引 - l# I# y0 K1 p; ^( Y4 V* l
FETCH NEXT " t7 L( s P+ _9 A6 _& E
FROM indexes & Z. W7 a$ F" ~9 `* g
INTO @tablename, @objectowner, @objectid, @indexname, @frag
3 c/ h! k3 z7 n, Z8 L8 UWHILE @@FETCH_STATUS = 0 2 t+ V3 w# \ M" j! Z
BEGIN 9 x5 s" c* z# p/ ~3 ]* h6 I% n
SET QUOTED_IDENTIFIER ON
" Q4 M) K! X7 c8 YSELECT @execstr = 'DBCC DBREINDEX (' + '''' +RTRIM(@objectowner) + '.' + RTRIM(@tablename) + '''' +
5 N; q/ _& f2 j l6 f Y" x', ' + RTRIM(@indexname) + ') WITH NO_INFOMSGS'
) ?7 H: c. J1 l# _# `$ j3 q' ISELECT 'Now executing: '
0 G: f- c. ]/ p5 c3 M7 pSELECT(@execstr) 3 h/ Y0 U* q+ z& B6 t' [; X+ `
EXEC (@execstr) 0 S: G4 k' c0 E, Y/ S
SET QUOTED_IDENTIFIER OFF 8 R. Z8 k/ p+ U6 Z
FETCH NEXT j8 ^% O2 `( v: y5 N8 z4 S
FROM indexes
6 R9 x0 ], f+ A2 |7 `9 p( _INTO @tablename, @objectowner, @objectid, @indexname, @frag 8 R( H. G4 E0 Q! @" K
END ) O; w5 P, e' w. \- `) ~8 r
-- 关闭释放游标
! q5 c3 T8 v# x6 f6 c7 ]. B/ ECLOSE indexes ' T3 B: q/ y4 g4 ^/ M1 y
DEALLOCATE indexes
' ~2 }4 L4 e8 z1 S( k, A* q; v5 x-- 报告结束时间 - l% s/ @3 }5 |# M
SELECT 'Finished defragmenting indexes at ' + CONVERT(VARCHAR,GETDATE()) 6 q) R f/ N8 S$ b9 j9 B/ r
-- 删除临时表 + j; M: d! |0 f, y& e" y
DROP TABLE #fraglist 8 h, u! F/ m2 t$ J* K1 F& b
GO
$ P$ X8 d. i8 T0 U# {" _5 C8 F9 i使用 4 Y/ u% A( F* w! w1 L, A
这个存储过程应该创建在master数据库里,以便你能在服务器上的任何用户数据库里使用。
7 @* U) |+ A: s9 H在用户数据库里通过传递一个参数(MAXFRAG)来运行。该参数是一个百分比值。意思是任何索引的碎片扫描密度小于这个值。例如,如果你想要整理那些扫描密度小于95%的索引的碎片: . ?/ I0 M1 y4 r( w; @, A6 {. I
USE pubs
, _ U! `' f0 F, r2 D/ {: ]6 SGO
7 ]3 q; z1 x4 g( h/ x- A/ s& cEXEC sp_deframent_indexes 95.00
4 k# F$ z' ^9 j* h/ W- T局限
; r% I7 ]/ v& V5 | _这个过程依赖于的标准是扫描密度,但扫描密度对于那些跨越多个文件的索引来说不是一个有效的标准。如果你的索引确实跨越多个文件,你需要用另一个标准(如Logical Frag)来更改这个存储过程。然而,这类更改超过本文的范围;如果你的索引跨越多个文件,你需要做更多的工作。 9 R5 J% H4 u. [/ |, J& U
怎样做,做什么? / p4 B. s6 }" @8 k
这个存储过程有两个独特的部分。
( y* H! m) t0 ^ j2 _. i7 O第1阶段
; D" I! d* Z, Y8 K" k在这部分里,存储过程通过在数据库里的每个表上运行下面的命令来检查索引碎片:
& O* s) z2 a6 h6 ~* V! d9 s( MDBCC SHOWCONTIG (‘tablename') WITH FAST, TABLERESULTS, ALL_INDEXES, NO_INFOMSGS
1 v1 Z' `* |; n, q) _* Z9 F命令的结果存储在预先创建的临时表#fraglist里。这里就会用到DBCC SHOWCONTIG 语句的WITH TABLERESULTS的好处,仅这一点,真正的节省了太多的以前版本得到同样结果所花费的麻烦和精力。 0 e# ~: @* Y8 P: N+ @# c
你应该注意该存储过程工作的数据库的表的拥有者是不是dbo,通常是。我发现我最初的版本不起作用,当时一个软件经销商给我们提供的新系统的数据库里就出现了拥有者不是dbo的表。当我在这个新系统上第一次运行我的碎片整理过程时,这个程序的缺点就暴露无遗了,最后彻底失败。这个问题实际上出现在碎片整理阶段(阶段2),因为表在这里要引用表名,而在阶段1,DBCC SHOWCONTIG命令引用的时表的ID即object_id。
; [; K V0 r- g" r第2阶段 : `2 B0 k; X1 C2 q3 _
这儿使用了另一个游标来循环处理表#fraglist里的记录,这些记录是那些扫描密度低于传给存储过程参数的那个阈值的表:
- }7 E! ]: g3 N4 N3 W3 k# LDBCC DBREINDEX() * L( f+ ~6 j+ f& H
执行的结果以输出文件的形式显示在表#fraglist的内容之后,以便你能查看表和索引的碎片,正如屏幕上所显示的那样,也可以通过查看DBCC DBREINDEX()执行的结果列表来查看采取的动作。利用这些你也能推导出每个索引重建的时间。 T9 o# M, X/ n% }
输出结果是什么意思? 5 u! T/ _% X) |" |: f* ~# G& ?
输出示例: " v* z4 i j$ a2 E: M/ s3 b# h, z
 # d' y9 j8 u. ^
上面是在Excel里打开的存储过程输出文本文件的一个截屏。为了简洁一些列已经删掉了。你需要用文本文件向导来打开它,选择固定列宽,打开导入从第三行起。
$ v# ~. s: X) G/ a, N6 W这里,你能够检查你选择检查的数据库里的表的扫描密度。 2 X' }, Z& Q2 E
在接下来的输出文件里(DBCC SHOWCONTIG输出结果的后面),你会发现正被重建索引的每个表或索引的细节,这部分的开始和结束部分都有重建索引的开始和结束时间。如下面例子显示的那样: 2 b0 z8 }& ^( m+ G0 m( i( h

c; [0 @; Z" |为什么不使用DBCC INDEXDEFRAG()去减少阻塞? : v k, u, W6 M) ?, y8 N
答案是如果你想要或者需要的话就使用它。如果你需要7×24小时的在线操作,那么DBCC DBREINDEX()的排他表锁不适合你的业务,你可以使用它来代替DBCC DBREINDEX()。然而,你需要适当改变一下语法,因为它们是不相同的(谢谢,微软!)。如果你不知道它们的区别,这里有一个简单的摘要:当运行DBCC DBREINDEX()的时候,必须对表有排他锁,因为它是一个完全的,彻头彻尾的索引重建操作。而DBCC INDEXDEFRAG()就不那么完全了,在线的操作试图改善你索引的环境而不至于引起阻塞和中断OLTP(希望如此)。我必须承认我从来不用DBCC INDEXDEFRAG(),因为很幸运的是我的系统不需要严格的7×24在线且要求不阻塞,所以我不敢担保是否有效率。我已经理解它不是和DBCC DBREINDEX一样有效率。然而它的确比什么都没有强,所以如果你的数据库运行一个全球的WEB站点并且从来不能停止,这在今天这也很普遍,那么你需要使用它来代替以改变这个存储过程。 % H4 h% l8 ]/ |" @4 l Y9 ]
添加到调度任务里 + U' u S* @+ y
对于有相当经验的DBA来说这是一个相关的微不足道的任务,所以我在这里不会提供它的代码。作为一个独立的任务或在你存在的维护作业里的一个步骤都行。你要确保作业的步骤或作业里的输出结果是一个文本文件以便你能保存和查看所有重要的输出文件。 9 P' I" `; K9 O: u
结论 . R9 B2 h% p/ s+ u- O( m
希望这篇文章和代码能帮助你完成一个对数据库服务器维护来说更好的更精确的方法。现在的维护窗口开销很大,所以在影响用户和执行时间上保持最小的同时也提供了有效率和良好的数据库服务器维护。用调度作业实现这个过程,小心的监控它的输出结果。 |