SQL遍历解析
在SQL的存储过程,函数中,经常需要使用遍历(遍历table),其中游标、临时表等遍历方法很常用。面对小数据量,这几种遍历方法均可行,但是面临大数据量时,就需要择优选择,不同的遍历方法,在效率上存在指数级别的差异
本文列举了常用的3中遍历方法:游标、临时表、索引表,重点分析其效率。
本文主要针对大量数据的遍历,当数据量小时;可以随意选择一种遍历方法。
实例数据如下:一共177471条数据
需求:更新LDBM,其中LDBM=LXBM+LDXLH;即update V_TL_T_LD_ALL set LDBM=LXBM+LDXLH:为了演示遍历,我们循环遍历,一条条数据更新,同时统计其效率,并初略分析其原因
1.游标遍历
游标的遍历
游标是一种最常用的方法,使用起来比较简单,主要步骤为:声明游标,打开游标,使用游标,关闭游标和释放游标。示例代码如下
1 -- 方法1:游标
2 -- 声明变量
3 DECLARE
4 @LDBM AS NVARCHAR(20),
5 @LDXLH AS NVARCHAR(20),
6 @LXBM AS NVARCHAR(20),
7 @CROWID AS NVARCHAR(80);
8
9 -- 声明游标
10 DECLARE T_LD CURSOR FAST_FORWARD FOR
11 SELECT LDBM,LDXLH,LXBM,CROWID
12 FROM V_TL_LD_ALL1
13
14 OPEN T_LD;
15
16 -- 取第一条记录
17 FETCH NEXT FROM T_LD INTO @LDBM,@LDXLH,@LXBM,@CROWID;
18
19 WHILE @@FETCH_STATUS=0
20 BEGIN
21 -- 操作
22 UPDATE V_TL_LD_ALL1 SET LDBM= @LDBM+' '+@LDXLH WHERE CROWID=@CROWID;
23
24 -- 取下一条记录
25 FETCH NEXT FROM T_LD INTO @LDBM,@LDXLH,@LXBM,@CROWID;
26 END
27
28 -- 关闭游标
29 CLOSE T_LD;
30
31 -- 释放游标
32 DEALLOCATE T_LD;
游标是最直接的从表里面一条条的数据取出,并进行update操作,没有涉及到索引,如果数据量大,其取数据和update都将消耗大量的时间,因此此种方式效率很低。
从对数据库的操作上,其一共操作数据库2n+1次,将数据取出并存入游标(申明游标):1次;update更新操作:n次;从游标取记录:n次;将数据存储到游标和消耗了大量的内存,且随着数据量的增大,消耗值将呈现指数增加
更新上述177474条数据一共消耗了2h48min37s
2.临时表
使用游标不仅仅存在性能的问题,也违背面向集合思想的问题,所以我们有必要用面向集合的思想去找到一种更好的解决方案,即使用面向对象的思想,构造一个临时表,然后直接操作临时表,代码如下。
1 -- 方法2:使用临时表
2 -- 创建临时表
3 SELECT LDBM,LDXLH,LXBM,CROWID
4 INTO #T_LD
5 FROM V_TL_LD_ALL1
6
7 -- 声明变量
8 DECLARE
9 @LDBM AS NVARCHAR(20),
10 @LDXLH AS NVARCHAR(20),
11 @LXBM AS NVARCHAR(20),
12 @CROWID AS NVARCHAR(80);
13
14 WHILE EXISTS(SELECT CROWID FROM #T_LD)
15 BEGIN
16 -- 也可以使用top 1
17 SET ROWCOUNT 1
18 SELECT @LXBM= LXBM, @LDXLH= LDXLH,@CROWID=CROWID FROM #T_LD;
19 UPDATE V_TL_LD_ALL1 SET LDBM= @LXBM+' '+@LDXLH WHERE CROWID=@CROWID;
20 SET ROWCOUNT 0
21
22 DELETE FROM #T_LD WHERE CROWID=@CROWID;
23 END
使用临时表,和游标类似,同时将大量的数据存储到内存中,但是随着遍历的进行,临时表的数据量越来越小,可以相当程度的降低内存的消耗,但是需要不停的与table表做交互,一共操作3n+1次数据库;
此种方式,更新上述数据一共消耗:1H:45min:37S
3.索引表
索引表和临时表的操作类似;唯一区别在于在建立临时表是,添加一个索引,然后通过此索引从表中取数据;效率上有所提升,但是增加了变量的输出,代码如下
1 --方法3:使用索引表
2 --创建临时表
3 IF EXISTS(Select Name From Sysobjects Where Name='tmpTable')
4 DROP table tmpTable --存在则删除
5 create table tmpTable(
6 NID int primary key identity(1,1), --主键,自增
7 CrowId nvarchar(90),
8 LXBM nvarchar(20),
9 LDXLH nvarchar(6),
10 )
11 --插入数据
12 insert into tmpTable(CrowId,LXBM,LDXLH)
13 select CrowId,LXBM,LDXLH from V_TL_LD_ALL1
14
15 -- 声明变量
16 DECLARE
17 @index int,
18 @countNum int,
19 @LDBM AS NVARCHAR(20),
20 @LDXLH AS NVARCHAR(20),
21 @LXBM AS NVARCHAR(20),
22 @CROWID AS NVARCHAR(80);
23
24 select @countNum=count(1) from tmpTable;
25 set @index=0;
26 --遍历
27 while @index<@countNum
28 begin
29 set @index=@index+1;
30 select @LXBM= LXBM, @LDXLH= LDXLH,@CROWID=CROWID from tmpTable where NID=@index
31 UPDATE V_TL_LD_ALL1 SET LDBM= @LXBM+' '+@LDXLH WHERE CROWID=@CROWID;
32 end
33
34 --删除临时索引表
35 DROP table tmpTable
临时索引表和临时表类似,区别在于:在取数据的时候,通过索引的方式取数据;相比临时表,减少了频繁操作数据库的次数,相比游标,减少了与数据库交互的时间(索引检索速度更快)
更新上述数据,一共消耗:1H2,min
比较而言,建议尽可能少的使用游标,不仅消耗内存,代码量也稍微复杂一些;当数据量小的时候,建议使用临时表(代码比较轻量),而随着数据的增加,建议使用索引表