-
Sql Server中三种字符串合并方法的性能比较
最近正在处理一个合并字符吕的存储过程,在一个测试系统的开发中,要使用到字符串合并功能,直接在Sql中做。
示例:
有表內容﹕
名称 內容
1 abc
1 aaa
1 dddd
2 1223
2 fkdjfd
--------------------------------
结果﹕
1 abc,aaa,dddd
2 1223,fkdjfd
要求用一条SQL语句实现﹐如﹕select sum(內容) from table group by 名称
--该问题,一共使用了三种方法,并分别测试了一下这三种方法的各自的性能
1: 创建处理函数
2 : sql 2005及以上版本中的新的解决方法,FOR XML
3 : 使用临时表实现字符串合并处理的示例
说明:以下测试是以本人机器的硬件配置为准,根据硬件配置的不同,结果可能不同。
1: 创建处理函数
说明:sql 全系列版本
CREATE FUNCTION dbo.f_strHeBin(@id int)
RETURNS varchar(8000)
AS
BEGIN
DECLARE @r varchar(8000)
SET @r = ''
SELECT @r = @r + ',' + value
FROM tb
WHERE id=@id
RETURN STUFF(@r, 1, 1, '')
END
GO
-- 调用函数
SELECt id, values=dbo.f_strHeBin(id)
FROM tb
GROUP BY id
以上方式得到的是根据ID合并的所有记录,如果要得到相应的单一ID的记录,则还需要添加一条语句:
假设:以上结果入到临时表3t3中:
SELECT id,max(values) as values FROM #t3 GROUP BY id
go
分析结果如下:
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 7 毫秒。
1--使用sql 全系列版本,自定义合并函数方式
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
表 'Worktable'。扫描计数 1,逻辑读取 4030 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb'。扫描计数 2,逻辑读取 46 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 1397254 毫秒,占用时间 = 1463680 毫秒。
(1969 行受影响)
(218 行受影响)
表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 '#t3___000067'。扫描计数 1,逻辑读取 16 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 84 毫秒。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 2 毫秒。
总计耗时计:24.4分钟,这才1969行记录,这个方法看来在这种情况下不可取。
2 : sql 2005及以上版本中的新的解决方法,FOR XML
select id,stuff(
(select '-' + convert(varchar(4),value)
from tb
where id=A.id
order by id
for xml path('')
),1,1,'') as values
from tb A
group by id
go
分析结果如下:
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
表 'Worktable'。扫描计数 439,逻辑读取 32978 次,物理读取 0 次,预读 0 次,lob 逻辑读取 319 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb'。扫描计数 4,逻辑读取 92 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 1856 毫秒,占用时间 = 1955 毫秒。
总计耗时:2秒钟。不过这个方法随着记录数量的增加,性能也随之降低,在数据记录达到20000条的时候,耗时将近2.5分钟。
3 : 使用临时表实现字符串合并处理的示例
SELECT id ,values=CAST(value as varchar(8000))
INTO #t2 FROM tb
ORDER BY id
DECLARE @col1 varchar(5),@col2 varchar(8000)
UPDATE #t2 SET
@col2=CASE WHEN @col1=id THEN @col2+'-'+values ELSE values END,
@col1=zo3,
qs=@col2
SELECT id,max(values) values FROM #t2 group by id
drop table #t2
go
分析结果如下:
SQL Server 分析和编译时间:
CPU 时间 = 7 毫秒,占用时间 = 7 毫秒。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb'。扫描计数 2,逻辑读取 46 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 734 毫秒,占用时间 = 769 毫秒。
(2012 行受影响)
表 '#t2___________000000000065'。扫描计数 1,逻辑读取 1677 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 62 毫秒,占用时间 = 62 毫秒。
(2012 行受影响)
表 '#t2__________000000000065'。扫描计数 1,逻辑读取 849 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 16 毫秒,占用时间 = 7 毫秒。
(218 行受影响)
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
总计耗时:769ms+62ms+15ms=846ms,总费时1秒钟不到,当数据记录达到20000条记录时,性能损耗也不太严重,在6-10秒左右。能够接受。
出处:https://www.cnblogs.com/chillsrc/archive/2011/03/02/1969010.html
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式