-
使用SQL SERVER存储过程实现历史数据迁移方式
今天讲下软件开发中最常见的历史数据迁移方式。在讲迁移之前,先简单介绍下几个基本概念。
1、什么是历史数据迁移?
简单直白地说:就是将一些创建时间比较久而且不常用的历史数据,存储到另一个地方(可以是另一个数据,也可以是另一个表),一般历史数据迁移的数据,都是不会更改了的数据,后续只可能需要查询统计而已。
2、历史数据迁移的目的
减少在用数据库的数量,因为数据量越大,数据库操作数据(包括:查询、排序等等)的时间也就越长,当一个表的数据达到上千万级以上,再来个多条件多表查询的时候,是会有响应速度慢的可能。(因为不同开发人员写的逻辑,不可能保障每个SQL都是高效率执行的SQL)
所以及时迁移走一些历史数据,是对整个系统性能的提升是有一定好处的。
3、什么时候需要做历史数据迁移?
最简单的情况,就是你感觉程序有变慢的趋势,那就可以开始考虑历史数据迁移了。
原则上,小企业服务器不多,硬件配置也不是很高的情况下,单表500万以上的数据,最好就开始慢慢迁移,别动不动就等到几千万的数据才开始迁移。
根据产生数据量的大小判断,一般保持1年左右的业务数据即可,一年前的历史数据都迁入历史上数据库。如果每天产生的数据量实在太大的话,一般就需要考虑自动分表存储,当然如果没做这个的话,可以在不影响日常业务的情况下,实时在用业务数据库只保留最近3-6个月的数据。
4、数据迁移的基本思路
1)、第一次迁移创建一个一模一样的表结构(只要第一次迁移前创建即可)
2)、按照数据的创建时间排序,把最早的数据N条数据查出,同时插入到历史数据表中。
insert into ... select from
3)、检测插入数据的准确性,一定要保证是N条没错。之后删除在用的业务数据库。
4)、当迁移数据中途有误时,终止程序,但不能删除在用数据库,需要开发人员核对数据。
5)、根据迁移的对性能的影响,N不能太多,最多一次5W到10W条吧(根据服务器的性能配置,推荐一次迁移1W至5W条数据影响较小)。如果要迁移大量数据,可以考虑分批执行。
5、数据迁移存储过程代码示例
代码如下:(无需过多解释,很简单的代码,一看就懂)
我们在测试数据库中来简单执行下试试效果:
6、使用场景特别说明
此方式是采用 insert into ... select from 的方式进行数据迁移。这个思路由于是最简单的数据迁移逻辑,仅适用于小数据量的情况(一般表数据低于500万),当数据量大于500万之后千万别用此方法,因为此时的insert into ... select from 会执行很慢,有很大可能会影响正式环境的运行。
还有就是此方法,由于是SQL直接访问数据库,所以要求当前业务库和历史数据都能访问(也就是同一个数据库实例),如果异地不同的数据库也没办法处理。
所以此方法仅适用于简单的历史数据迁移场景,使用前提有限,适合小项目使用。
对于大数据量的(单表1千万以上的数据),又不能影响当下业务性能指标的数据迁移方式,请看下篇文章介绍。
到此这篇关于使用SQL SERVER存储过程实现历史数据迁移的文章就介绍到这了
原文:https://www.jb51.net/article/223454.htm