✎ 编程开发网

SQL Server统计信息维护策略的选择(二)

2015-11-21 01:29:11 · 作者: · 浏览: 208

标签: SQL Server 统计信息维护策略选择

回多少条记录，这时候就需要一个统计信息的支持。如果没有，SQL Server会自动创建一个。

我们可以在SalesOrderHeader_test上试试。 ??

sp_helpstats SalesOrderHeader_test ? ?

go ? ?

-- 返回表格没有statistics（索引上的除外） ? ?

select count(*) from ? ?

dbo.SalesOrderHeader_test ? ?

where OrderDate = '2004-06-11 00:00:00.000' ? ?

go ? ?

-- 运行一句在OrderDate上有过滤条件的查询 ? ?

sp_helpstats SalesOrderHeader_test ? ?

go ? ?

-- 返回表格已经有了一个新的统计信息 ? ?

statistics_name ? ? ? ? ? ?statistics_keys ? ?

------------------------------------------ --------------- ? ?

_WA_Sys_00000003_1A34DF26 ?OrderDate

因此，在打开Auto Create Statistics的数据库上，一般不需要担心SQL Server没有足够的统计信息来选择执行计划，这一点完全交给SQL Server管理就可以了。

SQL Server不仅要建立合适的统计信息，还要及时更新它们，使它们能够反映表格里数据的变化，数据的插入、删除、修改都可能会引起统计信息的更新。但是，更新统计信息本身也是一件消耗资源的事情，尤其是对比较大的表格。如果有一点点小的修改SQL Server都要去更新统计信息，可能SQL Server就得光忙活这个，来不及做其他事了。SQL Server还是要在统计信息的准确度和资源合理消耗之间做一个平衡。触发统计信息自动更新的条件是：

1．如果统计信息是定义在普通表格上的，那么当发生下面变化之一后，统计信息就被认为是过时的了，下次使用到时，会自动触发一个更新动作

（1）表格从没有数据变成有大于等于1条数据。

（2）对于数据量小于500行的表格，当统计信息的第一个字段数据累计变化量大于500以后。

（3）对于数据量大于500行的表格，当统计信息的第一个字段数据累计变化量大于500 + (20%×表格数据总量)以后。

所以对于比较大的表，只有1/5以上的数据发生变化后，SQL Server才会去重算统计信息。

2．临时表（Temp Table）上可以有统计信息，其维护策略基本和普通表格一致，但是表变量（Table Variable）上不能建统计信息

这样的维护策略能够保证花费比较小的代价，确保统计信息基本正确。本案例，反映这个维护策略在数据分布特殊的表格上，也有可能造成一些负面的影响，只需定期手工（或者做一个任务）更新表的统计信息即可。

在SQL Server 2005以后，数据库属性多了一个“Auto Update Statistics Asynchronously”。当SQL Server发现某个统计信息过时时，它会用老的统计信息继续现在的查询编译，但是会在后台启动一个任务，更新这个统计信息。这样下一次统计信息被使用到时，就已经是一个更新过的版本。这样做的缺点是不能保证当前这句查询的执行计划准确性，凡事有利有弊，数据库管理员可以根据实际情况做选择。

当然，的确有一些例外情况。由于数据的特殊性，会使得SQL Server这种Auto Update Statistics的算法不能满足确保执行计划准确性的需求，在实际使用中，有时候数据库的性能会突然之间慢下来。

有经验的管理员会安排做一次索引重建的任务，常常对性能会有所帮助。通常人们会解释为，因为索引重建消除了数据碎片，而提高了性能，其实索引重建还做了另外一件很重要的工作，它使用full scan的方式，重新更新了表上的统计信息，使得统计信息非常精确。这对性能帮助作用也会很大。

跟踪标记 2371

SQL Server 2008 R2 SP1介绍了一个非常好的特性，可以修改自动统计算法（auto stats algorithm），从默认的20%+500行到一个范围值（sliding scale）。该属性只能通过打开跟踪标记2371打开，而并不是默认打开的。

如果按自动统计算法一切运行良好，没有性能问题需要担心。现在只需要考虑到表基数太大像50000行或1000000时的阈值。在这种情况下，对于高基数的表，这些阈值可能不够好。例如，我有一个表基数为50000的表。我插入了20%（10000）新行。根据之前的标准阈值，这些20%的新插入的行不满足触发自动更新统计信息。这可能就是你的情况中性能问题的原因之一。如果你面对同样的问题，不需要担心，因为微软提供了跟踪标记2371.通过使用该标记，SQL Server对于自动更新超过25000行的表上的统计信息，将会决定动态的阈值。对于自动更新统计信息，更高的行基数将会使用更低的阈值。

2371：SQL根据需要自动修改统计信息更新的阀值，而不按照默认算法

http://www.sqlservergeeks.com/sql-server-trace-flag-2371/

策略选择

在大数据库上开启该跟踪标记，很明显是为了使用自动统计，因此需要打开自动统计。此外，我们需要对于拥有超级大表的数据库打开“Auto Update Statistics Asynchronously”。开启异步更新统计信息特性的原因是，当自动统计触发的时候，你不想看到查询超时。

我们知道自动统计当表中实际的行数改变时会更新统计信息。当超级大表触发了自动统计运行时，如果花费超过30秒运行更新统计信息命令，触发自动统计的查询语句将会超时，导致了事务回滚，意味着自动统计命令也回滚。因此下一个查询也会触发自动统计信息更新，并且这个过程将重复循环。

你会在SQL Server中随机看到查询超时，即使执行计划看起来总体正常。你也会看到存储该数据库的磁盘上产生了大量的IO，因为自动统计统计做了大量的表查询，并且自动统计不断循环运行。

当在数据库上开启异步自动更新统计信息，当自动统计被SQL Server触发时，查询不会等待更新统计信息命令去完成。而更新统计信息命令会在后台运行，让查询继续正常运行。现在查询将会使用旧的也许可用的统计信息运行，在这种情况下，它们在2秒之前可用，因此如果它们用于数秒也没有什么大不了。

不推荐在每个数据库上开启异步更新统计信息设置。所有的小数据库都会在超时时间内很好的更新统计信息。

对于需要开启异步更新统计信息的表，可以定时手动更新同步信息。

设置异步更新统计信息

SELECT name, is_auto_update_stats_on, is_auto_update_stats_async_on ? ?

FROM sys.databases

ALTE

首页上一页 1 2 3 下一页尾页 2/3/3

上一篇 SQL关联操作（查询与更新）

下一篇在SQL Server中为什么不建议使用N..