下面是一个典型的dbms_stats方法调用。
SQL> exec dbms_stats.gather_table_stats(user,'T',cascade => true,method_opt => 'for all columns size auto');
PL/SQL procedure successfully completed
其中,method_opt参数是一个重要的工作控制参数,与表列统计量有关。目前的method_opt参数主要负责三部分职责:
ü用来指定对哪些数据列收集或者不收集统计量;
ü数据列直方图Histogram生成控制;
ü拓展统计量extended statistics数据收集;
本篇分别从实验的各个环节进行分析。
1、实验环境介绍
我们选择11gR2版本进行试验。
SQL> select * from v$version;
BANNER
---------------------------------------------------------------------
Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - Production
PL/SQL Release 11.2.0.1.0 - Production
CORE11.2.0.1.0Production
TNS for Linux: Version 11.2.0.1.0 - Production
NLSRTL Version 11.2.0.1.0 - Production
数据表T创建。
SQL> create table t as select * from dba_objects ;
Table created
SQL> exec dbms_stats.gather_table_stats(user,'T',cascade => true,method_opt => 'for all columns size auto');
PL/SQL procedure successfully completed
2、Method_Opt参数官方解析
从官方资料中,我们可以找到dbms_stats方法的说明如下:
procedure gather_table_stats
(ownname varchar2, tabname varchar2, partname varchar2 default null,
estimate_percent number default DEFAULT_ESTIMATE_PERCENT,
block_sample boolean default FALSE,
method_opt varchar2 default DEFAULT_METHOD_OPT,
degree number default to_degree_type(get_param('DEGREE')),
granularity varchar2 defaultDEFAULT_GRANULARITY,
cascade boolean default DEFAULT_CASCADE,
stattab varchar2 default null, statid varchar2 default null,
statown varchar2 default null,
no_invalidate boolean default
to_no_invalidate_type(get_param('NO_INVALIDATE')),
stattype varchar2 default 'DATA',
force boolean default FALSE);
--method_opt - method options of the following format
--
--method_opt:= FOR ALL [INDEXED | HIDDEN] COLUMNS [size_clause]
--FOR COLUMNS [size_clause]
--column|attribute [size_clause]
--[,column|attribute [size_clause] ... ]
--
--size_clause := SIZE [integer | auto | skewonly | repeat],
--where integer is between 1 and 254
--
--column:= column name | extension name | extension
--
--default is FOR ALL COLUMNS SIZE AUTO.
--The default value can be changed using set_param procedure.
--Optimizer related table statistics are always gathered.
--
--If an extension is provided, the procedure create the extension if it
--does not exist already. Please refer to create_extended_stats for
--description of extension.
从说明材料中,可以发现几个方面的内 :首先,method_opt并不只是gather_table_stats过程独有的参数,而是dbms_stats包若干方法中共有的一个控制参数。如果没有指定的话,Oracle选择了一个默认值DEFAULT_METHOD_OPT赋值。
在包声明中寻找DEFAULT_METHOD_OPT取值,可以找到一个定义值’z’。
DEFAULT_METHOD_OPTCONSTANT VARCHAR2(1) := 'Z';
取值内部Z是一个编码内部解析的原理,不是随便的字符可以得到解析。
SQL> exec dbms_stats.gather_table_stats(user,'T',method_opt => 'Z');
PL/SQL procedure successfully completed
SQL> exec dbms_stats.gather_table_stats(user,'T',method_opt => 'A');
begin dbms_stats.gather_table_stats(user,'T',method_opt => 'A'); end;
ORA-20000: Cannot parse for clause: A
ORA-06512: 在 "SYS.DBMS_STATS", line 20337
ORA-06512: 在 "SYS.DBMS_STATS", line 20360
ORA-06512: 在 line 1
从官方解析的看,11gR2这个参数的取值作用是for all columns size auto。注意:之前版本9i时,这个参数取值不是这个。
那么,这个method_opt默认取值for all columns size auto的作用是什么呢?这个取值是要给所有的数据列生成统计量,并且依据auto的原则生成直方图Histogram。
3、auto与直方图
直方图Histogram是Oracle为了解决倾斜列Skew进行的一种折中处理方法。因为如果一个列取值分布是不平均的,那么where条件中出现不同的取值,对应的最优执行计划可能是不同的。
但是,传统的密度、选择率等统计量是不能够反应取值分布差异的。所以,Oracle选择使