SQL语句优化方案资料汇总(一)

2014-11-24 15:34:35 · 作者: · 浏览: 2

晚上项目组内开会讨论SQL语句的优化方案,大家都分享了自己的优化经验,以下为我记录、摘录、汇总部分资料与大家分享,不用全看,留着仅作查询,每次写SQL语句的时候能想起来查询一下即可。让我们做到不但会写SQL,还要做到写出性能优良的SQL。

(1)选择最有效率的表名顺序(只在基于规则的优化器中有效):
ORACLE 的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最先处理,在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。如果有 3 个以上的表连接查询, 那就需要选择交叉表 (intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

(2) WHERE 子句中的连接顺序: ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他 WHERE 条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE 子句的末尾.
(3) SELECT 子句中避免使用 ‘ * ‘: ORACLE 在解析的过程中, 会将'*'依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间
(4)减少访问 数据库的次数: ORACLE 在内部执行了许多工作: 解析 SQL 语句, 估算索引的利用率, 绑定变量 , 读数据块等;
(5)在SQL*Plus , SQL*Forms 和Pro*C 中重新设置ARRAYSIZE 参数, 可以增加每次数据库访问的检索数据量 ,建议值为200

(6)使用DECODE 函数来减少处理时间: 使用DECODE 函数可以避免重复扫描相同记录或重复连接相同的表.
(7)整合简单,无关联的数据库访问: 如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)
(8)删除重复记录: 最高效的删除重复记录方法 ( 因为使用了ROWID)
例子:DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID) FROM EMP X WHEREX.EMP_NO = E.EMP_NO);
(9)用TRUNCATE 替代DELETE: 当删除表中的记录时,在通常情况下, 回滚段(rollbacksegments ) 用来存放可以被恢复的信息.
如果你没有COMMIT 事务,ORACLE 会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况) ,而当运用 TRUNCATE 时, 回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.因此很少的资源被调用,执行时间也会很短.
(译者按:TRUNCATE 只在删除全表适用,TRUNCATE 是DDL不是DML)
(10)尽量多使用COMMIT: 只要有可能, 在程序中尽量多使用 COMMIT, 这样程序的性能得到提高, 需求也会因为 COMMIT 所释放的资源而减少:
COMMIT 所释放的资源:

a. 回滚段上用于恢复数据的信息.
b. 被程序语句获得的锁
c. redo logbuffer 中的空间
d. ORACLE 为管理上述3种资源中的内部花费
(11)用Where 子句替换HAVING 子句: 避免使用 HAVING 子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤.
这个处理需要排序,总计等操作. 如果能通过 WHERE 子句限制记录的数目,那就能减少这方面的 开销.
(非oracle中)on、where、having 这三个都可以加条件的子句中,on 是最先执行,where 次之,having 最后,因为on 是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,where 也应该比having 快点的,因为它过滤数据后才进行sum,在两个表联接时才用on 的,所以在一个表的时候,就剩下where 跟 having 比较了。

在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where 可以使用rushmore 技术,而having就不能,在速度上后者要慢如果要涉及到计算的字段,就表示在没计算之前,这个字段的值是不确定的,根据上篇写的工作流程,where 的作用时间是在计算之前就完成的,而having 就是在计算后才起作用的,所以在这种情况下,两者的结果会不同。在多表联接查询时,on 比 where 更早起作用。 系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where 进行过滤,然后再计算,计算完后再由 having 进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里

(12)减少对表的查询: 在含有子查询的SQL 语句中,要特别注意减少对表的查询.
例子:SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT TAB_NAME,DB_VERFROM TAB_COLUMNS WHERE VERSION = 604)
(13)通过内部函数提高SQL 效率.: 复杂的 SQL 往往牺牲了执行效率. 能够掌握上面的运用函数解决问题的方法在实际工作中是非常有意义的
(14)使用表的别名(Alias): 当在SQL 语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column 上.这样一来, 就可以减少解析的时间并减少
那些由Column歧义引起的语法错误.

(15)用EXISTS 替代IN、用NOTEXISTS 替代NOT IN: 在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOTEXISTS)通常将提高查询的效率. 在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOTIN 都是最低效的(因为它对子查询中的表执行了一个全表遍历).为了避免使用 NOT IN ,我们可以把它改写成外连接(OuterJoins)或 NOT EXISTS.
例子: (高效)SELECT * FROM EMP (基础表) WHERE EMPNO > 0AND EXISTS (SELECT ‘X' FROM DEPT WHERE DEPT.DEPTNO =EMP.DEPTNO AND LOC = ‘MELB')
(低效)SELECT* FROM EMP (基础表) WHERE EMPNO > 0 AND DEPTNOIN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB')
(16)识别'低效执行'的SQL 语句:虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法:
SELECTEXECUTIONS , DISK_READS, BUFFER_GETS,ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,ROUND(DISK_READS/EXECUTIONS,2)
Reads_per_run,SQL_TEXT FROM V$SQLAREA WHERE EXECUTIONS>0 AND BUF