今天发现一个问题,问题大概是这样的,查询interface的信息,在本地使用本地的数据库访问没有问题,但是发布到服务器上以后访问速度就特别的忙,需要5分钟左右才能返回数据,这肯定是无法让人接受的,刚开始以为是服务器性能的问题,为了验证就把服务器上的数据库备份到本地,发现本地的速度也马上慢了下来,到底是什么问题的。看了一下查询interface的sql语句不禁吓了一跳:
select
distinct
a.id
,a.name
,a.interfacecode
,a.version
,a.synasyn
,a.frequence
,a.solutionmodelid
,a.owner
,a.createtime
,a.status
,a.description
,p.id as "project.id"
,p.name as "project.name"
,p.pcategory as "project.pcategory"
,r.name as "release.name"
, r.id as "release.id"
,b.name as "middlewarename"
,l1.name as "sourcesystem"
,l2.name as "targetsystem"
, f.name as "messageformat1"
,k.name as "messageformat2"
,g.name as "messagename1"
,l.name as "messagename2"
,m.id as "interfacemapid"
,m.category as category
, c.bos as "bos1"
,h.bos as "bos2"
,sm.name as "solutionModelName"
,a.lastmodifytime as "lastModifiedAt"
,df.name as "scenario"
,a.iscurrent as "iscurrent"
,m.reviewstatus as "reviewStatus"
,m.reviewedby as "reviewedBy"
,m.reviewedat as "reviewedAt"
,m.trackleader
FROM interfacemapping m
LEFT JOIN project p ON m.projectid = p.id
LEFT JOIN realse r ON p.realseid = r.id
LEFT JOIN integrationinterface a ON m.interfaceid = a.id
LEFT JOIN logicsystem b ON a.middleware = b.id
LEFT JOIN interfacedetail c ON c.interfaceid = a.id AND UCASE(c.flowflag) = 'START'
LEFT JOIN logicsystem d ON d.id = c.logicsystemid
LEFT JOIN messageformat f ON f.id = c.messageformatid
LEFT JOIN messagedic g ON g.id = c.messagename
LEFT JOIN interfacedetail h ON h.interfaceid = a.id AND UCASE(h.flowflag) = 'END'
LEFT JOIN logicsystem j ON j.id = h.middleware
LEFT JOIN messageformat k ON k.id = h.messageformatid
LEFT JOIN messagedic l ON l.id = h.messagename
LEFT JOIN interfacedetail u ON u.interfaceid = a.id AND UCASE(u.flowflag) = 'MID'
LEFT JOIN messageformat n ON n.id = u.messageformatid
LEFT JOIN messagedic z on z.id = u.messagename
LEFT JOIN logicsystem l1 ON l1.id = a.sourcesystemid
LEFT JOIN logicsystem l2 ON l2.id = a.targetsystemid
lEFT JOIN solutionmodel sm ON sm.id = a.solutionmodelid
LEFT JOIN DATAFLOWINFO df ON df.ID = a.SCENARIOID
?
我想你也一定被吓到了。但是这也只是其中的一部分,还有动态的sql我没有贴出来。是因为一堆表连接所以速度有影响吗?决定下手调一下这个sql语句,使用的方法就是逐个的连接表。当我连接到LEFT JOINinterfacedetail c 时,查询速度竟然是20秒。就是这一个表导致的表之间连接的速度慢的吗?
然后我就开始分析为什么原来本地的数据库时数据快,我发现原来本地的库中interfacedetail中是没有数据的。而现在的库中表中有8000条数据,这是导致查询慢的原因吗?8000条以上的数据就不适合做连接查询了吗?
但是我突然想到原来在db2中一样的数据,为什么查询就挺快的。首先我是验证了。当前mysql中每一个表中的数据和db2中的数据完全相同。结果发现完全相同,但是db2中执行的速度是0.4秒,完全是可以接受的。问题又来了。这就是企业级数据库与普通数据库的区别?
但这个结果还是不能让我相信的。我就查了其他的资料,发现有人说索引可以提高表之间连接的速度,结果我还是真的发现db2中有interfacedetail.interfaceid的索引。我在mysql中加入同样的索引:
CREATE INDEX T_PI_VLO_NAAE_IDX1 ONinterfacedetail (interfaceid);
然后再直接上面的语句,直接速度马上到了0.5秒以内。。问题算是解决了。但是究竟索引为啥又这么大的作用,索引是什么呢?
为什么要创建索引呢?这是因为,创建索引可以大大提高系统的性能。
第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
第二,可以大大加快数据的检索速度,这也是创建索引的最主要的原因。
第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。
第四,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。
也许会有人要问:增加索引有如此多的优点,为什么不对表中的每一个列创建一个索引呢?这种想法固然有其合理性,然而也有其片面性。虽然,索引有许多优点,但是,为表中的每一个列都增加索引,是非常不明智的。这是因为,增加索引也有许多不利的一个方面。
第一,创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。
第二,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。
第三,当对表中的数据进行增加、删除和修改的时候,索引也