设为首页 加入收藏

TOP

记录一次MongoDB3.0.6版本wiredtiger与MMAPv1引擎的写入耗时对比(一)
2015-11-21 01:31:57 来源: 作者: 【 】 浏览:2
Tags:记录 一次 MongoDB3.0.6 版本 wiredtiger MMAPv1 引擎 写入 耗时 对比
一、业务需求:
?
公司某个APP应用的 数据库已经实现了日志与业务的垂直分割,将原有的一套RAC,拆分成两套,目前数据库暂时还比较稳定,服务器负载也在正常范围内,但是现有用户数450万,日活跃用户达到100万,每日日志产生1000万条记录,100G的数据量,而目标用户数接近1800万,预估届时的每日数据库将达到6000万/条,且需要满足单条记录查询的需求,计划采用MongoDB来替代ORACLE RAC,现测试MongoDB WiredTiger引擎与MMAPv1引擎的写入对比。
?
二、MongoDB3.0.x的版本特性(相对于MongoDB2.6及以下):
?
增加了wiredtiger引擎:
?
开源的存储引擎;
?
支持多核CPU、充分利用内存/芯片级别缓存(注:10月14日刚刚发布的3.0.7版本中,进一步改进了内存操作的性能);
?
基于B-TREE及LSM算法;
?
提供文档级锁(document-level concurrency control),类似于关系型数据库的的行级锁;
?
支持文件压缩(其中snappy压缩机制可以在5%的额外CPU消耗,减少70%的空间使用,也可以根据需要调节压缩比例),三种压缩类型:
?
不压缩;
?
Snappy压缩:默认的压缩方式, Snappy是在谷歌内部生产环境中被许多项目使用的压缩库,包括BigTable,MapReduce和RPC等,压缩速度比Zlib快,但是压缩处理文件的大小会比Zlib大20%-100%, Snappy对于纯文本的压缩率为1.5-1.7,对于HTML是2-4,对于JPEG、PNG和其他已经压缩过的数据压缩率为1.0。在I7 i7 5500u 单核CPU测试中,压缩性能可在200M/s-500M/s;
?
Zlib压缩: Z1ib是一个免费、通用、跨平台、不受任何法律阻碍的、无损的数据压缩开发库,相对于Snappy压缩,消耗CPU性能高、压缩速度慢,但是压缩效果好。
?
MMAPv1引擎(MongoDB2.6及以下版本用的是MMAP引擎):
?
collection锁(collection-level concurrency control),在MMAP版本中,只提供了database的锁(既当一个用户对一个collection进行操作时,其他的collection也被挂起);
?
无缝迁移(MMAP版本的数据可以在线迁移至MMAPV1版本,也可以迁移至wiredtiger引擎中)。
?
可插拔的存储引擎API(类似于 mysql的多引擎驱动)
?
通过不同的数据引擎来满足不同的数据需求;
?
未来更多的场景扩展。
?
Ops manager(MongoDB企业版提供的功能)
?
居于web的图形管理界面
?
减少日常日常和配置的工作
?
四、测试环境:
?
服务器硬件配置:172.16.16.169 CPU:2*E5620@ 2.40GHz、内存:8G
?
客户端硬件配置:172.16.40.92 CPU: 4*I5-4300U@ 1.90GHz、内存:4G
?
数据库:mongodb V3.0.6
?
开发环境:python3.4.3、pycharm4.5.4
?
测试前提:已安装完成了mongodb、python、pycharm
?
五、测试场景:插入100万条数据的时间消耗对比;
?
1. 在服务器端启动MongoDB(默认为MMAPv1引擎,默认端口为27017,在MongoDB的安装目录中启动MongoDB,定义数据和日志路径):
#./mongod --dbpath=/data/db --logpath=/data/log?
?
2. 登录MongoDB:
#./mongo
?
3. 查看当前的引擎状态:
> db.serverStatus()
"storageEngine" : {
"name" : "mmapv1"
?
4. 在服务器端启动MongoDB(WiredTiger引擎,端口:11111,在MongoDB的安装目录中启动MongoDB,定义数据和日志路径,定义WiredTiger引擎):
#./mongod --dbpath=/data/wiredtiger --logpath=/data/wiredtiger/log
?
5. 登录至启动了WiredTiger引擎的Mongodb:
#./mongo127.0.0.1:11111?
?
6. 查看当前的引擎状态:
> db.serverStatus()
"storageEngine" : {
"name" : "wiredTiger"
?
7. python连接MongoDB MMAPv1写入配置:
?
importtime
import datetime
importtimeit
importmath
ISOTIMEFORMAT = '%Y-%m-%d %X'

from pymongo import MongoClient
mc = MongoClient("172.16.16.169",27017)
db = mc.users
def dateDiffInSeconds(date1,date2):
timedelta = date2 - date1
return timedelta.days*24*3600 +timedelta.seconds
date1 = datetime.datetime.now()
db.users.drop()
for iin range(0,1000000) :db.users.insert({"name":"ljai","age":i,"addr":"fuzhou"})
c = db.users.find().count()
print("count is ",c)
date2 = datetime.datetime.now()
print(date1)
print(date2)
print(dateDiffInSeconds(date1,date2),"seconds")
mc.close()
8. 测试结果:1000万条数据写入花费了12分钟28秒:
2、 python连接MongoDB WiredTiger写入配置:
importtime
import datetime
importtimeit
importmath
ISOTIMEFORMAT = '%Y-%m-%d %X'

from pymongo import MongoClient
mc = MongoClient("172.16.16.169",27017)
db = mc.users
def dateDiffInSeconds(date1,date2):
timedelta = date2 - date1
return timedelta.days*24*3600 +timedelta.seconds
首页 上一页 1 2 下一页 尾页 1/2/2
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇蓝的成长记――追逐DBA(20):何.. 下一篇讲给普通人听的分布式数据存储

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: