设为首页 加入收藏

TOP

它是和Oracle Exadata PK的吗?(一)
2014-11-24 01:44:55 】 浏览:8334
Tags:Oracle Exadata 的吗


数据仓库一体机

什么是一体机

一体机 (Applicance) 并没有一个通用的定义 , 一体机应该具备以下的一些特征。它应该是为特定的应用领域专门设计的设备,针对特定的用途集中优化,在特定的领域内提供一套完整的解决方案,需要很低的维 护成本。对于最终用户来说一体机应该是能够快速简易的安装,通过标准的接口和非常简单的操作来满足用户的需求。一体机是个黑盒子,用户告诉它想要做什么, 一体机快速的把结果或答案反馈给用户。IPod 就是一个很好的一体机例子,它简单化并且彻底改革了数字娱乐领域。

Netezza- 数据仓库领域真正的一体机

值得骄傲的是 Netezza 的产品是真正的,是专门为数据仓库设计的一体机。 在数据仓库领域许多厂商都推出的自己的“一体机”产品。有些产品只提供软件,用户需要自行的集成软件与硬件。有些产品虽然把软件与硬件结合在一起,但并不 是专门的为数据仓库而设计和优化。这些产品都需要非常复杂并漫长的人工调优过程,而且后续的维护成本也很高昂。 说 Netezza 是真正的一体机是因为它解决了以上问题。它是软件与硬件不可分离的紧密结合体,无缝的整合数据库管理系统(DBMS)、服务器(Server)和存储设备 (Storage)。不需要复杂配置和调优就可以取得非常优异性能。“Netezza”是印度某种方言中的一个词,在英语中的意思是“RESULT”。这 个名字也非常恰如其分的体现了 Netezza 一体机的特点。需要结果么? 那么只需要提出问题。

简单性

Netezza 一体机与传统数据仓库的一个很大区别在于它的简单性。这种简单性体现在方方面面。

· 安装与部署的简单性 : 从外部来看 Netezza 一体机就是一个大盒子,给这个大盒子插上电配置好服务 IP 那它就可以对外提供服务了。而传统的数据仓库往往需要花很大的心思在物理规划设计上。这包括规划存储、配置网络以及安装所需要的软件等等。

· 管理和维护的简单性 : 听起来似乎有点不可思议,但事实确实如此 -Netezza 几乎不需要执行任何传统数据仓库 DBA 所执行的任务

o 没有索引(index)

o 不需要性能调优(tuning)

o 不需要存储管理:没有 dbspace/tablespace 规划和配置,没有 redo/physical long 规划和配置,没有表的 page/block/extent 规划和配置,无需临时表空间的分配与监控,无需 RAID 级别的选择,无需逻辑卷的规划与创建时间

o 无需配置操作系统内核参数以及维护建议的操作系统补丁级别

o 简单的数据分区策略:哈希或者随机

简单性所带来到好处是巨大的。这种简单性可以节省出昂贵的 DBA 管理和维护成本,节省出的资源可以投入到更能够创造出商业价值的任务上而不是乏味的 DBA 任务。是 一个非常简单的创建数据库例子。可以看出 Netezza 的语句十分简单。当然其他的数据仓库语句也可以简单的和 Netezza 一样,但是如果那样的话创建出的数据库是没有经过优化会比清单 1 中创建出的数据库性能差很多。Netezza 的优势就在于用简单的语句(更少的管理与维护)也可以创建出性能很好的数据库。在一些实际的数据仓库数迁移项目中,其它数据仓库数千行的建表语句(包括分 区和索引部分)转换到 Netezza 只用十几行就能代替,并且还能取得更好的性能。由于篇幅的关系这里就不列出建表语句的例子了


清单 1 在某数据仓库上创建一个 database 的语句

CREATE DATABASE TEST

LOGFILE 'E:\OraData\TEST\LOG1TEST.ORA' SIZE 2M,

'E:\OraData\TEST\LOG2TEST.ORA' SIZE 2M,

'E:\OraData\TEST\LOG3TEST.ORA' SIZE 2M,

'E:\OraData\TEST\LOG4TEST.ORA' SIZE 2M,

'E:\OraData\TEST\LOG5TEST.ORA' SIZE 2M

EXTENT MANAGEMENT LOCAL MAXDATAFILES 100

DATAFILE 'E:\OraData\TEST\SYS1TEST.ORA' SIZE 50 M

DEFAULT TEMPORARY TABLESPACE temp TEMPFILE 'E:\OraData\TEST\TEMP.ORA' SIZE 50 M

UNDO TABLESPACE undo DATAFILE 'E:\OraData\TEST\UNDO.ORA' SIZE 50 M

NOARCHIVELOG

CHARACTER SET WE8ISO8859P1;



清单 2 在 Netezza 上创建一个 database 的语句

CREATE DATABASE TEST


Netezza 一体机架构

之前的介绍中说用户可以把 Netezza 一体机看作一个黑盒子。那这个黑盒子是如何在保持简单性的同时又提供高性能的呢?这就需要我们打开黑盒子看一看 Netezza 一体机的独特架构。


主要包括四大关键组件。SMP 主机、S-Blades、磁盘存储柜和网络结构

Netezza 1000

Netezza 1000 是 Netezza 一体机很具代表性的一个型号。在 Netezza 被 IBM 收购之前这个型号的名称是 Netezza TwinFin

· SMP 主机是两台高性能的 Linux 服务器,两台服务器一台是活动的,另外一体是备机。BI 应用程序的请求都会通过活动的 SMP 主机来提交。SMP 主机编译并且生成最优的可执行代码,分发生成的可执行代码给 S-Blades 执行。最后收集并汇总 S-Blades 返回的结果返回给用户。

· S-Blades 是智能的处理节点也是 Netezza 魔法发生的地方。每个 S-Blades 都是一台独立的服务器它包含了个一台标准的刀片服务器和一块 Netezza 特有的数据库加速卡。刀片服务器和数据库加速卡通过 IBM 的 sidercar 技术整合起来,使它们在逻辑上和物理上都成为一个整体。Netezza 1000 的每个 S-Blades 节点包括 2 个 4 核的 CPU、4 个 2 核的 FPGA 引擎以及 16GB 的内存。

· 磁盘存储柜包含了高密度高性能的磁盘。每块磁盘包含表的一个数据片(data slice)。所有磁盘上的某个表的数据片合起来组成一个表完整的数据。每块磁盘上还包含另外一块磁盘上的数据镜像。磁盘阵列柜通过高速的通道 (3Gb/s SAS)和 S-Blades 连接在一起。

· 网络结构并没有在中标注出来。主要的网络链接线路都在机柜的背面。Netezza 1000 一体机的各个组件是通过高速网络连接起来的。网络有两种一种是 IP 网络另一种是 SAS 存储网络。IP 网络是服务于 SMP 主机与 S-Blades 节点之间以及不同 S-Blades 节点之间的数据通讯。IP 网络中的协议是经过深度定制的,专门为了 Netezza 的应用环境而优化,能够支持上千节点之间同时的大数据量传输。SAS 网络连接了 S-Blades 节点与磁盘存储柜,使 S-Blades 能够高速的访问磁盘上的数据。


Netezza 一体机架构

Netezza 的 AMPP(Asymmetric Massively Parallel Processing)是一个两层结构,专门为了处理多用户的大数据量

首页 上一页 1 2 3 下一页 尾页 1/3/3
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇DB2和Oracle中唯一约束和唯一索引.. 下一篇DB2V9.7与ORACLE的兼容特性

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目