PostgreSQL强大的多层表继承--及其在海量数据分类按月分区存储中的应用 - 数据库编程

最近发现大家越来越关注 PostgreSQL了。2008年以来，通过对PostgreSQL的实际使用，发现其对象
-关系数据库机制对现实问题非常有帮助。在多重表继承下，对上亿条不同类别的数据条目进行按型号、
按月份双层分区管理，既可在总表查阅所有条目的共有字段，也可在各类型字表查询附加字段，
非常高效。下面把这种分区机制介绍如下！

实验平台：PostgreSQL 9.1

实验背景：

假设有N种数据收集设备，分别叫做 machine1, machine2...machineN, 各类收集设备从
传感器上采集的数据各不相同。但是他们都包括3个共有属性：1、采集时刻 2、一个电压值 3、
机器的ID。这些机器源源不断的从各个传感器收集信息，每类机器还有各自不同的附加数据。
比如，machine1有当前最大单元数、当前已使用单元数两个属性。Machine2有前端传感器的ID和取值。
数据量约100万条/天，要求数据库容纳至少5年的数据。

设计原则：

由于采集的频率高，每天会有上百万条数据存入，为了考虑缩小索引的规模，提高检索效率，
采用按月分区存储。由于各类机器的字段各有区别，使得我们必须设计不同的表结构，分别存储
各类数据。由于要求能够统一检索基本信息、按需检索额外信息，我们采用PostgreSQL的表继承，
首先按照机器类型分类，而后各类型机器内按照月份分类。

数据库结构：

全局ID 序列:

[sql]

CREATE SEQUENCE serial_id_seq
INCREMENT 1
MINVALUE 1
MAXVALUE 9223372036854775807
START 1
CACHE 1;
ALTER TABLE serial_id_seq
OWNER TO postgres;

该序列用于保持全局ID的唯一性。PostgreSQL各个继承表中的主键约束仅仅限于本表，在不想通过
检查条件确保唯一的情况下，可以通过触发器手工从序列获取新的值，以及限制用户修改ID来保
证唯一。基本表（爷爷表），承载了所有机器的共同属性

[sql]

CREATE TABLE base_table
(
id bigint NOT NULL,
dvalue double precision,
sample_time timestamp with time zone,
machine_code character varying(32),
CONSTRAINT pk_base_table_id PRIMARY KEY (id )
)
WITH (
OIDS=FALSE
);
ALTER TABLE base_table
OWNER TO postgres;
CREATE INDEX idx_sample_time
ON base_table
USING btree
(sample_time );

下面为机器类型1创建按类型分区子表（爸爸表）

[sql]

CREATE TABLE base_table_machine1
(
max_res integer,
curr_res integer,
CONSTRAINT pk_base_table_machine1 PRIMARY KEY (id )
)
INHERITS (base_table)
WITH (
OIDS=FALSE
);
ALTER TABLE base_table_machine1
OWNER TO postgres;
CREATE INDEX idx_base_table_machine1_sample_time
ON base_table_machine1
USING btree
(sample_time );

同样，为机器2创建按类型分区子表

[sql]

CREATE TABLE base_table_machine2
(
manu_id character varying(16),
manu_value character varying(16),
CONSTRAINT pk_base_table_machine2 PRIMARY KEY (id )
)
INHERITS (base_table)
WITH (
OIDS=FALSE
);
ALTER TABLE base_table_machine2
OWNER TO postgres;
CREATE INDEX idx_base_table_machine2_sample_time
ON base_table_machine2
USING btree
(sample_time );

其他机器不再赘述。创建完后，我们开始写创建按月分区表的触发器(儿子表)。按月分区会判断
每次插入的数据的时刻，按照月份放到分区表中。如果分区表不存在，则自动创建。这里给出机器1、
机器2 的触发器

[sql]

-- Function: on_insert_base_table_machine1()
-- DROP FUNCTION on_insert_base_table_machine1();
CREATE OR REPLACE FUNCTION on_insert_base_table_machine1()
RETURNS trigger AS
$BODY$
DECLARE
--Variable Hold subtable name
str_sub_tablename varchar;
--Variable Hold year\month info with timestamle
str_sub_sample_time varchar;
str_sql_cmd varchar;
str_sub_checkval varchar;
BEGIN
--

首页上一页 1 2 3 4 下一页尾页 1/4/4

上一篇大型数据库的设计原则与开发技巧

下一篇大型数据库设计需要注意的一些原则

PostgreSQL强大的多层表继承--及其在海量数据分类按月分区存储中的应用(一)