数据库数据在Java占用内存简单估算
结论:
1.数据库记录放在JAVA里,用对象(ORM一般的处理方式)需要4倍左右的内存空间,用HashMap这种KV保存需要10倍空间;
2.如果你主要数据是text大文本,那空间一般可以按2倍估算。
以上是一个通用数据测试结论,估大家参考。
数据库记录占用的空间大小比较好算,比如一个int占用4字节,bigint占用8字节,date占用3字节,datetime占用8字节,varchar是变长字节等。如果不想精确计算,在数据库中通过统计信息也可以比较轻松的知道表总共占用的空间及每条记录平均行长。
当我们用JDBC访问数据库时,经常会被问到内存溢出的问题,由于java是面向对象的语言,用JVM来自动内存回收,不能按普通方法计算内存,本文给出一个估算内存的思路和参考答案
先给出普通JDBC中数据库对象与内存的映射关系
| MySQL |
Oracle |
JDBC |
| Int |
|
Integer |
| Int unsigned |
|
Long |
| BigInt |
|
Long |
| BigInt unsigned |
|
BigInteger |
| Decimal |
Number |
BigDecimal |
| Varchar |
Varchar2 |
String |
| Date |
|
Date |
| Datetime |
Date |
Timestamp |
| Timestamp |
Timestamp |
Timestamp |
| Clob |
Clob |
String |
| Blob |
blob |
Byte[] |
| Text |
Clob |
String |
| float |
binary_float |
float |
| double |
binary_double |
double |
上面这个比较好理解,接下来我们需要JAVA常用对象的内存占用空间,这个可以通过JDK 5 开始提供的Instrumentation 接口来完成,也可以通过开源的sizeOf.jar 来测试,笔者是通过sizeOf.jar验证的。测试结果数据如下:
| 对象 |
64位 JVM 压缩指针 |
64位 JVM 非压缩指针 |
| Integer |
16 |
24 |
| Long |
24 |
24 |
| Object |
16 |
16 |
| Date |
24 |
32 |
| Timestamp |
32 |
40 |
| String_0 |
48 |
64 |
| String_1 |
56 |
72 |
| String_10 |
72 |
88 |
| String_100 |
248 |
264 |
| StringBuilder |
24 |
32 |
| BigDecimal |
40 |
48 |
| BigInteger |
64 |
80 |
| HashMap |
128 |
216 |
| HashMap_0 |
72 |
96 |
| HashMap_100 |
576 |
1112 |
| HashMap_10000 |
65600 |
131160 |
| ArrayList |
80 |
144 |
| ArrayList_0 |
40 |
64 |
| ArrayList_100 |
440 |
864 |
| ArrayList_10000 |
40040 |
80064 |
| LinkedList |
48 |
80 |
| LinkedHashMap |
96 |
144 |
| ClassA |
32 |
40 |
| ClassB |
40 |
48 |
| ClassC |
40 |
56 |
由于现在主机一般都是64位, 64位JVM从JDK1.6.45开始,当JVM最大内存小于32GB时,自动打开压缩指针特性,这样对象的内存占用空间少很多,由上表可以看出,至少减少1/3的空间。
下面我们结合数据库数据来测试
假如mysql数据库有一张emp表,结构如下:
CREATE TABLE `emp` (
`id` int(11) NOT NULL,
`create_time` datetime DEFAULT NULL,
`modify_time` datetime DEFAULT NULL,
`name` varchar(16) DEFAULT NULL,
`address` varchar(256) DEFAULT NULL,
`age` smallint(6) DEFAULT NULL,
`height` decimal(10,2) DEFAULT NULL,
`weight` decimal(10,2) DEFAULT NULL,
`phone` varchar(20) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
样本数据如下:
hm.put("id", 1988);
hm.put("createTime", new Date());
hm.put("modifyTime", new Date());
hm.put("name", "张三丰");
hm.put("address","浙江杭州市西湖大道188号808室");
hm.put("age",88);
hm.put("weight",new BigDecimal(88));
hm.put("height",new BigDecimal(188));
hm.put("phone","1388888888");
按上面样本数据计算,有效数据约80字节,在MySQL里占用空间约120字节
在java里转换为HashMap和Emp对象测试空间如下
| 对象 |
64位 JVM 压缩指针 |
64位 JVM 非压缩指针 |
| HashMap_empty |
128 |
216 |
| HashMap_full |
1360 |
1832 |
| Emp_empty |
72 |
112 |
| Emp_full |
464 |
600 |
从上面测试结果看,数据到JAVA里占用的空间增加了许多,在64位压缩指针下,如果存到HashMap,需要1360字节,空间是数据库约11.3倍,如果存为Emp普通对象,需要464字节,是数据库的3.8倍。
如果我们是一个分页从数据库读取emp信息,每页显示50条记录,用List保存,HashMap需要68KB,emp对象需要23KB。
根据这个简单测试,我们可以总结一个结论:
数据库记录放在JAVA里,用对象(ORM一般的处理方式)需要4倍左右的内存空间,用HashMap这种KV保存需要10倍空间。
如果你的数据和参考数据差异非常大,如主要数据text大文本,那空间一般可以简单的按2倍估算。
以上是一个通用数据测试结论,估大家参考。
下面是测试代码:
import net.sourceforge.sizeof.SizeOf;
import java.io.IOException;
import java.math.BigDecimal;
import java.math.BigInteger;
import java.sql.SQLException;
import java.sql.Timestamp;
import java.util.*;
public class TestSize {
static {
SizeOf.skipStaticField(true); //java.sizeOf will not compute static fields
//SizeOf.skipFinalField(true); //java.sizeO