设为首页 加入收藏

TOP

浅谈Java中的hashcode方法(一)
2015-08-31 21:24:12 来源: 作者: 【 】 浏览:75
Tags:浅谈 Java hashcode 方法

  哈希表这个数据结构想必大多数人都不陌生,而且在很多地方都会利用到hash表来提高查找效率。在Java的Object类中有一个方法:


  public native int hashCode();


  根据这个方法的声明可知,该方法返回一个int类型的数值,并且是本地方法,因此在Object类中并没有给出具体的实现。


  为何Object类需要这样一个方法?它有什么作用呢?今天我们就来具体探讨一下hashCode方法。


一.hashCode方法的作用


  对于包含容器类型的程序设计语言来说,基本上都会涉及到hashCode。在Java中也一样,hashCode方法的主要作用是为了配合基于散列的集合一起正常运行,这样的散列集合包括HashSet、HashMap以及HashTable。


  为什么这么说呢?考虑一种情况,当向集合中插入对象时,如何判别在集合中是否已经存在该对象了?(注意:集合中不允许重复的元素存在)


  也许大多数人都会想到调用equals方法来逐个进行比较,这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据,如果采用equals方法去逐一比较,效率必然是一个问题。此时hashCode方法的作用就体现出来了,当集合要添加新的对象时,先调用这个对象的hashCode方法,得到对应的hashcode值,实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值,如果table中没有该hashcode值,它就可以直接存进去,不用再进行任何比较了;如果存在该hashcode值, 就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址,所以这里存在一个冲突解决的问题,这样一来实际调用equals方法的次数就大大降低了,说通俗一点:Java中的hashCode方法就是根据一定的规则将与对象相关的信息(比如对象的存储地址,对象的字段等)映射成一个数值,这个数值称作为散列值。下面这段代码是java.util.HashMap的中put方法的具体实现:


public V put(K key, V value) {


? ? ? ? if (key == null)


? ? ? ? ? ? return putForNullKey(value);


? ? ? ? int hash = hash(key.hashCode());


? ? ? ? int i = indexFor(hash, table.length);


? ? ? ? for (Entry e = table[i]; e != null; e = e.next) {


? ? ? ? ? ? Object k;


? ? ? ? ? ? if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {


? ? ? ? ? ? ? ? V oldValue = e.value;


? ? ? ? ? ? ? ? e.value = value;


? ? ? ? ? ? ? ? e.recordAccess(this);


? ? ? ? ? ? ? ? return oldValue;


? ? ? ? ? ? }


? ? ? ? }


? ? ? ? modCount++;


? ? ? ? addEntry(hash, key, value, i);


? ? ? ? return null;


? ? }


  put方法是用来向HashMap中添加新的元素,从put方法的具体实现可知,会先调用hashCode方法得到该元素的hashCode值,然后查看table中是否存在该hashCode值,如果存在则调用equals方法重新确定是否存在该元素,如果存在,则更新value值,否则将新的元素添加到HashMap中。从这里可以看出,hashCode方法的存在是为了减少equals方法的调用次数,从而提高程序效率。


有些朋友误以为默认情况下,hashCode返回的就是对象的存储地址,事实上这种看法是不全面的,确实有些JVM在实现时是直接返回对象的存储地址,但是大多时候并不是这样,只能说可能存储地址有一定关联。下面是HotSpot JVM中生成hash散列值的实现:


static inline intptr_t get_next_hash(Thread * Self, oop obj) {


? intptr_t value = 0 ;


? if (hashCode == 0) {


? ? // This form uses an unguarded global Park-Miller RNG,


? ? // so it's possible for two threads to race and generate the same RNG.


? ? // On MP system we'll have lots of RW access to a global, so the


? ? // mechanism induces lots of coherency traffic.


? ? value = os::random() ;


? } else


? if (hashCode == 1) {


? ? // This variation has the property of being stable (idempotent)


? ? // between STW operations.? This can be useful in some of the 1-0


? ? // synchronization schemes.


? ? intptr_t addrBits = intptr_t(obj) >> 3 ;


? ? value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;


? } else


? if (hashCode == 2) {


? ? value = 1 ;? ? ? ? ? ? // for sensitivity testing


? } else


? if (hashCode == 3) {


? ? value = ++GVars.hcSequence ;


? } else


? if (hashCode == 4) {


? ? value = intptr_t(obj) ;


? } else {


? ? // Marsaglia's xor-shift scheme with thread-specific state


? ? // This is probably the best overall implementation -- we'll


? ? // likely make this the default in future releases.


? ? unsigned t = Self->_hashStateX ;


? ? t ^= (t << 11) ;


? ? Self->_hashStateX = Self->_hashStateY ;


? ? Self->_hashStateY = Self->_hashStateZ ;


? ? Self->_hashStateZ = Self->_hashStateW ;


? ? unsigned v = Self->_hashStateW ;


? ? v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;


? ? Self->_hashStateW = v ;


? ? value = v ;


? }


? value &= markOopDesc::hash_mask;


? if (value == 0) value = 0xBAD ;


? assert (value != markOopDesc::no_hash, "invariant") ;


? TEVENT (hashCode: GENERATE) ;


? return value;


}


  该实现位于hotspot/src/share/vm/runtime/synchronizer.cpp文件下。


  因此有人会说,可以直接根据hashcode值判断两个对象是否相等吗?肯定是不可以的,因为不同的对象可能会生成相同的hashcode值。虽然不能根据has

首页 上一页 1 2 3 下一页 尾页 1/3/3
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇Java重写equals方法 下一篇Hibernate学习入门教程

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: