Map是Java中的一种键值对的数据结构,其中键和值都可以是任意的对象。而HashMap则是Map接口的一种实现,它使用哈希表来存储键值对,可以在O(1)的时间复杂度内进行插入和查找操作。下面从各个方面来深入理解Java中的Map和HashMap。
一、Map接口的基本使用
Map接口定义了一系列常用的方法,它们可以通过键来访问值。例如:
Map<String, Integer> map = new HashMap<>();
map.put("apple", 1);
map.put("banana", 2);
map.put("orange", 3);
int value = map.get("apple");
System.out.println(value); // 输出1
for (String key : map.keySet()) {
int value = map.get(key);
System.out.println(key + " : " + value);
}
这是一个简单的例子,它展示了如何使用Map接口的put、get和keySet方法来操作键值对。具体来讲:
- 使用put方法添加键值对。
- 使用get方法取出指定键的值。
- 使用keySet方法得到所有键的集合。
需要注意的是,Map中的键必须是唯一的,如果添加一个已经存在的键的话,它的值会被覆盖。
二、HashMap的实现原理
HashMap是Map接口的一种实现,它使用哈希表来存储键值对。哈希表是一种基于数组的数据结构,通过散列函数把键映射到数组中的一个位置上,然后把值存储在该位置上。当我们需要查找某个键的值时,哈希表会根据键再次计算出它在数组中的位置,然后找到这个位置上的值。
HashMap的put和get方法主要依赖于哈希值和equals方法。它们的基本实现如下所示:
public V put(K key, V value) {
if (key == null) {
return putForNullKey(value);
}
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
public V get(Object key) {
if (key == null) {
return getForNullKey();
}
int hash = hash(key.hashCode());
for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
return e.value;
}
}
return null;
}
从上面的代码可以看出,当插入一个键值对时,HashMap会先计算出键的哈希值,并根据哈希值找到键需要存储的位置。如果该位置上已经有了键值对,则以链表的形式将新的键值对加入到链表的尾部。对于长度超过一定值的链表,则会转换成红黑树来提高查找的效率。
当需要访问某个键的值时,HashMap会先计算出它在数组中的位置,然后找到该位置上的链表或红黑树,最后在其中查找该键的值。
三、HashMap的扩容机制
在使用HashMap时,如果已经存储的键值对的数量超过了容量(即threshold),那么HashMap就会进行扩容。它的扩容机制主要依靠resize方法来实现,代码如下:
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity];
transfer(newTable);
table = newTable;
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}
void transfer(Entry[] newTable) {
Entry[] src = table;
int newCapacity = newTable.length;
for (int j = 0; j < src.length; j++) {
Entry<K,V> e = src[j];
if (e != null) {
src[j] = null;
do {
Entry<K,V> next = e.next;
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);
}
}
}
从上面的代码可以看出,当HashMap需要扩容时,它会先将原来的数组复制到一个新的数组中,并根据新的容量重新计算所有键的位置。也就是说,扩容是非常耗费时间和空间的操作,需要尽可能避免频繁的扩容。
四、HashMap和ConcurrentHashMap的区别
HashMap和ConcurrentHashMap的最大区别在于线程安全。HashMap是非线程安全的,如果在多线程环境下使用它,可能会导致数据出现错误。而ConcurrentHashMap是线程安全的,它使用不同的锁来控制不同的桶,从而保证多个线程同时访问它时不会出现问题。
下面是一个简单的例子,它展示了HashMap在多线程环境下的问题:
Map<String, Integer> map = new HashMap<>();
for (int i = 0; i < 10; i++) {
new Thread(() -> {
for (int j = 0; j < 100000; j++) {
map.put("key", j);
}
}).start();
}
Thread.sleep(5000);
System.out.println(map.size()); // 99999
从上面的代码可以看出,虽然我们在10个线程中添加了100000个键值对,但是最终结果中只有99999个键值对。这是由于在多个线程同时调用HashMap的put方法时,可能会出现数据竞争的问题。为了解决这个问题,我们可以使用ConcurrentHashMap:
Map<String, Integer> map = new ConcurrentHashMap<>();
for (int i = 0; i < 10; i++) {
new Thread(() -> {
for (int j = 0; j < 100000; j++) {
map.put("key", j);
}
}).start();
}
Thread.sleep(5000);
System.out.println(map.size()); // 1000000
从上面的代码可以看出,通过使用ConcurrentHashMap,我们可以避免数据竞争的问题,保证最终的结果是正确的。
五、总结
本文从多个方面介绍了Java中的Map和HashMap。首先,我们介绍了Map接口的基本使用,包括插入、查找和遍历的操作。其次,我们介绍了HashMap的实现原理,包括哈希表、链表和红黑树等内容。然后,我们介绍了HashMap的扩容机制,以及它和ConcurrentHashMap的区别。最后,我们需要重点关注HashMap自身的实现和使用,从而保证程序在使用中不会出现问题。