您的位置:

深入理解Java中的Map和HashMap

Map是Java中的一种键值对的数据结构,其中键和值都可以是任意的对象。而HashMap则是Map接口的一种实现,它使用哈希表来存储键值对,可以在O(1)的时间复杂度内进行插入和查找操作。下面从各个方面来深入理解Java中的Map和HashMap。

一、Map接口的基本使用

Map接口定义了一系列常用的方法,它们可以通过键来访问值。例如:

Map<String, Integer> map = new HashMap<>();
map.put("apple", 1);
map.put("banana", 2);
map.put("orange", 3);

int value = map.get("apple");
System.out.println(value); // 输出1

for (String key : map.keySet()) {
    int value = map.get(key);
    System.out.println(key + " : " + value);
}

这是一个简单的例子,它展示了如何使用Map接口的put、get和keySet方法来操作键值对。具体来讲:

  • 使用put方法添加键值对。
  • 使用get方法取出指定键的值。
  • 使用keySet方法得到所有键的集合。

需要注意的是,Map中的键必须是唯一的,如果添加一个已经存在的键的话,它的值会被覆盖。

二、HashMap的实现原理

HashMap是Map接口的一种实现,它使用哈希表来存储键值对。哈希表是一种基于数组的数据结构,通过散列函数把键映射到数组中的一个位置上,然后把值存储在该位置上。当我们需要查找某个键的值时,哈希表会根据键再次计算出它在数组中的位置,然后找到这个位置上的值。

HashMap的put和get方法主要依赖于哈希值和equals方法。它们的基本实现如下所示:

public V put(K key, V value) {
    if (key == null) {
        return putForNullKey(value);
    }
    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

public V get(Object key) {
    if (key == null) {
        return getForNullKey();
    }
    int hash = hash(key.hashCode());
    for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            return e.value;
        }
    }
    return null;
}

从上面的代码可以看出,当插入一个键值对时,HashMap会先计算出键的哈希值,并根据哈希值找到键需要存储的位置。如果该位置上已经有了键值对,则以链表的形式将新的键值对加入到链表的尾部。对于长度超过一定值的链表,则会转换成红黑树来提高查找的效率。

当需要访问某个键的值时,HashMap会先计算出它在数组中的位置,然后找到该位置上的链表或红黑树,最后在其中查找该键的值。

三、HashMap的扩容机制

在使用HashMap时,如果已经存储的键值对的数量超过了容量(即threshold),那么HashMap就会进行扩容。它的扩容机制主要依靠resize方法来实现,代码如下:

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    if (oldCapacity == MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return;
    }
    Entry[] newTable = new Entry[newCapacity];
    transfer(newTable);
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

void transfer(Entry[] newTable) {
    Entry[] src = table;
    int newCapacity = newTable.length;
    for (int j = 0; j < src.length; j++) {
        Entry<K,V> e = src[j];
        if (e != null) {
            src[j] = null;
            do {
                Entry<K,V> next = e.next;
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } while (e != null);
        }
    }
}

从上面的代码可以看出,当HashMap需要扩容时,它会先将原来的数组复制到一个新的数组中,并根据新的容量重新计算所有键的位置。也就是说,扩容是非常耗费时间和空间的操作,需要尽可能避免频繁的扩容。

四、HashMap和ConcurrentHashMap的区别

HashMap和ConcurrentHashMap的最大区别在于线程安全。HashMap是非线程安全的,如果在多线程环境下使用它,可能会导致数据出现错误。而ConcurrentHashMap是线程安全的,它使用不同的锁来控制不同的桶,从而保证多个线程同时访问它时不会出现问题。

下面是一个简单的例子,它展示了HashMap在多线程环境下的问题:

Map<String, Integer> map = new HashMap<>();
for (int i = 0; i < 10; i++) {
    new Thread(() -> {
        for (int j = 0; j < 100000; j++) {
            map.put("key", j);
        }
    }).start();
}

Thread.sleep(5000);
System.out.println(map.size()); // 99999

从上面的代码可以看出,虽然我们在10个线程中添加了100000个键值对,但是最终结果中只有99999个键值对。这是由于在多个线程同时调用HashMap的put方法时,可能会出现数据竞争的问题。为了解决这个问题,我们可以使用ConcurrentHashMap:

Map<String, Integer> map = new ConcurrentHashMap<>();
for (int i = 0; i < 10; i++) {
    new Thread(() -> {
        for (int j = 0; j < 100000; j++) {
            map.put("key", j);
        }
    }).start();
}

Thread.sleep(5000);
System.out.println(map.size()); // 1000000

从上面的代码可以看出,通过使用ConcurrentHashMap,我们可以避免数据竞争的问题,保证最终的结果是正确的。

五、总结

本文从多个方面介绍了Java中的Map和HashMap。首先,我们介绍了Map接口的基本使用,包括插入、查找和遍历的操作。其次,我们介绍了HashMap的实现原理,包括哈希表、链表和红黑树等内容。然后,我们介绍了HashMap的扩容机制,以及它和ConcurrentHashMap的区别。最后,我们需要重点关注HashMap自身的实现和使用,从而保证程序在使用中不会出现问题。