Map值增加的最高效的方法:只一次搜索鍵
這個問題初看起來可能會比較基礎,但卻在論壇里頻繁地討論。在這篇文章中,我將會討論一種只在 Map 中搜索一次鍵的方法。
讓我們看一個例子。假設我正在創建一個詞頻表,使用 Map 來保存,每一個鍵都是一個待統計的詞而值則是其頻率(每次添加詞的時候都遞增)。一個直接的實現方法是:
- int count = map.containsKey(string) ? map.get(string) : 0;
- map.put(string, count + 1);
由于這段代碼包含了3 個潛在的浪費時間的操作(containsKey()、get()、put()),所以效率不會很高。每次執行統計操作,都會搜索 Map 中的鍵。現在,我們以此為例子,看如何為 Map 值增加提高性能。
Integer VS MutableInteger VS AtomicInteger
我們不得不調用三次消耗性能的操作,一個重要的原因就是使用了Integer來計數。在Java中,Integer是不可以被改變的。它在構造完成以后就會阻止我們修改其整數值。因而,為了讓計數器增長,我們就不得不從map中先獲得整數,然后再創建另外一個新的整數,新增并且添加回map中
需要使得計數器可修改,有幾種方法。其中一個就是簡單的創建你自己的MutableInteger,想我在下面展示的這樣:
- public class MutableInteger {
- private int val;
- public MutableInteger(int val) {
- this.val = val;
- }
- public int get() {
- return val;
- }
- public void set(int val) {
- this.val = val;
- }
- }
另外一種方法也許就是使用Java中AtomicInteger了,它被用于諸如需要原子增長計數器的應用程序之中。而把AtomicInteger作為***是因為你會想要在對整數進行操作的時候實現線程安全。因此它不能作為Integer的替代。基于此,如果線程安全并不是你的項目一個重要的考慮事項,那我就不會推薦AtomicInteger。
只一次搜索鍵
在使用MutableInteger之后,我們改變上面的代碼如下:
- if (map.containsKey(string)) {
- MutableInteger count = map.get(string);
- count.set(count.get() + 1);
- } else {
- map.put(string, new MutableInteger(1));
- }
或者
- MutableInteger count = map.get(string);
- if (count != null) {
- count.set(count.get() + 1);
- } else {
- map.put(string, new MutableInteger(1));
- }
在最糟糕的時候,當鍵還沒有出現過,這段代碼會執行2個搜索:一次是獲取MutableInteger,另一次是是設值。這比前面的那段代碼更優化。但我們不應該僅僅滿足現在,如果你查看了[Map.putt()]方法。(http://docs.oracle.com/javase/7/docs/api/java/util/Map.html#put(K, V)) 在java文檔中的方法。你會發現這個方法會返回先前與之關聯鍵的值。這就意味著我們可以合并重新獲取對象和設置方法。然而,也許你會好奇:如果我們不首先獲得計數器,我們怎么來設置新的計數器呢?現在我們終于碰到了這篇文章中最棘手的部分:我們可以簡單的使用零頻率計數器!
- public int incrementCount(K key, int count) {
- MutableInteger tmpCount = new MutableInteger(0);
- MutableInteger oldCount = map.put(key, tmpCount);
- if (oldCount != null) {
- count += oldCount.get();
- }
- tmpCount.set(count);
- return count;
- }
把所有必要操作放入到類中看起來對以后的使用非常有用。因此我創建了一個Counter類, 并聲明它為公共可用。在這個Counter中定義了一個集合,用于記錄一個對象在集合中出現的次數。假如你有一個包含集合{a, a, b, c}的計數器。調用getCount()方法,那么“a”將會返回2,然而調用keySet()將會返回{a,b,c}。這個類和Map的工作原理很像,但是它卻比Map有更簡單的方法。
獲得/設置/遞增計數對象并計算各種函數的計數。Counter的構造器和addAll()方法可用來復制另一個計數器的內容。可以通過 IntCounter和 AbstractMapBag對Counter類進行修改。
Counter中一些被強調的操作方法如下:
- incrementCount()和 decrementCount():根據給定的鍵值對當前的計數增加/減去給定的數值。如果這個鍵值在以前沒有出現過,那么可以斷定它的計數是0,增加計數的方法將會設置它的計數到給定的值。減值的方法將會把它的值設置為-1。
- getCount():返回給定鍵值當前的計數,如果以前沒有出現過就返回0。
- keysAt(), keysAbove()和keysBelow():返回給定鍵值的計數,計數必須是與給定的閾值相等,大于或者小于。這個集合可能有0個元素,但是它不會為空。
- argmin() 和 argmax():查找并返回在這個計數器中最小或者***計數的鍵值。如果有多個最小或者***計數,那么就隨機返回一個值。當Counter為空的時候返回空值。
英文原文:Most efficient way to increment a Map value in Java — Only search the key once