如何使用JavaScript Set集合更快地編寫代碼
我敢肯定,有很多開發人員堅持使用基本的全局對象:number,string,object,array和boolean值。
對于許多用例,這些都是你所需要的。但是,如果你想使代碼盡可能快和可擴展,那么這些基本類型并不總是足夠好。
在本文中,我們將討論JavaScript的 Set集合如何使你的代碼更快,尤其是在擴展時。數組可以執行的操作與Set可以執行的操作之間存在大量的交叉。使用Set往往會帶來數組無法實現的運行時優勢。在這篇文章中,我們將探討如何做到這一點。
Set有何不同?
最根本的區別是數組是索引集合,這意味著數組中的數據值由索引排序。
- const arr = [A, B, C, D];
- console.log(arr.indexOf(A)); // Result: 0
- console.log(arr.indexOf(C)); // Result: 2
相比之下,Set是一個鍵控集合。 Set使用鍵對數據進行排序,而不是使用索引。Set的元素可以按插入順序進行迭代,并且不能包含任何重復數據。換句話說,集合中的每個項目都必須是唯一的。
主要好處是什么?
直接比較,Set集合比數組具有多個優點,特別是在運行時間上更快:
- 搜索項目:使用 indexOf() 或 includes() 檢查數組中是否存在某項比較慢。
- 刪除項目:在Set集合中,可以按項目的值刪除項目。在數組中,等效項是根據元素的索引使用 splice()。與上一點一樣,依賴索引的速度很慢。
- 插入項目:與使用 push(),unshift() 或等效方法將項目添加到數組相比,將項目添加到Set更快。
- 儲存NaN:你不能使用 indexOf() 或 include() 來查找值 NaN,而Set可以存儲該值。
- 刪除重復項:Set對象僅存儲唯一值。如果要避免存儲重復項,則這是優于數組的顯著優勢,在數組中,需要附加代碼來處理重復項。
時間的復雜度是多少?
數組用于搜索項目的方法的線性時間復雜度為O(N)。換句話說,運行時間以與數據大小增加相同的速率增加。
相比之下,Set用于搜索,刪除和插入項目的方法的時間復雜度僅為O(1)——這意味著數據的大小實際上與這些方法的運行時間無關!
Set集合的速度究竟快多少?
盡管運行時間可能會因所使用的系統,所提供數據的大小和其他變量而有很大不同,但我希望我的測試結果能使你對Set的運行速度有實際的了解。我將分享我做的三個簡單測試和獲得的結果。
1. 準備測試
在運行任何測試之前,讓我們創建一個數組和一個Set,每個數組具有一百萬個條目。為簡單起見,我將從0開始,一直到999,999。
- let arr = [], set = new Set(), n = 1000000;
- for (let i = 0; i < n; i++) {
- arr.push(i);
- set.add(i);
- }
2. 測試一:搜索項目
首先,讓我們搜索數字 123123,我們知道它將返回true。
- let result;
- console.time('Array');
- result = arr.indexOf(123123) !== -1;
- console.timeEnd('Array');
- console.time('Set');
- result = set.has(123123);
- console.timeEnd('Set');
結果:Array: 0.173ms,set: 0.023ms,set的速度快了7.54倍。
3. 測試二:添加項目
現在,讓我們向每個集合中添加一個新項目。
- console.time('Array');
- arr.push(n);
- console.timeEnd('Array');
- console.time('Set');
- set.add(n);
- console.timeEnd('Set');
結果:Array: 0.018ms,set: 0.003ms,set速度提高了6.73倍。
4. 測試三:刪除項目
最后,讓我們從每個集合中刪除一個項目(我們可以使用剛剛添加的項目)。沒有內置的數組方法,因此我們將創建一個輔助函數以保持所有內容的整潔:
- const deleteFromArr = (arr, item) => {
- let index = arr.indexOf(item);
- return index !== -1 && arr.splice(index, 1);
- };
這是測試的代碼:
- console.time('Array');
- deleteFromArr(arr, n);
- console.timeEnd('Array');
- console.time('Set');
- set.delete(n);
- console.timeEnd('Set');
結果:Array: 1.122ms,set: 0.015ms,在這個例子中,Set的速度是驚人的74.13倍!
總的來說,我們可以看到,使用Set而不是數組可以極大地改善運行時?,F在讓我們來看看一些實際的例子,在這些例子中,Set集合是有用的。
案例1:從數組中刪除重復的值
如果要快速從數組中刪除重復的值,可以將其轉換為Set。到目前為止,這是過濾唯一值的最簡潔的方法:
- const duplicateCollection = ['A', 'B', 'B', 'C', 'D', 'B', 'C'];
- // 如果要將數組變成Set集合
- let uniqueCollection = new Set(duplicateCollection);
- console.log(uniqueCollection) // Result: Set(4) {"A", "B", "C", "D"}
- // 如果你想將值保留在數組中
- let uniqueCollection = [...new Set(duplicateCollection)];
- console.log(uniqueCollection) // Result: ["A", "B", "C", "D"]
案例2:一個Google面試問題
給定一個無序的整數數組和一個值 sum,如果可以相加任何兩個項目以使它們等于 sum 的值,則返回 true。否則,返回false。
因此,如果給定數組 [3,5,1,4] 和值 9,則我們的函數應返回 true,因為 4 + 5 = 9。
解決這個問題的一種很好的方法是遍歷數組,同時創建一組Set。
讓我們將這種想法應用于上面的示例。當我們遇到 3 時,可以將 6 加到我們的Set中,因為我們知道我們需要找到一個 9 的和。然后,每次我們接觸數組中的新值時,我們都可以檢查它是否在我們的Set中。當我們到了 5 ,我們就會把 4 加入到我們的Set中。然后,當我們最終遇到 4 時,我們也會在我們的Set中找到它,所以我們可以返回 true。
該解決方案可能如下所示:
- const findSum = (arr, val) => {
- let searchValues = new Set();
- searchValues.add(val - arr[0]);
- for (let i = 1, length = arr.length; i < length; i++) {
- let searchVal = val - arr[i];
- if (searchValues.has(arr[i])) {
- return true;
- } else {
- searchValues.add(searchVal);
- }
- };
- return false;
- };
這是一個更簡潔的版本:
- const findSum = (arr, sum) =>
- arr.some((set => n => set.has(n) || !set.add(sum - n))(new Set));
因為Set.prototype.has() 的時間復雜度僅為O(1),所以使用Set來存儲而不是數組可以幫助我們整體解決方案獲得線性運行時間O(N)。
如果我們改為依賴 Array.prototype.indexOf() 或 Array.prototype.includes() ,它們的時間復雜度均為O(N),則總運行時間將為O(N²),慢得多!
如果你以前從未接觸過JavaScript Set,希望我已經展示了它們的實用性!