前端代碼質量-圈復雜度原理和實踐

作者：ConardLi 2019-10-14 17:00:14

開發前端

本文的主角圈復雜度重磅登場，本文將從圈復雜度原理出發，介紹圈復雜度的計算方法、如何降低代碼的圈復雜度，如何獲取圈復雜度，以及圈復雜度在公司項目的實踐應用。

[[279168]]

寫程序時時刻記著，這個將來要維護你寫的程序的人是一個有嚴重暴力傾向，并且知道你住在哪里的精神變態者。

1. 導讀

你們是否也有過下面的想法？

重構一個項目還不如新開發一個項目...
這代碼是誰寫的，我真想...

你們的項目中是否也存在下面的問題？

單個項目也越來越龐大，團隊成員代碼風格不一致，無法對整體的代碼質量做全面的掌控
沒有一個準確的標準去衡量代碼結構復雜的程度，無法量化一個項目的代碼質量
重構代碼后無法立即量化重構后代碼質量是否提升

針對上面的問題，本文的主角圈復雜度重磅登場，本文將從圈復雜度原理出發，介紹圈復雜度的計算方法、如何降低代碼的圈復雜度，如何獲取圈復雜度，以及圈復雜度在公司項目的實踐應用。

2. 圈復雜度

2.1 定義

圈復雜度 (Cyclomatic complexity) 是一種代碼復雜度的衡量標準，也稱為條件復雜度或循環復雜度，它可以用來衡量一個模塊判定結構的復雜程度，數量上表現為獨立現行路徑條數，也可理解為覆蓋所有的可能情況最少使用的測試用例數。簡稱 CC 。其符號為 VG 或是 M 。

圈復雜度在 1976 年由 Thomas J. McCabe, Sr. 提出。

圈復雜度大說明程序代碼的判斷邏輯復雜，可能質量低且難于測試和維護。程序的可能錯誤和高的圈復雜度有著很大關系。

2.2 衡量標準

代碼復雜度低，代碼不一定好，但代碼復雜度高，代碼一定不好。

圈復雜度	代碼狀況	可測性	維護成本
1 - 10	清晰、結構化	高	低
10 - 20	復雜	中	中
20 - 30	非常復雜	低	高
>30	不可讀	不可測	非常高

3. 計算方法

3.1 控制流程圖

控制流程圖，是一個過程或程序的抽象表現，是用在編譯器中的一個抽象數據結構，由編譯器在內部維護，代表了一個程序執行過程中會遍歷到的所有路徑。它用圖的形式表示一個過程內所有基本塊執行的可能流向, 也能反映一個過程的實時執行過程。

下面是一些常見的控制流程：

3.2 節點判定法

有一個簡單的計算方法，圈復雜度實際上就是等于判定節點的數量再加上1。向上面提到的：if else 、switch case 、 for循環、三元運算符等等，都屬于一個判定節點，例如下面的代碼：

function testComplexity(*param*) {  
    let result = 1;  
    if (param > 0) {  
        result--;  
    }  
    for (let i = 0; i < 10; i++) {  
        result += Math.random();  
    }  
    switch (parseInt(result)) {  
        case 1:  
            result += 20;  
            break;  
        case 2:  
            result += 30;  
            break;  
        default:  
            result += 10;  
            break;  
    }  
    return result > 20 ? result : result;  
}

上面的代碼中一共有1個if語句，一個for循環，兩個case語句，一個三元運算符,所以代碼復雜度為 4+1+1=6。另外，需要注意的是 || 和 && 語句也會被算作一個判定節點，例如下面代碼的代碼復雜為3：

function testComplexity(*param*) {  
    let result = 1;  
    if (param > 0 && param < 10) {  
        result--;  
    }  
    return result;  
}

3.3 點邊計算法

M = E − N + 2P

E：控制流圖中邊的數量
N：控制流圖中的節點數量
P：獨立組件的數目

前兩個，邊和節點都是數據結構圖中最基本的概念：

P代表圖中獨立組件的數目，獨立組件是什么意思呢？來看看下面兩個圖，左側為連通圖，右側為非連通圖：

連通圖：對于圖中任意兩個頂點都是連通的

一個連通圖即為圖中的一個獨立組件，所以左側圖中獨立組件的數目為1，右側則有兩個獨立組件。

對于我們的代碼轉化而來的控制流程圖，正常情況下所有節點都應該是連通的，除非你在某些節點之前執行了 return，顯然這樣的代碼是錯誤的。所以每個程序流程圖的獨立組件的數目都為1，所以上面的公式還可以簡化為 M = E − N + 2 。

4. 降低代碼的圈復雜度

我們可以通過一些代碼重構手段來降低代碼的圈復雜度。

重構需謹慎，示例代碼僅僅代表一種思想，實際代碼要遠遠比示例代碼復雜的多。

4.1 抽象配置

通過抽象配置將復雜的邏輯判斷進行簡化。例如下面的代碼，根據用戶的選擇項執行相應的操作，重構后降低了代碼復雜度，并且如果之后有新的選項，直接加入配置即可，而不需要再去深入代碼邏輯中進行改動：

4.2 單一職責 - 提煉函數

單一職責原則（SRP）：每個類都應該有一個單一的功能，一個類應該只有一個發生變化的原因。

在 JavaScript 中，需要用到的類的場景并不太多，單一職責原則則是更多地運用在對象或者方法級別上面。

函數應該做一件事，做好這件事，只做這一件事。 — 代碼整潔之道

關鍵是如何定義這 “一件事” ，如何將代碼中的邏輯進行抽象，有效的提煉函數有利于降低代碼復雜度和降低維護成本。

4.3 使用 break 和 return 代替控制標記

我們經常會使用一個控制標記來標示當前程序運行到某一狀態，很多場景下，使用 break 和 return 可以代替這些標記并降低代碼復雜度。

4.4 用函數取代參數

setField 和 getField 函數就是典型的函數取代參數，如果么有 setField、getField 函數，我們可能需要一個很復雜的 setValue、getValue 來完成屬性賦值操作：

4.5 簡化條件判斷 - 逆向條件

某些復雜的條件判斷可能逆向思考后會變的更簡單。

4.6 簡化條件判斷 -合并條件

將復雜冗余的條件判斷進行合并。

4.7 簡化條件判斷 - 提取條件

將復雜難懂的條件進行語義化提取。

5. 圈復雜度檢測方法

5.1 eslint規則

eslint提供了檢測代碼圈復雜度的rules:

我們將開啟 rules 中的 complexity 規則，并將圈復雜度大于 0 的代碼的 rule severity 設置為 warn 或 error 。

rules: {  
       complexity: [  
           'warn',  
           { max: 0 }  
       ]  
   }

這樣 eslint 就會自動檢測出所有函數的代碼復雜度，并輸出一個類似下面的 message。

Method 'testFunc' has a complexity of 12. Maximum allowed is 0  
Async function has a complexity of 6. Maximum allowed is 0.  
...

5.2 CLIEngine

我們可以借助 eslint 的 CLIEngine ，在本地使用自定義的 eslint 規則掃描代碼，并獲取掃描結果輸出。

初始化 CLIEngine ：

const eslint = require('eslint');  
const { CLIEngine } = eslint;  
const cli = new CLIEngine({  
    parserOptions: {  
        ecmaVersion: 2018,  
    },  
    rules: {  
        complexity: [  
            'error',  
            { max: 0 }  
        ]  
    }  
});

使用 executeOnFiles 對指定文件進行掃描，并獲取結果，過濾出所有 complexity 的 message 信息。

const reports = cli.executeOnFiles(['.']).results;  
for (let i = 0; i < reports.length; i++) {  
    const { messages } = reports[i];  
    for (let j = 0; j < messages.length; j++) {  
        const { message, ruleId } = messages[j];  
        if (ruleId === 'complexity') {  
             console.log(message);  
        }  
    }  
}

5.3 提取message

通過 eslint 的檢測結果將有用的信息提取出來，先測試幾個不同類型的函數，看看 eslint 的檢測結果：

function func1() {  
    console.log(1);  
}  
const func2 = () => {  
    console.log(2);  
};  
class TestClass {  
    func3() {  
        console.log(3);  
    }  
}  
async function func4() {  
    console.log(1);  
}

執行結果：

Function 'func1' has a complexity of 1. Maximum allowed is 0.  
Arrow function has a complexity of 1. Maximum allowed is 0.  
Method 'func3' has a complexity of 1. Maximum allowed is 0.  
Async function 'func4' has a complexity of 1. Maximum allowed is 0.

可以發現，除了前面的函數類型，以及后面的復雜度，其他都是相同的。

函數類型：

Function ：普通函數
Arrow function ：箭頭函數
Method ：類方法
Async function ：異步函數

截取方法類型：

const REG_FUNC_TYPE = /^(Method |Async function |Arrow function |Function )/g;  
function getFunctionType(message) {  
    let hasFuncType = REG_FUNC_TYPE.test(message);  
    return hasFuncType && RegExp.$1;  
}

將有用的部分提取出來：

const MESSAGE_PREFIX = 'Maximum allowed is 1.';  
const MESSAGE_SUFFIX = 'has a complexity of ';  
function getMain(message) {  
    return message.replace(MESSAGE_PREFIX, '').replace(MESSAGE_SUFFIX, '');  
}

提取方法名稱：

function getFunctionName(message) {  
    const main = getMain(message);  
    let test = /'([a-zA-Z0-9_$]+)'/g.test(main);  
    return test ? RegExp.$1 : '*';  
}

截取代碼復雜度：

function getComplexity(message) {  
    const main = getMain(message);  
    (/(\d+)\./g).test(main);  
    return +RegExp.$1;  
}

除了 message ，還有其他的有用信息：

函數位置：獲取 messages 中的 line 、column 即函數的行、列位置
當前文件名稱：reports 結果中可以獲取當前掃描文件的絕對路徑 filePath ，通過下面的操作獲取真實文件名：

filePath.replace(process.cwd(), '').trim()

復雜度等級，根據函數的復雜度等級給出重構建議：

圈復雜度	代碼狀況	可測性	維護成本
1 - 10	清晰、結構化	高	低
10 - 20	復雜	中	中
20 - 30	非常復雜	低	高
>30	不可讀	不可測	非常高

圈復雜度	代碼狀況
1 - 10	無需重構
11 - 15	建議重構
>15	強烈建議重構

6.架構設計

將代碼復雜度檢測封裝成基礎包，根據自定義配置輸出檢測數據，供其他應用調用。

上面的展示了使用 eslint 獲取代碼復雜度的思路，下面我們要把它封裝為一個通用的工具，考慮到工具可能在不同場景下使用，例如：網頁版的分析報告、cli版的命令行工具，我們把通用的能力抽象出來以 npm包的形式供其他應用使用。

在計算項目代碼復雜度之前，我們首先要具備一項基礎能力，代碼掃描，即我們要知道我們要對項目里的哪些文件做分析，首先 eslint 是具備這樣的能力的，我們也可以直接用 glob 來遍歷文件。但是他們都有一個缺點，就是 ignore 規則是不同的，這對于用戶來講是有一定學習成本的，因此我這里把手動封裝代碼掃描，使用通用的 npm ignore 規則，這樣代碼掃描就可以直接使用 .gitignore這樣的配置文件。另外，代碼掃描作為代碼分析的基礎能力，其他代碼分析也是可以公用的。

基礎能力
- 代碼掃描能力
- 復雜度檢測能力
- ...
應用
- 命令行工具
- 代碼分析報告
- ...

7. 基礎能力 - 代碼掃描

本文涉及的 npm 包和 cli命令源碼均可在我的開源項目 awesome-cli中查看。

awesome-cli 是我新建的一個開源項目：有趣又實用的命令行工具，后面會持續維護，敬請關注，歡迎 star。

代碼掃描（c-scan）源碼：https://github.com/ConardLi/a...

代碼掃描是代碼分析的底層能力，它主要幫助我們拿到我們想要的文件路徑，應該滿足我們以下兩個需求：

我要得到什么類型的文件
我不想要哪些文件

7.1 使用

npm i c-scan --save  
const scan = require('c-scan');  
scan({  
    extensions:'**/*.js',  
    rootPath:'src',  
    defalutIgnore:'true',  
    ignoreRules:[],  
    ignoreFileName:'.gitignore'  
});

7.2 返回值

符合規則的文件路徑數組：

7.3 參數

extensions
- 掃描文件擴展名
- 默認值：**/*.js

rootPath
- 掃描文件路徑
- 默認值：.
defalutIgnore
- 是否開啟默認忽略（glob規則）
- glob ignore規則為內部使用，為了統一ignore規則，自定義規則使用gitignore規則
- 默認值：true
- 默認開啟的 glob ignore 規則：

const DEFAULT_IGNORE_PATTERNS = [  
    'node_modules/**',  
    'build/**',  
    'dist/**',  
    'output/**',  
    'common_build/**'  
];

ignoreRules
- 自定義忽略規則（gitignore規則）
- 默認值：[]
ignoreFileName
- 自定義忽略規則配置文件路徑（gitignore規則）
- 默認值：.gitignore
- 指定為null則不啟用ignore配置文件

7.4 核心實現

基于 glob ，自定義 ignore 規則進行二次封裝。

/**  
 * 獲取glob掃描的文件列表  
 * @param {*} rootPath 跟路徑  
 * @param {*} extensions 擴展  
 * @param {*} defalutIgnore 是否開啟默認忽略  
 */  
function getGlobScan(rootPath, extensions, defalutIgnore) {  
    return new Promise(resolve => {  
        glob(`${rootPath}${extensions}`,  
            { dot: true, ignore: defalutIgnore ? DEFAULT_IGNORE_PATTERNS : [] },  
            (err, files) => {  
                if (err) {  
                    console.log(err);  
                    process.exit(1);  
                }  
                resolve(files);  
            });  
    });  
}  
/**  
 * 加載ignore配置文件，并處理成數組  
 * @param {*} ignoreFileName   
 */  
async function loadIgnorePatterns(ignoreFileName) { 
     const ignorePath = path.resolve(process.cwd(), ignoreFileName);  
    try {  
        const ignores = fs.readFileSync(ignorePath, 'utf8');  
        return ignores.split(/[\n\r]|\n\r/).filter(pattern => Boolean(pattern));  
    } catch (e) {  
        return [];  
    }  
}  
/**  
 * 根據ignore配置過濾文件列表  
 * @param {*} files   
 * @param {*} ignorePatterns   
 * @param {*} cwd   
 */  
function filterFilesByIgnore(files, ignorePatterns, ignoreRules, cwd = process.cwd()) {  
    const ig = ignore().add([...ignorePatterns, ...ignoreRules]);  
    const filtered = files  
        .map(raw => (path.isAbsolute(raw) ? raw : path.resolve(cwd, raw)))  
        .map(raw => path.relative(cwd, raw))  
        .filter(filePath => !ig.ignores(filePath))  
        .map(raw => path.resolve(cwd, raw));  
    return filtered;  
}

8. 基礎能力 - 代碼復雜度檢測

代碼復雜度檢測（c-complexity）源碼：https://github.com/ConardLi/a...

代碼檢測基礎包應該具備以下幾個能力：

自定義掃描文件夾和類型
支持忽略文件
定義最小提醒代碼復雜度

8.1 使用

npm i c-complexity --save  
const cc = require('c-complexity');  
cc({},10);

8.2 返回值

fileCount：文件數量
funcCount：函數數量
result：詳細結果
- funcType：函數類型
- funcName；函數名稱
- position：詳細位置（行列號）
- fileName：文件相對路徑
- complexity：代碼復雜度
- advice：重構建議

8.3 參數

scanParam
- 繼承自上面代碼掃描的參數
min
- 最小提醒代碼復雜度，默認為1

9. 應用 - 代碼復雜度檢測工具

代碼復雜度檢測（conard cc）源碼：https://github.com/ConardLi/a...

9.1 指定最小提醒復雜度

可以觸發提醒的最小復雜度。

默認為 10
通過命令 conard cc --min=5 自定義

9.2 指定掃描參數

自定義掃描規則

掃描參數繼承自上面的 scan param
例如： conard cc --defalutIgnore=false

10. 應用 - 代碼復雜度報告

部分截圖來源于我們內部的項目質量監控平臺，圈復雜度作為一項重要的指標，對于衡量項目代碼質量起著至關重要的作用。

代碼復雜復雜度變化趨勢

定時任務爬取代碼每日的代碼復雜度、代碼行數、函數個數，通過每日數據繪制代碼復雜度和代碼行數變化趨勢折線圖。

通過 [ 復雜度 / 代碼行數 ] 或 [ 復雜度 / 函數個數 ] 的變化趨勢，判斷項目發展是否健康。

比值若一直在上漲，說明你的代碼在變得越來越難以理解。這不僅使我們面臨意外的功能交互和缺陷的風險，由于我們在具有或多或少相關功能的模塊中所面臨的過多認知負擔，也很難重用代碼并進行修改和測試。（下圖1）
若比值在某個階段發生突變，說明這段期間迭代質量很差。（下圖2）

復雜度曲線圖可以很快的幫你更早的發現上面這兩個問題，發現它們后，你可能需要重構代碼。復雜性趨勢對于跟蹤你的代碼重構也很有用。復雜性趨勢的下降趨勢是一個好兆頭。這要么意味著您的代碼變得更簡單（例如，把 if-else 被重構為多態解決方案），要么代碼更少（將不相關的部分提取到了其他模塊中）。（下圖3）
代碼重構后，你還需要繼續探索復雜度變化趨勢。經常發生的事情是，我們花費大量的時間和精力來重構，無法解決根本原因，很快復雜度又滑回了原處。（下圖4）你可能覺得這是個例，但是有研究標明，在分析了數百個代碼庫后，發現出現這種情況的頻率很高。因此，時刻觀察代碼復雜度變化趨勢是有必要的。