我讀 Typescript 源碼的秘訣都在這里了
這篇文章整理了我是怎么讀 Typescript 源碼的,類似的技巧也可以用于其他庫的源碼閱讀。
先從一個 ts 的語法開始:
Test<T> 這個高級類型,有一個泛型參數 T,當 T 傳入的類型為聯合類型的時候,有兩種情況:
- 如果 checkType(extends 左邊的類型) 是 T,則把聯合類型拆開后解析類型,最后合并成一個聯合類型返回。
- 如果 checkType 不是 T,把聯合類型整體作為 T 來解析,返回解析后的類型。
這個語法叫 Distributive Condition Type,分布式條件類型。設計的目的就是為了簡化 Test<number> | Test<boolean> 的情況。
這里不談這個語法設計的怎么樣,我們通過這個語法的實現作為抓手,來探究一下 ts 源碼應該怎么讀。
類型的表示法:類型對象
ts 會把源碼進行 parse,生成 AST,然后從 AST 中解析出類型信息。
ts 的類型信息是通過類型對象來存儲的,我們來看幾個例子。(可視化的查看 AST 可以使用 astexplorer.net 這個網站。)
上面定義了四個類型:
a 類型是 LiteralType,字面量類型,literal 屬性保存具體的字面量,這里是 NumericLiteral,數字字面量。
b 類型是 UnionType,聯合類型,types 屬性保存了它所包含的類型,這里是兩個 LiteralType
T extends boolean 這部分是一個 ConditionType,有 checkType、extendsType、trueType、falseType 四個屬性分別代表不同的部分。
可以看到,T 是一個 TypeReference 類型,也就是它只是一個變量引用,具體的值還是泛型參數傳入的類型。
Test<number | boolean> 也是一個 TypeReference,類型引用。有 typeName 和 typeArguments 兩個屬性,typeName 就是它引用的類型 Test,typeArguments 就是泛型參數的值,這里是 UnionType。
所以說,類型在 ts 里面都是通過類型對象來表示的。
比較特別的是 TypeReference 類型,它只是一個引用,具體的類型還得把類型參數傳入所引用的類型,然后求出最終類型。比如這里的 Test<number | boolean> 的類型,最終的類型是把參數 number | boolean 傳入定義的那個 ConditionType 來求出的。這就是 ts 的高級類型。
理解了類型是怎么表示的,高級類型和泛型參數都是什么,接下來我們就可以正式通過調試 ts 源碼來看下 ConditionType 的解析過程了。
VSCode 調試 Typescript 源碼
首先,我們要把 ts 源碼下載下來(加個 depth=1 可以下載單 commit,速度比較快)
- git clone --depth=1 git@github.com:microsoft/TypeScript.git
然后可以看到 lib 目錄下有 tsc.js 和 typescript.js,這兩個分別是 ts 的命令行和 api 的入口。
但是,這些是編譯以后的 js 代碼,源碼在 src 下,是用 ts 寫的。
怎么把編譯后的 js 代碼和 ts 源碼關聯起來呢?sourcemap!
默認編譯出來的產物是沒有 sourcemap 的,我們要修改下編譯配置:
修改下 src/tsconfig-library-base.json,(這是 ts 生成 lib 代碼的編譯配置)把 sourceMap 改為 true。
之后再編譯源碼:
- yarn
- yarn run build:compiler
然后就可以看到多了一個 built 目錄,下面有 tsc.js、typescript.js 這兩個入口文件,而且也有了 sourcemap:
接下來就可以直接調試 ts 源碼,而不是編譯后的 js 代碼了。信么?
不信我們來試試。
vscode 直接調試 ts
vscode 在項目根目錄下的 .vscode/launch.json 下保存調試配置:
我們添加一個調試配置:
- {
- "name": "調試 ts 源碼",
- "program": "${workspaceFolder}/built/local/tsc.js",
- "request": "launch",
- "skipFiles": [
- "<node_internals>/**"
- ],
- "args": [
- "./input.ts"
- ],
- "stopOnEntry": true,
- "type": "node"
- }
含義如下:
- name:調試配置的名字
- program:調試的目標程序的地址
- request:有 launch 和 attch 兩個取值,代表啟動新的還是連上已有的
- skipFiles:調試的時候跳過一些文件,這里配置的是跳過 node 內部的那些文件,調用棧會更簡潔
- args:命令行參數
- stopOnEntry:是否在首行加個斷點
- type:調試的類型,這里是用 node 來跑
保存之后就可以在調試面板看到該調試選項:
這里我們設計的 input.ts 是這樣的:
- type Test<T> = T extends boolean ? "Y" : "N";
- type res = Test<number | boolean>;
在 ts 的 checker.ts 部分打個斷點,然后點擊啟動調試。
然后,看,這斷住的地方,就是 ts 源碼啊,不是編譯后的 js 文件。這就是 sourcemap 的作用。
還可以在左邊文件樹看到源碼的目錄結構,這比調試編譯后的 js 代碼爽多了。
會了通過 sourcemap 調試源碼之后,我們該進入主題了:通過源碼探究分布式條件類型的實現原理。
其實我們上面使用的是 tsc.js 的命令行入口來調試的,這樣其實代碼比較多,很難理清要看哪部分代碼。怎么辦呢?
接下來就是我的秘密武器了,用 typescript compiler api。
typescript compiler api
ts 除了命令行工具的入口外,也提供了 api 的形式,只是我們很少用。但它對于探究 ts 源碼實現有很大的幫助。
我們定義個 test.js 文件,引入 typescript 的包:
- const ts = require("./built/local/typescript");
然后用 ts 的 api 傳入編譯配置,并 parse 源碼成 ast:
- const filename = "./input.ts";
- const program = ts.createProgram([filename], {
- allowJs: false
- });
- const sourceFile = program.getSourceFile(filename);
這里的 createProgram 第二個參數是編譯配置,我傳入了個 allowJS 意思了一下。
program.getSourceFile 返回的就是 ts 的 AST。
并且還可以拿到 typeChecker:
- const typeChecker = program.getTypeChecker();
然后呢?typeChecker 是類型檢查的 api,我們可以遍歷 AST 找到檢查的 node,然后調用 checker 的 api 進行檢查:
- function visitNode(node) {
- if (node.kind === ts.SyntaxKind.TypeReference) {
- const type = typeChecker.getTypeFromTypeNode(node);
- debugger;
- }
- node.forEachChild(child =>
- visitNode(child)
- );
- }
- visitNode(sourceFile);
我們判斷了如果 AST 是 TypeReference 類型,則用 typeChecker.getTypeFromTypeNode 來解析類型。
接下來就可以精準的調試該類型解析的邏輯了,相比命令行的方式來說,更方便理清邏輯。
完整代碼如下:
- const ts = require("./built/local/typescript");
- const filename = "./input.ts";
- const program = ts.createProgram([filename], {
- allowJs: false
- });
- const sourceFile = program.getSourceFile(filename);
- const typeChecker = program.getTypeChecker();
- function visitNode(node) {
- if (node.kind === ts.SyntaxKind.TypeReference) {
- const type = typeChecker.getTypeFromTypeNode(node);
- debugger;
- }
- node.forEachChild(child =>
- visitNode(child)
- );
- }
- visitNode(sourceFile);
我們改下調試配置,然后開始調試:
- {
- "name": "調試 ts 源碼",
- "program": "${workspaceFolder}/test.js",
- "request": "launch",
- "skipFiles": [
- "<node_internals>/**"
- ],
- "args": [
- ],
- "type": "node"
- }
在 typeChecker.getTypeFromTypeNode 這行打個斷點,我們去看下具體的類型解析過程。
然后,XDM,打起精神,本文的高潮部分來了:
我們進入了 getTypeFromTypeNode 方法,這個方法就是根據 AST 的類型來做不同的解析,返回類型對象的。各種類型解析的邏輯都是從這里進入的,這是一個重要的交通樞紐。
然后我們進入了 TypeReference 的分支,因為 Test<number | boolean> 就是一個類型引用嘛。
TypeReference 的類型就是它引用的類型,它引用了 ConditionType,所以會再解析 T extends boolean 這個 ConditionType 的類型:
所有的類型都是按照 ast node 的 id 存入一個 nodeLinks 的 map 中來緩存,只有第一次需要解析,之后直接拿結果。比如上圖的 resolvedType 就存入了 nodeLinks 來緩存。
然后,XDM,看到閃閃發光的那行代碼了么?
解析 ConditionType 的類型的時候會根據 checkType 部分是否是類型參數(TypeParameter,也就是泛型)來設置 isDistributive 屬性。
之后解析 TypeReference 類型的時候,會傳入具體的類型來實例化:
這里就判斷了 conditionType 的 isDistributive 屬性,如果是,則把 unionType 的每個類型分別傳入來解析,最后合并返回。
如圖,我們走到了 isDistributive 為 true 的這個分支。
那么解析出的類型就是 'Y' | 'N' 的聯合類型。
那我們把 input.ts 代碼改一下呢:
- type Test<T> = [T] extends [boolean] ? "Y" : "N";
- type res = Test<number | boolean>;
checkType 不直接寫類型參數 T 了。
再跑一次:
這次沒進去了。
難道說?
確實,這樣的結果就是 N。
說明了什么?說明了 ConditionType 是根據 checkType 是否是類型參數來設置了 isDistributive 屬性,之后解析 TypeReference 的時候根據 isDistributive 的值分別做了不同的解析。
那么只要 checkType 不是 T 就行了。
所以這樣也行:
這樣也行:
我們經常用 [T] 來避免 distributive 只不過這樣比較簡潔,看完源碼我們知道了,其實別的方式也行。
就這樣,我們通過源碼理清了這個語法的實現原理。
總結
我們以探究 distributive condition type 的實現原理為目的來閱讀了 typescript 源碼。
首先把 typescript 源碼下載下來,然后改下編譯配置,生成帶有 sourcemap 的代碼,之后在 vscode 里調試,這樣可以直接調試編譯前的源碼,信息更多。
typescript 有 cli 和 api 兩種入口,用 cli 的方式無關代碼太多,比較難理清,所以我們用 api 的方式來寫了一段測試代碼,之后打斷點來調試。
ts 的類型信息保存在類型對象中,這個可以用 astexplorer.net 來可視化的查看。
用 typeChecker.getTypeFromTypeNode 可以拿到某個類型的具體值,我們就是通過這個作為入口來探究各種類型的解析邏輯。
源碼中比較重要的有這么幾點:
- getTypeFromTypeNode 方法是通過 node 獲取類型的入口方法,所有 AST 的類型對象都是通過這個方法拿到
- nodeLinks 保存了解析后的類型,key 為 node id,這樣解析一遍就好了,下次拿緩存。
之后我們看了 ConditionType 的解析邏輯會根據 checkType 是否為類型參數來設置 isDistributive 屬性,然后 TypeReference 實例化該類型的時候會根據 isDistributive 的值進入不同的處理邏輯,這就是它的實現原理。
理解了原理之后,我們再使用 distributive condition type 就心里有底了,還可以創造很多變形使用,不局限于 [T]。
本文以調試一個類型解析邏輯的原理為抓手探究了 ts 源碼閱讀方式,調試 ts 別的部分的代碼,或者調試其他的庫也是類似的。
希望可以幫助大家掌握 typescript 源碼調試技巧,想探究某個類型語法實現原理的時候,可以通過源碼層面來徹底搞清楚。源碼面前,沒有秘密。