新聞中心
一、前言

對(duì)于前端同學(xué)來(lái)說(shuō),編譯器可能適合神奇的魔盒,表面普通,但常常給我們驚喜。
編譯器,顧名思義,用來(lái)編譯,編譯什么呢?當(dāng)然是編譯代碼咯。
其實(shí)我們也經(jīng)常接觸到編譯器的使用場(chǎng)景:
- React 中 JSX 轉(zhuǎn)換成 JS 代碼;
- 通過(guò) Babel 將 ES6 及以上規(guī)范的代碼轉(zhuǎn)換成 ES5 代碼;
- 通過(guò)各種 Loader 將 Less / Scss 代碼轉(zhuǎn)換成瀏覽器支持的 CSS 代碼;
- 將 TypeScript 轉(zhuǎn)換為 JavaScript 代碼。
- and so on...
使用場(chǎng)景非常之多,我的雙手都數(shù)不過(guò)來(lái)了。
雖然現(xiàn)在社區(qū)已經(jīng)有非常多工具能為我們完成上述工作,但了解一些編譯原理是很有必要的。接下來(lái)進(jìn)入本文主題:「200行JS代碼,帶你實(shí)現(xiàn)代碼編譯器」。
二、編譯器介紹
2.1 程序運(yùn)行方式
現(xiàn)代程序主要有兩種編譯模式:靜態(tài)編譯和動(dòng)態(tài)解釋。推薦一篇文章《Angular 2 JIT vs AOT》介紹得非常詳細(xì)。
靜態(tài)編譯
簡(jiǎn)稱 「AOT」(Ahead-Of-Time)即 「提前編譯」 ,靜態(tài)編譯的程序會(huì)在執(zhí)行前,會(huì)使用指定編譯器,將全部代碼編譯成機(jī)器碼。
在 Angular 的 AOT 編譯模式開發(fā)流程如下:
- 使用 TypeScript 開發(fā) Angular 應(yīng)用
- 運(yùn)行 ngc 編譯應(yīng)用程序
- 使用 Angular Compiler 編譯模板,一般輸出 TypeScript 代碼
- 運(yùn)行 tsc 編譯 TypeScript 代碼
- 使用 Webpack 或 Gulp 等其他工具構(gòu)建項(xiàng)目,如代碼壓縮、合并等
- 部署應(yīng)用
動(dòng)態(tài)解釋
簡(jiǎn)稱 「JIT」(Just-In-Time)即 「即時(shí)編譯」 ,動(dòng)態(tài)解釋的程序會(huì)使用指定解釋器,一邊編譯一邊執(zhí)行程序。
在 Angular 的 JIT 編譯模式開發(fā)流程如下:
- 使用 TypeScript 開發(fā) Angular 應(yīng)用
- 運(yùn)行 tsc 編譯 TypeScript 代碼
- 使用 Webpack 或 Gulp 等其他工具構(gòu)建項(xiàng)目,如代碼壓縮、合并等
- 部署應(yīng)用
AOT vs JIT
AOT 編譯流程:
JIT 編譯流程:
| 特性 | AOT | JIT |
|---|---|---|
| 編譯平臺(tái) | (Server) 服務(wù)器 | (Browser) 瀏覽器 |
| 編譯時(shí)機(jī) | Build (構(gòu)建階段) | Runtime (運(yùn)行時(shí)) |
| 包大小 | 較小 | 較大 |
| 執(zhí)行性能 | 更好 | - |
| 啟動(dòng)時(shí)間 | 更短 | - |
除此之外 AOT 還有以下優(yōu)點(diǎn):
- 在客戶端我們不需要導(dǎo)入體積龐大的 angular 編譯器,這樣可以減少我們 JS 腳本庫(kù)的大小。
- 使用 AOT 編譯后的應(yīng)用,不再包含任何 HTML 片段,取而代之的是編譯生成的 TypeScript 代碼,這樣的話 TypeScript 編譯器就能提前發(fā)現(xiàn)錯(cuò)誤??偠灾?,采用 AOT 編譯模式,我們的模板是類型安全的。
2.2 現(xiàn)代編譯器工作流程
摘抄維基百科中對(duì) 編譯器[2]工作流程介紹:
一個(gè)現(xiàn)代編譯器的主要工作流程如下:源代碼(source code)→ 預(yù)處理器(preprocessor)→ 編譯器(compiler)→ 匯編程序(assembler)→ 目標(biāo)代碼(object code)→ 鏈接器(linker)→ 可執(zhí)行文件(executables),最后打包好的文件就可以給電腦去判讀運(yùn)行了。
這里更強(qiáng)調(diào)了編譯器的作用:「將原始程序作為輸入,翻譯產(chǎn)生目標(biāo)語(yǔ)言的等價(jià)程序」。
編譯器三個(gè)核心階段.png
目前絕大多數(shù)現(xiàn)代編譯器工作流程基本類似,包括三個(gè)核心階段:
- 「解析(Parsing)」 :通過(guò)詞法分析和語(yǔ)法分析,將原始代碼字符串解析成「抽象語(yǔ)法樹(Abstract Syntax Tree)」;
- 「轉(zhuǎn)換(Transformation)」:對(duì)抽象語(yǔ)法樹進(jìn)行轉(zhuǎn)換處理操作;
- 「生成代碼(Code Generation)」:將轉(zhuǎn)換之后的 AST 對(duì)象生成目標(biāo)語(yǔ)言代碼字符串。
三、編譯器實(shí)現(xiàn)
本文將通過(guò) 「The Super Tiny Compiler[3]」 源碼解讀,學(xué)習(xí)如何實(shí)現(xiàn)一個(gè)輕量編譯器,最終「實(shí)現(xiàn)將下面原始代碼字符串(Lisp 風(fēng)格的函數(shù)調(diào)用)編譯成 JavaScript 可執(zhí)行的代碼」。
| Lisp 風(fēng)格(編譯前) | JavaScript 風(fēng)格(編譯后) | |
|---|---|---|
| 2 + 2 | (add 2 2) | add(2, 2) |
| 4 - 2 | (subtract 4 2) | subtract(4, 2) |
| 2 + (4 - 2) | (add 2 (subtract 4 2)) | add(2, subtract(4, 2)) |
話說(shuō) The Super Tiny Compiler 號(hào)稱「可能是有史以來(lái)最小的編譯器」,并且其作者 James Kyle 也是 Babel 活躍維護(hù)者之一。
讓我們開始吧~
3.1 The Super Tiny Compiler 工作流程
現(xiàn)在對(duì)照前面編譯器的三個(gè)核心階段,了解下 The Super Tiny Compiler 編譯器核心工作流程:
圖中詳細(xì)流程如下:
- 執(zhí)行「入口函數(shù)」,輸入「原始代碼字符串」作為參數(shù);
- // 原始代碼字符串
- (add 2 (subtract 42))
2. 進(jìn)入「解析階段(Parsing)」,原始代碼字符串通過(guò)「詞法分析器(Tokenizer)」轉(zhuǎn)換為「詞法單元數(shù)組」,然后再通過(guò) 「詞法分析器(Parser)」將「詞法單元數(shù)組」轉(zhuǎn)換為「抽象語(yǔ)法樹(Abstract Syntax Tree 簡(jiǎn)稱 AST)」,并返回;
3. 進(jìn)入「轉(zhuǎn)換階段(Transformation)」,將上一步生成的 「AST 對(duì)象」 導(dǎo)入「轉(zhuǎn)換器(Transformer)」,通過(guò)「轉(zhuǎn)換器」中的「遍歷器(Traverser)」,將代碼轉(zhuǎn)換為我們所需的「新的 AST 對(duì)象」;
4. 進(jìn)入「代碼生成階段(Code Generation)」,將上一步返回的「新 AST 對(duì)象」通過(guò)「代碼生成器(CodeGenerator)」,轉(zhuǎn)換成 「JavaScript Code」;
5. 「代碼編譯結(jié)束」,返回 「JavaScript Code」。
上述流程看完后可能一臉懵逼,不過(guò)沒事,請(qǐng)保持頭腦清醒,先有個(gè)整個(gè)流程的印象,接下來(lái)我們開始閱讀代碼:
3.2 入口方法
首先定義一個(gè)入口方法 compiler ,接收原始代碼字符串作為參數(shù),返回最終 JavaScript Code:
- // 編譯器入口方法 參數(shù):原始代碼字符串 input
- function compiler(input) {
- let tokens = tokenizer(input);
- let ast = parser(tokens);
- let newAst = transformer(ast);
- let output = codeGenerator(newAst);
- return output;
- }
3.3 解析階段
在解析階段中,我們定義「詞法分析器方法」 tokenizer 和「語(yǔ)法分析器方法」 parser 然后分別實(shí)現(xiàn):
- // 詞法分析器 參數(shù):原始代碼字符串 input
- function tokenizer(input) {};
- // 語(yǔ)法分析器 參數(shù):詞法單元數(shù)組tokens
- function parser(tokens) {};
詞法分析器
「詞法分析器方法」 tokenizer 的主要任務(wù):遍歷整個(gè)原始代碼字符串,將原始代碼字符串轉(zhuǎn)換為「詞法單元數(shù)組(tokens)」,并返回。
在遍歷過(guò)程中,匹配每種字符并處理成「詞法單元」壓入「詞法單元數(shù)組」,如當(dāng)匹配到左括號(hào)( ( )時(shí),將往「詞法單元數(shù)組(tokens)「壓入一個(gè)」詞法單元對(duì)象」({type: 'paren', value:'('})。
- // 詞法分析器 參數(shù):原始代碼字符串 input
- function tokenizer(input) {
- let current = 0; // 當(dāng)前解析的字符索引,作為游標(biāo)
- let tokens = []; // 初始化詞法單元數(shù)組
- // 循環(huán)遍歷原始代碼字符串,讀取詞法單元數(shù)組
- while (current < input.length) {
- let char = input[current];
- // 匹配左括號(hào),匹配成功則壓入對(duì)象 {type: 'paren', value:'('}
- if (char === '(') {
- tokens.push({
- type: 'paren',
- value: '('
- });
- current++;
- continue; // 自增current,完成本次循環(huán),進(jìn)入下一個(gè)循環(huán)
- }
- // 匹配右括號(hào),匹配成功則壓入對(duì)象 {type: 'paren', value:')'}
- if (char === ')') {
- tokens.push({
- type: 'paren',
- value: ')'
- });
- current++;
- continue;
- }
- // 匹配空白字符,匹配成功則跳過(guò)
- // 使用 \s 匹配,包括空格、制表符、換頁(yè)符、換行符、垂直制表符等
- let WHITESPACE = /\s/;
- if (WHITESPACE.test(char)) {
- current++;
- continue;
- }
- // 匹配數(shù)字字符,使用 [0-9]:匹配
- // 匹配成功則壓入{type: 'number', value: value}
- // 如 (add 123 456) 中 123 和 456 為兩個(gè)數(shù)值詞法單元
- let NUMBERS = /[0-9]/;
- if (NUMBERS.test(char)) {
- let value = '';
- // 匹配連續(xù)數(shù)字,作為數(shù)值
- while (NUMBERS.test(char)) {
- value += char;
- char = input[++current];
- }
- tokens.push({ type: 'number', value });
- continue;
- }
- // 匹配形雙引號(hào)包圍的字符串
- // 匹配成功則壓入 { type: 'string', value: value }
- // 如 (concat "foo" "bar") 中 "foo" 和 "bar" 為兩個(gè)字符串詞法單元
- if (char === '"') {
- let value = '';
- char = input[++current]; // 跳過(guò)左雙引號(hào)
- // 獲取兩個(gè)雙引號(hào)之間所有字符
- while (char !== '"') {
- value += char;
- char = input[++current];
- }
- char = input[++current];// 跳過(guò)右雙引號(hào)
- tokens.push({ type: 'string', value });
- continue;
- }
- // 匹配函數(shù)名,要求只含大小寫字母,使用 [a-z] 匹配 i 模式
- // 匹配成功則壓入 { type: 'name', value: value }
- // 如 (add 2 4) 中 add 為一個(gè)名稱詞法單元
- let LETTERS = /[a-z]/i;
- if (LETTERS.test(char)) {
- let value = '';
- // 獲取連續(xù)字符
- while (LETTERS.test(char)) {
- value += char;
- char = input[++current];
- }
- tokens.push({ type: 'name', value });
- continue;
- }
- // 當(dāng)遇到無(wú)法識(shí)別的字符,拋出錯(cuò)誤提示,并退出
- thrownewTypeError('I dont know what this character is: ' + char);
- }
- // 詞法分析器的最后返回詞法單元數(shù)組
- return tokens;
- }
語(yǔ)法分析器
「語(yǔ)法分析器方法」 parser 的主要任務(wù):將「詞法分析器」返回的「詞法單元數(shù)組」,轉(zhuǎn)換為能夠描述語(yǔ)法成分及其關(guān)系的中間形式(「抽象語(yǔ)法樹 AST」)。
- // 語(yǔ)法分析器 參數(shù):詞法單元數(shù)組tokens
- function parser(tokens) {
- let current = 0; // 設(shè)置當(dāng)前解析的詞法單元的索引,作為游標(biāo)
- // 遞歸遍歷(因?yàn)楹瘮?shù)調(diào)用允許嵌套),將詞法單元轉(zhuǎn)成 LISP 的 AST 節(jié)點(diǎn)
- function walk() {
- // 獲取當(dāng)前索引下的詞法單元 token
- let token = tokens[current];
- // 數(shù)值類型詞法單元
- if (token.type === 'number') {
- current++; // 自增當(dāng)前 current 值
- // 生成一個(gè) AST節(jié)點(diǎn) 'NumberLiteral',表示數(shù)值字面量
- return {
- type: 'NumberLiteral',
- value: token.value,
- };
- }
- // 字符串類型詞法單元
- if (token.type === 'string') {
- current++;
- // 生成一個(gè) AST節(jié)點(diǎn) 'StringLiteral',表示字符串字面量
- return {
- type: 'StringLiteral',
- value: token.value,
- };
- }
- // 函數(shù)類型詞法單元
- if (token.type === 'paren' && token.value === '(') {
- // 跳過(guò)左括號(hào),獲取下一個(gè)詞法單元作為函數(shù)名
- token = tokens[++current];
- let node = {
- type: 'CallExpression',
- name: token.value,
- params: []
- };
- // 再次自增 current 變量,獲取參數(shù)詞法單元
- token = tokens[++current];
- // 遍歷每個(gè)詞法單元,獲取函數(shù)參數(shù),直到出現(xiàn)右括號(hào)")"
- while ((token.type !== 'paren') || (token.type === 'paren' && token.value !== ')')) {
- node.params.push(walk());
- token = tokens[current];
- }
- current++; // 跳過(guò)右括號(hào)
- return node;
- }
- // 無(wú)法識(shí)別的字符,拋出錯(cuò)誤提示
- thrownewTypeError(token.type);
- }
- // 初始化 AST 根節(jié)點(diǎn)
- let ast = {
- type: 'Program',
- body: [],
- };
- // 循環(huán)填充 ast.body
- while (current < tokens.length) {
- ast.body.push(walk());
- }
- // 最后返回ast
- return ast;
- }
3.4 轉(zhuǎn)換階段
在轉(zhuǎn)換階段中,定義了轉(zhuǎn)換器 transformer 函數(shù),使用詞法分析器返回的 LISP 的 AST 對(duì)象作為參數(shù),將 AST 對(duì)象轉(zhuǎn)換成一個(gè)新的 AST 對(duì)象。
為了方便代碼組織,我們定義一個(gè)遍歷器 traverser 方法,用來(lái)處理每一個(gè)節(jié)點(diǎn)的操作。
- // 遍歷器 參數(shù):ast 和 visitor
- function traverser(ast, visitor) {
- // 定義方法 traverseArray
- // 用于遍歷 AST節(jié)點(diǎn)數(shù)組,對(duì)數(shù)組中每個(gè)元素調(diào)用 traverseNode 方法。
- function traverseArray(array, parent) {
- array.forEach(child => {
- traverseNode(child, parent);
- });
- }
- // 定義方法 traverseNode
- // 用于處理每個(gè) AST 節(jié)點(diǎn),接受一個(gè) node 和它的父節(jié)點(diǎn) parent 作為參數(shù)
- function traverseNode(node, parent) {
- // 獲取 visitor 上對(duì)應(yīng)方法的對(duì)象
- let methods = visitor[node.type];
- // 獲取 visitor 的 enter 方法,處理操作當(dāng)前 node
- if (methods && methods.enter) {
- methods.enter(node, parent);
- }
- switch (node.type) {
- // 根節(jié)點(diǎn)
- case'Program':
- traverseArray(node.body, node);
- break;
- // 函數(shù)調(diào)用
- case'CallExpression':
- traverseArray(node.params, node);
- break;
- // 數(shù)值和字符串,忽略
- case'NumberLiteral':
- case'StringLiteral':
- break;
- // 當(dāng)遇到無(wú)法識(shí)別的字符,拋出錯(cuò)誤提示,并退出
- default:
- thrownewTypeError(node.type);
- }
- if (methods && methods.exit) {
- methods.exit(node, parent);
- }
- }
- // 首次執(zhí)行,開始遍歷
- traverseNode(ast, null);
- }
在看「遍歷器」 traverser 方法時(shí),建議結(jié)合下面介紹的「轉(zhuǎn)換器」 transformer 方法閱讀:
- // 轉(zhuǎn)化器,參數(shù):ast
- function transformer(ast) {
- // 創(chuàng)建 newAST,與之前 AST 類似,Program:作為新 AST 的根節(jié)點(diǎn)
- let newAst = {
- type: 'Program',
- body: [],
- };
- // 通過(guò) _context 維護(hù)新舊 AST,注意 _context 是一個(gè)引用,從舊的 AST 到新的 AST。
- ast._context = newAst.body;
- // 通過(guò)遍歷器遍歷 處理舊的 AST
- traverser(ast, {
- // 數(shù)值,直接原樣插入新AST,類型名稱 NumberLiteral
- NumberLiteral: {
- enter(node, parent) {
- parent._context.push({
- type: 'NumberLiteral',
- value: node.value,
- });
- },
- },
- // 字符串,直接原樣插入新AST,類型名稱 StringLiteral
- StringLiteral: {
- enter(node, parent) {
- parent._context.push({
- type: 'StringLiteral',
- value: node.value,
- });
- },
- },
- // 函數(shù)調(diào)用
- CallExpression: {
- enter(node, parent) {
- // 創(chuàng)建不同的AST節(jié)點(diǎn)
- let expression = {
- type: 'CallExpression',
- callee: {
- type: 'Identifier',
- name: node.name,
- },
- arguments: [],
- };
- // 函數(shù)調(diào)用有子類,建立節(jié)點(diǎn)對(duì)應(yīng)關(guān)系,供子節(jié)點(diǎn)使用
- node._context = expression.arguments;
- // 頂層函數(shù)調(diào)用算是語(yǔ)句,包裝成特殊的AST節(jié)點(diǎn)
- if (parent.type !== 'CallExpression') {
- expression = {
- type: 'ExpressionStatement',
- expression: expression,
- };
- }
- parent._context.push(expression);
- },
- }
- });
- return newAst;
- }
重要一點(diǎn),這里通過(guò) _context 引用來(lái)「維護(hù)新舊 AST 對(duì)象」,管理方便,避免污染舊 AST 對(duì)象。
3.5 代碼生成
接下來(lái)到了最后一步,我們定義「代碼生成器」 codeGenerator 方法,通過(guò)遞歸,將新的 AST 對(duì)象代碼轉(zhuǎn)換成 JavaScript 可執(zhí)行代碼字符串。
- // 代碼生成器 參數(shù):新 AST 對(duì)象
- function codeGenerator(node) {
- switch (node.type) {
- // 遍歷 body 屬性中的節(jié)點(diǎn),且遞歸調(diào)用 codeGenerator,按行輸出結(jié)果
- case'Program':
- return node.body.map(codeGenerator)
- .join('\n');
- // 表達(dá)式,處理表達(dá)式內(nèi)容,并用分號(hào)結(jié)尾
- case'ExpressionStatement':
- return (
- codeGenerator(node.expression) +
- ';'
- );
- // 函數(shù)調(diào)用,添加左右括號(hào),參數(shù)用逗號(hào)隔開
- case'CallExpression':
- return (
- codeGenerator(node.callee) +
- '(' +
- node.arguments.map(codeGenerator)
- .join(', ') +
- ')'
- );
- // 標(biāo)識(shí)符,返回其 name
- case'Identifier':
- return node.name;
- // 數(shù)值,返回其 value
- case'NumberLiteral':
- return node.value;
- // 字符串,用雙引號(hào)包裹再輸出
- case'StringLiteral':
- return'"' + node.value + '"';
- // 當(dāng)遇到無(wú)法識(shí)別的字符,拋出錯(cuò)誤提示,并退出
- default:
- thrownewTypeError(node.type);
- }
- }
3.6 編譯器測(cè)試
截止上一步,我們完成簡(jiǎn)易編譯器的代碼開發(fā)。接下來(lái)通過(guò)前面原始需求的代碼,測(cè)試編譯器效果如何:
- const add = (a, b) => a + b;
- const subtract = (a, b) => a - b;
- const source = "(add 2 (subtract 4 2))";
- const target = compiler(source); // "add(2, (subtract(4, 2));"
- const result = eval(target); // Ok result is 4
3.7 工作流程小結(jié)
總結(jié) The Super Tiny Compiler 編譯器整個(gè)工作流程:
「1、input => tokenizer => tokens」
「2、tokens => parser => ast」
「3、ast => transformer => newAst」
「4、newAst => generator => output」
其實(shí)多數(shù)編譯器的工作流程都大致相同:
四、手寫 Webpack 編譯器
根據(jù)之前介紹的 The Super Tiny Compiler編譯器核心工作流程,再來(lái)手寫 Webpack 的編譯器,會(huì)讓你有種眾享絲滑的感覺~
話說(shuō),有些面試官喜歡問這個(gè)呢。當(dāng)然,手寫一遍能讓我們更了解 Webpack 的構(gòu)建流程,這個(gè)章節(jié)我們簡(jiǎn)要介紹一下。
4.1 Webpack 構(gòu)建流程分析
從啟動(dòng)構(gòu)建到輸出結(jié)果一系列過(guò)程:
1. 「初始化參數(shù)」
解析 Webpack 配置參數(shù),合并 Shell 傳入和 webpack.config.js 文件配置的參數(shù),形成最后的配置結(jié)果。
2. 「開始編譯」
上一步得到的參數(shù)初始化 compiler 對(duì)象,注冊(cè)所有配置的插件,插件監(jiān)聽 Webpack 構(gòu)建生命周期的事件節(jié)點(diǎn),做出相應(yīng)的反應(yīng),執(zhí)行對(duì)象的 run 方法開始執(zhí)行編譯。
3. 「確定入口」
從配置的 entry 入口,開始解析文件構(gòu)建 AST 語(yǔ)法樹,找出依賴,遞歸下去。
4. 「編譯模塊」
遞歸中根據(jù)「文件類型」和 「loader 配置」,調(diào)用所有配置的 loader 對(duì)文件進(jìn)行轉(zhuǎn)換,再找出該模塊依賴的模塊,再遞歸本步驟直到所有入口依賴的文件都經(jīng)過(guò)了本步驟的處理。
5 「完成模塊編譯并輸出」
遞歸完事后,得到每個(gè)文件結(jié)果,包含每個(gè)模塊以及他們之間的依賴關(guān)系,根據(jù) entry 配置生成代碼塊 chunk 。
6. 「輸出完成」
輸出所有的 chunk 到文件系統(tǒng)。
注意:在構(gòu)建生命周期中有一系列插件在做合適的時(shí)機(jī)做合適事情,比如 UglifyPlugin 會(huì)在 loader 轉(zhuǎn)換遞歸完對(duì)結(jié)果使用 UglifyJs 壓縮「覆蓋之前的結(jié)果」。
4.2 代碼實(shí)現(xiàn)
手寫 Webpack 需要實(shí)現(xiàn)以下三個(gè)核心方法:
- createAssets : 收集和處理文件的代碼;
- createGraph :根據(jù)入口文件,返回所有文件依賴圖;
- bundle : 根據(jù)依賴圖整個(gè)代碼并輸出;
1. createAssets
- function createAssets(filename){
- const content = fs.readFileSync(filename, "utf-8"); // 根據(jù)文件名讀取文件內(nèi)容
- // 將讀取到的代碼內(nèi)容,轉(zhuǎn)換為 AST
- const ast = parser.parse(content, {
- sourceType: "module"http:// 指定源碼類型
- })
- const dependencies = []; // 用于收集文件依賴的路徑
- // 通過(guò) traverse 提供的操作 AST 的方法,獲取每個(gè)節(jié)點(diǎn)的依賴路徑
- traverse(ast, {
- ImportDeclaration: ({node}) => {
- dependencies.push(node.source.value);
- }
- });
- // 通過(guò) AST 將 ES6 代碼轉(zhuǎn)換成 ES5 代碼
- const { code } = babel.transformFromAstSync(ast, null, {
- presets: ["@babel/preset-env"]
- });
- let id = moduleId++;
- return {
- id,
- filename,
- code,
- dependencies
- }
- }
2. createGraph
- function createGraph(entry) {
- const mainAsset = createAssets(entry); // 獲取入口文件下的內(nèi)容
- const queue = [mainAsset];
- for(const asset of queue){
- const dirname = path.dirname(asset.filename);
- asset.mapping = {};
- asset.dependencies.forEach(relativePath => {
- const absolutePath = path.join(dirname, relativePath); // 轉(zhuǎn)換文件路徑為絕對(duì)路徑
- const child = createAssets(absolutePath);
- asset.mapping[relativePath] = child.id;
- queue.push(child); // 遞歸去遍歷所有子節(jié)點(diǎn)的文件
- })
- }
- return queue;
- }
3. bunlde
- function bundle(graph) {
- let modules = "";
- graph.forEach(item => {
- modules += `
- ${item.id}: [
- function (require, module, exports){
- ${item.code}
- },
- ${JSON.stringify(item.mapping)}
- ],
- `
- })
- return`
- (function(modules){
- function require(id){
- const [fn, mapping] = modules[id];
- function localRequire(relativePath){
- return require(mapping[relativePath]);
- }
- const module = {
- exports: {}
- }
- fn(localRequire, module, module.exports);
- return module.exports;
- }
- require(0);
- })({${modules}})
- `
- }
五、總結(jié)
本文從編譯器概念和基本工作流程開始介紹,然后通過(guò) The Super Tiny Compiler 譯器源碼,詳細(xì)介紹核心工作流程實(shí)現(xiàn),包括「詞法分析器」、「語(yǔ)法分析器」、「遍歷器」和「轉(zhuǎn)換器」的基本實(shí)現(xiàn),最后通過(guò)「代碼生成器」,將各個(gè)階段代碼結(jié)合起來(lái),實(shí)現(xiàn)了這個(gè)號(hào)稱「可能是有史以來(lái)最小的編譯器?!?/p>
本文也簡(jiǎn)要介紹了「手寫 Webpack 的實(shí)現(xiàn)」,需要讀者自行完善和深入喲!
「是不是覺得很神奇~」
當(dāng)然通過(guò)本文學(xué)習(xí),也僅僅是編譯器相關(guān)知識(shí)的邊山一腳,要學(xué)的知識(shí)還有非常多,不過(guò)好的開頭,更能促進(jìn)我們學(xué)習(xí)動(dòng)力。加油!
最后,文中介紹到的代碼,我存放在 Github 上:
- [learning]the-super-tiny-compiler.js[4]
- [writing]webpack-compiler.js[5]
本文名稱:200行JS代碼,帶你實(shí)現(xiàn)代碼編譯器
URL標(biāo)題:http://m.fisionsoft.com.cn/article/djpcdss.html


咨詢
建站咨詢
