前言
什么是 CommonJS ?
node.js 的应用采用的commonjs模块规范。
每一个文件就是一个模块,拥有自己独立的作用域,变量,以及方法等,对其他的模块都不可见。CommonJS规范规定:每个模块内部,module变量代表当前模块。这个变量是一个对象,它的exports属性(即module.exports)是对外的接口。加载某个模块,其实是加载该模块的module.exports属性。require方法用于加载模块。
CommonJS模块的特点:
所有代码都运行在模块作用域,不会污染全局作用域。
模块可以多次加载,但是只会在第一次加载时运行一次,然后运行结果就被缓存了,以后再加载,就直接读取缓存结果。要想让模块再次运行,必须清除缓存。
模块加载的顺序,按照其在代码中出现的顺序。
如何使用?
假设我们现在有个a.js文件,我们要在main.js 中使用a.js的一些方法和变量,运行环境是nodejs。这样我们就可以使用CommonJS规范,让a文件导出方法/变量。然后使用require函数引入变量/函数。
示例:
// a.js module.exports = '这是a.js的变量'; // 导出一个变量/方法/对象都可以
// main.js // 这里如果导入a.js,那么他会自动按照预定顺序帮你添加后缀 let str = require('./a'); // 输出:'这是a.js的变量' console.log(str);
手写一个require函数
前言
我们现在就开始手写一个 精简版的 require函数,这个require函数支持以下功能:
导入一个符合CommonJS规范的JS文件。
支持自动添加文件后缀(暂时支持JS和JSON文件)
现在就开始吧!
1. 定义一个req方法
我们先自定义一个req方法,和全局的require函数隔离开。
这个req方法,接受一个名为ID的参数,也就是要加载的文件路径。
// main.js function req(id){} let a = req('./a') console.log(a)
2. 新建一个Module 类
新建一个module类,这个module将会处理文件加载的全过程。
function Module(id) { this.id = id; // 当前模块的文件路径 this.exports = {} // 当前模块导出的结果,默认为空 }
3. 获取文件绝对路径
刚才我们介绍到,require 函数支持传入一个路径。这个路径可以是相对路径,也可以是绝对路径,也可以不写文件后缀名。
我们在Module类上添加一个叫做“_resolveFilename” 的方法,用于解析用户传进去的文件路径,获取一个绝对路径。
// 将一个相对路径 转化成绝对路径 Module._resolveFilename = function (id) {}
继续添加一个 “extennsions” 的属性,这个属性是一个对象。key是文件扩展名,value就是扩展名对应的不同文件的处理方法。
我们通过debugger nodejs require源码看到,原生的require函数支持四种类型文件:
js文件
json文件
node文件
mjs文件
由于篇幅,这里我们就只支持两个扩展名:.js 和.json。
我们分别在extensions对象上,添加两个属性,两个属性的值分别都是一个函数。方便不同文件类型分类处理。
// main.js Module.extensions['.js'] = function (module) {} Module.extensions['.json'] = function (module) {}
接着,我们导入nodejs原生的“path”模块和“fs”模块,方便我们获取文件绝对路径和文件操作。
我们处理一下 Module._resolveFilename 这个方法,让他可以正常工作。
Module._resolveFilename = function (id) { // 将相对路径转化成绝对路径 let absPath = path.resolve(id); // 先判断文件是否存在如果存在了就不要增加了 if(fs.existsSync(absPath)){ return absPath; } // 去尝试添加文件后缀 .js .json let extenisons = Object.keys(Module.extensions); for (let i = 0; i < extenisons.length; i++) { let ext = extenisons[i]; // 判断路径是否存在 let currentPath = absPath + ext; // 获取拼接后的路径 let exits = fs.existsSync(currentPath); // 判断是否存在 if(exits){ return currentPath } } throw new Error('文件不存在') }
在这里,我们支持接受一个名id的参数,这个参数将是用户传来的路径。
首先我们先使用 path.resolve()获取到文件绝对路径。接着用 fs.existsSync 判断文件是否存在。如果没有存在,我们就尝试添加文件后缀。
我们会去遍历现在支持的文件扩展对象,尝试拼接路径。如果拼接后文件存在,返回文件路径。不存在抛出异常。
这样我们在req方法内,就可以获取到完整的文件路径:
function req(id){ // 通过相对路径获取绝对路径 let filename = Module._resolveFilename(id); }
4. 加载模块 —— JS的实现
这里就是我们的重头戏,加载common.js模块。
首先 new 一个Module实例。传入一个文件路径,然后返回一个新的module实例。
接着定义一个 tryModuleLoad 函数,传入我们新建立的module实例。
function tryModuleLoad(module) { // 尝试加载模块 let ext = path.extname(module.id); Module.extensions[ext](module) }
function req(id){ // 通过相对路径获取绝对路径 let filename = Module._resolveFilename(id); let module = new Module(filename); // new 一个新模块 tryModuleLoad(module); }
tryModuleLoad 函数 获取到module后,会使用 path.extname 函数获取文件扩展名,接着按照不同扩展名交给不同的函数分别处理。
接下来,我们处理js文件加载.
第一步,传入一个module对象实例。
使用module对象中的id属性,获取文件绝对路径。拿到文件绝对路径后,使用fs模块读取文件内容。读取编码是utf8。
Module.extensions['.js'] = function (module) { // 1) 读取 let script = fs.readFileSync(module.id, 'utf8'); }
第二步,伪造一个自执行函数。
这里先新建一个wrapper 数组。数组的第0项是自执行函数开头,最后一项是结尾。
let wrapper = [ '(function (exports, require, module, __dirname, __filename) {\r\n', '\r\n})' ];
这个自执行函数需要传入5个参数:exports对象,require函数,module对象,dirname路径,fileame文件名。
我们将获取到的要加载文件的内容,和自执行函数模版拼接,组装成一个完整的可执行js文本:
Module.extensions['.js'] = function (module) { // 1) 读取 let script = fs.readFileSync(module.id, 'utf8'); // 2) 内容拼接 let content = wrapper[0] + script + wrapper[1]; }
第三步:创建沙箱执行环境
这里我们就要用到nodejs中的 “vm” 模块了。这个模块可以创建一个nodejs的虚拟机,提供一个独立的沙箱运行环境。
具体介绍可以看: vm模块的官方介绍
我们使用vm模块的 runInThisContext函数,他可以建立一个有全局global属性的沙盒。用法是传入一个js文本内容。我们将刚才拼接的文本内容传入,返回一个fn函数:
const vm = require('vm'); Module.extensions['.js'] = function (module) { // 1) 读取 let script = fs.readFileSync(module.id, 'utf8'); // 2) 内容拼接 let content = wrapper[0] + script + wrapper[1]; // 3)创建沙盒环境,返回js函数 let fn = vm.runInThisContext(content); }
第四步:执行沙箱环境,获得导出对象。
因为我们上面有需要文件目录路径,所以我们先获取一下目录路径。这里使用path模块的dirname 方法。
接着我们使用call方法,传入参数,立即执行。
call 方法的第一个参数是函数内部的this对象,其余参数都是函数所需要的参数。
Module.extensions['.js'] = function (module) { // 1) 读取 let script = fs.readFileSync(module.id, 'utf8'); // 2) 增加函数 还是一个字符串 let content = wrapper[0] + script + wrapper[1]; // 3) 让这个字符串函数执行 (node里api) let fn = vm.runInThisContext(content); // 这里就会返回一个js函数 let __dirname = path.dirname(module.id); // 让函数执行 fn.call(module.exports, module.exports, req, module, __dirname, module.id) }
这样,我们传入module对象,接着内部会将要导出的值挂在到module的export属性上。
第五步:返回导出值
由于我们的处理函数是非纯函数,所以直接返回module实例的export对象就ok。
function req(id){ // 通过相对路径获取绝对路径 let filename = Module._resolveFilename(id); tryModuleLoad(module); // module.exports = {} return module.exports; }
这样,我们就实现了一个简单的require函数。
let str = req('./a'); console.log(str); // a.js module.exports = "这是a.js文件"
5. 加载模块 —— JSON文件的实现
json文件的实现就比较简单了。使用fs读取json文件内容,然后用JSON.parse转为js对象就ok。
Module.extensions['.json'] = function (module) { let script = fs.readFileSync(module.id, 'utf8'); module.exports = JSON.parse(script) }
6. 优化
文章初,我们有写:commonjs会将我们要加载的模块缓存。等我们再次读取时,就去缓存中读取我们的模块,而不是再次调用fs和vm模块获得导出内容。
我们在Module对象上新建一个_cache属性。这个属性是一个对象,key是文件名,value是文件导出的内容缓存。
在我们加载模块时,首先先去_cache属性上找有没有缓存过。如果有,直接返回缓存内容。如果没有,尝试获取导出内容,并挂在到缓存对象上。
Module._cache = {} function req(id){ // 通过相对路径获取绝对路径 let filename = Module._resolveFilename(id); let cache = Module._cache[filename]; if(cache){ // 如果有缓存,直接将模块的结果返回 return cache.exports } let module = new Module(filename); // 创建了一个模块实例 Module._cache[filename] = module // 输入进缓存对象内 // 加载相关模块 (就是给这个模块的exports赋值) tryModuleLoad(module); // module.exports = {} return module.exports; }
完整实现
const path = require('path'); const fs = require('fs'); const vm = require('vm'); function Module(id) { this.id = id; // 当前模块的id名 this.exports = {}; // 默认是空对象 导出的结果 } Module.extensions = {}; // 如果文件是js 的话 后期用这个函数来处理 Module.extensions['.js'] = function (module) { // 1) 读取 let script = fs.readFileSync(module.id, 'utf8'); // 2) 增加函数 还是一个字符串 let content = wrapper[0] + script + wrapper[1]; // 3) 让这个字符串函数执行 (node里api) let fn = vm.runInThisContext(content); // 这里就会返回一个js函数 let __dirname = path.dirname(module.id); // 让函数执行 fn.call(module.exports, module.exports, req, module, __dirname, module.id) } // 如果文件是json Module.extensions['.json'] = function (module) { let script = fs.readFileSync(module.id, 'utf8'); module.exports = JSON.parse(script) } // 将一个相对路径 转化成绝对路径 Module._resolveFilename = function (id) { // 将相对路径转化成绝对路径 let absPath = path.resolve(id); // 先判断文件是否存在如果存在 if(fs.existsSync(absPath)){ return absPath; } // 去尝试添加文件后缀 .js .json let extenisons = Object.keys(Module.extensions); for (let i = 0; i < extenisons.length; i++) { let ext = extenisons[i]; // 判断路径是否存在 let currentPath = absPath + ext; // 获取拼接后的路径 let exits = fs.existsSync(currentPath); // 判断是否存在 if(exits){ return currentPath } } throw new Error('文件不存在') } let wrapper = [ '(function (exports, require, module, __dirname, __filename) {\r\n', '\r\n})' ]; // 模块独立 相互没关系 function tryModuleLoad(module) { // 尝试加载模块 let ext = path.extname(module.id); Module.extensions[ext](module) } Module._cache = {} function req(id){ // 通过相对路径获取绝对路径 let filename = Module._resolveFilename(id); let cache = Module._cache[filename]; if(cache){ // 如果有缓存直接将模块的结果返回 return cache.exports } let module = new Module(filename); // 创建了一个模块 Module._cache[filename] = module; // 加载相关模块 (就是给这个模块的exports赋值) tryModuleLoad(module); // module.exports = {} return module.exports; } let str = req('./a'); console.log(str);
结束总结
这样,我们就手写实现了一个精简版的CommonJS require函数。
让我们回顾一下,require的实现流程:
拿到要加载的文件绝对路径。没有后缀的尝试添加后缀
尝试从缓存中读取导出内容。如果缓存有,返回缓存内容。没有,下一步处理
新建一个模块实例,并输入进缓存对象
尝试加载模块
根据文件类型,分类处理
如果是js文件,读取到文件内容,拼接自执行函数文本,用vm模块创建沙箱实例加载函数文本,获得导出内容,返回内容
如果是json文件,读取到文件内容,用JSON.parse 函数转成js对象,返回内容
获取导出返回值。
挂个招聘
我们是码云Gitee私有化部门,正在招聘阿里p6级别的前端开发。要求:统招本科学历及以上,4年以上前端开发经验,25-35k。坐标北京西三旗,不打卡,不996。有意者请发送简历至:wangshengsong@oschina.cn