[译]你不知道的NodeJS

1,440 阅读7分钟

你不知道的NodeJS

更新:这篇文章现在是我的书《Node.js进阶》的一部分。 在jscomplete.com/node-beyond…中阅读此内容的更新版本以及有关Node.js的更多信息。

在今年的Forward.js会议(关于JavaScript的会议)上,我分享了题为“你不知道的NodeJS”的演讲。 在那次演讲中,我向观众提出了一系列有关Nodejs运行时的问题,大多数有技术背景的观众无法回答其中大多数问题。

我没有真正去统计这个数据但确实能在会议室里感觉到。演讲后一些有勇气的人走近我并且承认了这个事实。

这就是让我发表演讲的原因。 我认为我们没有以正确的方式教授Node.js! 关于Node.js的大多数学习内容都聚焦于Node包上,而不是它的运行时上。 大多数Node包将模块封装在自身的Node运行时中(例如http或stream)。 当你遇到问题时,这些问题可能是在自身运行时发生,并且如果你不了解Node运行时,就会遇到麻烦。

关于Node.js的大多数学习内容都聚焦于Node包上,而不是它的运行时上。

我为这篇文章精选一些问题和回答。列如下的标题中,可以尝试先闹中回答它们。(如果你在这里发现了错误或者有歧义的回答,请让我知道)

问题 #1: 什么是调用堆栈?它是V8的一部分吗?

调用肯定是V8的一部分。它是V8用于保存函数调用轨迹的一种数据结构。每次我们运行一个函数,V8都会将该函数的引用放入调用堆栈,并对该函数中嵌套的其他函数进行相同的操作。这也包括递归调用的函数。

当嵌套的函数运行结束,V8将一次弹出一个函数并用它的返回值替换它的位置。

为什么这对于Node很重要? 因为每个Node进程仅获得一个调用堆栈。 如果使该调用堆栈处于繁忙状态,则整个Node进程都处于繁忙状态。记住这一点。

问题 #2: 什么是事件轮询? 它是V8的一部分吗?

你认为下图中的事件轮询在哪里?

事件轮询由libuv模块提供,它不是V8的一部分。

事件轮询是处理外部事件并将它们转换回调函数运行的一种机制。这种轮询会循环的从事件队列中选择事件执行,并将它们的回调函数推入调用堆栈中。

如果这是你第一次听到事件循环,则这些定义不会有太大帮助。 事件循环只是更大架构下中的一部分:

你需要理解事件轮询背后更大的架构、V8所扮演的角色、Node.js的APIs以及知道这些事情是如何推入队列并被V8执行的。

Node.jsAPIs是像setTimeoutfs.readFile这样的函数。这些并不是JavaScript的一部分,而由Node.js提供的函数。

事件循环位于这张照片的中间(实际上是它的一个更复杂的版本),并且像一个组织者。 当V8调用堆栈为空时,事件循环可以决定下一步执行什么。

问题 #3: 当调用堆栈和事件轮询队列全部为空时,Node.js会做什么?

它简单的退出.

当你启动一个Node.js进程时,Node将自动启动事件轮询。当事件轮询处于空闲状态并且无其他事件去处理时,程序将退出。

To keep a Node process running, you need to place something somewhere in event queues. For example, when you start a timer or an HTTP server you are basically telling the event loop to keep running and checking on these events. 为了保持Node进程运行,你需要向事件队列中放入一些内容。比如,当你可以启动一个定时器或者一个 HTTP服务时,你就相当于告诉事件轮询保持运行,同时去监听一些事件。

问题 #4: 除了V8和Libuv,Node还具有其他哪些外部依赖项?

以下是一个Node进程所有可以使用的独立库:

  • http-parser
  • c-ares
  • OpenSSL
  • zlib 它们所有都独立于Node,它们都有拥有自己独立的源码以及证书。Node仅仅是使用它们。所以你需要记住这些,如果你想知道你的程序运行在什么地方。如果你正在处理数据压缩相关的事情,你可能会在zlib库底层堆栈遇到遇到麻烦,那么你将面对一个zilb相关的错误,而不是归责于Node。

问题 #5: Node能否不依赖于V8运行?

这可能是一个棘手的问题。 你确实需要一个VM来运行Node进程,但是V8并不是唯一可以使用的VM。 您可以使用Chakra

问题 #6: module.exportsexports有什么不同 ?

你可以一直使用module.exports去导出模块的API。除一种情况外,你也可以使用export:

module.exports.g = ...  // Ok

exports.g = ...         // Ok

module.exports = ...    // Ok

exports = ...           // Not Ok

为什么?

export仅仅是module.export的一个别名或引用。 更改导出时,你将更改该引用,而不再更改官方API(即module.exports)。 你只需要在模块作用域中获取局部变量即可。

问题 #7: 为什么顶级变量不是全局变量?

如果你在模块module1中定义了一个顶级变量g:

// module1.js

var g = 42;

同时你有一个模块module2引用了模块module1,并且尝试访问变量g,你将得到g is not defined.的错误。

为什么?

如果你在浏览器端做相同的事情,你可以在该定义该顶级变量脚本之后的所有脚本里访问该顶级变量。 每个Node文件在后台都有其自己的IIFE(函数调用表达式)。 在Node文件中声明的所有变量都作用于该IIFE。

相关问题: 下面这个仅仅含有一行代码的Node文件将会输出什么?

// script.js

console.log(arguments);

你将会看一些参数!

为什么?

因为Node执行的是一个函数。Node将你的代码包装到一个函数中。该函数中明确定义了上图中你所见的5个参数。

问题 #8: 这些对象:exportrequiremodule都是全局可用的,然而在它们在每个文件又有所不同,为什么?

当你需要使用require对象,你就是像一个全局变量那样直接使用它。然而,如果你在两个不同的文件中检查require,你将看到两个不同的对象。为什么? 因为 由于具有相同的IIFE魔法:

如你所见, “这IIFE魔法”向你的代码中传递以下五个参数: exports, require, module, __filename, 和 __dirname。当你在Node中使用这5个参数时,它们看起来像全局变量,但实际上它们仅仅是函数参数。

问题 #9: 什么是Node中的循环依赖?

如果你定义一个模块module1引用了模块module2,同时模块module2内部又引用了模块module1。将发生什么?报错?

// module1
require('./module2');

// module2
require('./module1');

你不会得到报错。因为Node允许那种情况。 所以模块module1引用模块module2,但是因为模块module2依赖模块module1且模块module1没有加载完成,模块module1将仅仅获取到模块module2的一个部分版本。程序将提示警告。

问题 #10: 什么时候适合使用文件系统的同步方法(如 readFileSync)?

Node模块fs中的每一个方法都有一个同步版本。为什么你会使用一个同步方法代替一个异步方法?

有时候,使用同步方法会更好。比如服务器仍在加载时,可以在任何初始化步骤中使用它。 通常情况下,初始化步骤之后执行的所有操作都取决于在那里获取的数据。 只要你使用同步方法是一次性的,就可以使用同步方法来避免引入回调狱。

但是,如果您在处理程序(例如HTTP服务器请求回调)中使用同步方法,那简直就是100%错误。 不要那样做。

我希望你能够回答以上部分或者全部的问题。

感谢阅读。