我们都知道 Node.js 采用的是单线程、基于事件驱动的异步 I/O 模型,其特性决定了它无法利用 CPU 多核的优势,也不善于完成一些非 I/O 类型的操作(比如执行脚本、AI 计算、图像处理等),为了解决此类问题,Node.js 提供了常规的多进(线程)方案(关于进程、线程的讨论,可参见笔者的另一篇文章 Node.js 与并发模型),本文便为大家介绍 Node.js 的多进(线)程机制。
带大家深入了解一下Node.js中的多进程和多线程
child_process
我们可使用 child_process 模块创建 Node.js 的子进程,来完成一些特殊的任务(比如执行脚本),该模块主要提供了 exec、execFile、fork、spwan 等方法,下面我们就简单介绍下这些方法的使用。
exec
const { exec } = require('child_process'); exec('ls -al', (error, stdout, stderr) => { console.log(stdout); });
该方法根据 options.shell 指定的可执行文件处理命令字符串,在命令的执行过程中缓存其输出,直到命令执行完成后,再将执行结果以回调函数参数的形式返回。
该方法的参数解释如下:
● command:将要执行的命令(比如 ls -al);
● options:参数设置(可不指定),相关属性如下:
○ cwd:子进程的当前工作目录,默认取 process.cwd() 的值;
○ env:环境变量设置(为键值对对象),默认取 process.env 的值;
○ encoding:字符编码,默认值为:utf8;
○ shell:处理命令字符串的可执行文件,Unix 上默认值为 /bin/sh,Windows 上默认值取 process.env.ComSpec 的值(如为空则为 cmd.exe);比如:
const { exec } = require('child_process'); exec("print('Hello World!')", { shell: 'python' }, (error, stdout, stderr) => { console.log(stdout); });
运行上面的例子将输出 Hello World!,这等同于子进程执行了 python -c "print('Hello World!')" 命令,因此在使用该属性时需要注意,所指定的可执行文件必须支持通过 -c 选项来执行相关语句。
注:碰巧 Node.js 也支持 -c 选项,但它等同于 --check 选项,只用来检测指定的脚本是否存在语法错误,并不会执行相关脚本。
○ signal:使用指定的 AbortSignal 终止子进程,该属性在 v14.17.0 以上可用,比如:
const { exec } = require('child_process'); const ac = new AbortController(); exec('ls -al', { signal: ac.signal }, (error, stdout, stderr) => {});
上例中,我们可通过调用 ac.abort() 来提前终止子进程。
○ timeout:子进程的超时时间(如果该属性的值大于 0,那么当子进程运行时间超过指定值时,将会给子进程发送属性 killSignal 指定的终止信号),单位毫米,默认值为 0;
○ maxBuffer:stdout 或 stderr 所允许的最大缓存(二进制),如果超出,子进程将会被杀死,并且将会截断任何输出,默认值为 1024 * 1024;
○ killSignal:子进程终止信号,默认值为 SIGTERM;
○ uid:执行子进程的 uid;
○ gid:执行子进程的 gid;
○ windowsHide:是否隐藏子进程的控制台窗口,常用于 Windows 系统,默认值为 false;
● callback:回调函数,包含 error、stdout、stderr 三个参数:
○ error:如果命令行执行成功,值为 null,否则值为 Error 的一个实例,其中 error.code 为子进程的退出的错误码,error.signal 为子进程终止的信号;
○ stdout 和 stderr:子进程的 stdout 和 stderr,按照 encoding 属性的值进行编码,如果 encoding 的值为 buffer,或者 stdout、stderr 的值是一个无法识别的字符串,将按照 buffer 进行编码。
execFile
const { execFile } = require('child_process'); execFile('ls', ['-al'], (error, stdout, stderr) => { console.log(stdout); });
该方法的功能类似于 exec,唯一的区别是 execFile 在默认情况下直接用指定的可执行文件(即参数 file 的值)处理命令,这使得其效率略高于 exec(如果查看 shell 的处理逻辑,笔者感觉这效率可忽略不计)。
该方法的参数解释如下:
● file:可执行文件的名字或路径;
● args:可执行文件的参数列表;
● options:参数设置(可不指定),相关属性如下:
○ shell:值为 false 时表示直接用指定的可执行文件(即参数 file 的值)处理命令,值为 true 或其它字符串时,作用等同于 exec 中的 shell,默认值为 false;
○ windowsVerbatimArguments:在 Windows 中是否对参数进行引号或转义处理,在 Unix 中将忽略该属性,默认值为 false;
○ 属性 cwd、env、encoding、timeout、maxBuffer、killSignal、uid、gid、windowsHide、signal 在上文中已介绍,此处不再重述。
● callback:回调函数,等同于 exec 中的 callback,此处不再阐述。
fork
const { fork } = require('child_process'); const echo = fork('./echo.js', { silent: true }); echo.stdout.on('data', (data) => { console.log(`stdout: ${data}`); }); echo.stderr.on('data', (data) => { console.error(`stderr: ${data}`); }); echo.on('close', (code) => { console.log(`child process exited with code ${code}`); });
该方法用于创建新的 Node.js 实例以执行指定的 Node.js 脚本,与父进程之间以 IPC 方式进行通信。
该方法的参数解释如下:
● modulePath:要运行的 Node.js 脚本路径;
● args:传递给 Node.js 脚本的参数列表;
● options:参数设置(可不指定),相关属性如:
○ detached:参见下文对 spwan 中 options.detached 的说明;
○ execPath:创建子进程的可执行文件;
○ execArgv:传递给可执行文件的字符串参数列表,默认取 process.execArgv 的值;
○ serialization:进程间消息的序列号类型,可用值为 json 和 advanced,默认值为 json;
○ slient: 如果为 true,子进程的 stdin、stdout 和 stderr 将通过管道传递给父进程,否则将继承父进程的 stdin、stdout 和 stderr;默认值为 false;
○ stdio:参见下文对 spwan 中 options.stdio 的说明。这里需要注意的是:
如果指定了该属性,将忽略 slient 的值;必须包含一个值为 ipc 的选项(比如 [0, 1, 2, 'ipc']),否则将抛出异常。
○ 属性 cwd、env、uid、gid、windowsVerbatimArguments、signal、timeout、killSignal 在上文中已介绍,此处不再重述。
spwan
const { spawn } = require('child_process'); const ls = spawn('ls', ['-al']); ls.stdout.on('data', (data) => { console.log(`stdout: ${data}`); }); ls.stderr.on('data', (data) => { console.error(`stderr: ${data}`); }); ls.on('close', (code) => { console.log(`child process exited with code ${code}`); });
该方法为 child_process 模块的基础方法,exec、execFile、fork 最终都会调用 spawn 来创建子进程。
该方法的参数解释如下:
● command:可执行文件的名字或路径;
● args:传递给可执行文件的参数列表;
● options:参数设置(可不指定),相关属性如下:
○ argv0:发送给子进程 argv[0] 的值,默认取参数 command 的值;
○ detached:是否允许子进程可以独立于父进程运行(即父进程退出后,子进程可以继续运行),默认值为 false,其值为 true 时,各平台的效果如下所述:
在 Windows 系统中,父进程退出后,子进程可以继续运行,并且子进程拥有自己的控制台窗口(该特性一旦启动后,在运行过程中将无法更改);
在非 Windows 系统中,子进程将作为新进程会话组的组长,此刻不管子进程是否与父进程分离,子进程都可以在父进程退出后继续运行。
需要注意的是,如果子进程需要执行长时间的任务,并且想要父进程提前退出,需要同时满足以下几点:
● 调用子进程的 unref 方法从而将子进程从父进程的事件循环中剔除;
● detached 设置为 true;
● stdio 为 ignore。
比如下面的例子:
// hello.js const fs = require('fs'); let index = 0; function run() { setTimeout(() => { fs.writeFileSync('./hello', `index: ${index}`); if (index < 10) { index += 1; run(); } }, 1000); } run(); // main.js const { spawn } = require('child_process'); const child = spawn('node', ['./hello.js'], { detached: true, stdio: 'ignore' }); child.unref();
● stdio:子进程标准输入输出配置,默认值为 pipe,值为字符串或数组:
○ 值为字符串时,会将其转换为含有三个项的数组(比如 pipe 被转换为 ['pipe', 'pipe', 'pipe']),可用值为 pipe、overlapped、ignore、inherit;
○ 值为数组时,其中数组的前三项分别代表对 stdin、stdout 和 stderr 的配置,每一项的可用值为 pipe、overlapped、ignore、inherit、ipc、Stream 对象、正整数(在父进程打开的文件描述符)、null(如位于数组的前三项,等同于 pipe,否则等同于 ignore)、undefined(如位于数组的前三项,等同于 pipe,否则等同于 ignore)。
● 属性 cwd、env、uid、gid、serialization、shell(值为 boolean 或 string)、windowsVerbatimArguments、windowsHide、signal、timeout、killSignal 在上文中已介绍,此处不再重述。
以上就是关于Node.js中的多进程和多线程的全部知识分享,翼速应用平台内有更多相关资讯,欢迎查阅!
我来说两句