面試官:說說對 Node 中的 Buffer 的理解?應用場景?
本文轉載自微信公眾號「JS每日一題」,作者灰灰。轉載本文請聯系JS每日一題公眾號。
一、是什么
在Node應用中,需要處理網絡協議、操作數據庫、處理圖片、接收上傳文件等,在網絡流和文件的操作中,要處理大量二進制數據,而Buffer就是在內存中開辟一片區域(初次初始化為8KB),用來存放二進制數據
在上述操作中都會存在數據流動,每個數據流動的過程中,都會有一個最小或最大數據量
如果數據到達的速度比進程消耗的速度快,那么少數早到達的數據會處于等待區等候被處理。反之,如果數據到達的速度比進程消耗的數據慢,那么早先到達的數據需要等待一定量的數據到達之后才能被處理
這里的等待區就指的緩沖區(Buffer),它是計算機中的一個小物理單位,通常位于計算機的 RAM 中
簡單來講,Nodejs不能控制數據傳輸的速度和到達時間,只能決定何時發送數據,如果還沒到發送時間,則將數據放在Buffer中,即在RAM中,直至將它們發送完畢
上面講到了Buffer是用來存儲二進制數據,其的形式可以理解成一個數組,數組中的每一項,都可以保存8位二進制:00000000,也就是一個字節
例如:
- const buffer = Buffer.from("why")
其存儲過程如下圖所示:
二、使用方法
Buffer 類在全局作用域中,無須require導入
創建Buffer的方法有很多種,我們講講下面的兩種常見的形式:
- Buffer.from()
- Buffer.alloc()
Buffer.from()
- const b1 = Buffer.from('10');
- const b2 = Buffer.from('10', 'utf8');
- const b3 = Buffer.from([10]);
- const b4 = Buffer.from(b3);
- console.log(b1, b2, b3, b4); // <Buffer 31 30> <Buffer 31 30> <Buffer 0a> <Buffer 0a>
Buffer.alloc()
- const bAlloc1 = Buffer.alloc(10); // 創建一個大小為 10 個字節的緩沖區
- const bAlloc2 = Buffer.alloc(10, 1); // 建一個長度為 10 的 Buffer,其中全部填充了值為 `1` 的字節
- console.log(bAlloc1); // <Buffer 00 00 00 00 00 00 00 00 00 00>
- console.log(bAlloc2); // <Buffer 01 01 01 01 01 01 01 01 01 01>
在上面創建buffer后,則能夠toString的形式進行交互,默認情況下采取utf8字符編碼形式,如下
- const buffer = Buffer.from("你好");
- console.log(buffer);
- // <Buffer e4 bd a0 e5 a5 bd>
- const str = buffer.toString();
- console.log(str);
- // 你好
如果編碼與解碼不是相同的格式則會出現亂碼的情況,如下:
- const buffer = Buffer.from("你好","utf-8 ");
- console.log(buffer);
- // <Buffer e4 bd a0 e5 a5 bd>
- const str = buffer.toString("ascii");
- console.log(str);
- // d= e%=
當設定的范圍導致字符串被截斷的時候,也會存在亂碼情況,如下:
- const buf = Buffer.from('Node.js 技術棧', 'UTF-8');
- console.log(buf) // <Buffer 4e 6f 64 65 2e 6a 73 20 e6 8a 80 e6 9c af e6 a0 88>
- console.log(buf.length) // 17
- console.log(buf.toString('UTF-8', 0, 9)) // Node.js �
- console.log(buf.toString('UTF-8', 0, 11)) // Node.js 技
所支持的字符集有如下:
- ascii:僅支持 7 位 ASCII 數據,如果設置去掉高位的話,這種編碼是非常快的
- utf8:多字節編碼的 Unicode 字符,許多網頁和其他文檔格式都使用 UTF-8
- utf16le:2 或 4 個字節,小字節序編碼的 Unicode 字符,支持代理對(U+10000至 U+10FFFF)
- ucs2,utf16le 的別名
- base64:Base64 編碼
- latin:一種把 Buffer 編碼成一字節編碼的字符串的方式
- binary:latin1 的別名,
- hex:將每個字節編碼為兩個十六進制字符
三、應用場景
Buffer的應用場景常常與流的概念聯系在一起,例如有如下:
- I/O操作
- 加密解密
- zlib.js
I/O操作
通過流的形式,將一個文件的內容讀取到另外一個文件
- const fs = require('fs');
- const inputStream = fs.createReadStream('input.txt'); // 創建可讀流
- const outputStream = fs.createWriteStream('output.txt'); // 創建可寫流
- inputStream.pipe(outputStream); // 管道讀寫
加解密
在一些加解密算法中會遇到使用 Buffer,例如 crypto.createCipheriv 的第二個參數 key 為 string 或 Buffer 類型
zlib.js
zlib.js 為 Node.js 的核心庫之一,其利用了緩沖區(Buffer)的功能來操作二進制數據流,提供了壓縮或解壓功能
參考文獻
http://nodejs.cn/api/buffer.html
https://segmentfault.com/a/1190000019894714