Node.js – 检索文件字符编码
计算机系统在位上工作。同样,计算机将文件读取为二进制表示,这就是我们需要将文本字符转换为二进制数据的原因。最流行的字符编码类型是:ASCII和Unicode。Unicode有另外两种类型:utf8和utf16。
语法
detectCharacterEncoding(filePath)
设置环境和执行:
StepI- 初始化节点项目。
npm init
步骤II- 安装所需的模块。
npm install detect-character-encoding
步骤III-传递需要编码的文本文件名。
示例1
创建一个文件“abc.txt”,内容如下:“Welcometonhooo.com”并将其保存在项目目录中。
创建一个名为“charEncoding.js”的文件并复制以下代码片段。创建文件后,使用命令“charEncoding.js”运行此代码。
//获取字符编码示例 // Importing the fs & characterEncoding module const fs = require('fs'); const detectCharacterEncoding = require('detect-character-encoding'); //传递文件名 const fileBuffer = fs.readFileSync('abc.txt'); const charsetMatch = detectCharacterEncoding(fileBuffer); console.log(charsetMatch);输出结果
C:\home\node>> node charEncoding.js { encoding: 'ISO-8859-1', confidence: 44 }
示例2
创建一个文件“sample.txt”,内容如下:“1234567890”并将其保存在项目目录中。
//获取字符编码示例 // Importing the fs & characterEncoding module const fs = require('fs'); const detectCharacterEncoding = require('detect-character-encoding'); //传递文件名 const fileBuffer = fs.readFileSync('sample.txt'); const charsetMatch = detectCharacterEncoding(fileBuffer); console.log(charsetMatch);输出结果
C:\home\node>> node charEncoding.js { encoding: 'UTF-8', confidence: 15 }