node 版本 v10.9.0
npm 版本 v6.2.0
依赖包版本 "dependencies": { "fs": "0.0.1-security", "pdf2json": "^1.1.7" }
使用 pdf2json npm 包实现 PDF 转 JSON, 在 pdfParser_dataReady 回调函数中获取 json 数据
server.js
// pdf to json
let fs = require("fs"),
PDFParser = require("pdf2json");
let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => {
console.log(errData)
});
pdfParser.on("pdfParser_dataReady", pdfData => {
fs.writeFile("./json/1.json", JSON.stringify(pdfData), 'utf8', (err) => {
if (err) throw err;
console.log('The file has been saved!')
});
});
pdfParser.loadPDF("./pdf/1.PDF");
也可以使用此包实现 PDF 转 TXT,在 pdfParser_dataReady 回调函数中使用 pdfParser.getRawTextContent() 获取文本数据
server.js
let fs = require("fs"),
PDFParser = require("pdf2json");
let pdfParser = new PDFParser(this, 1);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
fs.writeFile("./txt/1.txt", pdfParser.getRawTextContent(), (err) => {
if (err) throw err;
console.log('The file has been saved!')
});
});
pdfParser.loadPDF("./pdf/1.PDF");