Windows下安装及使用pdf2htmlEX
简介
pdf2htmlEX:将pdf转为html网页,目的是将pdf以web的形式发布到网络。
pdf2htmlEX利用现代Web技术以HTML格式呈现PDF文件,旨在提供准确的渲染,同时保持针对Web显示的优化。文本,字体和格式原生保留在HTML中,还支持数学公式,图形和图像。
作者为中国人wang-lu,主要针对学术论文优化、PDF预览等。
GitHub仓库地址(已关闭):
https://github.com/coolwanglu/pdf2htmlEX
GitHub仓库地址(活跃分支):
https://github.com/pdf2htmlEX/pdf2htmlEX
Windows安装及使用pdf2htmlEX
下载地址:
https://soft.rubypdf.com/software/pdf2htmlex-windows-version
下拉页面只Download部分,选择Windows版本下载即可:
下载后,主目录如下图示:
cmd窗口进入主目录,执行pdf转换html命令:
pdf2htmlEX [options] <input.pdf> [<output.html>]
例如:将geneve_1564.pdf转换成geneve_1564.html命令:
pdf2htmlEX.exe geneve_1564.pdf geneve_1564.html
如下图示:
转换成html后预览截图如下:
更多文档转换效果可从官方GitHub上查看:
https://github.com/coolwanglu/pdf2htmlEX
(完)
国人开发的,国外用疯了(https://cloudconvert.com/pdf-to-html用的就是pdf2htmIEX,收费高,已经转换了数以亿计的文章了),国内如此凄清。国内所谓学者,确实一个个都是蠢猪,还整天鼻子插根葱。