一、需求说明
目前在通用文档系统中存在【文档比对】的功能,这里最好是支持word->word、pdf->pdf、word->pdf等形式的通用型比较。
二、首先说明下pdf
pdf文件比较特殊,它实际上文字的坐标映射,没有常规文本的段落、句子等含义。所以做【文档比对】的时候就很难有头绪了,这个我也在研究当中。
三、框架介绍
【文档比对】功能实际上是很难的,所以能找到的所有项目其实都是收费的,比如:
1、火眼审阅 2、千分尺 3、庖丁 4、mecheck 5、draftable
这其中draftable有两种方式调用,通过申请key进行API调用,但是只有30天期限【图2】。
图2
四、Demo演示
可运行demo正在部署中,下面给出结果示例。
图3
五、代码实现(付费)
正在处理中,代码挂载到CSDN进行付费下载。