java文本比较解决方案
创始人
2024-12-26 09:39:42
0

参考资料

VBA计算页码和行号icon-default.png?t=N7T8https://learn.microsoft.com/zh-cn/office/vba/api/word.wdinformation


概述:

最近在做word文档对比的,总结了几种解决方案,记录一下

在java中,常用的文本对比方案有如下几种:

差异比较工具小部分修改合理性大片段修改合理性修改部分定位便捷性容错度
java-diff
beyondCompare
WPS
git

总结:

  • git/jgit 适用于整个段落的增删改,但是对段落内部的细节处理捕捉欠佳,如果一整段话仅仅修改了一个字,那么也会认为是段落的替换;
  •  WPS的比较 适用于细节字符的增删改,但是对大片段落的增删改捕捉欠佳, 如果是一段话替换成了另一段话,那么不会被识别为段落的替换,而是找到里面的相似部分,表现为内部某些字符的增删改;
  • 建议两种插件结合着使用,可以使用字符串相似度等插件,来做到取长补短的效果

具体介绍:

如果对比的word,可以使用VBA进行解析,见本人的VBA系列文章,这里就不做赘述。

1.java-diff

        java-diff-utils网上教程其实很多,这里是一个例子

2. beyondCompare

        beyondCompare是一款PC版的文件对比工具,或许可以尝试用VBA来进行调用,参考文章:

  • Jacob调用Windows桌面软件(Adobe系列,CAD,ABBYY FineReader 等)

3. WPS

        WPS有word对比功能,在Word软件中的审阅→比较选项

可以使用VBA来使用此功能,参照文档,

下面是一段jacob代码

package com.example.worddemo.test.jacob;  import com.example.worddemo.test.jacob.enums.FileMacroEnum; import com.example.worddemo.utils.IdUtil; import com.jacob.activeX.ActiveXComponent; import com.jacob.com.ComThread; import com.jacob.com.Dispatch; import com.jacob.com.Variant;  /**  * @program: word-demo  * @description: 文档对比  最简单方式的文档对比方式  * @author: wjl  * @create: 2024-03-26 14:36  **/ public class CompareDocuments {       // 这里需要根据当前环境安装的是 MicroSoft Office还是WPS来选择     // 如果安装的是WPS,则需要使用 KWPS.Application     // 如果安装的是微软的 Office,需要使用 Word.Application     private static final String MS_OFFICE_APPLICATION = "Word.Application";     private static final String WPS_OFFICE_APPLICATION = "KWPS.Application";      public static void main(String[] args) {         ComThread.InitSTA();  // 初始化 COM 线程         FileMacroEnum macroEnum = FileMacroEnum.WORD_2003_DOC;         String targetPath = "D:\\"+ IdUtil.upper()+macroEnum.getSuffix();         String sourceWordPath =  "D:\\3.doc";         String targetWordPath =  "D:\\3 - 1.doc";         try {             ActiveXComponent app = new ActiveXComponent( WPS_OFFICE_APPLICATION);             app.setProperty("Visible", new Variant(false));             Dispatch docs = app.getProperty("Documents").toDispatch();             Dispatch sourceDoc = Dispatch.invoke(docs, "Open", Dispatch.Method, new Object[] {sourceWordPath, new Variant(false), new Variant(true)} , new int[1]).toDispatch(); //打開word文檔             Dispatch targetDoc = Dispatch.invoke(docs, "Open", Dispatch.Method, new Object[] {targetWordPath, new Variant(false), new Variant(true)} , new int[1]).toDispatch(); //打開word文檔              // 然后进行比较  只填写必须的 其他的使用默认值             Dispatch compareDoc = app.invoke("CompareDocuments", new Variant(sourceDoc), new Variant(targetDoc)).toDispatch();             // 然后将 比较后的文档进行保存             Dispatch.call(compareDoc, "SaveAs", targetPath, macroEnum.getMacro());             Dispatch.call(compareDoc, "Close", false);             Dispatch.call(sourceDoc, "Close", false);             Dispatch.call(targetDoc, "Close", false);             app.invoke("Quit",0);         }catch (Exception e) {             e.printStackTrace();         }         finally {             ComThread.Release();  // 释放 COM 线程         }         System.out.println("转换后的文件路径为:"+targetPath);     } } 

4.git

java使用Git功能,可以使用Jgit插件,参照本人文档

5.总结

  • 如果两个文档只是细枝末节的差异,没有大段落的差异,使用WPS比较即可
  • 如果只有大段落的增删,建议使用Jgit
  • 如果两者都有,建议WPS和Jgit结合着使用

相关内容

热门资讯

围绕透视问题!九哥玩辅助软件安... 围绕透视问题!九哥玩辅助软件安装,多乐手游辅助(好像是有修改器)-哔哩哔哩1、操作简单,无需九哥玩辅...
透视透视!wpk刷入池率脚本,... 透视透视!wpk刷入池率脚本,wpk透视怎么安装,真是有辅助技巧(哔哩哔哩)1、不需要AI权限,帮助...
今天下午!赣牌圈破解器,pok... 今天下午!赣牌圈破解器,pokemmo脚本辅助器(透视)好像是有辅助工具(哔哩哔哩)运pokemmo...
值得注意的是"wep... 值得注意的是"wepoker看底牌"wepoker透视最简单三个步骤(原来是真的辅助工具)-哔哩哔哩...
目前!微信微乐小程序修改器,雀... 目前!微信微乐小程序修改器,雀友会广东潮汕辅助透视(一贯是有修改器)-哔哩哔哩1、玩家可以在雀友会广...
有挂透视!德州局hhpoker... 有挂透视!德州局hhpoker,hhpoker怎么防作比弊,一贯一直总是有辅助教程(哔哩哔哩)1、金...
据目击者称!九九山城万州版辅助... 据目击者称!九九山城万州版辅助,wepoker私局辅助(透视)本来是有辅助插件(哔哩哔哩)1、九九山...
透视数据"wepok... 您好,pokemmo手机脚本辅助器这款游戏可以开挂的,确实是有挂的,需要了解加去威信【4852750...
网友热议!微信小程序多功能修改... 网友热议!微信小程序多功能修改器,透视盒子(总是真的是有工具)-哔哩哔哩网友热议!微信小程序多功能修...
今天下午!天天微友辅助神器,来... 今天下午!天天微友辅助神器,来玩app破解版(透视)原来是有辅助软件(哔哩哔哩)1、金币登录送、破产...