Java如何在不引入插件的前提下实现word文档的解析

毕设课题:关于word2013文件格式敏感词提取

慕斯709654
浏览 755回答 3
3回答

幕布斯6054654

word2013不知道,但是word2017其实是个zip压缩文件,可以解压,解压之后是一批XML文件,内容都可以读取。

jeck猫

其实就是解析xml, 至少你要适用几种jar包 包括 ,velocity ,Poi ,如果什么都不用 手写 估计工作量巨大,如果不让用POI 可以用很多其他的替代品 比如 doc4j 等等很多开源的都可以用,因为word里面 的样式 嵌套表格 换行 图片 等 单纯用手解析 几乎对一个人是不可能完成的任务,更不要提word里面的宏 等了
打开App,查看更多内容
随时随地看视频慕课网APP