猿问

使用Java读取docx文档

我有一个项目隐写术,可将docx文档隐藏到jpeg图像中。使用apache POI,我可以运行它并阅读docx文档,但只能读取字母。


即使其中有图片。


这是代码


FileInputStream in = null;

    try

    {

        in = new FileInputStream(directory);

        XWPFDocument datax = new XWPFDocument(in);

        XWPFWordExtractor extract = new XWPFWordExtractor(datax);

        String DataFinal = extract.getText();

        BufferedReader reader = new BufferedReader(new InputStreamReader(in));

        String line = null;

        this.isi_file = extract.getText();

    }

    catch (IOException x) {}

        System.out.println("isi :" + this.isi_file);

如何使用Java读取docx文档中的所有组件?请帮助我,谢谢您的帮助。


智慧大石
浏览 215回答 1
1回答

幕布斯6054654

请查看文档的XWPFDocument类。它包含一些有用的方法,例如:getAllPictures() 返回文档中所有图片的列表;getTables() 返回文档中所有表的列表。在您的代码段中存在line XWPFDocument datax = new XWPFDocument(in);。因此,在该行之后,您可以编写一些代码,例如:// process all pictures in documentfor (XWPFPictureData picture : datax.getAllPictures()) {    // get each picture as byte array    byte[] pictureData = picture.getData();    // process picture somehow    ...}
随时随地看视频慕课网APP

相关分类

Java
我要回答