最近项目需要实现PDF下载的功能,由于没有这方面的经验,从网上花了很长时间才找到相关的资料。整理之后,发现有如下几个框架可以实现这个功能。
1. 开源框架支持
iText,生成PDF文档,还支持将XML、Html文件转化为PDF文件;
Apache PDFBox,生成、合并PDF文档;
docx4j,生成docx、pptx、xlsx文档,支持转换为PDF格式。
比较:
iText开源协议为AGPL,而其他两个框架协议均为Apache License v2.0。
使用PDFBox生成PDF就像画图似的,文字和图像根据页面坐标画上去的,需要根据字数手动换行。
docx4j用来生成docx文档,提供了将WORD文档转换为PDF文档的功能,并不能直接生成PDF文档。
2. 实现方案
— | 格式复杂 | 格式简单 |
---|---|---|
数据量大 | docx4j+freemarker | docx4j或PDFBox |
数据量小 | docx4j | PDFBox |
2.1 纯数据生成PDF
1.docx4j,适用于生成格式简单或格式复杂且数据量小的PDF文档;
2.Apache PDFBox,适用于生成格式简单且数据量小的PDF文档。
1.docx4j
docx4j是一个开源Java库,用于创建和操作Microsoft Open XML(Word docx,Powerpoint pptx和Excel xlsx)文件。它类似于Microsoft的OpenXML SDK,但适用于Java。docx4j使用JAXB来创建内存中的对象表示,程序员需要花时间了解JAXB和Open XML文件结构 。
// word对象WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();// 文档主体MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();// 换行符Br br = objectFactory.createBr();// 段落P p = objectFactory.createP();// 段落设置PPr ppr = objectFactory.createPPr();// 文字位置Jc jc = new Jc(); jc.setVal(je); ppr.setJc(jc);// 行设置RPr rpr = objectFactory.createRPr();// 字体设置RFonts rFonts = objectFactory.createRFonts(); rFonts.setAscii("Times New Roman"); rFonts.setEastAsia("宋体"); rpr.setRFonts(rFonts);// 行R r = objectFactory.createR();// 文本Text text = objectFactory.createText(); text.setValue("这是一段普通文本"); r.setRPr(rpr); r.getContent().add(br); r.getContent().add(text); p.getContent().add(r); p.setPPr(ppr);// 添加到正文中mainDocumentPart.addObject(p);// 导出//..
2.Apache PDFBox
Apache PDFBox是处理PDF文档的一个开源的Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。Apache PDFBox还包括几个命令行实用程序。
String formTemplate = "/Users/xiaoming/Desktop/test_pdfbox.pdf";// 定义文档对象PDDocument document = new PDDocument();// 定义一页,大小A4PDPage page = new PDPage(PDRectangle.A4); document.addPage(page);// 获取字体PDType0Font font = PDType0Font.load(document, new File("/Users/xiaoming/work/tmp/simsun.ttf"));// 定义页面内容流PDPageContentStream stream = new PDPageContentStream(document, page);// 设置字体及文字大小stream.setFont(font, 12);// 设置画笔颜色stream.setNonStrokingColor(Color.BLACK);// 添加矩形stream.addRect(29, 797, 100, 14);// 填充矩形stream.fill(); stream.setNonStrokingColor(Color.BLACK);// 文本填充开始stream.beginText();// 设置行距stream.setLeading(18f);// 设置文字位置stream.newLineAtOffset(30, 800);// 填充文字stream.showText("呵呵");// 换行stream.newLine(); stream.showText("哈哈"); stream.newLine(); stream.showText("嘻嘻");// 文本填充结束stream.endText();// 关闭流stream.close();// 保存document.save(formTemplate);// 释放资源document.close();
2.2 模版+数据生成PDF
FreeMarker+docx4j,适用于生成格式复杂且数据量大的PDF文档
Apache FreeMarker是一个模板引擎,用于根据模板和更改数据生成文本输出(HTML网页,电子邮件,配置文件,源代码等)。模板是用FreeMarker模板语言(FTL)编写的,是一种简单的专用语言。
Office2003以上,Word是可以以XML文本格式存储的。先将要生成的PDF转换为Word文档 ,再将其保存为XML文本,通过模版引擎将数据填充到XML文本中,最后再反向转换为PDF文档。简单来说就是PDF->Word->XML->Word->PDF的流程。
步骤 | 描述 | 工具 |
---|---|---|
1 | word -> xml | 手动 |
2 | xml -> ftl | 手动,参考《XML格式Word文档常用标签介绍》 |
3 | ftl + obj = xml | freemarker |
4 | xml -> pdf | docx4j |
作者:飞虎兄
链接:https://www.jianshu.com/p/b89f6ea30585