在Java中。
我有2个PDF文件,我从第一个文件中提取标题,并从第二个文件中提取参考部分。
我想检查所有标题部分是否都在参考部分中。
我的问题是如何将所有标题部分作为一个变量,然后在所有参考部分中进行搜索。
这是代码的一部分:
PDFUtil pdfUtil = new PDFUtil();
String a = pdfUtil.getText("9.pdf");
String Title = a.substring(0,68);
System.out.println("The title part: "+Title);
String b = pdfUtil.getText("333.pdf");
String Refer = b.substring(b.indexOf("Reference")+0,b.length());
if ("Reference".equalsIgnoreCase("Reference")) {
System.out.println("The References part of the second file is: "+Refer);
System.out.println();
}
if (Title.contains(Refer)) {
System.out.println("Found ");
}
输出部分:标题部分:为广告服务量身定制的有效大数据收集第二个文件的“参考”部分是:[1] J. Han,H。Pei和Y. Yin。” 挖掘,没有候选者生成的频繁模式”,载于:Proc.Natl.Acad.Sci.USA。(所有参考部分)
我尝试了许多方法,但是即使确切的标题部分在参考部分中,输出也始终为false。
任何想法?
并且有(包含)搜索之外的另一种方法吗?
相关分类