OpenXML标签搜索

我正在编写一个.NET应用程序,该应用程序应读取200页长附近的.docx文件(通过DocumentFormat.OpenXML 2.5),以查找该文档应包含的某些标记的所有出现。为了清楚起见,我不是在寻找OpenXML标记,而是应该由文档编写者在文档中设置为值的占位符的标记,我需要在第二阶段填充这些值。此类标签应采用以下格式:


 <!TAG!>

(其中TAG可以是任意字符序列)。正如我所说,我必须找到所有此类标签的出现,再加上(如果可能的话)将找到该标签出现的“页面”定位。我在网上发现了一些东西,但是不止一次,基本方法是将文件的所有内容转储为字符串,然后在这样的字符串中查找,而不管.docx编码如何。这可能导致误报或完全不匹配(而测试.docx文件包含多个标签),其他示例可能超出了我对OpenXML的了解。查找此类标签的正则表达式模式应为此类:


<!(.)*?!>

可以在整个文档中找到标签(在表,文本,段落中以及页眉和页脚中)。


我正在Visual Studio 2013 .NET 4.5中进行编码,但是如果需要的话我可以回来。PS我不希望使用Office Interop API的代码,因为目标平台将无法运行Office。


斯蒂芬大帝
浏览 602回答 3
3回答
打开App,查看更多内容
随时随地看视频慕课网APP