Aspose.Words是目前最受欢迎的一款Word文档处理类控件,完全采用API实现类似Microsoft Words软件中的几乎所有功能,开发人员可以根据项目的具体需求来选择需要的功能集成到应用程序里,这篇文章主要介绍怎么利用这款产品对多页Word文档中的文本进行提取,如果要提取图片可以参考控件提供的其他帮助文档:
Document document = new Document(MyDir + "in.docx");
var collector = new LayoutCollector(document);
PageSplitterExample.DocumentPageSplitter splitter = new PageSplitterExample.DocumentPageSplitter(collector);
int pagecount = document.PageCount;
for (int i = 1; i <= pagecount; i++)
{
Aspose.Words.Document dstDoc = splitter.GetDocumentOfPage(i);
string pagetext = dstDoc.ToString(SaveFormat.Text);
}