在C#代码中提取PDF中的注释文本
2015-11-13 17:36
489 查看
//这里要引用using iTextSharp.text;using iTextSharp.text.pdf;
PdfReader myPdfReader = new PdfReader(@"C:\Users\Administrator\Desktop\加快QTP运行速度的建议.pdf"); int a = myPdfReader.NumberOfPages; PdfDictionary pageDict = myPdfReader.GetPageN(1); PdfArray annotArray = pageDict.GetAsArray(PdfName.ANNOTS); if (annotArray == null) return; for (int i = 0; i < annotArray.Size; ++i) { PdfDictionary curAnnot = annotArray.GetAsDict(i); string sSubType = curAnnot.Get(PdfName.SUBTYPE).ToString(); if (sSubType == "/FreeText") { PdfString pdfString = curAnnot.GetAsString(PdfName.CONTENTS); if (pdfString != null) { string value = pdfString.ToUnicodeString(); System.Windows.Forms.MessageBox.Show(value); } } //PdfDictionary annot = (PdfDictionary)PdfReader.GetPdfObject(annotArray[i]); //PdfString content = (PdfString)PdfReader.GetPdfObject(curAnnot.Get(PdfName.CONTENTS)); //if (content != null) //{ // System.Windows.Forms.MessageBox.Show(content.ToUnicodeString()); //} }
相关文章推荐
- C#语法糖,甜过初恋
- C#暴力屏蔽任务管理器
- (C#基础)创建文件,文件夹
- C#实现的三种模拟自动登录和提交POST信息的方法
- C# 发送邮件实例
- C#警惕匿名方法造成的变量共享实例分析
- C#实现向多线程传参的三种方式实例分析
- C# 开发Chrome内核浏览器(WebKit.net)
- C#基础概念 代码样例
- C#中foreach遍历学习笔记
- C# GET 和 SET作用
- C# linq
- AutoCAD.Net/C#.Net QQ群:193522571 VS2013与cad调试时的问题
- C#基于WebBrowser获取cookie的实现方法
- C#使用正则表达式实现首字母转大写的方法
- C#判断窗体是否存在重复打开
- C# 获取CPU信息
- C# 将数据生成excel并储存
- c#文件操作
- (C#基础)Linq学习理解