要读取pdf文件,必须有pdfbox1.7.1.jar和fontbox1.7.1.jar,可以到官网下,也可以到我的资源里下,下面代码
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
public class Mytest {
public static String getText(String file) {
String s = "";
String pdffile = file;
PDDocument pdfdoc = null;
try {
pdfdoc = PDDocument.load(pdffile);
PDFTextStripper stripper = new PDFTextStripper();
s = stripper.getText(pdfdoc);
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (pdfdoc != null) {
pdfdoc.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
return s;
}
public static void toTextFile(String doc, String filename) throws Exception {
String pdffile = doc;
PDDocument pdfdoc = null;
PrintWriter pw = null;
try {
pdfdoc = PDDocument.load(pdffile);
PDFTextStripper stripper = new PDFTextStripper();
pw = new PrintWriter(new FileWriter(filename));
stripper.writeText(pdfdoc, pw);
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if(pw!=null){
pw.close();
}
if (pdfdoc != null) {
pdfdoc.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) {
try {
String sc = getText("在这里输入要转换的pdf文件路径");
System.out.print(sc);
toTextFile("在这里输入要转换的pdf文件路径",
"要保存的txt文件路径");
} catch (Exception e) {
e.printStackTrace();
}
}
}
分享到:
相关推荐
利用iText操作PDF文件非常的方便,包括PDF文件的读取,写入,其中中包含了支持中文字体iTextAsian.jar
一个java操作pdf文件的开发包,很好用的.
自己写的 spire.pdf 简单的demo ,有一些基础的使用方法,对刚接触的小伙伴...分割pdf ,包括按总页数,每页分割为一个 pdf文件,由于免费版原因,可以每9页生成一个pdf,或者根据 指定页数 (页) 根据指定页数 分割pdf
java代码,给pdf文件加水印,本例子水印内容使用Wingdings.ttf英文艺术字体,可自行更换成自己喜欢的字体。
itexpdf在文件上添加图片,也可动态添加图片,非常实用
很多应用程序要求动态生成 PDF 文档。这类应用程序包括银行生成用于电子邮件投递的客户报表,到...在本文中,将使用 iText Java 库生成 PDF 文档,并引导您完成一个示例应用程序,以使您能够更好地理解和使用 iText。
用简单的java代码实现了pdf的上传、下载、在线预览等基本操作. 可以在此代码上扩展或者直接拿来就可以使用.
1.功能:该API为适用于Java平台下,通过后端程序代码调用API接口操作PDF文档,可实现如下功能: 1.1 文档转换:PDF转图片/Word/SVG/XPS/HTML/XPS/TIFF、图片转PDF 1.2 文档操作:文档创建、合并、拆分、压缩、复制...
NULL 博文链接:https://jinjiajie.iteye.com/blog/999217
通过它JAVA开发人员可以读取EXCEL文件的内容,创建新的EXCEL文件,更新已经存在的EXCEL文件。
通过java填写pdf表单,压缩文件里面都要相关的jar包,源码也在里面
java输入输出流和文件操作.pdf
java的POI操作Excel文件.pdf
java操作pdf的jar包,很实用!生成pdf文件,很简单
Java操作word转PDF需要下载Jacob包.
java操作属性文件.pdf
在java中通过ImageMagick...在wiondows操作系统java开发环境中可通过ImageMagick安装包和im4java.jar把其他格式图片如pdf转换为PNG,JPEG等常用格式图片。操作其实比较简单。内附有操作步骤及图片转换文件大小的调整。
java 读取PDF JAR包 例子 按照里面的例子做,配合提供的JAR包,JAVA操作PDF很简单的说