打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
POI3.8读取WORD(简洁实例)
目前最新版POI为3.8:
poi-3.8-20120326.jar
poi-examples-3.8-20120326.jar
poi-excelant-3.8-20120326.jar
poi-ooxml-3.8-20120326.jar
poi-ooxml-schemas-3.8-20120326.jar
poi-scratchpad-3.8-20120326.jar

Java代码
 
  1. import java.io.FileInputStream;  
  2. import java.io.FileOutputStream;  
  3. import java.io.IOException;  
  4. import java.io.InputStream;  
  5.   
  6. import javax.servlet.ServletException;  
  7. import javax.servlet.http.HttpServlet;  
  8. import javax.servlet.http.HttpServletRequest;  
  9. import javax.servlet.http.HttpServletResponse;  
  10.   
  11. import org.apache.poi.hwpf.HWPFDocument;  
  12. import org.apache.poi.hwpf.extractor.WordExtractor;  
  13. import org.apache.poi.hwpf.model.PicturesTable;  
  14. import org.apache.poi.hwpf.usermodel.CharacterRun;  
  15. import org.apache.poi.hwpf.usermodel.Picture;  
  16. import org.apache.poi.hwpf.usermodel.Range;  
  17.   
  18.   
  19.   
  20. public class WordDemo extends HttpServlet {  
  21.   
  22.     private static final long serialVersionUID = 1L;  
  23.   
  24.     public void doGet(HttpServletRequest request, HttpServletResponse response)  
  25.             throws ServletException, IOException {  
  26.         this.doPost(request, response);  
  27.     }  
  28.   
  29.     public void doPost(HttpServletRequest request, HttpServletResponse response)  
  30.             throws ServletException, IOException {  
  31.           
  32.         //从硬盘读取一个doc文档  
  33.         InputStream in = new FileInputStream("F:\\test.doc");  
  34.         //类从word文档中提取文本,非特殊情况下,都将使用getParagraphText()与getText()  
  35.         WordExtractor word = new WordExtractor(in);  
  36.           
  37.         //获取段文本  
  38.         String [] strArray = word.getParagraphText();  
  39.         String str = word.getText();    
  40.           
  41.         for(int i=0 ; i<strArray.length ; i++){  
  42.             System.out.println(strArray[i]+"\ti循环:"+i);  
  43.         }  
  44.         System.out.println(str +"\t --");  
  45.           
  46.         //这个构造函数从InputStream中加载Word文档。  
  47.         HWPFDocument doc = new HWPFDocument((InputStream)new FileInputStream("F:\\test.doc"));  
  48.           
  49.         //这个类为HWPF对象模型,对文档范围段操作  
  50.         Range range = doc.getRange(); //  
  51.           
  52.         //看看此文档有多少个段落  
  53.         int num = range.numParagraphs();  
  54.         System.out.println(num+"段");     
  55.           
  56.         //得到word数据流  
  57.         byte [] dataStream = doc.getDataStream();  
  58.         System.out.println("数据流长度:"+dataStream.length);  
  59.           
  60.         //用于在一段范围内获得段落数  
  61.         int numChar = range.numCharacterRuns();  
  62.         System.out.println("CharacterRuns 数:"+numChar);  
  63.            
  64.         //负责图像提取  和    确定一些文件某块是否包含嵌入的图像。  
  65.         PicturesTable table = new PicturesTable(doc, dataStream, null);  
  66.           
  67.         for(int j=0 ; j<numChar ; j++){  
  68.             //这个类表示一个文本运行,有着共同的属性。  
  69.             CharacterRun run = range.getCharacterRun(j);  
  70.             //是否存在图片  
  71.             boolean bool = table.hasPicture(run);  
  72.             System.out.println("是否存在图片:"+bool);  
  73.             if(bool){  
  74.                 //返回图片对象绑定到指定的CharacterRun  
  75.                 Picture pic = table.extractPicture(run, true);  
  76.                 //图片的内容字节写入到指定的输出流。  
  77.                 pic.writeImageContent(new FileOutputStream("F:\\"+j+".bmp"));  
  78.                 System.out.println("成功提取图片"+j+":");  
  79.             }  
  80.         }  
  81.         request.getRequestDispatcher("ok.jsp").forward(request, response);  
  82.     }  
  83.   
  84.   
  85. }  


可正常运行及提取图片
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Java使用poi读取word文档中的表格
Java 操作Word表格数据
POI抽取word文档图片并保存
java 实现word 转PDF (采用第三方技术 IText、Poi、Jsoup)
利用poi操作word文档
提取文本内容二:提取word格式文档内容
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服