一、导入相关的依赖包三、实现相应的工具类import org.apache.poi.hwpf.extractor.WordExtractor;import org.springframework.util.StringUtils;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStream;public class Wordutil { public static void main(String[] args) throws Exception { Wordutil wordutil=new Wordutil(); wordutil.testReadByExtractor("/xxxx/xxxx/xxxxxxxxxx.doc); } public void testReadByExtractor(String absolutePath) throws Exception { InputStream is = new FileInputStream(absolutePath); WordExtractor extractor = new WordExtractor(is); //获取各个段落的文本,这种适合简单的文本格式 String paraTexts[] = extractor.getParagraphText(); for (int i=0; i org.apache.poi poi-scratchpad3.17 org.apache.poi poi4.1.0 org.apache.poi poi-ooxml4.1.0 四、代码的实现import org.apache.poi.hwpf.HWPFDocument;import org.apache.poi.hwpf.usermodel.*;import org.apache.poi.poifs.filesystem.POIFSFileSystem;import org.apache.poi.xwpf.usermodel.XWPFDocument;import org.apache.poi.xwpf.usermodel.XWPFTable;import org.apache.poi.xwpf.usermodel.XWPFTableCell;import org.apache.poi.xwpf.usermodel.XWPFTableRow;import org.springframework.util.StringUtils;import java.io.FileInputStream;import java.util.Iterator;import java.util.List;/** * word文档中表格的读取,如果是用模板.ftl文件导出的word,无法进行相应的读取, * 需要将word文档另存为 */public class DocTableReadUtil {/** * 读取文档中表格 */public static String getWord(String filePath) { String wordContent = ""; String tmpWord = "";//报告录入人: 录入时间: try { FileInputStream in = new FileInputStream(filePath);//载入文档 // 处理docx格式 即office2007以后版本 if (filePath.toLowerCase().endsWith("docx")) { //word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后 XWPFDocument xwpf = new XWPFDocument(in);//得到word文档的信息 Iterator org.apache.poi poi-ooxml-schemas4.1.0 it = xwpf.getTablesIterator();//得到word中的表格 // 设置需要读取的表格 set是设置需要读取的第几个表格,total是文件中表格的总数 int set = 4; // 过滤前面不需要的表格 for (int i = 0; i < set - 1; i++) { it.hasNext(); it.next(); } while (it.hasNext()) { XWPFTable table = it.next(); List rows = table.getRows(); //读取每一行数据 String tableTxt = ""; for (int i = 0; i < rows.size(); i++) { XWPFTableRow row = rows.get(i); String rowTxt = " "; //读取每一列数据 List cells = row.getTableCells(); for (int j = 0; j < cells.size(); j++) { XWPFTableCell cell = cells.get(j); //输出当前的单元格的数据 //输出结果------------- } } } } else { // 处理doc格式 即office2003版本 POIFSFileSystem pfs = new POIFSFileSystem(in); HWPFDocument hwpf = new HWPFDocument(pfs); Range range = hwpf.getRange();//得到文档的读取范围 TableIterator it = new TableIterator(range); // 迭代文档中的表格 // 如果有多个表格只读取需要的一个 set是设置需要读取的第几个表格,total是文件中表格的总数 int set = 4; for (int i = 0; i < set - 1; i++) { it.hasNext(); it.next(); } while (it.hasNext()) { Table tb = it.next(); //迭代行,默认从0开始,可以依据需要设置i的值,改变起始行数,也可设置读取到那行,只需修改循环的判断条件即可 String table = ""; for (int i = 0; i < tb.numRows(); i++) { TableRow tr = tb.getRow(i); //迭代列,默认从0开始 String row = " "; for (int j = 0; j < tr.numCells(); j++) { TableCell td = tr.getCell(j);//取得单元格 //取得单元格的内容 for (int k = 0; k < td.numParagraphs(); k++) { Paragraph para = td.getParagraph(k); String s = para.text(); //输出结果------------- } } } } } } catch (Exception e) { //初始化时,处理是否将word转化为html的标签,存入数据库中,如果出现异常抛出 e.printStackTrace(); } return wordContent;}}
绿衫军完成签约,火箭迎来好消息,保罗被起诉,湖人三方交易受阻头条创作挑战赛北京时间9月13日,NBA休赛期正在进行,联盟仍然不平静。贝弗利认为,篮网应该留下欧文,因为他们找不到比欧文更好的球员。NBA记者Windhorst宣称,博格达诺维奇中国成为推动全球能源转型关键力量国际电工委员会近日提出,由中国牵头制定全球首个新型电力系统关键技术国际标准框架体系,加快建设新型电力系统,推动能源清洁低碳转型。一些专家认为,中国在新能源领域方面的迅猛发展,为其赢戴琪要让中国付出代价?美国对华新动作浮出水面,中方寸步不让戴琪要让中国付出代价?美国对华新动作浮出水面,中方寸步不让。随着美国通胀压力的不断升高,美国对华关税问题一直讨论不断,此前,美财长耶伦与美国商务部长雷蒙多就多次表示,取消对华关税将中国电信上半年省公司业绩排名出炉这几家公司排名很靠前运营商财经网讯近日,运营商财经网独家报道了中国电信近年上半年各省公司综合业绩排名情况,其中甘肃电信湖北电信河南电信山西电信在南北方各省公司中排名都很靠前。附主要文章独家甘肃电信今年北美观察丨美国8月CPI同比上涨8。3通胀忧虑引发美股暴跌当地时间9月13日,美国劳工部公布数据显示,今年8月美国消费者价格指数(CPI)同比上涨8。3,随后在通胀忧虑蔓延的情况下,当日美股市场出现暴跌,三大股指创下两年多来最大单日跌幅。中科院国家天文台我国首次实现太阳过渡区探测据中科院国家天文台网站9月14日消息,近期,中科院空间新技术试验卫星(SATech01)上搭载的46。5nm极紫外太阳成像仪(英文名SolarUpperTransitionRegi对话赋同量子尤立星核心技术必须掌握在我们自己手里过去两年是中国量子信息科技集中爆发的一年。2020年12月,中国科大宣布成功构建了76光子的量子计算原型机九章,并使我国成为世界上第二个实现量子计算优越性的国家。2021年,构建1说说那些我用上瘾的中端家电,没有品牌溢价,款款实在耐用前段时间跟朋友一起聊天,他的新屋刚住满了一年却吐槽连连,原因是他当时花了不少钱买了很多高端家电,咬咬牙买下来却用不起了。听完他的吐槽,坚信我自己当初入手的都是中端家电是没错的。为什日系车国内越来越不好卖了!国产自主品牌强势崛起随着国产自主品牌的发展,在国内乘用车市场,国产车的销量逐步攀升,市占率也随之走高。不过,伴随着国产车的强势崛起,合资品牌的市场份额被进一步挤压,韩系车已经被打趴,而今,日系车也开始羊了个羊太火爆!过关太难,服务器2天崩3次!官方急召技术人员自荐入职奖金五千!背后涉这家A股公司每经编辑杜宇9月14日,游戏羊了个羊话题再度登顶微博热搜。这是款啥游戏?据悉,这是一款卡通背景的消除闯关游戏。玩家们需要点击上方卡牌,被选中的卡牌会下移到底部的木框中,框内最多可以关键技术来了,2nm半导体工艺迎来新突破,英特尔要逆袭?在芯片制造领域,台积电凭借着超高的良品率,一举成为全球最大的芯片制造商,而三星和英特尔紧随其后,尤其是英特尔,一直都想重新回到半导体领导者地位。然而,现实并不允许英特尔臆想连篇,原椰林海鸥海风习习,这是我关于海南夏天最美好的记忆北方的海边通常是没有高大的椰子树相映衬的,只有漫长的海岸线平阔的沙滩或者是成片的隆起的礁石。而海南岛的海边却是另外一番景象,沙滩海鸥海浪,还有大片的椰林相伴。图源小版管家如若去到海法国作家点赞西藏发展新华社拉萨7月6日电(记者林建杨吕秋平唐霁)法国作家索尼娅布雷斯莱近日表示,西藏近年来的发展变化进步巨大,令人印象深刻,而只有这些发展才能确保满足西藏的民生所需,方便民众出行上学看世界旅游地图揽胜亚洲阿富汗通过世界旅游地图来看世界各国的著名的旅游景点,领略世界的大好河山。第二十二篇亚洲阿富汗阿富汗西亚内陆国家。位于伊朗高原东北部,与塔吉克斯坦土库曼斯坦中国巴基斯坦伊朗毗邻。面积64万海南航空计划新开并恢复多条暑运热门航线为助力师生旅客顺利返乡,满足公商务及旅游度假旅客的出行需求,海南航空计划新开并恢复多条暑运热门航线,并推出多样化的暑期优惠产品,为旅客打造优质便捷的出行选择。据悉,海南航空暑期计划越南下龙湾(六)前面这个山体形状很特别,像马鞍?像骆驼?总之,也应该有个称呼,我没听见广播里的介绍,想想都为这道风景叫屈它已经这么与众不同了,怎么就连属于自己的位置也没有呢!游船徐徐在靠近,岛屿像为什么你的餐后血糖总是高?现实生活中,很多糖尿病友自己觉得血糖控制良好,但随着病程的延长还是出现了各种糖尿病并发症。其中一个原因就是他们忽视了餐后血糖的控制。由于我们大部分时间都是处于餐后状态,因此对于大部鸡蛋也会过期吗?我们如何安全地吃鸡蛋鸡蛋是世界各地人们最受欢迎的,并且营养丰富且美味的家庭主食。尽管它们是许多人能负担得起的健康食物,但这个问题仍然存在你会安全地吃鸡蛋吗?如果你将鸡蛋放在外面几个星期,这个鸡蛋是否还颐起学空调虽好,可也要小心空调病!4招教你有效预防又到要靠空调续命的炎炎夏日了!待在空调房里虽然凉爽,但待的时间太久也是会出现一些问题的。比如鼻塞流鼻涕喉咙干痒关节酸痛以及头晕头痛食欲不振全身乏力等症状,也就是大家所说的空调病。其这三类食物更适合糖尿病患者夏季吃,看看你安排上了吗进入夏季,糖尿病患者多吃这三类食物,对身体健康有好处。1。富含维生素C的食物维生素C是人体必需的营养素,是众所周知的抗氧化剂,可保护细胞免受氧化应激的伤害。2型糖尿病患者的氧化应激这5种养胃的食物,其实并不靠谱,你知道是哪5种吗现在的生活节奏越来越快,很多人都有胃病,深受胃病困扰。当有胃病时,调节饮食非常重要。但是,在日常生活中,一些人们普遍认为可以养胃的食物其实并不是很靠谱。有哪些常见的养胃食物不是特别如何治疗冠心病?冠心病,是一种严重的心脏病。冠心病早期症状不明显,只是有点胸闷,会逐渐发展成胸痛,进而发展成心肌梗死,最严重的结果就是猝死。那么如何治疗冠心病呢?冠状动脉是一种血管,是向心脏供血的