2021年4月13日星期二

Java 获取Word中的标题大纲(目录)

概述

Word中的标题可通过"样式"中的选项来快速设置(如图1),

图1

 

在添加目录时,可将"有效样式"设置为"目录级别"显示(如图2),一定程度上来说,标题大纲也可以作为目录来参考。

图2

本文,将通过后端Java程序代码介绍如何来获取Word中的标题内容。

注:如果在Word中进行了如图2中的设置,此方法也可以作为获取目录的方法;若没有对应设置,则想要通过此方法来获取的目录内容可能不完整。

 

本次测试的Word文档如下图所示,【标题样式】和【目录级别】经过相应设置,在获取标题大纲时等同于获取目录:

图3

代码测试环境

  • Word测试文档:.docx 2013版
  • 编译环境:IntelliJ IDEA 2018
  • Jdk版本:1.8.0
  • Word jar包:free spire.doc.jar 3.9.0

 

Java 程序代码

import com.spire.doc.*;import com.spire.doc.documents.Paragraph;import java.io.BufferedWriter;import java.io.File;import java.io.FileWriter;import java.io.IOException;public class GetTitle { public static void main(String[] args)throws IOException {  //加载Word测试文档  Document doc = new Document();  doc.loadFromFile("sample.docx");  //保存标题内容到.txt文档  File file = new File("GetTitle.txt");  if (file.exists())  {   file.delete();  }  file.createNewFile();  FileWriter fw = new FileWriter(file, true);  BufferedWriter bw = new BufferedWriter(fw);  //遍历section  for (int i = 0; i < doc.getSections().getCount(); i++)  {   Section section = doc.getSections().get(i);   //遍历Paragraph   for (int j = 0; j < section.getParagraphs().getCount(); j++)   {    Paragraph paragraph = section.getParagraphs().get(j);    //获取标题    if ( paragraph.getStyleName().matches("1"))//段落为"标题1"的内容    {     //获取段落标题内容     String text = paragraph.getText();     //写入文本到txt文档     bw.write("标题1: "+ text + "\r");    }    //获取标题    if ( paragraph.getStyleName().matches("2"))//段落为"标题2"的内容    {     //获取段落标题内容     String text = paragraph.getText();     //写入文本到txt文档     bw.write("标题2: " + text + "\r");    }    //获取标题    if ( paragraph.getStyleName().matches("3"))//段落为"标题3"的内容    {     //获取段落标题内容     String text = paragraph.getText();     //写入文本到txt文档     bw.write("标题3: " + text+"\r");    }    //获取标题    if ( paragraph.getStyleName().matches("4"))//段落为"标题4"的内容    {     //获取段落标题内容     String text = paragraph.getText();     //写入文本到txt文档     bw.write("标题4: " + text+"\r");    }    bw.write("\n");   }  }  bw.flush();  bw.close();  fw.close(); }}

标题(目录)获取结果:

 

本文完。

原创内容,如需转载,请注明出处!

 









原文转载:http://www.shaoqun.com/a/684737.html

跨境电商:https://www.ikjzd.com/

预售:https://www.ikjzd.com/w/889

c2c:https://www.ikjzd.com/w/1576


概述Word中的标题可通过"样式"中的选项来快速设置(如图1),图1在添加目录时,可将"有效样式"设置为"目录级别"显示(如图2),一定程度上来说,标题大纲也可以作为目录来参考。图2本文,将通过后端Java程序代码介绍如何来获取Word中的标题内容。注:如果在Word中进行了如图2中的设置,此方法也可以作为获取目录的方法;若没有对应设置,则想要通过此方法来获取的目录内容可能不完整。本次测试的Wor
环球市场:https://www.ikjzd.com/w/1762
cima:https://www.ikjzd.com/w/1372
custommade:https://www.ikjzd.com/w/2514
口述:多事婆婆请老公的前妻吃团圆饭:http://lady.shaoqun.com/m/a/9779.html
口述_大龄剩女_剩女相亲记:http://lady.shaoqun.com/m/a/66963.html
亚马逊欧洲站指南:https://www.kjyunke.com/courses/227

没有评论:

发表评论