POIのWord

文書構造(HWPFDocument)

FileInputStream fio = new FileInputStream("FilePath");
HWPFDocument hd = new HWPFDocument(fio);

としてWordの文書オブジェクトを作る。

文章の取り出し

Range rg = hd.getRange();
Paragraph pg = rg.getParagraph(0);

このようにRangeクラスを利用して全体を取り出し、順番に(0は一番最初のインデックス)Paragraphなどを取り出す。

パラグラフ

String str = pg.text();

こうすることでテキストデータが取り出せる。

スタイルシート(テンプレート?)

StyleSheet ss = hd.getStyleSheet();
StyleDescription desc = ss.getStyleDescription(pg.getStyleIndex());

こうして、そのパラグラフに結びついているスタイルを取り出します。

結構利用できそう。書き出せないと意味もないけどある程度考えている
ことができる様子。