POIのWord
文書構造(HWPFDocument)
FileInputStream fio = new FileInputStream("FilePath");
HWPFDocument hd = new HWPFDocument(fio);
としてWordの文書オブジェクトを作る。
文章の取り出し
Range rg = hd.getRange();
Paragraph pg = rg.getParagraph(0);
このようにRangeクラスを利用して全体を取り出し、順番に(0は一番最初のインデックス)Paragraphなどを取り出す。
パラグラフ
String str = pg.text();
こうすることでテキストデータが取り出せる。
スタイルシート(テンプレート?)
StyleSheet ss = hd.getStyleSheet();
StyleDescription desc = ss.getStyleDescription(pg.getStyleIndex());
こうして、そのパラグラフに結びついているスタイルを取り出します。
結構利用できそう。書き出せないと意味もないけどある程度考えている
ことができる様子。