WordテキストHTML置換

【WordテキストHTML置換】

●機能
Word書式でかかれた文字をHTMLタグで囲んで、きれいなHTMLコンテンツをまとめて作成することができます 複数のWordファイルについて処理が可能です。


変換可能なHTMLタグ

名称タグ
太字<b>~</b>
斜体<i>~</i>
下線<u>~</u>
取消し線<s>~</s>
上付き文字x2<sup>~</sup>
下付き文字x2<sub>~</sub>
ルビ
<ruby>~</ruby>
見出し<h1>~</h1>
本文<p>~</p>
改行<br>


●使用イメージ
例えば、Wrod上で太字・斜体・ルビなどを付けて、書式をきれいに整えたデータがあります。以下、太宰治の「斜陽」の一節に書式を使ったデータを用意しました。

#イタリック体、ルビ、太字など書式を使っています

これをHTML形式にする場合、WordにもWEBページとして保存する機能があります。しかし標準機能では、フォントの大きさ・使っているフォント・行間など、不要な情報が多く含まれています。

左端を見ていただくと【段落】という文字が始まるのが、このファイルの874行目になってからで、本文にも不要な情報が複雑にたくさん含まれています

この状態でWEBページに掲載すると、WEBデザインに合わないページになってしまいます。

本ツールでは、文字があればその両端を判断してタグをつけるというシンプルな素のHTML作成を行います。こちらが本ツールで変換したHTMLです。最小限、必要な個所にだけタグが付くようになっています。

ルビは手動で打ち込むと誤字脱字やタグがちぐはぐになったり間違えやすいです。ルビまで変換できるのが本ツールの魅力的なところです

また、複数のWordファイルについて一括で変換することが可能です。きれいなHTMLコンテンツをまとめて作成することができます。

*対応する拡張子 :”docx,docm,doc”

FREE版PAID版
処理ファイル数2ファイル無制限
処理できるタグ太字,改行,ルビすべて
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordTextMultiTagging.zip : 78KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】docx,docm,doc
【動作環境】   Microsoft Excel,Wordが必要 ※Mac版は不可

Wordテキスト一括置換

【Wordテキスト一括置換】

●機能
複数のWordファイルについて、Wordの機能「検索と置換」を連続で行います。SHARE版ではワイルドカードによる正規表現も利用可能です。
*対応する拡張子 :”docx,docm,doc”

参考 ワイルドカードで使用する正規表現について
正規表現を使うことで複雑なテキスト処理が可能です。

正規表現説明
?任意の1文字を検索します
(例:あ?た → あきた, あなた, あくた…)
*任意の複数の文字を検索します
(例:す*か → すいか, すりらんか…)
[][]内の文字をすべて検索します
(例:[。、!?] → すべて検索.)
[-][0-9]  … 0から9までの数字を検索
[ぁ-ん] … ひらがな全て
[ァ-ヶ] … カタカナ全て
[亜-熙] … 漢字


■活用例1 htmlタグ(下線)をWord書式に変更する


本ツールと正規表現を使うことで、段階的な検索置換が可能です。
htmlタグ(下線)をWord書式に変更する場合、まず、「<u>*</u>」で、”u”に囲まれた文字に下線を引きます。
そして、先頭の<u>を削除し、末尾の</u>を削除することで、下線付き文字に置き換えることが可能です。

■活用例2 Wordから漢字だけを抽出する


[]または[-]を使うことで、複数の文字グループを検索することが可能です。掴んだ文字を一度、仮に「@」に置き換えます。そして最後にまとめて@を削除して、必要な文字だけを取り出すことが可能です。

FREE版PAID版
処理ファイル数2ファイル無制限
ワイルドカード機能
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordTextMultiReplace.zip : 80KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】docx,docm,doc
【動作環境】   Microsoft Excel,Wordが必要 ※Mac版は不可

Word内画像一括抽出

【Word内画像一括抽出】

●機能
Wordファイル内にある画像を別のフォルダに抽出します。
複数のWordファイルについて一括で処理を行う事が可能です。


*対応する拡張子 :”docx,docm”    ※docは抽出不可
*抽出する画像形式:”png, jpeg, gif, tif” ※FREE版は png, jpeg のみ
 ※ オートシェイプ等の図形は抽出不可

FREE版PAID版
処理ファイル数2ファイル無制限
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordPictureExport.zip : 61KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】docx,docm ※docは抽出不可
*抽出する画像形式:”png, jpeg, gif, tif” ※FREE版は png, jpeg のみ
 ※ オートシェイプ等の図形は抽出不可
【動作環境】   Microsoft Excelが必要 ※Mac版は不可

Wordファイル情報一括抽出

【Wordファイル情報一括抽出】

●機能
複数のWordファイルについて、Word内の情報をExcelリストに書き出します。複数のWordから情報を取り出すことで次のようなチェックが可能です。
・複数のWordデータの冒頭の文章を並べて一括で確認する
・複数のWordデータの誌面レイアウトを確認する ・プロパティ情報から個人情報が含まれていないか確認する


*対応する拡張子 :”docx,docm,doc”

FREE版PAID版
処理ファイル数3ファイル無制限
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordInfoExport.zip : 54KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】doxc, docm, doc
【動作環境】   Microsoft Excel, Wordが必要 ※Mac版は不可

【出力する情報】
 ファイル名   : Wordファイルのファイル名
 用紙(高さ)   : 用紙サイズの高さ(単位:mm)
 用紙(幅)    : 用紙サイズの幅(単位:mm)
 余白(上)    : 余白サイズの上(単位:mm)
 余白(下)    : 余白サイズの下(単位:mm)
 余白(左)    : 余白サイズの左(単位:mm)
 余白(右)    : 余白サイズの右(単位:mm)
 とじしろ    : 余白サイズのとじしろ(単位:mm)
 表示方法    : 表示方法(印刷表示,WEB表示など)
 表示倍率    : 表示倍率(単位:%)
 ページ数    : ページ数
 図(行内)の数  : 文章内の図をカウント
 図(行外)の数  : 文章外のフロート図をカウント
 表の数     : 表の数をカウント
 1段落目の内容 : 1段落目の本文の内容を転記
 2段落目の内容 : 2段落目の本文の内容を転記
 3段落目の内容 : 3段落目の本文の内容を転記
 プログラム名  : Wordのプロパティ情報です
 タイトル    : Wordのプロパティ情報です
 件名      : Wordのプロパティ情報です
 タグ      : Wordのプロパティ情報です
 コメント    : Wordのプロパティ情報です
 作成者     : Wordのプロパティ情報です
 前回保存者   : Wordのプロパティ情報です
 改訂番号    : Wordのプロパティ情報です
 会社      : Wordのプロパティ情報です
 マネージャー  : Wordのプロパティ情報です
 テンプレート  : Wordのプロパティ情報です
 サイズ     : Wordのプロパティ情報です
 作成日時    : Wordのプロパティ情報です
 更新日時    : Wordのプロパティ情報です

Wordファイル指定文字一括分割

【Wordファイル指定文字一括分割】

●機能
Word内のキーワードを掴んで、Wordファイルを分割します。
例えば「段落1、段落2、段落3」という文章構成のファイルについて、「段落」という文字を掴んで、3つのファイルに分割することができます。


複数のWordファイルについても一括で処理を行う事が可能です。
*対応する拡張子 :”docx,docm,doc”

FREE版PAID版
処理ファイル数2ファイル
3分割まで
無制限
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordContentsSplitter.zip : 106KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】doxc, docm, doc
【動作環境】   Microsoft Excel, Wordが必要 ※Mac版は不可

Wordページレイアウト一括設定

【Wordページレイアウト一括設定】

●機能
複数のWordファイルの、ページ設定を一括で統一します。
・Word内の用紙サイズ、余白、行間、文字サイズが自由に変えれる
・複数のWordファイルを同じレイアウトに整えられる


*対応する拡張子 :”docx,docm,doc”

FREE版PAID版
処理ファイル数2ファイル無制限
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordPageLayoutSet.zip : 84KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】doxc, docm, doc
【動作環境】   Microsoft Excel, Wordが必要 ※Mac版は不可

Word to PDF一括変換

【WordtoPDF一括変換】

●機能
複数のWordファイルを、PDFファイルに変換するツールです。

*対応する拡張子 :”doxc, docm, doc ”

FREE版paid版
処理ファイル数2ファイル無制限
シートの保護の解除
ソースコードの公開
実行ファイル(*1)

(WordtoPDF.zip : 44KB)

for sale

*1…ツールを起動しなくても1クリックで実行可能な実行ファイル(VBS)

【対応する拡張子】doxc, docm, doc
【動作環境】   Microsoft Excel, Wordが必要 ※Mac版は不可