昨年末の案件で使った方法をメモ。
PDFが文字情報を(画像としてではなく)含んでいる場合、
Adobe Readerで「ファイル」→「テキストとして保存」するとテキストファイルにできる。
良くも悪くも単純なテキストとして書き出されるため、
・日本語版での中国語の書き出しは失敗する(多言語でもあるかも)
・表がべた打ち文字列になる
これを一挙に解決する対症療法を思いついた。
0. PDFファイルと貼り付け先のWord文書を開いておく
1. PDF上の使いたい文字列を全て選択
2. Wordで「編集」→「形式を選択して貼り付け」→「Unicodeテキスト」を選ぶ
3. 貼り付けた結果をよく見る(笑)
A・表の各行が段落記号で区切られている
B・表の各列が半角スペースなどで区切られている
#この2点が目視できない場合、「ツール」→「オプション」→「表示」タブで
「編集記号の表示」をいじる
4. Word上で表にしたい文字列を全て選択し、「罫線」→「変換」→「文字列を表にする」
5. 「区切り記号」に上記3Bの区切り記号を指定する
6. Wordの表できあがり
ところどころ区切り記号の過不足がある場合は「元に戻す」で3.の段階に戻り、
半角スペースの挿入なり削除なりの調整をして4.に進む。
……文で説明するとややこしそうだが、やってみると便利。
自分で書いた表に一部ずつ貼り付けるより数倍お手軽なはず。
OX Word PDF変換はOX Microsoft WordドキュメントをPDFファイルに変換できる効率的アプリケーションです。Microsoft Wordをインストールせずにそれを使用することができます。OX Word PDFフリーは任意のWindows 2000、Windows x64、XPのアプリケーションからPDFファイルを作成します。OX Word PDF変換をアプリケーションとしてインストロールします。そしてOX PDF作成するにはdocファイルを追加することことが必要です。また暗号化や多種なカ スタムも自由的に設定できます。そのほか優れた機能を備えるにもかかわらず、とても簡単な操作なので、利用できないことは心配しないでください。
http://www.oxpdf.jp/word-to-pdf-converter.html