スキャナーで読み込むなどして、テキストが画像化されている画像PDFや画像データを変換するときの認識方法を設定します。テキストに対しては反映されません。
※設定した内容は、次回JUST PDF [データ変換]を起動したときにも有効になります。
■操作
- [ファイル-詳細モードにする]を選択して、詳細モードに切り替えます。
※[詳細モードにする]メニュー名の先頭にチェックマーク(レ)が付いている場合は、この操作は不要です。次に進んでください。
- [認識設定]をクリックします。
- 表示される[変換設定]ダイアログボックスで、必要な設定を行ないます。
- ファイルを変換します。
◎[画像補正]の設定
変換元のファイルの認識方法を調整します。
- ノイズを除去する
画像に含まれるノイズ(黒点状の汚れ)を自動的に除去して認識させる場合は、オンします。
- 回転を補正する
画像の向きを変更して認識させる場合は、オンにします。
- 白黒反転を補正する
画像を白黒反転させて認識させる場合は、オンにします。
- ゆがみを補正する
画像のゆがみや傾きを補正して認識させる場合は、オンにします。
- ファイル追加時のみ有効
追加した変換元のファイルのみに有効な変換方法を設定します。
- ごみを除去する
画像に含まれるごみを自動的に除去して認識させる場合は、オンにします。
- にじみを除去する
画像に含まれるにじみを自動的に除去して認識させる場合は、オンにします。
- コントラストを調整する
画像の最も暗い領域と最も明るい領域の差 (コントラスト)を調整する場合は、オンにします。
- ごみを除去する
◎[文字認識]の設定
変換元のファイルに含まれる画像化されたテキストの認識方法を設定します。
※初期設定ではすべてオンになっています。正しく認識して変換するため、通常はオンのままにしておきます。認識の速度を速くしたい場合に、変換元ファイルの内容上、影響がない項目をオフにします。
- 低解像度を考慮する
オンにすると、低解像度のためにかすれた文字やつぶれた文字など、通常は認識できない文字を、フォントデータベースのデータと比較して認識します。
- スペルチェック
オンにすると、スペルチェック用の辞書を参照し、文字の並びを解析して認識します。
- 斜体
オンにすると、イタリック体(斜体)の文字をより正しく認識します。
- 太字
オンにすると、下線が付いた文字をより正しく認識します。
- 下線
オンにすると、イタリック体(斜体)の文字をより正しく認識します。
※認識できるのは、下線が直線の場合だけです。
- 上付き文字
オンにすると、単位や記号などの上付きの文字をより正しく認識します。
- 下付き文字
オンにすると、単位や記号などの下付きの文字をより正しく認識します。
- PDF内のテキストを直接使用する
オンにすると、PDF内のテキストを直接認識します。