スキャナーで読み込むなどして、テキストが画像化されている画像PDFや画像データを変換するときの認識方法を設定します。テキストに対しては反映されません。
※設定した内容は、次にJUST PDF 3 [データ変換]を起動したときにも有効になります。
■操作
- [認識設定]タブで各項目を設定します。
- ファイルを変換します。
◎[画像補正]の設定
変換元のファイルの認識方法を調整します。
- 画像のノイズを除去する
画像に含まれるノイズ(黒点状の汚れ)を自動的に除去して認識させる場合は、オンします。
- 画像の回転を補正する
画像の向きを変更して認識させる場合は、オンにして、回転する角度を選択します。
[自動判別]を選択した場合は、自動的に画像の向きを解析し、回転して認識します。
- 画像の傾きを調整する
画像の傾きを補正して認識させる場合は、オンにして、補正方法を選択します。
- 自動補正
自動的に画像の傾きを補正します。
- 傾き角度を指定
[傾き角度]の右側にある をクリックして、補正する角度を指定します。
- 自動補正
◎[文字認識処理]の設定
変換元のファイルに含まれる画像化されたテキストの認識方法を設定します。
※初期設定ではすべてオンになっています。正しく認識して変換するため、通常はオンのままにしておきます。認識の速度を速くしたい場合に、変換元ファイルの内容上、影響がない項目をオフにします。
- スペルチェック
オンにすると、スペルチェック用の辞書を参照し、文字の並びを解析して認識します。
- 曖昧な文字認識
オンにすると、かすれた文字やつぶれた文字など、通常は認識できない文字を、フォントデータベースと比較して認識します。
- 下線・取り消し線の文字認識
オンにすると、下線・取消線が付いた文字をより正しく認識します。
※認識できるのは、下線・取消線が直線の場合だけです。
- ノイズを考慮
オンにすると、ノイズ(黒点状の汚れ)がある場合でも、より正しく認識します。
- イタリック体の認識
オンにすると、イタリック体(斜体)の文字をより正しく認識します。
◎[処理設定]の設定
- テキストPDFを画像として処理する
- 透明テキストPDFの場合
オンにすると透明テキスト部分を認識させないで変換します。透明テキスト部分の文字変換と背景画像が重なって文字部分が二重となり、読めなくなる場合などに有効です。
- 通常テキストPDFの場合
オンにするとテキストを画像化して変換します。認識結果が思わしくない場合などにも利用できます。
- 透明テキストPDFの場合