変換元のファイルの内容は、文字認識(OCR)エンジンにより文字認識が実行され、テキスト・表・画像の領域に分割されます。変換元のファイルの状態によっては、領域が正しく認識されず、期待どおりに変換されません。
このような誤認識を防ぐため、領域の認識結果を確認し、必要に応じて、領域の属性や範囲を変更したり、対象とする文字の種類を指定したりできます。表領域に対しては、セルの区切りを変更して、より正しいレイアウトが再現されるよう調整できます。
※[変換設定]タブの[設定]で[認識結果を編集する]がオンの場合、変換を開始すると認識結果編集画面が自動的に表示されます。
※変換後のファイルが画像PDF・JPEG・BMPのいずれかの場合は、すべて画像として扱われるため、認識結果編集画面は表示されません。
認識結果編集画面では、認識された領域やその属性を次の方法で変更します。
I 領域や属性を変更する
【領域の属性を変更する】
画面左側の画像ビューで枠をクリックして選択し、[横書き文字]/[縦書き文字]/[表]/[画像]のうち、変更したい属性のボタンをクリックします。
【領域の範囲を変更する 】
領域の幅・高さを変更するには、画面左側の画像ビューで枠をクリックして選択し、枠線にポインターを合わせてポインターの形が に変わったらドラッグします。
領域の位置を変更するには、画像ビューで枠にポインターを合わせ、ポインターの形が に変わったらドラッグします。
※画面右側の[領域のプロパティ]の[領域の種類]で、右端の▼をクリックして属性を選択するのも同じです。
【領域を解除して認識の対象から外す】
画面左側の画像ビューで枠をクリックして選択し、[領域の解除]をクリックします。
※すべての領域を解除したい場合は、[編集-すべて選択]ですべての枠を選択してから、[領域の解除]をクリックします。
【領域がない部分を認識の対象にする】
画面左側の画像ビューでドラッグして枠を作成し、[横書き文字]/[縦書き文字]/[表]/[画像]のうち、設定したい属性のボタンをクリックします。
【認識する文字の種類を指定する】
画面左側の画像ビューで枠をクリックして選択し、画面右側の[領域のプロパティ]の[対象文字種]で、その領域に含まれない文字の種類をオフにします。
【全角文字を半角文字にする】
画面左側の画像ビューで枠をクリックして選択し、画面右側の[領域のプロパティ]の[全角文字を半角文字に]で、その領域に含まれる文字のうち半角文字にする文字の種類をオンにします。
【テキストの改行のしかたを変更する】
画面左側の画像ビューで枠をクリックして選択し、画面右側の[領域のプロパティ]の[改行の挿入]で設定します。自動で改行を挿入する場合は[自動]、すべての行の末尾で改行する場合は[行ごと]、改行しない場合は[なし]を、それぞれ選択します。
【表領域のセルの区切りを変更する 】
画面左側の画像ビューで表領域の枠をクリックして選択し、[表の編集]をクリックして表示される[表の編集]ダイアログボックスで、セルの区切りを変更します。
[表の編集]ダイアログボックスでは、対象となる表領域の内容とセルの区切り(赤い線)が画像ビューに表示されます。セルの区切りは、表領域ごとに、次の方法で変更します。
- セル単位で区切りを追加・削除する場合は、[セル単位]をオンにします。
※初期設定ではオフになっており、行・列単位で区切りが追加・削除されます。
- 区切りを追加・削除します。
- 区切り線を追加する
[横罫線]または[縦罫線]をクリックしてから、区切り線を追加したい位置をクリックします。
※[自動]をクリックすると、追加する罫線が横罫線か縦罫線かが、ポインターの動きによって自動的に判断されます。
- 区切り線を削除する
[削除]をクリックしてから、削除したい区切り線をクリックします。
- 区切り線を追加する
- 区切り線の追加・削除が終わったら、[OK]をクリックして[表の編集]ダイアログボックスを閉じるか、[前の表]/[次の表]をクリックしてほかの表領域のセルの区切りを変更します。
【画像を回転する 】
画像の向きを変更する場合は、[回転]の絵の部分をクリックするか、右端の▼をクリックして回転角度を選択します。
※この機能は画像データを変換するときに有効です。また、テキストPDFを画像として処理する設定にしている場合は、テキストにも有効になります。
II 領域解析・文字認識をしなおす
【領域解析・文字認識をしなおす】
属性や領域の変更を行ったあと、[領域解析]/[文字認識]をクリックすると、再度ページ全体の領域解析や文字認識をしなおします。
III テキストを編集する
領域解析や文字認識を実行すると編集したテキストやスタイルが解除されます。テキストの編集やフォントスタイルの変更は、領域解析や文字認識のあとで行います。
【テキストを編集する】
画面中央のテキストビューで誤認識された文字を修正します。修正したい文字の右側にポインターを移動すると、認識候補の文字の一覧が表示され、クリックすると置換できます。直接編集することもできます。