このFAQは、JUST PDF 6/5[データ変換]用です。
変換元のファイルの内容は、文字認識(OCR)エンジンにより文字認識が実行され、テキスト・表・画像の領域に分割されます。変換元のファイルの状態によっては、領域が正しく認識されず、期待どおりに変換されません。
このような誤認識を防ぐため、領域の認識結果を確認し、必要に応じて、領域の属性や範囲を変更したり、対象とする文字の種類を指定したりできます。表領域に対しては、セルの区切りを変更して、より正しいレイアウトが再現されるよう調整できます。
※認識結果編集画面の[表示設定]で、画像ビューとテキストビューの切り替えや、ビューの左右または上下分割ができます。
※変換後のファイルが画像PDF・JPEG・BMPのいずれかの場合は、すべて画像として扱われるため、認識結果編集画面は表示されません。
認識結果編集画面では、認識された領域やその属性を次の方法で変更します。
I 領域や属性を変更する
【領域の属性を変更する】
画面左側の画像ビューで枠をクリックして選択し、[領域]の /
/
のうち、変更したい属性のボタンをクリックします。
【領域の範囲を変更する 】
領域の幅・高さを変更するには、画面左側の画像ビューで枠をクリックして選択し、枠線にポインターを合わせてポインターの形が に変わったらドラッグします。
領域の位置を変更するには、画像ビューで枠にポインターを合わせ、ポインターの形が に変わったらドラッグします。
【領域を解除して認識の対象から外す】
画面左側の画像ビューで枠をクリックして選択し、[領域]の をクリックします。
※すべての領域を解除したい場合は、画面左側の画像ビューで枠をクリックして選択します。右クリックで表示されるメニューから[全選択]ですべての枠を選択して、 をクリックします。
【領域がない部分を認識の対象にする】
画面左側の画像ビューでドラッグして枠を作成し、[領域]の /
/
のうち、設定したい属性のボタンをクリックします。
【画像を回転する 】
画像の向きを変更する場合は、[表示]の の絵の部分をクリックするか、右端の▼をクリックして回転角度を選択します。
※この機能は画像データを変換するときに有効です。また、テキストPDFを画像として処理する設定にしている場合は、テキストにも有効になります。
【表領域のセルの区切りを変更する 】
画面左側の画像ビューで表領域の枠をクリックして選択し、[領域]で[表]を選択した後に をクリックして表示される[表の編集]ダイアログボックスで、セルの区切りを変更します。
[表の編集]ダイアログボックスでは、対象となる表領域の内容とセルの区切り(赤い線)が画像ビューに表示されます。セルの区切りは、表領域ごとに、次の方法で変更します。
- セル単位で区切りを追加・削除する場合は、[セル単位]をオンにします。
※初期設定ではオフになっており、行・列単位で区切りが追加・削除されます。
- 区切りを追加・削除します。
- 区切り線を追加する
または
をクリックしてから、区切り線を追加したい位置をクリックします。
- 区切り線を削除する
をクリックしてから、削除したい区切り線をクリックします。
- 区切り線を追加する
- 区切り線の追加・削除が終わったら、[編集終了]をクリックして[表の編集]ダイアログボックスを閉じます。
II 領域解析・文字認識をしなおす
属性や領域の変更を行ったあと、[表示]の /
をクリックすると、再度ページ全体の領域解析や文字認識をしなおします。
III テキストを編集する
ページの再解析や文字認識を実行すると編集したテキストやスタイルが解除されます。テキストの編集やフォントスタイルの変更は、ページの再解析や文字認識のあとで行います。
●こんなときは
- 画像や文字の認識方法を変更するには、[認識設定]をクリックして、[認識設定]ダイアログボックスを開きます。