文字がテキストデータに変換されない場合、変換元のPDFファイルの文字が画像として格納されています。
スキャナで入力したデータなどで、文字が画像として格納されているPDFファイルから、文字をテキストデータとして変換する場合、変換元のデータが以下の条件を満たしている必要があります。
- モノクロ原稿(下地が白、文字色が黒)を300dpi以上の解像度で入力した鮮明な文字
- 文字サイズ7pt〜36ptの明朝・ゴシック系の活字
※文字修飾(斜体・太字・下線など)付きの文字、手書き文字、英数字、記号は除く。
※文字が画像化されたPDFの認識には「文字認識(OCR)エンジン」を使用しています。
文字認識(OCR)エンジンは、日本語と英語に対応しています。
◆補足
変換元のPDFファイルに画像とテキストデータ両方が格納されている場合、テキストデータはそのままテキストで変換し、それ以外を画像として変換します。スキャナで取り込んだPDFファイルでは、画像データと透明テキストデータが混在している場合があり、[テキストPDFを画像として処理]をクリックし にして透明テキストデータを画像にしてから変換します。