ビルトインの OCR

OCR はイメージからテキストを抽出するプロセスです。このイメージは、紙のドキュメントをスキャンしたり、電子イメージ ファイルまたは PDF ファイルを開いたりすることで得られます。イメージには編集可能なテキスト文字はありません。多くの小さなドット (ピクセル) が集まって文字形状を形成しています。これらはページ上でテキストの画像を表します。

 

文字イメージから...  

... 編集可能なテキストへ

ピクセル化した文字 S の画像

編集可能な文字 S の画像