OCR はイメージからテキストを抽出するプロセスです。このイメージは、紙のドキュメントをスキャンしたり、電子イメージ ファイルまたは PDF ファイルを開いたりすることで得られます。イメージには編集可能なテキスト文字はありません。多くの小さなドット (ピクセル) が集まって文字形状を形成しています。これらはページ上でテキストの画像を表します。
文字イメージから...
... 編集可能なテキストへ