画像から文字を抜き出す(OCR処理)ことが目的だが
さらに縦書き日本語を横書き日本語への変換を同時に行って欲しい
無論、有料のソフトでなく無料で変換できることが条件で探してみた
Googleドライブのドキュメント部分にOCR機能が有ることが分かった
通常はWORD文書の保存、編集などにGoogleドキュメントを使うことが多い
この中に、文書ファイルの代わりに画像ファイルをアップロードすると
完全に自動で画像の中の文字をテキスト文書として抜き出してくれる
(1)まず画像をGoogleドキュメントにアップロードする
・アップロード設定を忘れずに行うこと
アップロードの際に以下のような確認メッセージが表示されるので必ずチエックを入れる
「PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する」
・画像ファイルの大きさは2M(メガ)を超えないこと
超えるとエラーになってアップロードできない
PDFファイルが2Mを超えている場合には下記の様なサービスを使ってファイルを分割する
http://foxyutils.com/blog/archive/
(2)Googleドキュメント内で画像ファイルを開く
・PDFの場合だと、元のPDFページの次に変換後の文字テキストページが表示される
変換結果を比較検証しやすいようになっているのが特徴である
コピーや貼り付けの作業が不要なのも特徴である
コメントを残す