本文へ移動
サポートシェアリングソリューション
OKWAVE Plus

このQ&Aは役に立ちましたか?

2人が「役に立った」と評価
ベストアンサー

EPSONのOCR認識率を上げる設定について

2019/03/05 17:16

EPSONスキャナーで出力したPDFファイルのOCR認識率を上げたいのですが、OCR認識率UPに関係すると思われるスキャニングソフトの設定として以下のパラメータがあると思っているのですが、他に関連しそうな設定等がありますでしょうか?
・イメージタイプ(自動、カラー、グレー、モノクロ)
・解像度(75~300、400、600、1200)
・圧縮レベル(標準圧縮、高圧縮)
・テキスト検索(対応、非対応)
よろしくお願い致します。

※OKWAVEより補足:「EPSON社製品」についての質問です。

質問者が選んだベストアンサー

ベストアンサー
2019/03/06 01:11
回答No.2

スキャナーの解像度を頑張ってもOCRソフト次第と考えます。

極論するとバンドルソフト「読んでここ」を使用している時点でこの質問にまっとうに答える気力が失せる類です。
バンドルソフト以外を使用しているならOCRソフトも開示しないとOCR認識率UPなんて…

大雑把な議論ならドキュメントスキャナを用意するとか非破壊型のドキュメントスキャナーが良いかなど自分のスキャナーの特性が不可欠だし。
スキャンする対象が横書き縦書きのどんなものかでも変わってくると思います。

スキャンする文書によっては無理やりテキスト化する必要がないものだったりしますしね。

つまりマンガなんて文字をテキスト化して抜き出しても時間の無駄。

個人的には自炊するにしてもスキャナーでとの発想しか浮かばない方々が不思議でなりません。
業務用のスキャナーで本を自動ページ捲りしながら1000ページを一気に処理できるならともかく、フラットベット型やA4までのドキュメントスキャンでOCR云々は20年前の発想と感じます。
数は出版業界全体から見れば限られているとは言え電子書籍も大分増えてきました。
所蔵の本の自炊も敢えてテキスト化する必要もなく解像度100もあれば十分文字として認識できるレベルです。

現行であればそういった作業は敢えて専用のスキャナーを用意するまでもなくスマホのカメラで容易にスキャンできますし、斜め補正などのアプリも用意されて手軽にスキャンが可能になりました。

企業の過去の書類の電子化でOCRが必要な案件がある場合にはオマケのバンドルOCRは使わずにそれなりの機能を持ったOCRソフトが必要でしょう。

参考例
較2019'【使用歴19年】OCRソフト15点の性能とおすすめ【日本語・外国語OCR】:資料・名刺・縦書き文書認識、英語日本語混在文書の精度
http://monomania.sblo.jp/article/55737163.html

検索でざっくり見つけた記事ですが内容的に問題ないと思います。

お礼

2019/03/06 08:37

素人同然の質問内容に、親切丁寧な回答ありがとうございます。
OCR認識精度に関しては、スキャニングソフトよりOCRソフトの選択が重要とのこと、良くわかりました。
ありがとうございました。
大変参考になりました。

質問者

このQ&Aは役に立ちましたか?

この質問は投稿から一年以上経過しています。
解決しない場合、新しい質問の投稿をおすすめします。

質問する

その他の回答 (2件中 1~2件目)

2019/03/05 22:04
回答No.1

PDF出力は、複数ページを一括で管理できるメリットがありますが、解像度を高めてもA4等、一定の大きさにしかなりません。
その点、JPEGなど画像ファイルであれば文字サイズも大きく出来るので、認識率は向上するかなと思います。
また、「EPSONスキャナーで出力した」とはいえ、文字認識は「読んdeココ」のようなOCRソフトだと思うのですが、OCRは文字通りソフトの力が大きく影響しますので、名のあるソフトに変えるというのも手ではないでしょうか。

お礼

2019/03/06 08:40

丁寧な回答ありがとうございます。
別の人の回答にもありましたが、スキャニングソフトよりOCRソフトの性能等に依存するようですので、OCRソフト側で確認するようにします。
ありがとうございました。

質問者

お礼をおくりました

さらに、この回答をベストアンサーに選びますか?

ベストアンサーを選ぶと質問が締切られます。
なおベストアンサーを選びなおすことはできません。