このQ&Aは役に立ちましたか?
【MFC-J6983CDW】PDFをOCRしたい
2024/03/14 02:27
■製品名を記入してください。
【MFC-J6983CDW】
■どのようなことでお困りでしょうか?
相談したいこと、トラブルに至った経緯、試したこと、エラーなどを教えてください。
【OCRされていないPDFファイルに対してMFC-J6983CDWの
OCR機能を利用してOCRできないでしょうか。
つまり、下記はできないでしょうか。
PDF(OCRなし) → iPrint&Scan → PDF(OCRあり)
紙を資料をスキャンする際にiPrint&Scanを使用して
OCR化しており、本ソフトのOCRの正確性が非常に
高く満足しています。
ただ、OCR化されていないPDFファイルがあり、
このPDFファイルをどうにかOCR化できないか検討
しています。いろいろフリーソフトなどでOCR化を
試してみたのですが、正確性がいまいちでした。
iPrint&Scan(またはControlCenter4)のOCR機能を
利用して、正確にOCR化されたPDFファイルを
生成できないでしょうか。
】
■お使いの環境について教えてください。
・パソコンもしくはスマートフォンのOSは何ですか?
(例)Windows10/8.1/7・MacOS・iOS・Android
【Windows10】
・どのように接続されていますか?
(例)有線LAN・無線LAN・USBケーブル・bluetooth
【有線LAN】
・関連するソフト・アプリがあれば教えてください。
【iPrint&Scan、ControlCenter4】
・電話回線の種類は何ですか?
(例)アナログ回線・ISND回線・ひかり回線・IP電話
【ひかり回線】
※OKWAVEより補足:「ブラザー製品」についての質問です。
質問者が選んだベストアンサー
https://support.brother.co.jp/j/b/producttop.aspx?c=jp&lang=ja&prod=mfcj6983cdw
こちらですね。
原稿の文字をテキストデータとしてスキャンする(OCR)
https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-3538B62F-E095-4172-82F7-6AF040E8B7A3_85
スキャンする時に同時にOCRをすることは出来ますが既にPDFファイルとして保存済みのものをOCRするような機能は無いです。
PDFをGoogleドライブで文字認識させる方法
https://blog.mc-copy.jp/pdf/pdf-character-recognition-google/
みたいなのを利用するとか…
このQ&Aは役に立ちましたか?
その他の回答 (4件中 1~4件目)
なるほど、誤解したあさってな回答失礼しました。
ブラザーさんのOCR技術はスキャン時のものなので
できないですね。
お礼
2024/03/15 12:38
ご回答ありがとうございました。
やはり、PDF→PDFのOCRはできなさそうですね。
ちなみにBrotherさんから提供されている
ソフトウェアで下記があります。
・Presto PageManager
・Nuance PaperPort
これらのソフトウェアではPDF→PDFで
OCRの機能がありました。ただ、結果が
正確な場合とそうでない場合の差が大きく、
利用を諦めました。
保存をクリックした後、
保存のダイアログボックスで
ファイル形式選択で
サーチャブルPDF マルチページ (*.pdf)
が選べるかと思うのですが。
https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-8BD3959D-9D42-48D7-A086-34631BA42A53_110
補足
2024/03/15 09:29
ご返信頂きありがとうございます。
ご指摘頂いた手順に辿り着くことが
できていません。。。
ご提示頂いたURLは「スキャン」機能の説明かと
思います。ただ、私の理解ではこの画面から
できることは下記の認識です。
1)【できる】紙 → PDF
2)【できない】PDF → PDF
今回私が行いたい作業は2)となります。
手元に紙があれば1)の方法でサーチャブル
PDFを生成できるのですが、今回のケースでは
紙が手元になく、電子データ(PDF)のみが
手元にある状態です。
なるほど、ブラザーさんのOCR機能が優れているんですね。
OCR化されたPDFが
サーチャブルpdfへの出力であるなら
ControlCenter4 Homeモードのスキャン設定
でできます。https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-7BA06984-74D2-47D5-B5E8-A790DF77647E_112
ーーーーーー
透明テキスト付きPDF(Searchable PDFと呼ばれることもあります)
https://www.antenna.co.jp/pdf/reference/whats-searchable-pdf.html
スキャンした画像だけのPDFにもかかわらず、文字を検索したり、コピーが可能な場合があります。こうしたPDFは透明テキスト付きと呼ばれ、紙文書の電子化に欠かせない仕組みのひとつと考えられています。
補足
2024/03/14 15:08
回答ありがとうございます。
下記の手順を具体的に教えて頂けないでしょうか。
>OCR化されたPDFが
>サーチャブルpdfへの出力であるなら
>ControlCenter4 Homeモードのスキャン設定
>でできます。
お礼
2024/03/14 15:12
回答ありがとうございます。
やはり、難しそうですか。。。
現状、下記を行うことで対応しています。
1) PDFをJPGに変換
2) tesseractでPNGをOCRしてPDFに変換
上記の対応により、PDFを開いてCTRL+Fから検索は
できるのですが、コピー&ペーストすると、余計な
スペースなどが多く含まれてしまいます。。。