本文へ移動
サポートシェアリングソリューション
OKWAVE Plus

このQ&Aは役に立ちましたか?

ベストアンサー

【MFC-J6983CDW】PDFをOCRしたい

2024/03/14 02:27

■製品名を記入してください。
【MFC-J6983CDW】

■どのようなことでお困りでしょうか?
 相談したいこと、トラブルに至った経緯、試したこと、エラーなどを教えてください。
【OCRされていないPDFファイルに対してMFC-J6983CDWの
 OCR機能を利用してOCRできないでしょうか。

 つまり、下記はできないでしょうか。
  PDF(OCRなし) → iPrint&Scan → PDF(OCRあり)

 紙を資料をスキャンする際にiPrint&Scanを使用して
 OCR化しており、本ソフトのOCRの正確性が非常に
 高く満足しています。

 ただ、OCR化されていないPDFファイルがあり、
 このPDFファイルをどうにかOCR化できないか検討
 しています。いろいろフリーソフトなどでOCR化を
 試してみたのですが、正確性がいまいちでした。

 iPrint&Scan(またはControlCenter4)のOCR機能を
 利用して、正確にOCR化されたPDFファイルを
 生成できないでしょうか。



■お使いの環境について教えてください。
・パソコンもしくはスマートフォンのOSは何ですか?
(例)Windows10/8.1/7・MacOS・iOS・Android
【Windows10】

・どのように接続されていますか?
(例)有線LAN・無線LAN・USBケーブル・bluetooth
【有線LAN】

・関連するソフト・アプリがあれば教えてください。
【iPrint&Scan、ControlCenter4】

・電話回線の種類は何ですか?
(例)アナログ回線・ISND回線・ひかり回線・IP電話
【ひかり回線】

※OKWAVEより補足:「ブラザー製品」についての質問です。

質問者が選んだベストアンサー

ベストアンサー
2024/03/14 04:45
回答No.1

https://support.brother.co.jp/j/b/producttop.aspx?c=jp&lang=ja&prod=mfcj6983cdw
こちらですね。

原稿の文字をテキストデータとしてスキャンする(OCR)
https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-3538B62F-E095-4172-82F7-6AF040E8B7A3_85
スキャンする時に同時にOCRをすることは出来ますが既にPDFファイルとして保存済みのものをOCRするような機能は無いです。

PDFをGoogleドライブで文字認識させる方法
https://blog.mc-copy.jp/pdf/pdf-character-recognition-google/
みたいなのを利用するとか…

お礼

2024/03/14 15:12

回答ありがとうございます。

やはり、難しそうですか。。。

現状、下記を行うことで対応しています。
1) PDFをJPGに変換
2) tesseractでPNGをOCRしてPDFに変換

上記の対応により、PDFを開いてCTRL+Fから検索は
できるのですが、コピー&ペーストすると、余計な
スペースなどが多く含まれてしまいます。。。

質問者

このQ&Aは役に立ちましたか?

その他の回答 (4件中 1~4件目)

2024/03/15 10:19
回答No.4

なるほど、誤解したあさってな回答失礼しました。
ブラザーさんのOCR技術はスキャン時のものなので
できないですね。

お礼

2024/03/15 12:38

ご回答ありがとうございました。
やはり、PDF→PDFのOCRはできなさそうですね。

ちなみにBrotherさんから提供されている
ソフトウェアで下記があります。
 ・Presto PageManager
 ・Nuance PaperPort

これらのソフトウェアではPDF→PDFで
OCRの機能がありました。ただ、結果が
正確な場合とそうでない場合の差が大きく、
利用を諦めました。

質問者
2024/03/14 15:34
回答No.3

保存をクリックした後、
保存のダイアログボックスで
 ファイル形式選択で
 サーチャブルPDF マルチページ (*.pdf)
が選べるかと思うのですが。
https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-8BD3959D-9D42-48D7-A086-34631BA42A53_110

補足

2024/03/15 09:29

ご返信頂きありがとうございます。

ご指摘頂いた手順に辿り着くことが
できていません。。。

ご提示頂いたURLは「スキャン」機能の説明かと
思います。ただ、私の理解ではこの画面から
できることは下記の認識です。
 1)【できる】紙 → PDF
 2)【できない】PDF → PDF

今回私が行いたい作業は2)となります。
手元に紙があれば1)の方法でサーチャブル
PDFを生成できるのですが、今回のケースでは
紙が手元になく、電子データ(PDF)のみが
手元にある状態です。

質問者
2024/03/14 08:32
回答No.2

なるほど、ブラザーさんのOCR機能が優れているんですね。
OCR化されたPDFが
サーチャブルpdfへの出力であるなら
ControlCenter4 Homeモードのスキャン設定
でできます。https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-7BA06984-74D2-47D5-B5E8-A790DF77647E_112

ーーーーーー
透明テキスト付きPDF(Searchable PDFと呼ばれることもあります)
https://www.antenna.co.jp/pdf/reference/whats-searchable-pdf.html
スキャンした画像だけのPDFにもかかわらず、文字を検索したり、コピーが可能な場合があります。こうしたPDFは透明テキスト付きと呼ばれ、紙文書の電子化に欠かせない仕組みのひとつと考えられています。

補足

2024/03/14 15:08

回答ありがとうございます。
下記の手順を具体的に教えて頂けないでしょうか。

>OCR化されたPDFが
>サーチャブルpdfへの出力であるなら
>ControlCenter4 Homeモードのスキャン設定
>でできます。

質問者

お礼をおくりました

さらに、この回答をベストアンサーに選びますか?

ベストアンサーを選ぶと質問が締切られます。
なおベストアンサーを選びなおすことはできません。