このQ&Aは役に立ちましたか?
文字化けしてしまいます
2024/03/31 09:18
PDF→WORD で、文字化けしてしまうのですが、どうすればよいでしょうか?
※OKWAVEより補足:「ソースネクスト株式会社の製品・サービス」についての質問です。
回答 (7件中 1~5件目)
PDFファイルをExcelやWordファイルに変換すると文字化けする 【いきなりPDFシリーズ】
https://faq.sourcenext.com/app/answers/detail/a_id/5730/related/1
これが参考になりませんか?
あと、これはあまり関係がないかも知れないのですが参考に。
Windows 10の文字コード(システムロケール)をUTF-8に変更する方法
https://togeonet.co.jp/post-13850
このQ&Aは役に立ちましたか?
こういうことを書くとソースネクストの人に怒られそうですが、
「WORDでPDFを開いて」みたらいかがでしょう。
バージョンにもよると思いますが、WORD本体にPDFを読み込んで変換する機能があります。
https://support.microsoft.com/ja-jp/office/word-%E3%81%A7-pdf-%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E9%96%8B%E3%81%8F-1d1d2acc-afa0-46ef-891d-b76bcd83d9c8
https://xtech.nikkei.com/atcl/nxt/column/18/01256/032500003/
お礼
2024/03/31 18:14
バージョンにもよるのかもしれませんね。アドバイス、ありがとうございました。
>ほかのPDFはきれいに読み込めるのですが。
そうだとしたら、元のPDFの品質が悪いか、特殊なフォント(書体)か、ということはありませんか?
極端な例ですが、人の手書き文字は、人間は普通に読めても、コンピュータの文字認識では上手く読めません。
お礼
2024/03/31 14:26
そうなのですね。繊細なものですね。
PDFの品質という視点もあるのですね。
勉強になりました。
おそらくはOCR機能を使って変換しているものと考えられますが、もしOCR機能だとするなら、文字の認識率や認識方法等が大きく絡んできます。認識率や認識精度が高い専用のOCRソフトはかなり高額です。一般人が手を出せる価格帯の場合、精度が高いと言っても誤認識は結構出ます。そう言った場合当然ですが自動修正などの機能はなく、変換後に自分でコツコツと修正する必要が出てきます。文字化けという状況ではなく誤認識と理解してください。
ちなみに文字化けと一般的に言われるものとしては、メールやサイトの表示です。文字データが正しく読み込まれていなかったり、文字コードが適正になっていないと発生します。その場合はほとんどすべての文字が判読不可能な記号になります。
完全に文字化けしているのではなくて、一部の文字が正しく認識されていないということでしたら、「その程度のもの」として、あとは目と手で修正するしかありません。
そういうものです。
お礼
2024/03/31 13:04
一部の文字化けではなく、すべてが「誤認識」となってしまうので、困りました。ほかのPDFはきれいに読み込めるのですが。
お礼
2024/04/14 08:09
残念ながら、変換はうまくいきませんでしたが、ご協力に感謝いたします。
パソコンは孤独な作業ですが、インターネットを通じての連帯を実感させていただきました。今後ともよろしくお願いします。