3回以上読んだ文庫本を紹介

3回以上読んで本棚に残した(売らなかった)上に、自炊して電子書籍化し、さらにもう1度電子データで読んだ文庫本を紹介します。

Clear Scanの落とし穴

ファイルサイズも減るし、文字もくっきり読みやすくなるし、Adobe のClear Scanはいいことばっかりだと思っていたけれど、私は落とし穴にみごとにはまりました。

自炊って何に一番時間がかかると思いますか?
スキャン時間ではありません。ファイルにOCRをかける時間です。
だから、スキャンしたPDFを10冊、20冊フォルダにためて、一気に夜中なんかにPC立ち上げっぱなしで、OCRをかけるわけです。

最初のうちは何事もなかったです。
でも、読んでいるうちに文字がちょっとずれているのが気になりだしました。例えば、以下のようなものです。

赤い枠で囲んだところがずれているでしょう。でも、読めないことはないので放置していました。オリジナルで確認すると、ずれてはいません。


つまり、OCRをかけたときにずれたということですね。
ですが、小説やエッセイを読んでいると、どうしてもこのずれはだめだーと思う瞬間がついに来てしまいました。それは、

です。ずれすぎだー。これはさすがにこうしたずれが度々出るようでは、気になって仕方がありません。

というわけで、今はOCRをかけていません。
もっとも、これはファイルを一気に処理すると出る問題なので、1ページずつOCRをかければ問題ありません。
実際、Webで検索すると、少量ずつOCRをかけて問題回避している方もいるようです。だけど、私は面倒くさすぎてそんなのやる気になれませんでした。