PDFソフトの下手くそショッピングの記録である。 私の場合、用途はかなり限定されていて、 スキャンしたPDFに目次をしおりとして入れること、 また必要があればOCRを行うことである。
以下、色々なソフトが出て来るが、導入したタイミングがバラバラなので、 比較しているつもりはない。遍歴をつづっているだけである。
私は ScanSnap というスキャナーを使っている (購入は何台目だろうか、 満足している)。
ScanSnap には、 ABBY FineReader for ScanSnap というOCRソフトがおまけふうについている。
(ずっと以前は、ScanSnap には Adobe Acrobat が付属していて、 私は満足していたのだが、 今では Adobe は殿様商売状態で、 PFU も ScanSnap に Acrobat を付属させることは出来なくなったのだろう。 自分で Adobe Acrobat を購入するということも検討したのだが、 購入手続きが面倒だったり、割高だったりで、他のものを色々試している、 という状況である。)
そう書くと、ScanSnap にOCR機能はついていないようであるが、実はOCRしてくれる (これに長いこと気づかず損をした)。 そのOCRの品質はまあまあで、 これで後述する PDFelement や UPDF で目次をつけてとりあえずスキャン完了、 というのが最近の私が採用している電子化手順である。 OCRの品質が “まあまあ” というのが微妙なところだが、 十分役に立っている。
以前はかなりひどい目にあっていた。
ずっと以前は必ず ABBY FineReader for ScanSnap を使っていた。 これは扱えるのが ScanSnap で作成したPDFのみ、という機能制限がある。 肝心の OCR 機能に不安定さを感じて最近は使っていない (他のソフトで編集した後、OCR 結果が壊れたことがあるというか、 しょっちゅう壊れる、もしかしてそういう仕様?)。 実は ABBY FineReader の正規版を購入してインストールしたこともあるのだが (その場合は ScanSnap 以外で作成した PDF も扱える。当たり前だけど。)、 いわゆるサブスクリプション形式で、 Mac版で1年あたり1万円程度かかる。毎年支払うのはちょっと辛いところ。 何より自分が苦労して入力したものを何度か壊された(と感じている)のがうらめしい。 私は敬遠モードになっている。
割と有名な Wondershare PDFelement というのを使っている (Version 9.5.7 -- ちょっと古くなったな)。 これは買い切りも可能である。 目次機能はまあ許せるレベル (日本語入力中に入力文字が表示されなくなるというバグがある)。 OCRするとファイルサイズがかなり増える。 そういう訳で大満足という訳ではないが、実用になっている。 OCRすると以前作ったしおりでジャンプできなくなるというバグ(仕様?)がある。 この辺、最新バージョンではどうなるのかな? 今見たらMac版が6000円位になっている。買ってみようかな。 (PDF関係でかなり散財しているけれど、仕事の質に影響するので、 ここはケチらないのが良いと考えている。)
最近 UPDFというのも使っている。 これは買い切り可能である。 (なんか分からないけれど、1万2000円から3000円の値引きになった。) 目次機能は良い感じだが、一度だけ編集中にフリーズして、 入力した結果が消えたことがある。 OCR機能はIntel Macでは使えない?これは痛い!そのうち対応とか書いてあるけど。 早く言ってよ。 ところで、このソフトは1つのライセンスで、 デスクトップ2つ、モバイル2つにインストールできるとか。 この説明の仕方、MacBook はデスクトップ扱いなのかな? 渡に船で、手近の Apple Silicon Mac にインストールしてみる (一台PDFソフトをインストールしていないものがあった)。 なるほど、OCR 機能のプラグインが追加インストールできる。 早速試す。 レイアウトというので、ページ画像下のテキストというのを選ぶべきなのかな。 縦書きの場合に1文字ごとに空白が入る。うわー(笑)。 (made in China らしいけれど、なんで縦書きOCRがイマイチなんだろう。) 横書きは一応大丈夫か。サイズがあまり増えない。 (縦書きの場合にサイズが増えたのは、もしかして空白のせい?) OCRしてもしおりは壊れない。 ABBY FineReader for ScanSnap で処理してOCR結果がバケバケになっていたPDFが、 気持ち良く仕上がった。満足。 このソフトはあちこち荒削りな感じがあるけれど (新参者みたいだ)、割と好印象を持った。
しばらくは、PDFelement と UPDF を併用してみる。 それにしても書籍の電子化は段々便利になったと感じる (3年くらい前は色々と不満を抱えていたけれど、少しずつ改善されて、 今はスイスイ電子化している)。
研究室Macには Adobe Acrobat でも入れてみるかな (研究室にいるときは忙しくて目次入力する暇はほとんどないので、 必要性は一段低いと思うけれど)。