binWord/blog

読んde!!ココVer.11で透明テキスト付きPDFを認識し直す

3月 27th, 2005

[`evernote` not found]

以前の記事で、エー・アイ・ソフトの「読んde!!ココ Ver.10」で作った透明テキスト付きPDFがAcrobat 7で見られないと書いた。
すでに透明テキスト付きPDFをけっこう作成していたので、非常に困る。そこで、新版である「読んde!!ココ Ver.11」の無料体験版をダウンロード。Acrobat 7で見られないPDFをまず読んde!!ココ Ver.11に読み込み（Ver.11ではPDFの直接読み込みに対応している）、改めて文字認識を行ってPDFとして保存する。こうして作り直した透明テキスト付きPDFは、Ver.10で作ったものよりサイズがなぜか大きくなったが（設定は同じにしたつもりなんだけど）、Acrobat 7でも問題なく見られた。まあ、一から紙文書をスキャニングし直すよりは楽だし、確かにVer.11の認識精度や使い勝手はVer.10よりもよくなっているようだ。
ただ、私はVer.11が発表される1ヶ月半ほど前にVer.10を購入しているから、ここでバージョンアップ料を払うのが何だか惜しくて……（いつも2月に新バージョンが出ていたから予測はしていたが）。また、Ver.10が発売されたのはAcrobat 7の発表前ではあるが、Acrobat 7での不具合が見つかった後もこの問題についてサポート情報ページではまったく触れていないのもちょっとどうかな。Ver.10ユーザーには何らかの救済措置を用意してもらいたいところ。

（追記）
認識に関して細かな指定が必要ないのであれば、OCRファクトリーを使って複数ファイルを一括処理することも可能。ただ、「保存方法」を「1原稿につき1ファイルで保存」にしていてもページ数分のPDFが作られてしまう。「1つのファイルにまとめて保存」にして、あとから原稿単位で切り出すようにすると多少手間が省けるだろう。

（2005年4月1日追記）
メーカーによれば、「1原稿につき1ファイルで保存」でもページ単位で保存されてしまうのはバグらしい。これに関しては、リビジョンアップ等で対応予定とのこと。

（2005年4月6日追記）
エー・アイ・ソフトから、読んde!!ココVer.10以前で作られたPDFを変換するためのコンバータが発表された。

This entry was posted on 日曜日, 3月 27th, 2005 at 19:04 and is filed under software. You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

3 Responses to “読んde!!ココVer.11で透明テキスト付きPDFを認識し直す”

yamane Says:
3月 30th, 2005 at 19:10
（追記）
認識に関して細かな指定が必要ないのであれば、OCRファクトリーを使って複数ファイルを一括処理することも可能。ただ、「保存方法」を「1原稿につき1ファイルで保存」にしていてもページ数分のPDFが作られてしまう。「1つのファイルにまとめて保存」にして、あとから原稿単位で切り出すようにすると多少手間が省けるだろう。

これって変ですね。
段落単位の設定をしても、結果は行単位になるみたいです。

それはともかく、私の印象では、エー・アイ・ソフトのサポートは昔から上等だと思っています。

なお、検証してみたところ、PDFファイル約１９０の内、問題ありは４０ほどでした。だいたい５分の１ですね。原因は分かっているのでしょうかね？
Tats_y Says:
4月 1st, 2005 at 13:44
メーカーに尋ねてみました。
「1原稿につき1ファイルで保存」でもページ単位で保存されてしまう件は、リビジョンアップで対応とのことです。

「改行の挿入単位」を「段落」に設定しても「行」単位になるということに関してですが、
> 認識パラメータで、モードを「英語」にして
> 認識を行う場合。「改行の挿入単位」で
> 「段落」を選択しても「文」単位で改行が挿入
> されます。これは、仕様となっておりますので
> ご了承くださいますようお願いいたします。
とのことでした。
tomato Says:
10月 13th, 2005 at 08:35
はじめまして。
読んde!!ココでＰＤＦにしたものが部分的に白抜けして困っていました。全部やり直しかと青くなって検索したところ、こちらにたどり着き、コンバータをダウンロードして無事変換することができました。
ありがとうございました。

Tats_y: もちろん、かまいませんよ！ 1点、うちのMacBook Proのハードウェア的な問題、あるいは他のソフトウェアとのバッティングかもしれませんが、なぜか「ぺ」の入力がうまく...
大田: Karabiner Elements用NICOLA配列設定ファイルを完成していただきありがとうございます。「親指シフト表記付きUSBライトタッチキーボード」というキーボードを販売させていただいておりますライフラボ株式...
Tats_y: >dodosukeさんコメントの承認遅れてすみません。こういうマニアックな情報、ありがたいですね〜。お役に立てて、光栄です！
dodosuke: 初めまして。ここに記載されている情報を参考にして、研究社の英和活用大辞典の変換スクリプトを作ってみました。だいぶラフな作りですけれど。情報共有いただき、感謝です！...
Tats_y: >Borodinskiiさんああ、それはご苦労様でした！しかし、以前は問題なかったのに、不思議ですね。Appleの辞書変換ツールのアルゴリズムも時々変更されているのかもしれませんね。

kymblg: MacのExcelでセルの再編集のショートカット
Monoblogue of a security engineer: Movable TypeのDB移行
iOSの内蔵辞書にカスタム辞書を自由に追加: binWord/blog
iOSの内蔵辞書にカスタム辞書を自由に追加: binWord/blog
reliphone: このアプリがすごい No.003 Dictionary.appender

読んde!!ココVer.11で透明テキスト付きPDFを認識し直す

3 Responses to “読んde!!ココVer.11で透明テキスト付きPDFを認識し直す”

Leave a Reply

About

最近の投稿

最近のコメント

最近のトラックバック

カテゴリー

アーカイブ

これまでのアクセス数

広告