Babylon-Proで洋書を読む
水曜日, 9月 10th, 2003以前、銀河ヒッチハイク・ガイドについて語った時、PDF版はテキストのコピーが不可になっていると書いた。テキストをコピーできないんじゃ電子辞書を引けないと思っていたのだが、いい手があることに気付いた。
それは、情報収集ソフト「Babylon-Pro」を使うというもの。Babylon-Proは、マウスクリックだけで(ドラッグで選択する必要もない)単語や熟語を翻訳できるソフトだ。以前は翻訳ソフトと銘打っていたが、データベースから情報を引っ張ってくる用途なら何にでも使えることから、情報収集ソフトというようになったらしい。
Babylon-Proのユニークな点は、単語を認識するのにOCR技術を使っていること。つまり、テキストデータではなく、画像データに書かれた単語でも読み取れる。テキストのコピーを許可していないPDFであっても、Babylon-Proなら翻訳できるわけだ。読み取るソースは、別にPDFでなくても画像なら何でもいい。Quicktionaryといい、イスラエルの技術ってすごい……(やはり軍事技術と関係があるのだろうか)。
原書をスキャナで読み込み、OCRソフトでテキスト化すれば電子辞書が使えて便利だろうなと思ったことがあるが、テキストデータ化の面倒くささに挫折(で、QuicktionaryIIの世話になる)。ところが、Babylon-Proなら、スキャンして画像データにするところまででいい(それでも面倒くさいのは間違いないけど)。
今度、洋書を読む時はこの方法を試してみるか(→試してみたが、認識率が実用的ではなかった……)。
(2004年6月10日追記)
文書内容のコピーを不許可にしたPDFを作り、Babylon-Proで単語を引こうとしたところ、「この文書は Acrobat Reader により保護されており、Babylonの読み取りができないようになっています。」
というメッセージが……。がっかり。