画像内の文字をコピー&ペーストする3分LifeHacking

資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。

» 2007年10月30日 13時30分 公開
[斎藤健二,ITmedia]

 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。

 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。

 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを追加する機能が追加されている。

 リリース直前のバージョンを使い、編集部で試したところ、JPEG、PNG、BMPファイルはドラッグ&ドロップするだけで読み込み可能だった。GIFファイルは未対応だった。

 OCRの対応範囲はどうか。Internet Explorer 6の文字サイズ「中」の設定でキャプチャしたBiz.IDトップページを、PNGファイルとして読み込ませてみた。キャプチャした画像をそのままOCRにかけた結果が下記だ。

対応必至メタポリックシンドローム
社員が健康になることで、企業が負担すべき費用が減る” という時
代になってきた。企業も個人もメタポリックシンドロームヘの対策を真
剣に考えなくてはならない今、どんな対応が可能なのか。個人ででき
る対策、そして企業がサポートできることをさぐる。


 オリジナルサイズであれば、まず問題なくテキストに変換してくれる。次にXGAサイズからSVGAサイズ(800×600ピクセル)まで縮小してみた。

対応必至メタボリックシンドローム
社員が・健康にな5 ことで企菓が・負担すべき費用が一滴ざ・というl j§
μ;になl 、てきた。企栗t Jfl A もメタポリックジl . ・ドC】- & への71 1 rき再
糾こ考えりくてり1なぞ・ない今、どんな対応力’・町能なのか。l .人ででき
ド5 舛茉. そして企貰がりポートできることきさぐ≒5 .


 SVGAサイズになると、タイトル部分以外はかなり厳しい。さらにVGAサイズにまで縮小すると、ほぼ読み取ることはできなかった。

 アドビの「Acrobat Professional」にもOCR機能が搭載されているが、やはりSVGAやVGAは厳しい。クセロReader ZEROのOCR機能は優秀だ。

 ではデジカメで撮影した、発表会のスライド写真はどうか。こちらはSVGAレベルまで縮小したものを読み込ませてPDF化。OCRをかけてみた。あまりに大きなサイズの写真だとOCRがうまく動かないが、SVGAレベルであれば動作。完全ではないがテキストデータとして読み込むこともできた。

今回のレシピ
ツール 入手法
クセロReader ZERO http://xelo.jp/xelopdf/index.html

関連キーワード

PDF | OCR | キャプチャ


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ