画像から文字を起こすOCRツール
10年ぶりに公開された某日銀HPにある金融政策決定会合の議事録が,スキャナーで取り込んだ画像をPDFファイルにしているだけなのでとても不評のようですが,SmartOCR Lite Editionというフリーソフトの文字変換能力がとても優秀なのでご紹介します。
ダウンロードはここです。(開発元の会社はなくなってしまったので,たぶん有志の方が保存してくださっているものです。当然ながら製品の保証とサポートはありません。)
■ まず,SmartOCRのダウンロードのリンクをクリックしてバージョン1.07をダウンロードします。(直接ダウンロードページに飛ぶには
http://www.4shared.com/account/file/47838267/b5ea8418/SmartOCRlite107.html
をクリックします。)
■ DownloadボタンをクリックしてZIPファイルをダウンロードして解凍します。
■ SmartOCRLite107.EXEを実行してセットアップを行います。
■ ツールを実行すると,任意の画像ファイルおよびスキャナーからの取り込みおよびクリップボードの画像コピー内容から文字を起こすことができます。
■ 面倒な操作を覚える必要はありません。一番簡単なのは目的のPDFを開いて任意の矩形領域をクリップボードにコピーする別のツール(CaptureXPなど)を用意します。それで,クリップボードにコピーした後に,ファイルメニューの中のクリップボードの画像を読み込む(B)を選択します。
■ 実行例の画面はこのようになります。(画像をクリックすると拡大します。)

■ 右側のウインドウの文字はドラッグで全選択可能です。再度コピー&ペーストしてメモ帳やワードに貼り付けましょう。文字を少しだけ読み違えるところがありますがすぐ分かりますので,元の原稿と比べながら右側画面上あるいはペースト後の画面上で修正します。飛躍的に文字起こしが楽になるでしょう。
皆様の知的好奇心を満たしつつ,ハードコピー印刷を減らして地球環境保護に少しだけ貢献できますように…
ダウンロードはここです。(開発元の会社はなくなってしまったので,たぶん有志の方が保存してくださっているものです。当然ながら製品の保証とサポートはありません。)
■ まず,SmartOCRのダウンロードのリンクをクリックしてバージョン1.07をダウンロードします。(直接ダウンロードページに飛ぶには
http://www.4shared.com/account/file/47838267/b5ea8418/SmartOCRlite107.html
をクリックします。)
■ DownloadボタンをクリックしてZIPファイルをダウンロードして解凍します。
■ SmartOCRLite107.EXEを実行してセットアップを行います。
■ ツールを実行すると,任意の画像ファイルおよびスキャナーからの取り込みおよびクリップボードの画像コピー内容から文字を起こすことができます。
■ 面倒な操作を覚える必要はありません。一番簡単なのは目的のPDFを開いて任意の矩形領域をクリップボードにコピーする別のツール(CaptureXPなど)を用意します。それで,クリップボードにコピーした後に,ファイルメニューの中のクリップボードの画像を読み込む(B)を選択します。
■ 実行例の画面はこのようになります。(画像をクリックすると拡大します。)

■ 右側のウインドウの文字はドラッグで全選択可能です。再度コピー&ペーストしてメモ帳やワードに貼り付けましょう。文字を少しだけ読み違えるところがありますがすぐ分かりますので,元の原稿と比べながら右側画面上あるいはペースト後の画面上で修正します。飛躍的に文字起こしが楽になるでしょう。
皆様の知的好奇心を満たしつつ,ハードコピー印刷を減らして地球環境保護に少しだけ貢献できますように…
コメント
SmartOCR
数日前はダウンロードを何度やってもZipファイルが壊れていたのですが、今は大丈夫みたいですね。おかげさまで挫折せずに済みました。
多謝です。
これは本当に助かります。解説記事書くときコピペできないと涙物ですので。早速試してみます。
>ユーロダラーリさん,
そうでしたか。私は全く気づきませんでした。
>本石町さん,
以前はOCRなどスキャナー時代の遺物と思っていたのですよ。でも,画像イメージとして考えれば,PCの画面の上のものが文字変換できてもおかしくないわけです。私も昔の論文をサーチするとまれにイメージそのままのPDFファイルの場合があり,引用に重宝しています。
そうでしたか。私は全く気づきませんでした。
>本石町さん,
以前はOCRなどスキャナー時代の遺物と思っていたのですよ。でも,画像イメージとして考えれば,PCの画面の上のものが文字変換できてもおかしくないわけです。私も昔の論文をサーチするとまれにイメージそのままのPDFファイルの場合があり,引用に重宝しています。
コメントの投稿
トラックバック
http://eurofactory.21.dtiblog.com/tb.php/179-3d33be9d




