ウィンドウズ10対応のUWPアプリで、画像などから文字を抜き出す機能のものがあります。果たして日本語は無事認識できるのでしょうか。
画像から文字読み取るには?
画像や動画となると、文字のデータが画像のデータとなってしまい、文字データとして利用するにはいちいち自分で手打ちしておこさないといけません。
もっと最近ではランサーズやクラウドワークスなどのクラウドソーシングを利用すると、低価格で代行してくれる人を見つけることはできるでしょうが。
そこで便利なのは、画像から文字を抽出してくれるソフトです。
これらはOCR(Optical Character Recognition)ソフトと呼ばれます。
OCRソフトを使う
Photo Scan
Photo Scanは、画像から文字を抜き出したり、音声合成でそれをしゃべらせたり、といった機能が使える無料アプリです。
アプリ内課金で、広告をのぞくために200円となります。
起動するとこんな感じ。
「Choose photo」でまず画像ファイルを選びます。
すると文字を抜き出してくれます。
日本語も対応しています。
ただし画像の状況や、書かれている文章の内容などで読み取り精度は変わってくるでしょうからここではあまり深入りはしません。
ちなみにこの場合の元の文章は以下の通り
その言葉は本気かそれとも皮肉か?、ニューラルネットワークがそれを見つける
右上のスピーカーアイコンを押すと音声合成で抜き出した文字を読み上げてくれます。
一応日本語にも対応してるっぽいですが、「皮肉」を「かわにく」と読み上げてくれるのであまり正確性には期待しない方がよいでしょう。
お勧め度:★★★
おすすめポイントは
- 無料
- 音声化して読み上げる機能
- 日本語も一応よめる
マイナスポイントは
- 広告あり(無料時)
- メニューは英語
- スクリーンをキャプチャする機能はなし
無料ですし、一応日本語も読んでくれるので、この手のアプリを利用したいという人には持っておいて悪くはないアプリだと思います。
ダウンロードはこちら
Photo toText OCR
起動後はこんな感じ。
画像をドラッグアンドドロップするか、右上のアイコンよりファイルを指定するかなどします。
先ほどの文章の入った画像をこちらでやってみると、下のような感じです。
お勧め度:★★★
おすすめポイントは
- 無料
- 日本語も一応よめる
- シンプルで使いやすい
マイナスポイントは
- メニューは英語
- スクリーンをキャプチャする機能はなし
こちらはシンプルで簡単に使えるアプリです。無料の上日本語もちゃんと読めるようです。
ダウンロードはこちら
LEADTOOLS OCR
高機能そうな無料OCRツール。
基本的には画面上を右クリックすると下にツールバーが出ます。
右端にある「OpenFile」で画像を開きます。
ファイルを開いたら、読み取りたい個所をドラッグで指定すると、解析が始まります。
また、右クリックして下のバーを表示。「Recognize current page」ボタンをクリック。
すると、指定したテキストファイル(またはPDFファイル)で読み取った内容を出力することもできます。
今回試したら日本語はうまく読めませんでした。
ひょっとすると日本語は対応していないのかもしれません。
お勧め度:★
おすすめポイントは
- 無料
- PDFやテキストファイル書き出しが可能
マイナスポイントは
- メニューは英語
- 読み取りも日本語未対応?
- スクリーンをキャプチャする機能はなし
こちらはシンプルで簡単に使えるアプリです。無料の上日本語もちゃんと読めるようです。
ダウンロードはこちら
アプリやウェブサービスを使う
最近ではグーグルドライブなどでOCRを使うことができます。
使い方や精度については以下のまとめを参照ください。