Google ドキュメントでファイルをアップロードする時に「PDFや画像ファイルをドキュメントに変換する」という機能が新しく追加されたということだったので、どのくらいの精度で文字を認識してくれるのか試してみました。
» Google Adds OCR for PDF Files and Images
まずは昨日書いた記事を画像に落として、アップロードさせてみました。すると一文字も認識しておりません。う~む
この画像を
アップロードさせた結果がこれ。
英語の場合ではどうでしょう。この画像をアップロードさせてみました。
段落は無視されていますが、ほぼ全文を読み取っています。認識されなかった文字は黄色のマーカー目立つように表示されています。
ファイルをアップロードさせてから、読み取りの時間にほとんどかからないので、早く日本語に対応してほしいものです。