OCRソフトで手書き文字は認識可能?

この記事では、近年業務効率化やペーパーレス化の手法として注目されるOCRについて説明します。OCRとはそもそもどんなものなのか、手書き文字の認識はできるのかといったことを解説します。

公開日公開日:
カテゴリーカテゴリー:
知識

目次

  1. OCRで手書きの文字を読み取ることは可能か?
  2. 手書き文字の100%の読み取りは不可能だということは認識する
  3. OCRにおける文字認識の精度を向上させるためにやっておきたいこと
  4. まとめ

OCRで手書きの文字を読み取ることは可能か?

OCRの仕組み

OCRとはテキストをスキャンして読み取る文字認識技術です。OCRを活用すればPDFデータや紙の資料を読み取り、編集・検索可能なテキストとして取り込むことができます。読み取りにはスキャナの代わりスマホやタブレットのカメラなどを使用できるアプリケーションもあります。

手書き文字にも対応するOCR技術

これまで手書き文書の認識は難しいとされてきましたが、近年OCRの進化は目覚ましく、AIを活用することで手書き文字の認識も可能になってきています。なかには手書き文字をNGとするアプリもありますが、今後、対応が広がっていくことが予想されます。また、OCRで手書き文書を電子化し、RPAの導入を進めるという活用も可能です。

この記事では、近年業務効率化やペーパーレス化の手法として注目されるOCRについて説明します。OCRとはそもそもどんなものなのか、手書き文字の認識はできるのかといったことを解説します。

OCRの仕組み

OCRとはテキストをスキャンして読み取る文字認識技術です。OCRを活用すればPDFデータや紙の資料を読み取り、編集・検索可能なテキストとして取り込むことができます。読み取りにはスキャナの代わりスマホやタブレットのカメラなどを使用できるアプリケーションもあります。

手書き文字にも対応するOCR技術

これまで手書き文書の認識は難しいとされてきましたが、近年OCRの進化は目覚ましく、AIを活用することで手書き文字の認識も可能になってきています。なかには手書き文字をNGとするアプリもありますが、今後、対応が広がっていくことが予想されます。また、OCRで手書き文書を電子化し、RPAの導入を進めるという活用も可能です。

手書き文字の100%の読み取りは不可能だということは認識する

OCRで手書き文字の精度をあげるためには

私たちは普段多くの手書き文字を目にしていますが、自分以外の手書き文字を読んで「読みにくい」と感じることがあります。それは人の書く手書き文字にはクセがあるからです。漢字や数字などを書く際、同じ文字であっても手書きにすると個性が出てしまい、その手書きの個性がOCRの認識精度を低下させるのです。

OCRで手書き文字の精度をあげるためには、最初から個性のない、正確な楷書の文字を手書きすることが求められます。しかし、実際にはそのような文字を手書きすることは多くの人にとって難しいことです。そのため、OCRの精度を高めていくためには、OCR内の辞書に手書き文字のバリエーションを増やしていくことが重要です。

OCRを活用すればすぐに手書き文字を認識できると考えるのではなく、OCRを使いながら手書き文字の精度高めていく意識を持つイメージです。

人が読めない手書き文字はOCRでも認識できない

ノートにペンで書かれた手書き文字を見て、そもそも人が読み取れないものはOCRでも認識できません。楷書でとまではいいませんが、OCRで読み取るなら最低限人が読める手書き文字である必要があります。

OCRはWindowsやパナソニック、東芝、ハンモックなどの様々なメーカーによって開発が進められ、evernoteのようにメモアプリでありながらOCR機能を持つものも出てきています。グーグルクラウドもOCRサービスを搭載したことも話題になりました。

また、OCRソフトTegakiはライセンス購入者向けにビジネス開発者用APIを配布し、OCR技術のカスタマイズが可能です。近年ではPythonのライブラリからOCRを操作することができるサービスも登場するなど、今後はOSSなど通じたさらなる技術革新が期待できます。

OCRは使いながら、手書き文字認識のミスを減らしていく

OCRを導入する際には、最初から完璧な手書き文字認識ができると考えないことが重要です。これは料金のかかるサービスであっても、フリーで使える無料ソフトであっても同様です。OCRは、そもそも使いながら手書き文字認識のミスを減らしてくものだと考えましょう。

OCRにおける文字認識の精度を向上させるためにやっておきたいこと

OCRで手書き文字認識の精度を高めるポイント①文書の角度

OCRで手書き文字を認識する際には、文書を取り込む角度に注意が必要です。OCRでは文字の角度も含めて手書き文字を認識するため、文書がナナメになっているために手書き文字を正しく認識できないということがないように、OCRで読み込む角度をまっすぐにしてください。

OCRで手書き文字認識の精度を高めるポイント②文書の色

OCRで手書き文字を認識する際、最も成功しやすいのは白黒で書かれた文書です。カラーで書かれた手書き文字はOCRにとって苦手なものになります。OCRで手書き文字を読み込む際には白黒の手書き文字に絞るか、カラーの手書き文字を一度白黒にコピーしてから取り込むようにしましょう。

OCRで手書き文字認識の精度を高めるポイント③文字の間隔

OCRの手書き文字認識をうまく行うためには、文字と文字の間に一定の間隔があるほうが望ましいです。間隔の詰まった文字が人にとっても読みにくいように、OCRにとっても間隔のあいていない手書き文字は高い精度での認識が難しいということを理解しておく必要があります。

OCRで手書き文字認識の精度を高めるポイント④特殊文字

OCRの手書き文字認識は読み取りを繰り返し、OCR内の辞書に手書きデータを蓄積していくことで精度を高めていきます。そのため、通常の文書で登場頻度の少ない特殊文字の認識はOCRではしにくいものです。OCRは初めて読み込む特殊文字を別の手書き文字として認識しようとしますので、特殊文字のある手書き文書は最初から読み取りデータを修正することを想定し、OCRを活用したほうがいいかもしれません。
このような4つのポイントを意識することで、OCRで手書き文字を認識する精度は向上しやすくなるでしょう。OCRで手書き文字を認識する際には、向き不向きもふまえ、人の手をかけながら成功率を高めていくことが重要です。

まとめ

著しい進化を見せるOCRは手書き文字だけでなく、画像とあわせて読み取りができるサービスや、読み取った表をエクセルに自動変換して保存するサービスなど、デジタル化を促進する様々なアプリ・機能が登場しています。導入を検討する際には人気ランキングなどを参考にし、価格や機能を比較することをおすすめします。そして、導入後は時間をかけて手書き文字認識の精度を高めていく意識をもって、OCRを活用していくことが大切です。

RPA導入事例集

業務効率化 働き方改革 自動化 生産性向上 内部統制
エンジニア 管理職 総務 人事 営業事務 経理 経営者 IT担当者

資料を無料でダウンロードいただけます。ぜひ、社内共有や業務改善にお役立て下さい!

まずはご相談

「何から始めたらいいか分からない」「自社に合った製品が分からない」「トータルの費用が知りたい」
「他社サービス・製品と比較したい」など、お困り事をなんでもご相談ください。

 お役立ち資料をダウンロード

 まずは無料で相談

 資料ダウンロード

 無料相談する