AI-OCRとは
AI-OCRとは、テキストをスキャンして読み取る文字認識技術「OCR(Optical Character Recognition/Reader、光学文字認識)」に「AI(Artificial Intelligence、人工知能)」が搭載された技術です。ここでは、AI-OCRは従来のOCRとどのように異なるのか、またその特徴を解説します。
OCRとAI-OCRの違い
AI-OCRが従来のOCRと大きく異なる点は「手書き文字が読み込める」「異なるフォーマットでも対応できる」この2点です。
従来のOCRは、PDFデータや紙の資料に印字された文字をスキャナやデジタルカメラで読み取り、編集・検索可能なテキストとして取り込める技術です。文字を読み取る方法は、スキャナやデジタルカメラの代わりにスマートフォンやタブレットのカメラなどを使用するアプリケーションなども多くあります。しかし、OCRでの手書き文字の認識は難しく、決められたフォーマットでなくては正確な文字認識ができませんでした。
一方AI-OCRは、印字された文字だけでなく、これまで難しいとされていた手書き文字の認識もAI技術を組み合わせることで可能にします。最初は間違えて文字を認識する場合もありますが、マシンラーニング(機械学習)やディープラーニング(深層学習)の活用により間違えを学習していきます。そのため、情報の読み取りを繰り返して傾向を学習させることで文字認識率は高まり、非定型フォーマットに記載された文字の認識も可能になります。
OCRはWindowsやPanasonic、東芝、ハンモックなどの様々なメーカーによって開発が進められ、evernoteのようにメモアプリでありながらOCR機能を持つものも出てきています。Google CloudもOCRサービスを搭載したことも話題になりました。
また、AI-OCRサービス「Tegaki」はライセンス購入者向けにビジネス開発者用APIを配布し、OCR技術のカスタマイズが可能です。近年ではPythonのライブラリからOCRを操作することができるサービスも登場するなど、今後はOSSなどを通したさらなる技術革新が期待できます。
まだ手書き文字に対応していないアプリケーションもありますが、今後、AI技術を活用した文字認識技術はさらに拡大していくことが予想されます。また、AI-OCRで手書き書類を電子化し、RPA(Robotic Process Automation、ロボットによる業務の自動化)ツールと連携することで、活用の幅も広がっていくでしょう。
AI-OCRの特徴
それでは、AI-OCRの特徴をみていきましょう。ここでは、手書き文字の認識率を高めるポイントもあわせて解説します。
識字率が高い
従来のOCRとAI-OCRの違いで述べた通り、AI-OCRはマシンラーニングやディープラーニングの活用で大量のデータから規則性や関連性を見出しながら判断や予測を行い高い文字認識率を実現します。これにより、見た目だけでは分かりづらい工場の「工(こう)」とカタカナの「エ(え)」や、数字の「一(いち)」とハイフン「―」も、文字の前後の規則性や関連性で判別することが可能です。
従来のOCRの場合、手書きしたカタカナの「ソ(そ)」と「ン(ん)」、「ハ(は)」と「へ(へ)」、「イ(い)」と「ト(と)」も正確に見分けることは困難でした。しかし、AI-OCRは筆跡のパターンも学習できるので、情報の読み取りを繰り返すことでクセのある手書き文字にも対応できるようになります。
このようにAI-OCRは文字認識率が高いのが特徴ですが、さらに手書き文字の認識精度を高めるには「文書の色」と「文字の間隔」の書き方に気をつけることも大切です。
AI-OCRで手書き文字を認識する際、白黒の手書き文字にするか、カラーの手書き文字を一度白黒にコピーしてから取り込むようにしましょう。カラーで書かれた手書き文字はAI-OCRで読み取りづらいため、白黒で書かれた文書にすることで、文字認識率が高まります。
また、文字と文字の間に一定の間隔をあけましょう。間隔の詰まった文字は人が読みにくいと感じるように、AI-OCRにとっても間隔のあいていない手書き文字は高い精度での認識が難しくなります。
このようにAI-OCRで手書き文字を認識する際には、書き方に気をつけながら認識精度を高めていくことが重要です。
フォーマットが異なる帳票にも対応
AI-OCRは非定型フォーマットでも、高い精度で文字認識が可能です。
従来のOCRで非定型フォーマットに記載された文字を認識するには、読み取る範囲を指定する必要があり、事前に書式が異なる複数の書類の読み取り範囲を指定する手間がかかっていました。しかしAI-OCRの利用により、読み取り範囲を指定しなくても、フォーマットが異なる帳票などを正確に読み取れるようになります。
非定型フォーマットでも文字認識ができる点がAI-OCRの特徴ですが、さらに文字認識率を高めるにはポイントがあります。それは、手書き文書を取り込む際に、取り込む角度をまっすぐにすることです。これにより、文書がナナメになっているために文字を正しく認識できないということを防げます。
当社で取り扱っているAI-OCRツール「DX Suite」は、歪みや傾きの自動補正機能が備わっています。こういった機能が備わっていると、読み取りの失敗が少なくなりますのでツール選定の要件の一つとして、ぜひ検討してみてください。
読み取り精度が高く
簡単に文字認識が可能なAI-OCR
AI-OCRのメリット
前章では、AI-OCRは文字認識率が高く、非定型フォーマットにも対応できるという特徴をお伝えしました。これにより、「入力業務の削減」「チェック作業の削減」も期待できます。ここでは、それぞれのメリットを詳しく解説します。
入力業務の削減
AI-OCRでスキャンするだけで紙の書類に書かれた文字をデータ化できるので、これまで手で入力していた業務の負担や時間を削減できます。
従来のOCRと比べ文字認識率が高く、手書き文字や非定型フォーマットにも対応しているAI-OCRは、申込書や注文書、アンケートなど、さまざまな書類で活用が可能です。これまでデータ化が難しかった紙の資料もデータ化することで、書類の保管場所を確保する必要がなくなり、ペーパーレス化にもつながります。また社内のインターネット環境を整え、手書き書類のデータを一元管理すれば、資料を探す際も手間をかけずに簡単に必要な資料を探し出せるようになるので便利です。
チェック業務の削減
文字認識能力が高いAI-OCRを活用すれば、チェック業務も軽減できます。
データを手で入力する場合、複数人で入力したデータに間違いがないかを確認する作業が必要になります。しかしデータ入力をAI-OCRに任せれば、人が行う作業はAI-OCRが読みとったデータを確認するだけになるため、効率的にチェック業務が可能です。そして、これまでデータ入力に充てていた時間で他のコア業務に集中することもできるため、生産性の向上にもつながるでしょう。
また人が入力する場合、疲労や集中力の低下などにより、誤入力や入力漏れなどのヒューマンエラーが発生する可能性があります。AI-OCRの文字認識の精度を高めて入力を自動化することで、そのようなヒューマンエラーが減り、業務品質の向上にもつながるでしょう。
しかし、特殊文字のある手書き文書を読み取る場合は注意が必要です。特殊文字は、最初から読み取りデータを修正することを想定しておきましょう。AI-OCRの手書き文字認識は読み取りを繰り返して、AI-OCR内の辞書に手書きデータを蓄積していくことで精度を高めていきます。そのため、通常の文書で登場頻度の少ない特殊文字の認識は別の手書き文字として認識しようとする可能性があります。最初から特殊文字の読み取りデータを修正することを想定しておくことで、AI-OCRの読み取りミスを修正して、読み取り精度の向上につなげられます。
手書き文字をどこまで認識できる?
AI-OCRは手書き文字を読み取れる点が魅力ですが、どのくらいの文字なら認識できるのでしょうか?ここでは、AI-OCRが手書き文字をどこまで認識できるのかを解説します。
100%認識できるわけではない
AI-OCRは文字認識率が高いとお伝えしてきましたが、手書き文字を100%認識できるわけではありません。具体的には、人が読めない手書き文字はAI-OCRでも認識できません。また、クセのある手書き文字もAI-OCRの認識精度の低下につながります。
AI-OCRで手書き文字の認識精度を向上させるには、最初から個性のない、正確な楷書の文字を手書きすることが求められます。しかし、実際にはそのような文字を手書きすることは多くの人にとって難しいことです。そのため、AI-OCRの精度を高めていくためには、AI-OCR内の辞書に手書き文字のバリエーションを増やしていくことが重要です。
このように、AI-OCRを活用すればすぐに手書き文字を認識できると考えるのではなく「使いながら手書き文字の精度を高めていく」という意識を持ちましょう。全てをAI-OCRに任せるのではなく、部分的に人の目で確認し、修正しながら手書き文字の認識精度を高めてくことが必要です。
情報を取得し学習していくことで精度が向上する
前述した通り、AI-OCRの文字認識精度は100%ではなく、使いながら手書き文字認識のミスを減らしていきます。例えば、AIがディープラーニングでさまざまな種類の犬の画像を見ながら「犬」について学んだとします。すると、AIは犬の画像を見た時に、それが犬だと認識できるようになります。これと同じように、さまざまな形の手書き文字データを蓄積していくことで、AIは文字認識のアルゴリズムを使って、手書き文字に関しても正しい判断ができるようになっていきます。その結果、工場の「工」とカタカナの「エ」や、数字の「一」とハイフン「―」も正確に読み取れるようになるのです。
このように、AI-OCRは情報を取得しながら学習して精度が向上していきます。そのため、AI-OCRを導入する際には、最初から完璧な手書き文字の認識ができると考えないことが重要です。これは料金のかかるサービスであっても、フリーで使える無料ソフトであっても同様です。読み込んだデータは必ず人の目による確認と修正作業を行い、文字認識精度を高めていきましょう。
主なAI-OCR
実際にAI-OCRの導入を検討する際、どのようなサービスがあるのでしょうか。ここでは、おすすめのサービスを3つ紹介します。
DX Suite
AI inside株式会社が提供する「DX Suite」は、金融業から地方自治体まで、さまざまな業種で活用されているAI-OCRです。
従来のOCRでは難しかった手書き文字や縦書きの文字も高精度で読み取れます。対応する言語は日本語だけでなく、英語・中国語(繁体字・簡体字)・タイ語・ベトナム語に対応しているため、海外に拠点がある企業におすすめです。
RPAツールやアプリケーションとの連携もでき、アップロードした書類をAIが仕分けてくれる「Elastic Sorter」を活用すれば、さらに業務の効率化が進むでしょう。
自社が抱える課題解決方法についてアドバイスもらいながら、実際にDX Suiteを利用できる1ヶ月間のトライアルが有償で提供されています。このようなトライアルでツールの効果を十分に体験してから導入すると、導入に失敗することがないのでおすすめです。その他、DX Suiteを体験できるハンズオンセミナーやDX Suiteの活用法などを紹介するセミナーも開催されているので、導入検討の際には、ぜひ活用しましょう。
プラン名 |
初期費用 |
月額費用 |
無料枠 |
リクエスト単価 |
速度優先 全文読取 Express |
精度優先 全文読取 Full |
【DX Suite Lite】 |
0円 |
30,000円〜 |
18,000円分 |
文字あり 3円/文字なし 3円 |
30円/ページ |
60円/ページ |
【DX Suite Standard】 |
200,000円 |
100,000円〜 |
50,000円分 |
文字あり 1円/文字なし 0.5円 |
30円/ページ |
60円/ページ |
【DX Suite Pro】 |
200,000円 |
200,000円〜 |
200,000円分 |
文字あり 1円/文字なし 0.1円 |
30円/ページ |
60円/ページ |
【Elastic Sorter】 ※オプション |
– |
20,000円 |
– |
– |
– |
– |
<DX-suite>
https://dx-suite.com/
AIよみと~る
NTT東日本が提供する「AIよみと〜る」は、読み取り精度96.71%のAI-OCRサービスです。専門的な知識がなくても、直感的に作業ができる操作性の良さも魅力です。マウス操作だけで読み取り設定が簡単にできるので、社内にITに詳しい人材がいなくても設定後すぐに利用できます。
同社が提供するRPAツール「おまかせRPA」と連携すれば、読み取ったデータを活用した業務の自動化が可能です。RPAツールと連携して自社システムへ自動入力できるようにすることで、大幅に稼働時間を削減して、業務の効率化が進むでしょう。
初期費用をかけずに導入でき、プラン1(小型)は30日間のトライアル版、プラン2(中型)は60日間のトライアル版が有償で用意されています。トライアル版では、通常オプションとなっている「自動帳票仕分け機能」も利用できます。通常版は、最低利用期間が12ヶ月となっており、途中で解約する場合は途中解約金が発生するため注意が必要です。まずは、トライアル版から始めてみるのがおすすめです。
有償のトライアル版以外にも、「オペレータによるサンプル帳票を用いたデモ(オペレータデモ)」または「自社の帳票を用いてご自身でツールを体験する(セルフデモ)」の2つから選んでデモ体験が可能です。まずは、問い合わせて実際にツールを使用してみるのも良いでしょう。
プラン名 |
月額費用 |
オプション 自動帳票仕分け機能 |
【プラン1(小型)】 |
33,000円(読取箇所6,000まで) |
月額22,000円 |
【プラン2(中型)】 |
110,000円(読取箇所60,000まで) |
月額22,000円 |
【プラン3(大型)】 |
220,000円(読取箇所200,000まで) |
月額22,000円 |
<AIよみと~る>
https://business.ntt-east.co.jp/service/rpa_aiocr/
CLOVAOCR
LINE株式会社が提供する「CLOVA OCR」は、手書き文字の読み取りはもちろんのこと、傾いた文字や歪んだ文字の読み取り、多言語や専門用語を高い精度で認識可能です。また、表が入った書類やPDFもブラウザ上にアップロードするだけで、表形式でのデータ化ができます。
各種会計書類の読み込みに特化した「CLOVA OCR(レシート・領収書特化型)」と「CLOVA OCR(請求書特化型)」のサービスも提供しており、自社のニーズにあわせて「CLOVA OCR Reader」と組み合わせて利用することで、業務効率化にもつながります。
初期費用なしで導入でき、料金体系は1枚ごとに課金となります。そのため気軽に導入しやすく、ランニングコストを想定しやすいので、コストを抑えてAI-OCRを導入したい企業におすすめです。契約後、専任の担当者から2ヶ月間の無料導入支援が受けられるので、初めてAI-OCRを導入する場合も安心して利用できます。オンラインで開催される無料体験会も開催されており、実際にツールに触れることも可能です。
プラン名 |
月額費用 |
1万枚読み取った 場合の目安単価 |
【Template (定型書類)】 |
55,000円 |
8円 |
【General (非定型書類や画像)】 |
55,000円 |
2円 |
【特化型(請求書)】 |
55,000円 |
– |
<CLOVAOCR>
https://clova.line.me/clova-ocr/
SmartRead
株式会社 Cogent Labsが提供する「SmartRead」は、定型・非定型文書などが読み取り可能なAI-OCRからさらに発展したIDP(Intelligent Document Processing)サービスです。「Tegaki」で培ってきた独自のエンジンを継承し、手書き・活字含めて高い読み取り精度を有しています。
文書の仕分けも可能です。
現在、無償トライアルで1ヶ月無料でサービスの体験ができます。
このようなトライアルでサービスの効果を十分に体験してから導入すると、導入に失敗することがないのでおすすめです。
セミナーでは、実際にSmartReadのデモなどを行なっていますので、導入検討の際にはぜひ活用してみましょう。
プラン名 |
月額費用 |
月間処理枚数 |
スモールプラン |
30,000円 |
1,000枚前後 |
スタンダードプラン |
80,000円 |
5,000枚前後 |
エンタープライズプラン |
200,000円 |
22,000枚前後 |
<SmartRead>
https://smartread.jp/
RPAと組み合わせて、さらに業務効率アップ!
AI-OCRとRPAツールを組み合わせることで、さらに業務効率化が促進されます。AI-OCRで読み取ったテキストデータを、連携したRPAツールで自社システムに自動入力するようにしておけば、入力業務の負担がさらに軽減されるでしょう。例えば、各社で異なるフォーマットの請求書をAI-OCRで読み取って、会計システムに自動入力することも可能です。
従来のOCRにAI技術が搭載されたAI-OCRは、これまで難しいとされていた手書き文字の認識ができるだけでなく、非定型フォーマットに記載された文字も高い精度で読み取れるため、さまざまな書類のデータ化が可能となります。手書き文字がある帳票のデータ化にも最適です。
AI-OCRの文字認識率は100%ではありませんが、手で入力していた業務をAI-OCRに任せれば、入力業務の削減につながります。また、データ入力にかかっていた膨大な時間や業務負担を削減でき、担当者は確認作業に注力できるため、チェック業務も効率的に行えます。このようにAI-OCRを活用した書類のデータ化と人の目での確認作業で、業務の効率化だけでなく、ペーパーレス化の推進や業務工率の向上も期待できるでしょう。
ただし、注意していただきたい点があります。それは、AI-OCRは使用しながら手書き文字の認識精度を高めていくため、全てを任せるのではなく、読み取ったデータは必ず人の目で確認し、間違えを修正しながら手書き文字認識の精度を高めていく必要があるという点です。AI-OCRに任せる部分と、人の目で判断する部分で使い分けて、AI-OCRを最大限に活用しましょう。そしてRPAツールとの連携で、業務効率化をさらに推進しましょう。
著しい進化を見せるAI-OCRは手書き文字だけでなく、画像とあわせて読み取りができるサービスや、読み取った表をエクセルに自動変換して保存するサービスなど、デジタル化を促進する様々なアプリケーションや機能が登場しています。導入を検討する際には、それぞれのサービスの価格や機能を比較するのがおすすめです。本記事でご紹介したサービスの情報も参考にしながら、ぜひ自社の業務効率化に役立ててください。
読み取り精度が高く
簡単に文字認識が可能なAI-OCR