AI-OCRとは?メリットや導入シーンをご解説

公開日公開日:
カテゴリーカテゴリー:
知識

目次

  1. そもそもOCRとは?AI-OCRとの違いとは?
  2. AI-OCRは通常のOCRと比較してどんなことが可能になった?AI-OCRの3つのメリットとは
  3. 現在のAIのトレンドと、そこから考えるこれからのAI-OCR
  4. 導入することによって生産性が向上する業務
  5. まとめ

そもそもOCRとは?AI-OCRとの違いとは?

まず、OCRとは何か説明しましょう。OCR(Optical Character Recognition/Reader、光学式文字読み取り装置)とは、手書きや印刷された文字をデジタルスキャナーによって読み込み、デジタルの文字列に変換する仕組みやツールを指します。

手書きの書類や印刷された書類のデジタル化を手入力で行うと、ヒューマンエラーが生じる可能性があったり、そのミスを減らすためにダブルチェックをする必要があったりと、何かと時間や手間がかかります。

そこで、何らかのツールを用いて文字を読み込みしようと考えるのは当然です。しかし、従来型のスキャナーでは手書きの文字がつぶれてしまう、表や帳票などのレイアウトが崩れてしまうなどのデメリットがありました。

OCRは表や帳簿や伝票などのあらかじめ決められた帳票を読み込むことが可能です。また、文字を読み込んでテキスト化しているので、範囲選択や検索などの機能を利用できます。OCRで表を読み込み、表計算ソフトに出力してグラフを作成するなど、データを違う方法で利用するということも可能です。

このように、OCRを利用することによって単純業務に割く時間を削減できるだけでなく、効率的な業務遂行に役立てることもできるのです。そのため、データ入力から文書管理などビジネスの幅広い業務で活用されています。

AI-OCRは通常のOCRと比較してどんなことが可能になった?AI-OCRの3つのメリットとは

それでは、AI-OCR、つまりAIを搭載したOCRは従来型のOCRと比較してどんなところが違い、どんなことが可能になったのでしょうか。

文字認証の正確性が向上

まず、文字認証が正確に、素早く行えるようになったことです。従来のOCRは固定ピッチと呼ばれる、1枠に1文字が入力されているという仕組みに基づいて文字を認識していました。そのため、フリーピッチ枠と呼ばれる仕組み(自由記入欄があるアンケートなど、枠の中に自由に文字を記述しているもの)をスキャンする際には認識率が低下してしまうという欠点がありました。

しかし、AI-OCRはAIがディープラーニング(deep learning、深層学習)を行うことにより、文字の認識率を向上させ、精度を大幅に高めました。これにより、より効率的にかつ大量の文書をスキャンすることが可能となりました。

Microsoft Azureによる「Azure cognitive services」や「Compture Vision API」などは日本語の認識能力に優れているといわれており、さまざまなOCRサービスを支えています。

レイアウト解析能力が向上し、さまざまなフォーマットに対応可能

表や帳簿などをOCRでスキャンする際、これまでは事前に読み取り位置などの詳細を設定する必要がありました。それとは対照的に、AI-OCRではAIが自動で読み取り位置を自動的に抽出します。そのため、表や帳簿だけでなく請求書・見積書・発注書といったビジネスに欠かせないさまざまなフォーマットも瞬時に読み込み、項目を抽出できます。

RPAと連携し、さらなる効率化も

AI-OCRはRPA (Robotic Process Automation)と連携することにより、さらに効率的に業務を行うことが可能です。この2つのシステムを連携させることで、文字データを自動的に読み込み、作業の自動化を図ることができるようになります。RPAはデータ入力や数字の自動抽出など、単純作業をすることが得意である反面、紙に記載された情報を読み込むことが不得意だという点が欠点でした。

そこでこの2つを連携させることによりデータのスキャンから抽出、入力や加工、出力までをワンストップで自動化できるのです。これにより、さらにツールに任せられる業務が増え、その分コア業務やクリエイティブな分野に集中できるでしょう。

現在のAIのトレンドと、そこから考えるこれからのAI-OCR

現在、AIの技術に関しては以下のようなトレンドがあります。まず、Amazon EchoやGoogle Homeなどのスマートスピーカーに代表されるように、AIは自然言語に対応できるようになっています。そして、近年は防犯カメラの分析やスマートレジなど、画像を瞬時に大量に分析できることでAIができる業務の幅が拡大しています。実際に、2019年頃からこのような業務を可能とするサービスが登場しています。

これらのことから、これからのAI-OCRは動画や音声、また画像が掲載されているアンケートなどさまざまな種類のデータを同時に、そして大量に読み取れるようになるのではないでしょうか。そうなれば、現在人の手で行っているこれらのデータの分析や結果の抽出などをAI-OCRに任せることも可能になってくるでしょう。

それでは、上記で述べた最新のAIはどんな技術が用いられているのでしょうか。ここでは、深層学習で文字や数字を認識する過程と、画像認証に使われている技術をご紹介します。

AI-OCRはどんな過程で文字を認識しているのか?

これまでのOCRを始めとする文字認識ツールは、数字や文字を1文字ずつに分割し、それぞれのパーツを1つずつどんな文字であるかを認識しています。この方法では、文字同士がくっついていたり続け字で書かれていたりすると認識しにくいという欠点がありました。そのため、くせ字や続け時が混入する手書き文字の文書の読み込みが難しい状況でした。

深層学習では数字や文字を1文字ずつに分解するのではなく、「文字列」としてとらえ、それらをて画像として認識します。そして、認識する範囲を少しずつずらしながら文字を認識しています。これにより「ここは0と1が接触している」「ここはaとbの続け字」という認識が可能です。

また、この認識を繰り返すことにより「00」など頻出する文字列のパターンを学習していきます。そのため、再び同じ内容の文字列をスキャンした際に、エラーを起こす頻度を減らすこともできるのです。

画像認識にはどんな技術が使われているのか?

画像認識に使われてる技術にはさまざまなものがありますが、代表的なものとしてCNN(Convoltional Neural Network、畳み込みニューラルネットワーク)というものがあります。

CNNには畳み込みとブーリングという2つの技術が使われています。読み込まれた画像は、カーネルと呼ばれる格子状の数値データと、ウィンドウと呼ばれるカーネルと同サイズの画分割画像に変換されます。

畳み込みは、少しずつ切り出してずらしながらスキャンしてその結果をデータに置き換えます。ブーリングも畳み込みと似通った技術ですが、ウィンドウの数値データから数値を作り出します。この2つの処理によって得られたデータから画像の特徴を判断した上でデータを統合し、最終的にその画像がどんなもの(被写体や色など)であるかを判定します。近い未来にAI-OCRはこの複雑な動作を瞬時に、そして大量に行うことを目指して開発が進められています。

導入することによって生産性が向上する業務

AI-OCRを導入することによって、どんな業務の向上が見込めるのでしょうか。ここで、該当すると考えられるいくつかの業務をご紹介します。

請求書のデータ入力

さまざまな形式の請求書を手入力でエクセルやシステムに入力している、というケースは多いのではないでしょうか。AI-OCRは異なるフォーマットを連続して読み込み、そこからRPAによるデータを抽出して集計・加工が可能です。

申込書のデータ入力

業種によっては、申込書にさまざまな項目がありますので、それらを手入力でインプットするには膨大な時間がかかります。また、商品購入や入会申込書など、手書きのものが運用されているケースもまだまだ多いでしょう。AI-OCRを利用すれば手書きの申込書でもエラーを大幅に抑制しながら効率よくスキャンできます。

納品書のデータ入力

小売やアパレルなど、商品を送付・搬入する業種では、納品書のやりとりを行います。業者ごとに異なるフォーマットでもAI-OCRなら効率的に読み込みができ、その後の集計作業も簡単に行えます。

手書きアンケートの集計

外食や小売など、顧客に手書きでのアンケートを実施している業種では、その集計を手入力で行うと膨大な時間がかかってしまいます。また、くせ字の判定などは肉眼で行うのが難しいこともあります。AI-OCRは、AIの深層学習によってくせ字や続け字の判定も容易になりましたので、この業務の負担を大きく軽減することでしょう。

まとめ

AI-OCRがどんな特長を持ち、どんな業務を向上させるものか、お分かりいただけたでしょうか。AI-OCRは現在でも進化を続けています。その例として、アメリカのとあるカンファレンスで発表されたAndroidスマートフォンで利用できるAI-OCRアプリをご紹介します。

これは、スマートフォンのカメラで文書を撮影するだけで、AI-OCRアプリがその内容を自動でデータ化できるものです。いずれはこのように、誰でも簡単に使えるAI-OCRが登場すると思われます。

また、AI-OCRは単に業務時間を削減するだけでなく、取り込んだ文字列をGoogle Driveで保存し、自宅以外の場所から編集・加工するなど、柔軟な働き方を支援するツールとしても利用できます。このことから、これから日本企業でもさらに普及が進んでいくと考えられます。

すでに、法人向けのAI-OCRとして株式会社日立システムズによる「DX Suite」、NTTデータによる「NaNaTsu™ AI-OCR with DX Suite」や「Cloud OCR API」、ntt西日本による「おまかせAI-OCR」、富士通フロンテックによる「Keyword Capture」などさまざまなサービスが登場しています。なかでもDX suiteはすでに3,000契約を突破しており、2020年6月現在、日本のAI-OCRシェアのナンバーワンとなっています。

AI-OCRが気になるという業務担当者の方向けに、現在はwebセミナーが多数開催されています。それらのサービスや導入事例を参考にした上で、フリーソフトやトライアル利用といった形でその操作性や利便性を確認してみてはいかがでしょうか。中には無料で利用できるものもありますので、価格面で導入をためらいがちな中小企業にもおすすめです。

業務効率化のみならず働き方改革にも寄与するツールとして、ぜひAI-OCRの導入を検討してみてください。

RPA導入事例集

業務効率化 働き方改革 自動化 生産性向上 内部統制
エンジニア 管理職 総務 人事 営業事務 経理 経営者 IT担当者

資料を無料でダウンロードいただけます。ぜひ、社内共有や業務改善にお役立て下さい!

まずはご相談

「何から始めたらいいか分からない」「自社に合った製品が分からない」「トータルの費用が知りたい」
「他社サービス・製品と比較したい」など、お困り事をなんでもご相談ください。

 お役立ち資料をダウンロード

 まずは無料で相談

 資料ダウンロード

 無料相談する