ソリューション紹介

時代はAI-OCRからIDPへ、ドキュメント処理の自動化サービス「SmartRead」がリリース

 

昨今、テレワークの一般化によりデジタルドキュメントの数が飛躍的に増大しています。

また、2022年1月に施行されるの電子帳簿保存法改正が追い風となり、文書を電子的にスマートに管理することが、今後のさまざまな分野における生産性向上においてますます求められてくると思われます。

そのようなドキュメントの電子化と活用を推進するソリューションとして、従来のAI-OCRから実行可能な処理をさらに広げたIDP(Intelligent Document Processing)が注目されています。

IDPとは、AIを活用した高度な文書処理技術のことをいい、最新のAI技術によりさまざまな文書を分類し、活用できる情報として抽出することができます。

そんなIDPの新製品として、2021年12月に最先端AI技術の開発・提供を行う株式会社Cogent Labs(以下、「コージェントラボ」)から「SmartRead」がリリースされました。

今回はSmartReadの企画担当である開発設計に関わったコージェントラボの泉氏に、当製品の特長についてお話を伺いました。

「SmartRead」の3つの特長

SmartReadは、IDPの正確かつスピーディな文書処理の技術を取り入れ、さまざまな文書から情報抽出・データ化に関するプロセスの効率化を実現する製品です。

弊社が提供してきた従来の文字読み取りの技術「AI-OCR」サービスである「Tegaki」を包含し、抽出できる文書の様式、文書からの情報抽出、確認、修正、仕分け、管理方法など、機能を大幅に強化しています。

特長① 独自開発のAIによる高い文字認識・文書仕分けの精度

従来のAI-OCRから精度の高い文字認識精度をそのまま引き継ぎつつ、文書の仕分け(分類)ができるようになったのが、SmartReadの新たなポイントのひとつです。

あらかじめ文書の様式ごとに作成したテンプレートに基づいて文書を仕分けし、OCRを実行します。
文書の様式の細かな違いも識別できるため、従来人手で行っていた文書を振り分ける手間と時間が大幅に削減できます。

 

【精度の高い文字認識】

 

【読み取り文書選択画面】

 

 

【テンプレート設定画面】

 

 

【テンプレート編集設定画面】

 

 

【仕分け結果の確認修正画面】

特長② さまざまなタイプのドキュメントから情報抽出が可能に

SmartReadでは、従来の「定型文書」はもちろん、レポート・契約書・図面などの「非定型文書」の文字をテキスト化することもできます。

それ以外に、項目は共通でレイアウトが固定されていない「準定型文書」の読み取りや情報抽出も、順次強化していく予定です。

特長③ 使い勝手のよいUI/管理機能の強化

専門知識や難しい操作が必要なく、はじめて使う方でも直感的に操作できるUIもSmartReadの特長です。
確認修正の際には、AIによる認識結果の確からしさ(確信度)を色で表現し、確信度の低い結果のみを重点的に確認するというような絞り込みも可能なため、修正作業が効率よく行えます。

また、グループや権限管理機能では、必要な人だけが参照したり修正したりすることも可能で、情報セキュリティへも十分配慮がされています。

 

 

【「確からしさ」が直感的に分かる画面】

 

 

【タスクを一覧で確認できる画面】

 

「社内では、”お客さまの困りごとを常にキャッチアップし、どのように解決していくか?”という話をよくしています。」とコージェントラボの泉氏は言います。

お客さまやパートナー様から話をうけた営業担当者から「こんな様式の文書は読めるか?」と相談があります。そこから試行錯誤の挑戦が始まり、製品の開発や新機能の実装へと至っているのです。

非定型文書である契約書や図面は決まった型がない為、まずは「どこにあるかわからない文字を見つけて読める」という基礎技術を強化するところから開発が始まります。

度重なる改良の結果、当初は指定したところだけを読んでいたのが、今では非定型文書の文字を自動で認識し読み取れるよう、技術が進化してきたそうです。

「苦労もありましたが、お客さまの期待に応えられると、一歩一歩進んでいる実感はあります。」(泉氏)

APIやRPA連携でドキュメント処理を限りなく省力的に

SmartReadはRPAとAPIを活用しながら連携することも可能です。連携によって、ドキュメント処理にかかる工数を最小限にすることができます。

例えば、各営業拠点で受領した書類をRPAが収集してSmartReadへアップロードする作業を行うようなこともできます。

それをSmartReadにで受信し、データ化した後はSmartReadで文書の仕分け、情報抽出を行った後、確認修正に関してのみ人が作業します。

文書情報の確認が取れたら、RPAがAPIで文書を取り出してシステムへデータ連携をすることで、手動でのドキュメント処理を限りなく省略し、処理の自動化を推進することが可能です。

システムとシステムをつなぐ役割はRPAがおこない、最後の確認は人の目でする、ということが今後スタンダードになるのではないでしょうか。

今後は多くの企業が労働力不足の問題に直面するため、SmartReadとRPAの組み合わせのような、業務の自動化・省力化の方法はますます支持を得ていくでしょう。

将来的にはAI技術でさまざまな文書を理解し、情報抽出できるように

コージェントラボの泉氏に、今後の展望についてお話を伺いました。

「SmartReadはさまざまな文書のデータ化に困っている方々のお役に立てばという思いで開発されています。レイアウトが決まっていない請求書や注文書をはじめ、さまざまな文書の読み取りに対応できるように製品を強化していきたいと考えています。

また、製造業や建設業の分野では、紙でしか残っていない文書を探すのに苦労されているという話をよく耳にします。自治体や官公庁などでもデジタル化が今後加速すると思いますが、まだまだ膨大な量の紙文書の管理やデータ化に困っているとも聞きます。このようなドキュメント処理に関するさまざまな課題を解決できるように、正確に、素早く、効率的に、人がやらなくてもいい作業はAIに置き換えていきたいです。」(泉氏)

非定型の文書に対応しているSmartReadによって、紙のデータ化、ペーパーレス化を実現する企業は多いのではないでしょうか。

 

ダウンロード