OCRとは、光学文字認識(Optical Character Recognition)という、文書の画像を文字コードに変換する技術。
OCRの技術が開発されたのは1920年代と古く、日本では1968年に初めて製品化されています。
以前からのイメージで、未だに「OCRは精度が低い」という印象が抜けきらない方も多いのではないでしょうか。
この記事では
・OCRで高い精度を発揮する文書の特徴
・OCRの精度を高める使い方
について解説しています。
OCRの導入を検討している方は最後までご覧ください。
OCRの精度
OCRは、光学文字認識(Optical Character Recognition)の略称で、画像から文字を読み取る技術です。
以前は文字の認識能力が期待値を上回らないこともあり、OCRの精度に疑問を持つ人も少なくないようです。
ですが、現代のOCRの読み取り精度は年々向上しています。
まずは現代のOCRの精度について、またOCRで読み取りにくい様式について解説します。
OCRの読み取り精度は年々上がっている
OCRの精度に疑問を持つ方は、読み取り精度がそれほど高くないデバイスを使い続けている、無料ソフトの機能の範囲内で使用している、など、最先端のOCRの読み取り精度を体感できる環境でない場合も考えられます。
過去にOCRの読み取り精度が期待値に追いつかなかったことは事実としてありますが、現代ではOCRの精度は年々向上しています。
印刷された文字や画像データからの読み取り、手書き文字まで、様々な様式から読み取りが可能です。
古い資料は読み取りにくいケースも
OCRの精度が向上しているとはいえ、資料が古く黄ばんでいたり、文字がかすれていると、読み取り精度は落ちてしまいます。
同じ内容の資料でも、白い紙にはっきりとした文字が書いてある資料の方が読み取り精度が上がることは間違いないでしょう。
加えて、フォントにも注意が必要です。古い資料に使われているフォントは、現代のフォントと大きく違います。昭和以前の資料などを見てみると、人でも読みづらさを感じるのではないでしょうか。
人が読みづらいものはOCRにも読み取りにくくなるのです。
フォントの違いやレイアウトによって精度が変わるケースがある
前項でも書きましたが、古いフォントだけでなく形のいびつなフォントなども読み取り精度は落ちてしまうと考えた方がよいでしょう。
また、文字の色もOCRの読み取り精度に影響します。白い紙に黄色やピンクの文字など、明るい色は読み取りづらくなります。人が見ても明るい色に明るい文字は読みづらさを感じますよね?
人が見にくいと感じるものはOCRの精度にも同じように反映されます。
加えて、カタログや広報誌など、レイアウト解析が必要な資料はOCRとの相性はあまりよくありません。図や写真、表などがあると、画像補正や詳細なレイアウト設定が必要になるためです。
このようにOCRと相性の悪いフォントや色、レイアウトがあることは覚えておきましょう。
OCRの精度を高める使い方
OCRの精度は、前項で解説した通り資料の古さ、フォントや文字色、レイアウトなどで大きく変わります。
OCRの読み取り精度が年々向上しているとはいえ、毎回100%を達成することは困難です。
そのため、OCRで文書をスキャンする際にはできるだけ認識率を上げるために工夫するべきことがあります。
難しいことではないので、OCRを使用する際には以下の点に注意して取り組んでみましょう。
高解像度でスキャンする
OCRの精度向上のためには、高解像度で文字をスキャンすることが近道です。高解像度にすることで文字がすっきりと見えるようになり、結果的にOCRの読み取り精度も向上します。
ただし、むやみに解像度を上げてしまうとOCRでスキャンする時間や読み取りに時間がかかりすぎて、実用的ではありません。
業務効率化のためにOCRを取り入れているのに、読み取りに長時間かけてしまっては本末転倒ですよね。
OCRの精度と読み取り時間をバランスよく使用するには、200~300dpi程度が適切とされています。
白黒でスキャンする
OCRはカラー文字の認識が苦手なため、書類の文字を白黒でスキャンすることで精度が上がる可能性があります。
しかし、書類にピンクや黄色などの読み取りづらい色が使われている場合、白黒でスキャンすると文字がグレーで読み込まれてしまうことも。
その場合はコントラストを強調するとよいでしょう。コントラストを調整することで、ぼんやりとした文字がくっきりと見え、OCRでも認識しやすくなります。
このように画像編集ソフトを使い、読み取りやすく明るさやコントラストを調整することも重要な工夫の一つです。
紙をまっすぐにする
スキャンする時の書類の向きも、OCRの精度を上げるために重要な要素の一つです。
書類を斜めのままスキャンすると文字をまっすぐに読み取ることができず精度は落ちてしまいます。
そのため、スキャンする際には紙をまっすぐに整頓する、というひと手間が必要です。しかし、スキャンするごとに一枚ずつまっすぐに整える作業は想像以上に手間がかかります。
スキャナーの中には、紙の傾きを自動で補正してくれる機能がついているものもあるため、毎回紙をまっすぐに整える作業に手間を取られたくない場合は、こういった機能を搭載したスキャナーを選んでおくとよいでしょう。まとめて紙を通しても、一枚一枚傾きを補正してくれるため、大きな効率化になります。
AI-OCRとRPAの組み合わせてペーパーレス化の自動化も
AI-OCRとは、AI技術を取り入れたOCRの仕組みのことです。
AIの特長である、機械学習やディープラーニングをOCRに取り入れることによって、これまでOCRの文字認識だけでは読み取りにくかった文字(「ソ」と「ン」など)も、AIで文字の補正結果を学習することで読み取り精度が徐々に向上します。
OCRの読み取り精度は、特に手書き文字において高くなく、実用化するには難しい領域でした。
この課題を解決するのがAI-OCRです。
誤った認識をAIに学習させることで、継続的に精度の向上が見込め、さらには業界用語やさまざまな言語にも対応できるのがAI-OCRのメリットです。
そしてこのAI-OCRとRPAを組み合わせることで、ペーパーレス化を自動化する仕組みを作ることができます。
RPAは、PC上での定型業務を記憶させ自動化する仕組みのことをいいます。
従来のRPAで扱えるものはデジタルデータのみで、紙媒体は対象外でした。
しかし、AI-OCRで紙の媒体からデータ化することで、RPAでのデジタルデータの処理が可能になります。
AI-OCRで紙媒体から高精度で文字を読み取り、データ化されたものの振り分けやシステム間の移動をRPAで自動化することにより、ペーパーレスで業務の自動化が実現できるのです。
まとめ
OCRの精度は年々向上しており、読み取る際の工夫によってさらに精度を上げることは可能です。
また、AI-OCRの導入によって手書き文字や、さまざまな言語、レイアウトの読み取りも可能になるでしょう。
ペーパーレス化の推進のためには、OCRは欠かせない技術です。
そして紙媒体からデータ化するOCRと、PC上での定型業務を自動化するRPAを組み合わせることによって、更なる業務効率化も可能でしょう。