従来印字物の読込は、透かし模様などのノイズ、フォーマットがバラバラなどの問題がありOCRの精度に課題がありました。
スキャナーから読み込んだ文書の画像データのレイアウト解析を行い、項目ごとの文字列(活字)を認識して返すアルゴリズムを構築します。画像を補正するアルゴリズムを活用して透かし模様等のノイズに頑健なアルゴリズムを構築することで、OCR(光学的文字認識)では精度が出ないような画像に対しても文字認識精度を向上でき、99%以上の正答率で識別に成功しました。これにより、これまで人の手で行っていた入力作業を自動化し、コストやミスを削減できます。
ディープラーニングによる文字認識システムで、従来手法よりも高い正答率での認識が可能です。