SERVICE

書類の文字読み取り自動化

目的
OCR(光学的文字認識)では精度が出ないような画像に対し、文字認識の精度を向上させることで、これまで人の手で行っていた入力作業を自動化し、コストやミスを削減したい。
結果
画像を補正するアルゴリズムを活用し、透かし模様等のノイズに頑健なモデルを構築し精度を向上。これにより入力作業の自動化と人的作業の工数を削減。

従来印字物の読込は、透かし模様などのノイズ、フォーマットがバラバラなどの問題がありOCRの精度に課題があありました。

スキャナーから読み込んだ文書の画像データのレイアウト解析を行い、項目ごとの文字列(活字)を認識して返すアルゴリズムを構築します。画像を補正するアルゴリズムを活用して透かし模様等のノイズに頑健なアルゴリズムを構築することで、OCR(光学的文字認識)では精度が出ないような画像に対しても文字認識精度を向上でき、99%以上の正答率で識別に成功しました。これにより、これまで人の手で行っていた入力作業を自動化し、コストやミスを削減できます。

【文字認識の流れ】
1)画像の読み込み
2)レイアウト解析(画像からテキスト領域を抽出)
3)文字認識(ディープラーニングを活用)
4)認識した文字列のテキストを出力

ディープラーニングによる文字認識システムで、従来手法よりも高い正答率での認識が可能です。

お問い合わせ

ALBERTは、あらゆるデータに高度な分析力で挑み、独自のソリューションでビジネス課題の最適解を導きます。
詳しくは、下記までお問い合わせください。