東芝デジタルソリューションズ(旧東芝ソリューション、神奈川県川崎市)は1月31日、非定型文書から必要な項目を探し出して読み取る文字認識サービスを発表した。専用のスキャナ、読み取る位置の事前設定は不要。読み取りたい項目をキーワードとして登録すると、複合機などで作成した紙文書のイメージデータから該当する項目を取得、活字を読み取るという。同日から販売する。
受発注伝票や見積書などのさまざまな書式、レイアウトの非定型文書で利用可能。中でも特に機会が多い「請求書」では、合計金額や請求番号などを主なキーワードとして事前登録済み。「合計金額」「総合計」「御合計」のような言葉の“ゆらぎ”にも対応し、すぐに利用できるとしている。
ログインして続きを読んでください。