ドキュメント自動入力AIプラットフォーム
ディープシグマDPAについて
2017/12/1 デジタルフォースシェルパ AI&Analytics 新井 克人
Copyright SIGMAXYZ Inc. all rights reserved. 0
Strictly Confidential/Copyright SIGMAXYZ Inc. all rights reserved. 1
Deep Learningを活用することで従来より遥かに精度の高い、
OCR技術をコアとしたドキュメント運用自動化ソリューション(≒超高級高性能OCR)
ディープシグマDPAとは ~概要
Copyright SIGMAXYZ Inc. all rights reserved. 2
OCRパッケージ・AI-API・DNNのコンペによる技術検証を実施し、
ビジネス・業務・システム要件を満たすことができるソリューションを選択
なぜディープシグマDPAを始めたのか - OCR関連技術検証
ビジネス要件
業務要件
ビジネス要件の明確化
業務要件(最終出力、
目座す精度、レスポン
ス)を検証要件へ反映
プ
ロ
セ
ス
ポ
イ
ン
ト
初期調査 技術検証実施
②
③
検証要件の明確化
①画像補正(入力画像)要件
②レイアウト認識要件
③文字認識要件
④最終出力(項目補正)要件
⑤既存システム連携要件
検証要件の整理
①
④
⑤
OCRパッケージ
AI-API
DL構築
既存システム
①, ②, ③, ④
③
①, ②, ③
④, ⑤
①, ②, ③
各社(OCR、AI-API、
DL)最小限の技術検証
要件に絞り、短期での
技術検証を実施
Copyright SIGMAXYZ Inc. all rights reserved. 3
従来のOCRではフォーマットの座標を特定・設定し、各項目の場所を切り取った上で
文字を認識しており、項目が同じでも座標が異なる場合は別の帳票として扱う
なぜディープシグマDPAを始めたのか - 従来のOCRの方式
★基準座標
● ●
●●
①基準座標からの
距離や座標を基準に
読取箇所を認識
②行・文字の
切り出し
③文字認識
④辞書補正
Deep
Learning
の導入が
遅れてい
るエリア
Copyright SIGMAXYZ Inc. all rights reserved. 4
ベンダー/ユーザー視点の矛盾を解決する新たな顧客協創型のソリューションが必要
なぜディープシグマDPAを始めたのか - 既存OCRパッケージのジレンマ
デ
ー
タ
オープン
1社でも収集可能
クローズ
複数社の協力が必要
ベ
ン
ダ
ー
視
点
ユ
ー
ザ
ー
視
点
機
能
文字認識機能(活字・手書)
1社で教師データの収集が可能
⇒コンペが激化
最終的には技術力があり、かつ
教師データ入手サイクルを築い
たベンダーが勝利する領域
レイアウト認識、辞書補正機能
ベンダー側ではデータ収集が困
難なためユーザー企業の協力
(データ提供)が必須
コンペが激しくてデータが分散
Deep Learningが良く分かって
いない≒自身のデータの価値に
気づいていない
ノンコア領域のため、自身で
ツールを作るのは大変
類似ソリューションが多すぎる
同業他社内で殆ど同じツール選
定作業が繰り返される
顧客協創型の
ソリューションが
必要
Copyright SIGMAXYZ Inc. all rights reserved. 5
業界1stユーザーと共同開発したテンプレートを2nd, 3rdユーザーに従量課金サービ
スを提供することで業界全体での効率化を目指したサービス
ディープシグマDPAの狙い ー サービススキーム概要
顧客 ディープシグマDPA ビジネスパートナー
1stユーザー
Deep Sigma DPA
システム費
システム提供
パートナー
文字認識
RPA BPO
初期費用
システム提供
ロイヤリティ パートナー
アルゴリズム提供
レイアウト認識
文字認識
辞書補正
自動入力
2ndユーザー
利用料金
サービス提供
3rdユーザー
利用料金
サービス提供
ディープシグマDPA 伝票情報処理自動化サービス
Copyright SIGMAXYZ Inc. all rights reserved. 6
Deep Sigma DPAは学習用のデータが数百枚単位で必要なため、フォーマット数が多
く、月間百枚以下の読み取りが必要な業務には別ソリューションを提供
用途に合わせたOCRソリューション
処理枚数 月間1万枚以上 月間数百枚~数千枚
目標精度 手入力を最小限にする 手入力での確認・修正を前提とする
対象帳票 証明書・申込書・レシート 等 請求書・注文書 等
フォーマット 数種に限定 多種類を処理
Copyright SIGMAXYZ Inc. all rights reserved. 7
マイクロソフト社のComputer Visionを活用し、帳票種類・項目・金額を自動認識する
ソリューション
伝票情報処理自動化サービス
Microsoft Azure
Azure Cognitive Services
Computer Vision
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて

ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて

  • 1.
  • 2.
    Strictly Confidential/Copyright SIGMAXYZInc. all rights reserved. 1 Deep Learningを活用することで従来より遥かに精度の高い、 OCR技術をコアとしたドキュメント運用自動化ソリューション(≒超高級高性能OCR) ディープシグマDPAとは ~概要
  • 3.
    Copyright SIGMAXYZ Inc.all rights reserved. 2 OCRパッケージ・AI-API・DNNのコンペによる技術検証を実施し、 ビジネス・業務・システム要件を満たすことができるソリューションを選択 なぜディープシグマDPAを始めたのか - OCR関連技術検証 ビジネス要件 業務要件 ビジネス要件の明確化 業務要件(最終出力、 目座す精度、レスポン ス)を検証要件へ反映 プ ロ セ ス ポ イ ン ト 初期調査 技術検証実施 ② ③ 検証要件の明確化 ①画像補正(入力画像)要件 ②レイアウト認識要件 ③文字認識要件 ④最終出力(項目補正)要件 ⑤既存システム連携要件 検証要件の整理 ① ④ ⑤ OCRパッケージ AI-API DL構築 既存システム ①, ②, ③, ④ ③ ①, ②, ③ ④, ⑤ ①, ②, ③ 各社(OCR、AI-API、 DL)最小限の技術検証 要件に絞り、短期での 技術検証を実施
  • 4.
    Copyright SIGMAXYZ Inc.all rights reserved. 3 従来のOCRではフォーマットの座標を特定・設定し、各項目の場所を切り取った上で 文字を認識しており、項目が同じでも座標が異なる場合は別の帳票として扱う なぜディープシグマDPAを始めたのか - 従来のOCRの方式 ★基準座標 ● ● ●● ①基準座標からの 距離や座標を基準に 読取箇所を認識 ②行・文字の 切り出し ③文字認識 ④辞書補正 Deep Learning の導入が 遅れてい るエリア
  • 5.
    Copyright SIGMAXYZ Inc.all rights reserved. 4 ベンダー/ユーザー視点の矛盾を解決する新たな顧客協創型のソリューションが必要 なぜディープシグマDPAを始めたのか - 既存OCRパッケージのジレンマ デ ー タ オープン 1社でも収集可能 クローズ 複数社の協力が必要 ベ ン ダ ー 視 点 ユ ー ザ ー 視 点 機 能 文字認識機能(活字・手書) 1社で教師データの収集が可能 ⇒コンペが激化 最終的には技術力があり、かつ 教師データ入手サイクルを築い たベンダーが勝利する領域 レイアウト認識、辞書補正機能 ベンダー側ではデータ収集が困 難なためユーザー企業の協力 (データ提供)が必須 コンペが激しくてデータが分散 Deep Learningが良く分かって いない≒自身のデータの価値に 気づいていない ノンコア領域のため、自身で ツールを作るのは大変 類似ソリューションが多すぎる 同業他社内で殆ど同じツール選 定作業が繰り返される 顧客協創型の ソリューションが 必要
  • 6.
    Copyright SIGMAXYZ Inc.all rights reserved. 5 業界1stユーザーと共同開発したテンプレートを2nd, 3rdユーザーに従量課金サービ スを提供することで業界全体での効率化を目指したサービス ディープシグマDPAの狙い ー サービススキーム概要 顧客 ディープシグマDPA ビジネスパートナー 1stユーザー Deep Sigma DPA システム費 システム提供 パートナー 文字認識 RPA BPO 初期費用 システム提供 ロイヤリティ パートナー アルゴリズム提供 レイアウト認識 文字認識 辞書補正 自動入力 2ndユーザー 利用料金 サービス提供 3rdユーザー 利用料金 サービス提供
  • 7.
    ディープシグマDPA 伝票情報処理自動化サービス Copyright SIGMAXYZInc. all rights reserved. 6 Deep Sigma DPAは学習用のデータが数百枚単位で必要なため、フォーマット数が多 く、月間百枚以下の読み取りが必要な業務には別ソリューションを提供 用途に合わせたOCRソリューション 処理枚数 月間1万枚以上 月間数百枚~数千枚 目標精度 手入力を最小限にする 手入力での確認・修正を前提とする 対象帳票 証明書・申込書・レシート 等 請求書・注文書 等 フォーマット 数種に限定 多種類を処理
  • 8.
    Copyright SIGMAXYZ Inc.all rights reserved. 7 マイクロソフト社のComputer Visionを活用し、帳票種類・項目・金額を自動認識する ソリューション 伝票情報処理自動化サービス Microsoft Azure Azure Cognitive Services Computer Vision