SlideShare a Scribd company logo
Copyright © 2019 WingArc1st Inc. All Rights Reserved.
テクニカルセールス部
敦賀 武志
AI-OCR データ化のポイント
~ AI-OCR+記録管理+RPA=MAX(業務効率化) ~
ウイングアーク1st株式会社
#RPALT
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT
紙文書の AI-OCR によるデータ化のポイント
1
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTOCRデータ化に必要なプロセス
2
①文書のスキャン ②読み取りの前処理 ③OCR処理 ④データ連携
OCR
RPA/API/ETL
電子化
(PDF・画像)
自動取込
サイズ調整
回転・傾き補正
OCRデータ化
ファイル保管
データ確認/修正
OCRデータ連携
他システム活用
データ化/活用までの流れ
登録データと
電子化ファイルの
記録管理
⑤記録(文書)管理
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT①文書のスキャン
3
紙
PDFや画像形式で紙文書を電子化
文書の電子化プロセスのポイント
【スキャナ設定】
・解像度
200dpi/300dpi/400dpi (ファイルサイズも考慮)
・階調
カラー/モノクロ(2値またはグレースケール)
・ファイル形式
PDF/画像(TIFF, JPEG, BMPなど)
1枚を1ファイル/複数枚を1ファイル
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT②読み取りの前処理
4
OCR 読み取り前処理で加工調整
OCR 精度を上げるポイント
・印刷やスキャン時の傾き補正
・カメラ撮影時の台形補正
・余白のオフセット補正
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT③OCR 処理(1)
5
OCR
OCR 処理でデータ化
OCRデータ化のポイント①
・ノイズ、罫線、網掛けなど読み取り対象により
読み取り精度に影響
・処理エラーの検知と対応
・完了ファイルの保管方法と運用
数値や文字(英字/ひらがな/カタカナ/漢字)、チェックボックスや
丸囲い等をデータ化
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT
OCRデータ化のポイント②
③OCR 処理(2) 確認修正
6
確認・修正
OCRの読取り精度は100%ではありません!!
・認識率の高い数値やQRコード(バーコード)を利用
・読み間違えの確認、修正の運用を検討
・効率良く確認、修正できる機能が必要
OCR
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT④データ連携
7
データ連携
ERP
Package
マスター
データ
OCR
API
ETL
RPA
OCRデータ連携のポイント
OCR データを必要なシステムに連携して活用
・連携する手段(RPA/API/ETL)を検討
・連携するシステムに合わせてフォーマットを変更
・元データにマスターデータなどの項目を追加
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT⑤記録(文書)管理
8
OCRデータ活用のポイント
OCR 登録データ管理 +記録(文書)管理
システムに登録した記録としてのデータ
OCR
OCR
参照
電子化した文書の記録としてのデータ
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT⑤記録(文書)管理の事例
9
領収書と請求書の電帳法スキャナ保存
領収書
請求書
タイムスタンプ局
中継
Server
基幹
システム
タイムスタンプ付与
決裁・伝票情報登録
ワークフローシステム
伝票登録
申請
アップロード
電子化
WF申請
アップロード
タイムスタンプ付与
WF決裁
バッチ処理
基幹システム連携
(伝票登録)
登録データ管理
+
記録(文書)管理
決裁
バッチ処理
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT⑤記録(文書)管理の事例
10
登録データ管理 +記録(文書)管理の画面
リンクをクリック
保存されているPDFファイルを表示
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT
デモンストレーション
11
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT
AI-OCR 搭載文書管理ツール + RPA = MAX(業務効率化)
12
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTAI-OCR 搭載文書管理ツール SPA
13
文書の自動削除文書の自動取得
本社管理部門支店・支社工場拠点営業部門
文書の検索・回覧・決済
OCR
文書のライフサイクルを管理
作成 ⇒ 処理 ⇒ 保管 ⇒ 保存 ⇒ 廃棄
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTSPA の複数 OCR エンジン:読取項目ごとに選択
ABBYY
1文字ボックスの認識
オンプレ版を提供予定
辞書と文脈判断の機能
複数行の認識
200カ国以上の国で
5,000万人以上が使用
WingArc Data Capture
チェックボックス
丸囲い
活字OCR
手書きOCR
手書きOCR
書 類 を デ ー タ 化 !
OCR読取データを
CSVファイルでダウンロード
14
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTSPA の自動仕分け機能
帳票名 日付
お客様名
請求書
TNS
2015
2016
帳票名で
判断して帳票棚へ
お客様名は
省略名称を利用
注文書
経理部
取り込み用フォルダ
PDFを配置
棚が無ければ自動生成 配置
同 時 に 整 理 !
15
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTSPA の RPA 活用デモンストレーション
16
電子帳票サーバー
自動化されるプロセス
CSV
OCR読取
データ
検索申込書
受領
AI-OCR
自動仕分け
DB
RPA
原本
ウイング
ツアー
OCRデータ
CSV出力
チェック
修正
レビュー
チェック済
未連携
スキャン 検索
出力
データ
入力
入力
データ
登録
登録
連携済フラグ
更新
格納
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT
デモンストレーション
17
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTデータ化プロセスと計測の範囲
18
手入力
SPA
①紙帳票を見なが
らExcelに登録
②紙帳票を見なが
らExcelを確認
①紙帳票を
スキャナでPDF化
②SPA取込
OCR処理
③SPAで
データ修正
④SPAで
データ確認
計測範囲
計測範囲
5ページ
5ページ
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT比較に使用したサンプル帳票A
19
項目 項目数
数字 11
英数字 2
日本語 6
チェック 2
丸囲い 4
DEEP READ使用 19
合計 25
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTデータ化計測結果 サンプルA × 5ページ
20
項目 時間 備考
①紙帳票を見ながらExcelに登録 12分57秒
②紙帳票を見ながらExcelを確認 6分0秒
合計:①+② 18分57秒
■入力方法:手入力
項目 時間 備考
①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作
②SPA取込OCR処理 5秒 タイマー時間+SPAログより
③SPAでデータ修正 6分9秒 OCR認識率は77%
④SPAでデータ確認 4分30秒
合計:①+③+④ 10分39秒 ②は人的工数ではない為、除外
■入力方法:SPA
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALT比較に使用したサンプル帳票B
21
項目 項目数
英数字(鑑) 1
数字(鑑) 1
日本語(鑑) 2
数字(明細×10行) 20※
英数字(明細×10行) 10※
日本語(明細×10行) 10※
合計 44※
※明細10行全てのデータを登録した場合の最大値
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTデータ化計測結果 サンプルB × 5ページ
22
項目 時間 備考
①紙帳票を見ながらExcelに登録 9分53秒
②紙帳票を見ながらExcelを確認 3分12秒
合計:①+② 13分5秒
■入力方法:手入力
項目 時間 備考
①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作
②SPA取込OCR処理 5秒 タイマー時間+SPAログより
③SPAでデータ修正 6分 OCR認識率は63%
④SPAでデータ確認 2分30秒
合計:①+③+④ 8分30秒 ②は人的工数ではない為、除外
■入力方法:SPA
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTサンプル帳票A コスト比較
23
項目 手入力 SPA 備考
① 5ページ登録確認の
時間(上段)とコスト(下段)
18分57秒
約660円
10分39秒
約370円
5ページで125フィールド
② 1フィールド毎の登録確認の
時間(上段)とコスト(下段)
9.1秒
約5.27円
5.1秒
約2.95円
③ 500ページ登録確認の
時間(上段)とコスト(下段)
31時間35分
約66,000円
17時間45分
約37,000円
約14時間(45%)
の作業時間削減
④ 1000ページ登録確認の
時間(上段)とコスト(下段)
63時間10分
約132,000円
35時間30分
約74,000円
約28時間(44%)
の作業時間削減
⑤ 2500ページ登録確認の
時間(上段)とコスト(下段)
157時間55分
約330,000円
88時間45分
約185,000円
約77時間(49%)
の作業時間削減
⑥ 5000ページ登録確認の
時間(上段)とコスト(下段)
315時間50分
約660,000円
177時間30分
約370,000円
約138時間(44%)
の作業時間削減
人的コストは時給2,100円(0.58円/1秒)で計算 ※1
※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成
29年度派遣労働者平均料金である 16,482円 を元に算出しています。
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTサンプル帳票 B コスト比較
24
項目 手入力 SPA 備考
① 5ページ登録確認の
時間(上段)とコスト(下段)
13分5秒
約455円
8分30秒
約295円
5ページで80フィールド
② 1フィールド毎の登録確認の
時間(上段)とコスト(下段)
9.8秒
約5.68円
6.3秒
約3.65円
③ 500ページ登録確認の
時間(上段)とコスト(下段)
21時間50分
約45,500円
14時間10分
約29,500円
約7時間(33%)
の作業時間削減
④ 1000ページ登録確認の
時間(上段)とコスト(下段)
43時間40分
約91,000円
28時間20分
約59,000円
約13時間(30%)
の作業時間削減
⑤ 2500ページ登録確認の
時間(上段)とコスト(下段)
109時間10分
約227,500円
70時間50分
約147,500円
約39時間(36%)
の作業時間削減
⑥ 5000ページ登録確認の
時間(上段)とコスト(下段)
218時間20分
約455,000円
141時間40分
約295,000円
約77時間(35%)
の作業時間削減
人的コストは時給2,100円(0.58円/1秒)で計算 ※1
※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成
29年度派遣労働者平均料金である 16,482円 を元に算出しています。
Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved.
#RPALTまとめ
25
AI-OCR
++
記録管理
RPA =
MAX(業務効率化)
人生を豊かに幸せにする
Copyright © 2019 WingArc1st Inc. All Rights Reserved.
Copyright © 2017 WingArc1st, Inc. All Rights Reserved.
go way beyond
ご清聴ありがとうございました!
#RPALT

More Related Content

What's hot

LiBRA 06.2021 / DX
LiBRA 06.2021 / DXLiBRA 06.2021 / DX
LiBRA 06.2021 / DX
Masanori Saito
 
LiBRA 06.2021 / クラウドコンピューティング
LiBRA 06.2021 / クラウドコンピューティングLiBRA 06.2021 / クラウドコンピューティング
LiBRA 06.2021 / クラウドコンピューティング
Masanori Saito
 
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータ
Masanori Saito
 
LiBRA 11.2020 / インフラとプラットフォーム
LiBRA 11.2020 / インフラとプラットフォームLiBRA 11.2020 / インフラとプラットフォーム
LiBRA 11.2020 / インフラとプラットフォーム
Masanori Saito
 
LiBRA 09.2020 / インフラとプラットフォーム
LiBRA 09.2020 / インフラとプラットフォームLiBRA 09.2020 / インフラとプラットフォーム
LiBRA 09.2020 / インフラとプラットフォーム
Masanori Saito
 
LiBRA 10.2020 / 開発と運用
LiBRA 10.2020 / 開発と運用LiBRA 10.2020 / 開発と運用
LiBRA 10.2020 / 開発と運用
Masanori Saito
 

What's hot (6)

LiBRA 06.2021 / DX
LiBRA 06.2021 / DXLiBRA 06.2021 / DX
LiBRA 06.2021 / DX
 
LiBRA 06.2021 / クラウドコンピューティング
LiBRA 06.2021 / クラウドコンピューティングLiBRA 06.2021 / クラウドコンピューティング
LiBRA 06.2021 / クラウドコンピューティング
 
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータ
 
LiBRA 11.2020 / インフラとプラットフォーム
LiBRA 11.2020 / インフラとプラットフォームLiBRA 11.2020 / インフラとプラットフォーム
LiBRA 11.2020 / インフラとプラットフォーム
 
LiBRA 09.2020 / インフラとプラットフォーム
LiBRA 09.2020 / インフラとプラットフォームLiBRA 09.2020 / インフラとプラットフォーム
LiBRA 09.2020 / インフラとプラットフォーム
 
LiBRA 10.2020 / 開発と運用
LiBRA 10.2020 / 開発と運用LiBRA 10.2020 / 開発と運用
LiBRA 10.2020 / 開発と運用
 

Similar to AI-OCRデータ化のポイント

株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明
株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明
株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明
株式会社ダブルスタンダード
 
AI-OCR 導入最前線 (AI inside)
AI-OCR 導入最前線 (AI inside)AI-OCR 導入最前線 (AI inside)
AI-OCR 導入最前線 (AI inside)
Shotaro Umeda
 
Pactera RPA Solution Introduction (JP)
Pactera RPA Solution Introduction (JP)Pactera RPA Solution Introduction (JP)
Pactera RPA Solution Introduction (JP)
Taro Nishimaki
 
AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方
Shota Suzuki
 
【A-4】kintone API、JavaScript APIの実力
【A-4】kintone API、JavaScript APIの実力【A-4】kintone API、JavaScript APIの実力
【A-4】kintone API、JavaScript APIの実力
Cybozucommunity
 
APIに関するセッション資料
APIに関するセッション資料APIに関するセッション資料
APIに関するセッション資料
CData Software Japan
 
SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」
SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」
SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」
MasashiOtsuka1
 
現場のインフラエンジニアから見たヤフー #ヤフー名古屋
現場のインフラエンジニアから見たヤフー #ヤフー名古屋現場のインフラエンジニアから見たヤフー #ヤフー名古屋
現場のインフラエンジニアから見たヤフー #ヤフー名古屋
Yahoo!デベロッパーネットワーク
 
Tokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by IidaTokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by Iida
Hidenori Fujioka
 
JANOG35_RPKIやってみませんか? 20150120
JANOG35_RPKIやってみませんか? 20150120JANOG35_RPKIやってみませんか? 20150120
JANOG35_RPKIやってみませんか? 20150120
Osamu Kurokochi
 
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
Daisuke Ikeda
 
AI OCR AISpect製品概要
AI OCR AISpect製品概要AI OCR AISpect製品概要
AI OCR AISpect製品概要
ASAHI Accounting Robot 研究所
 
20190810
2019081020190810
20190810
DaiNagase1
 
Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)
Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)
Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)
Kazuya Sugimoto
 
RPAで実現させる創造的企業改革
RPAで実現させる創造的企業改革RPAで実現させる創造的企業改革
RPAで実現させる創造的企業改革
株式会社シーエーシー RPAソリューション
 
20160527_06_Azure Certified for IoT for 共創ラボ
20160527_06_Azure Certified for IoT for 共創ラボ20160527_06_Azure Certified for IoT for 共創ラボ
20160527_06_Azure Certified for IoT for 共創ラボ
IoTビジネス共創ラボ
 
20210217_sitTokyo_SAPでIoTやってみた
20210217_sitTokyo_SAPでIoTやってみた20210217_sitTokyo_SAPでIoTやってみた
20210217_sitTokyo_SAPでIoTやってみた
MasashiOtsuka1
 
Api and rpa_seminar_april20_osaka
Api and rpa_seminar_april20_osakaApi and rpa_seminar_april20_osaka
Api and rpa_seminar_april20_osaka
Yuki Hayakawa
 
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会 海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
IoTビジネス共創ラボ
 
20180319 ccon sync kintone
20180319 ccon sync kintone20180319 ccon sync kintone
20180319 ccon sync kintone
CData Software Japan
 

Similar to AI-OCRデータ化のポイント (20)

株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明
株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明
株式会社ダブルスタンダードの各種サービスに関するOCR処理技術基盤説明
 
AI-OCR 導入最前線 (AI inside)
AI-OCR 導入最前線 (AI inside)AI-OCR 導入最前線 (AI inside)
AI-OCR 導入最前線 (AI inside)
 
Pactera RPA Solution Introduction (JP)
Pactera RPA Solution Introduction (JP)Pactera RPA Solution Introduction (JP)
Pactera RPA Solution Introduction (JP)
 
AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方
 
【A-4】kintone API、JavaScript APIの実力
【A-4】kintone API、JavaScript APIの実力【A-4】kintone API、JavaScript APIの実力
【A-4】kintone API、JavaScript APIの実力
 
APIに関するセッション資料
APIに関するセッション資料APIに関するセッション資料
APIに関するセッション資料
 
SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」
SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」
SAP Inside Track 2018 LT資料「ABAPerが触ってきた SAP Cloud PlatformのABAP環境 」
 
現場のインフラエンジニアから見たヤフー #ヤフー名古屋
現場のインフラエンジニアから見たヤフー #ヤフー名古屋現場のインフラエンジニアから見たヤフー #ヤフー名古屋
現場のインフラエンジニアから見たヤフー #ヤフー名古屋
 
Tokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by IidaTokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by Iida
 
JANOG35_RPKIやってみませんか? 20150120
JANOG35_RPKIやってみませんか? 20150120JANOG35_RPKIやってみませんか? 20150120
JANOG35_RPKIやってみませんか? 20150120
 
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
 
AI OCR AISpect製品概要
AI OCR AISpect製品概要AI OCR AISpect製品概要
AI OCR AISpect製品概要
 
20190810
2019081020190810
20190810
 
Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)
Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)
Java クライント実装におけるAPIスタイル頂上決戦! 野良REST vs GraphQL vs OData vs OpenAPI (Swagger)
 
RPAで実現させる創造的企業改革
RPAで実現させる創造的企業改革RPAで実現させる創造的企業改革
RPAで実現させる創造的企業改革
 
20160527_06_Azure Certified for IoT for 共創ラボ
20160527_06_Azure Certified for IoT for 共創ラボ20160527_06_Azure Certified for IoT for 共創ラボ
20160527_06_Azure Certified for IoT for 共創ラボ
 
20210217_sitTokyo_SAPでIoTやってみた
20210217_sitTokyo_SAPでIoTやってみた20210217_sitTokyo_SAPでIoTやってみた
20210217_sitTokyo_SAPでIoTやってみた
 
Api and rpa_seminar_april20_osaka
Api and rpa_seminar_april20_osakaApi and rpa_seminar_april20_osaka
Api and rpa_seminar_april20_osaka
 
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会 海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
 
20180319 ccon sync kintone
20180319 ccon sync kintone20180319 ccon sync kintone
20180319 ccon sync kintone
 

AI-OCRデータ化のポイント

  • 1. Copyright © 2019 WingArc1st Inc. All Rights Reserved. テクニカルセールス部 敦賀 武志 AI-OCR データ化のポイント ~ AI-OCR+記録管理+RPA=MAX(業務効率化) ~ ウイングアーク1st株式会社 #RPALT
  • 2. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT 紙文書の AI-OCR によるデータ化のポイント 1
  • 3. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTOCRデータ化に必要なプロセス 2 ①文書のスキャン ②読み取りの前処理 ③OCR処理 ④データ連携 OCR RPA/API/ETL 電子化 (PDF・画像) 自動取込 サイズ調整 回転・傾き補正 OCRデータ化 ファイル保管 データ確認/修正 OCRデータ連携 他システム活用 データ化/活用までの流れ 登録データと 電子化ファイルの 記録管理 ⑤記録(文書)管理
  • 4. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT①文書のスキャン 3 紙 PDFや画像形式で紙文書を電子化 文書の電子化プロセスのポイント 【スキャナ設定】 ・解像度 200dpi/300dpi/400dpi (ファイルサイズも考慮) ・階調 カラー/モノクロ(2値またはグレースケール) ・ファイル形式 PDF/画像(TIFF, JPEG, BMPなど) 1枚を1ファイル/複数枚を1ファイル
  • 5. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT②読み取りの前処理 4 OCR 読み取り前処理で加工調整 OCR 精度を上げるポイント ・印刷やスキャン時の傾き補正 ・カメラ撮影時の台形補正 ・余白のオフセット補正
  • 6. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT③OCR 処理(1) 5 OCR OCR 処理でデータ化 OCRデータ化のポイント① ・ノイズ、罫線、網掛けなど読み取り対象により 読み取り精度に影響 ・処理エラーの検知と対応 ・完了ファイルの保管方法と運用 数値や文字(英字/ひらがな/カタカナ/漢字)、チェックボックスや 丸囲い等をデータ化
  • 7. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化のポイント② ③OCR 処理(2) 確認修正 6 確認・修正 OCRの読取り精度は100%ではありません!! ・認識率の高い数値やQRコード(バーコード)を利用 ・読み間違えの確認、修正の運用を検討 ・効率良く確認、修正できる機能が必要 OCR
  • 8. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT④データ連携 7 データ連携 ERP Package マスター データ OCR API ETL RPA OCRデータ連携のポイント OCR データを必要なシステムに連携して活用 ・連携する手段(RPA/API/ETL)を検討 ・連携するシステムに合わせてフォーマットを変更 ・元データにマスターデータなどの項目を追加
  • 9. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT⑤記録(文書)管理 8 OCRデータ活用のポイント OCR 登録データ管理 +記録(文書)管理 システムに登録した記録としてのデータ OCR OCR 参照 電子化した文書の記録としてのデータ
  • 10. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT⑤記録(文書)管理の事例 9 領収書と請求書の電帳法スキャナ保存 領収書 請求書 タイムスタンプ局 中継 Server 基幹 システム タイムスタンプ付与 決裁・伝票情報登録 ワークフローシステム 伝票登録 申請 アップロード 電子化 WF申請 アップロード タイムスタンプ付与 WF決裁 バッチ処理 基幹システム連携 (伝票登録) 登録データ管理 + 記録(文書)管理 決裁 バッチ処理
  • 11. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT⑤記録(文書)管理の事例 10 登録データ管理 +記録(文書)管理の画面 リンクをクリック 保存されているPDFファイルを表示
  • 12. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 11
  • 13. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール + RPA = MAX(業務効率化) 12
  • 14. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTAI-OCR 搭載文書管理ツール SPA 13 文書の自動削除文書の自動取得 本社管理部門支店・支社工場拠点営業部門 文書の検索・回覧・決済 OCR 文書のライフサイクルを管理 作成 ⇒ 処理 ⇒ 保管 ⇒ 保存 ⇒ 廃棄
  • 15. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTSPA の複数 OCR エンジン:読取項目ごとに選択 ABBYY 1文字ボックスの認識 オンプレ版を提供予定 辞書と文脈判断の機能 複数行の認識 200カ国以上の国で 5,000万人以上が使用 WingArc Data Capture チェックボックス 丸囲い 活字OCR 手書きOCR 手書きOCR 書 類 を デ ー タ 化 ! OCR読取データを CSVファイルでダウンロード 14
  • 16. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTSPA の自動仕分け機能 帳票名 日付 お客様名 請求書 TNS 2015 2016 帳票名で 判断して帳票棚へ お客様名は 省略名称を利用 注文書 経理部 取り込み用フォルダ PDFを配置 棚が無ければ自動生成 配置 同 時 に 整 理 ! 15
  • 17. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTSPA の RPA 活用デモンストレーション 16 電子帳票サーバー 自動化されるプロセス CSV OCR読取 データ 検索申込書 受領 AI-OCR 自動仕分け DB RPA 原本 ウイング ツアー OCRデータ CSV出力 チェック 修正 レビュー チェック済 未連携 スキャン 検索 出力 データ 入力 入力 データ 登録 登録 連携済フラグ 更新 格納
  • 18. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 17
  • 19. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTデータ化プロセスと計測の範囲 18 手入力 SPA ①紙帳票を見なが らExcelに登録 ②紙帳票を見なが らExcelを確認 ①紙帳票を スキャナでPDF化 ②SPA取込 OCR処理 ③SPAで データ修正 ④SPAで データ確認 計測範囲 計測範囲 5ページ 5ページ
  • 20. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT比較に使用したサンプル帳票A 19 項目 項目数 数字 11 英数字 2 日本語 6 チェック 2 丸囲い 4 DEEP READ使用 19 合計 25
  • 21. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTデータ化計測結果 サンプルA × 5ページ 20 項目 時間 備考 ①紙帳票を見ながらExcelに登録 12分57秒 ②紙帳票を見ながらExcelを確認 6分0秒 合計:①+② 18分57秒 ■入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分9秒 OCR認識率は77% ④SPAでデータ確認 4分30秒 合計:①+③+④ 10分39秒 ②は人的工数ではない為、除外 ■入力方法:SPA
  • 22. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALT比較に使用したサンプル帳票B 21 項目 項目数 英数字(鑑) 1 数字(鑑) 1 日本語(鑑) 2 数字(明細×10行) 20※ 英数字(明細×10行) 10※ 日本語(明細×10行) 10※ 合計 44※ ※明細10行全てのデータを登録した場合の最大値
  • 23. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTデータ化計測結果 サンプルB × 5ページ 22 項目 時間 備考 ①紙帳票を見ながらExcelに登録 9分53秒 ②紙帳票を見ながらExcelを確認 3分12秒 合計:①+② 13分5秒 ■入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分 OCR認識率は63% ④SPAでデータ確認 2分30秒 合計:①+③+④ 8分30秒 ②は人的工数ではない為、除外 ■入力方法:SPA
  • 24. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTサンプル帳票A コスト比較 23 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 18分57秒 約660円 10分39秒 約370円 5ページで125フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.1秒 約5.27円 5.1秒 約2.95円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 31時間35分 約66,000円 17時間45分 約37,000円 約14時間(45%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 63時間10分 約132,000円 35時間30分 約74,000円 約28時間(44%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 157時間55分 約330,000円 88時間45分 約185,000円 約77時間(49%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 315時間50分 約660,000円 177時間30分 約370,000円 約138時間(44%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
  • 25. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTサンプル帳票 B コスト比較 24 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 13分5秒 約455円 8分30秒 約295円 5ページで80フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.8秒 約5.68円 6.3秒 約3.65円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 21時間50分 約45,500円 14時間10分 約29,500円 約7時間(33%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 43時間40分 約91,000円 28時間20分 約59,000円 約13時間(30%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 109時間10分 約227,500円 70時間50分 約147,500円 約39時間(36%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 218時間20分 約455,000円 141時間40分 約295,000円 約77時間(35%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
  • 26. Copyright © 2019 WingArc1st Inc. All Rights Reserved.Copyright © 2019 WingArc1st Inc. All Rights Reserved. #RPALTまとめ 25 AI-OCR ++ 記録管理 RPA = MAX(業務効率化) 人生を豊かに幸せにする
  • 27. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright © 2017 WingArc1st, Inc. All Rights Reserved. go way beyond ご清聴ありがとうございました! #RPALT