AIの取り組み.pdf

生成系AIの
センテンスジェネレーションを
業務効率化の実現手段として
検討した経緯をご紹介
ＳＢＳ情報システム
公共事業本部
土屋明生

2つの取り組み
１つ目：（今回の話題）
業務ドキュメント検索システムの取り組み
・目的：部署全体の工数削減
2つ目：（今回は未記載）
類似画像グルーピングシステム（仮称）の取り組み
・似通った画像の類似度を計算しグルーピングする
⇒ CNNとDNNを両方試したが、何故か成果が出せない

マニュアル
データファイル
（ＷＯＲＤ等）
各お客様との
対応履歴
マニュアル
各お客様との
対応履歴
こんなことはありませんか？
システムAの
エキスパート
システムBの
エキスパート
受付担当者
システムCとDのエキスパートは、
お客様002に出向き打合せ中
お客様001から
システムAと
システムCの
緊急問合せを受付
スライド１
現時点の社内リソース

マニュアル
各お客様との対応履歴
こんなことできたらいいな
受付担当者
各エキスパートは専門業務
に専任出来る
・お客様との打合せ
・システム開発
・ドキュメント更新
お客様001からシステムAと
システムCの緊急問合せ
マニュアル
各お客様との対応履歴
全システムの情報
スライド２

最初に試した大雑把なフロー
マニュアル
TEXT
抽出
ＯＣＲ
TEXT
Cleaning TEXT Files 大雑把な
要約 text
Vector
Store
作成API
平文のドキュメント
（idは一つ）
LLM
OpenAI
API利用
スライド３

初期スクラッチのエッセンス
import openai
# OpenAI APIキーを設定----------------------------------------------
openai.api_key = 'sk-*********************'
# ドキュメントの登録関数--------------------------------------------
def upload_document(file_path):
with open(file_path, 'rb') as file:
response = openai.File.create(file=file)
document_id = response['id']
return document_id
# ドキュメントの検索関数--------------------------------------------
def search_document(query, documents):
response = openai.Answer.create(
search_model="davinci",
model="davinci",
question=query,
documents=documents,
examples_context=query
)
return response['answers'][0]['document']
# ドキュメントのファイルパス----------------------------------------
document_path = '*************************/document.txt'
# ドキュメントを登録する----------------------------------
document_id = upload_document(document_path)
# 検索するクエリ（質問）を定義--------------------------------------
search_query = '「XXXをｏｏｏしたいが、どうしたらよいでしょうか？」'
# ドキュメントを検索する--------------------------------------------
search_result = search_document(search_query, [document_id])
# 検索結果を出力する------------------------------------------------
print(search_result)
最初スクラッチで記述したソースの抜粋
まともには、動きませんでした。
スライド４
平文のドキュメント
（idは一つ）

変更後の大雑把なフロー
マニュアル
TEXT
抽出
ＯＣＲ
TEXT
Cleaning TEXT Files 大雑把な
要約 text
登録textの
最適化処理
Vector
Store
作成API
Vector Store
最適化された
登録ドキュメント
LLM
OpenAI
API利用
スライド５

変更したスクラッチのエッセンス
import openai
# OpenAI APIの設定--------------------------------------------------
openai.api_key = 'sk-*********************'
# ドキュメントの登録------------------------------------------------
def register_documents(documents):
examples = []
for doc in documents:
examples.append({'document': doc['content'], 'metadata': doc['id']})
openai.Answer.create(
examples=examples,
documents=documents
)
# ドキュメントの検索と回答------------------------------------------
def search_documents(query, documents):
search_results = openai.Search.create(
query=query
)
top_result = search_results['data'][0]['document']
answer = ""
for doc in documents:
if doc['id'] == top_result['metadata']:
answer = doc['content']
break
return answer
# ドキュメントを最適化して登録する（簡易的なVector Store）----------
documents = [
{'id': 'doc1', 'content': 'これはドキュメント1です。'},
]
register_documents(documents)
# 質問文------------------------------------------------------------
query = "ドキュメント2について教えて。"
# ドキュメントを検索する--------------------------------------------
answer = search_documents(query, documents)
# 回答を表示する----------------------------------------------------
print(answer)
・ドキュメント登録時にカテゴリ分けして、
最適化したテキストデータ登録を行う。
・登録内容を意識した質問文を作成すると、
回答が得られた。
メリット：僅かながら改善がみられる
デメリット：データ作成に手間がかかる
※：データ登録数が一定程度ないと
回答が行われない
大雑把な
要約 text
textを最適化
スライド６

OpenAI API
一般的な概念図（まだ未実装）
Vector
Store
Add Vector
API
質問入力
回答表示
LLM1
LLM2
LLM3
Query
Document
Files
Text
Files
JSON
Files
Text
Cleaning
Text
Indexing
FineTuning
Enbedding
LLM1-i/f
LLM2-i/f
LLM3-i/f
スライド７

OpenAI API
教育現場で求められる概念図
Vector
Store
質問入力
回答表示
LLM1
LLM2
LLM3
Query
JSON
Files２
JSON
Files１
JSON
Files３
JSON
Files4
物
化
地
生
関連項目１
関連項目２
関連項目３
関連項目４
物
化
地
生物学的な
回答を主に
表示
関連内容を
少し表示
データの登録や
作成方法に工夫
が必要
ダッシュボードをイメージ
Vector Storeに極力登録を行い、外部LLMの依存度を
下げる事で、有害コンテンツが表示される可能性を、
下げる効果が期待できると思われる。
スライド８
［物］［化］［地］［生］が、各関連業務名に変わるだけで、ビジネスの現場でも同じことが求められる。

OpenAI API
使い続ける為にはメンテが大切！！
Vector
Store
質問入力回答表示
Query
JSON
Files
新規追加情報
苦労して作成した仕組やデータを使い続ける為には、メンテナンスが不可欠。
データ削除
API
新機能追加や、不要な機能の削除等により、Vector Storeの登録情報を調整する。
LLM1
LLM2
LLM3
削除
データ
データ追加
API
スライド９

AIの取り組み.pdf

Recommended

Recommended

More Related Content

Similar to AIの取り組み.pdf

Similar to AIの取り組み.pdf (20)

More from KunihiroSugiyama1

More from KunihiroSugiyama1 (12)

Recently uploaded

Recently uploaded (8)

AIの取り組み.pdf