IBM ミドルウェア・ユーザー研究会
Japan IBM Middleware User
Community (JIMUC)
新春オープンセミナー
生成AI 分科会
中間報告
2025年2月28日
1
IBM ミドルウェア・ユーザー研究会
• 生成 AI 分科会-参加者
• 開催日程/開催方法
• UAP支援システムの実装について
• 生成AIモデルランキング
• DeepSeek R1について
• RAGの3形態(demo)について
生成AI 分科会 中間報告 Agenda
IBM ミドルウェア・ユーザー研究会
生成 AI 分科会-参加者
キックオフ (9/04) 15名
10月度 (10/2) 13 名
11月度 (11/6) 11 名
12月度 (12/4) 10 名
1月度 (1/8) 11 名
2月度 (2/5) 11 名
3月度 (3/5)
4月度
5月度
6月度
7社 19名+事務局参加
2024 年度
生成AI分科会 2024年度 参加 Box
JIMUC
Comm
Teams
担当理事 エレメンタムコンサルティング 増田 和紀 1 OK 1 OK
エクシオ・デジタルソリューションズ株式会社 吉村 和記 1 NG 1 N/A
吉村 和記 OK OK
エクシオ・デジタルソリューションズ株式会社 福原 翔 1 NG N/A
福原 翔 OK OK
ENEOSリニューアブル・エナジー株式会社 塚田 光樹 1 OK
ENEOSリニューアブル・エナジー株式会社
翟 含章(タク ハ
ンショウ)
1 OK
エレメンタムコンサルティング 増田 はるか 1 OK Inv OK
理事 株式会社オプロ 石川 忠宏 1 OK 1 OK
Leader 株式会社 ソルパック 細田 和憲 1 OK 1 OK
株式会社 ソルパック 山口 和馬 1 OK OK
株式会社 ソルパック 近藤 拓人 1 OK 1 OK
株式会社 ソルパック 相木 翼 1 OK OK
株式会社ライトウェル 水田 圭 1 OK OK
株式会社ライトウェル 津崎 洋平 1 OK OK
株式会社ライトウェル 小泉 祐貴 1 OK OK
株式会社ライトウェル 玉木 学 1 OK OK
理事 リコーITソリューションズ(株) 江戸 栄一 1 OK 1 OK
Sub-LeaderリコーITソリューションズ(株) 山口 貴久 1 OK OK
リコーITソリューションズ(株) 榎本 由伸 1 OK OK
リコーITソリューションズ(株) 石塚 直満 1 OK 1 OK
KPR 稲見 千賀子 1 OK 1 OK
2024年度 分科会メンバー
7社 19 ∔ 事務局
IBM ミドルウェア・ユーザー研究会
開催日程/開催方法
9月 10月 11月 12月 1月 2月 3月 4月 5月 6月 7月
分科会
日程
第3水曜日
■9/4
キックオフ
→Zoom
■10/2
第2回
→Zoom
■11/6
第3回
→Zoom
■12/4
第4回
→Zoom
■1/8
第5回
→Zoom
■2/5
第6回
→Zoom
■2/28
新春オー
プンセミ
ナー
■3/5
第7回
→Zoom
■4/X
第8回
→Zoom
■5/X
第9回
→Zoom
■6/X
第10回
→Zoom
■7/X
総会
進め方
・本年度
のテーマに
ついて討
議
・多段階
ステップに
よる応答
の課題と
対応
・多段階
ステップに
よる応答
の課題と
対応
・GPT4-
orealtime
api
・ハルシ
ネーション
への対応
CRAG
Guardrail
・ハルシ
ネーション
への対応
Graph
RAG
・Partner
World
2025
DeepSee
k R1
・ハルシネー
ションへの
対応
・Grok3
.Deep
Search
・ハルシ
ネーション
への対応
GraphR
AG
・ハルシ
ネーション
への対応
GraphR
AG
具体的
取組討議
成果
発表
中間
発表
IBM ミドルウェア・ユーザー研究会
• ユーザアプリケーション
• ERP
• CRM
• 生産管理システム
• 資産管理システム(maximo)
• コールセンターシステム
• 事故情報管理システム
• Etc…
UAP支援システムの実装について
UAP
ユーザ
アプリケーション
UAP支援システム
• UAP支援システム(応答システム)
• UAPの資産をベクトル化
• UAPのDBに対しSQLでアクセス
• UAPに対する複雑な問い合わせ
• UAPに対しリアルタイムな音声による
UAP支援システム開発の課題を上げ、それに対する解決策を討議しています。
RAGのあり方、そしてハルシネーションの対応について、継続して討議をしています。
IBM ミドルウェア・ユーザー研究会
• LLM戦国時代
• OpenAI GPTのリリースによって始まった。
• Azure OpenAI Serviceで企業利用が始まった。
• Google Geminiが参入
• xAI Grockが参入
• DeepSeek R1の登場
生成AIのモデルについて
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング 2024/9/1
Meta-Llama-3.1はコミュニティーライセンスなので、オープンソースであり、自ら
サーバを立てれば、無料でかつ、オンプレミスで、使用することができる。
Grok-2 は、いきなり2位に登場、イーロンマスクのxAIで有料版のみ
GPT-4o miniは、GPT-3.5より安価で早く、画像も扱える。Azureでも提供さ
れている。
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング2024/10/1
また、入れ替わりました。最新のOpenAI社のo1-previewが首位です。
OpenAI社のo1-miniも3位に入っています。
9/25(水)にリリースされた、MetaのLlama 3.2は、まだランキングに入っていませ
ん。
OpenAI社のGPT-4o-miniは安価なので、私たちも使用しています。
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング2024/11/6
o1-previewとGPT-4oが入れ替わっただけで、あまり変わりはありません。
一位から三位までは、変わらず、OpenAIのモデルです。
yi-lightningは、01.AIという北京にある中国企業のモデルです。
初めて入ってきました。その後聞きません。
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング2024/12/3
前月に続き、ChatGPT-4o-latest (2024-11-20)が、一位です。前月は、
(2024-09-03)ですので、かなり、細かくバージョンアップしていることが分かります。
Gemini-Exp-1121とGemini-Exp-1114も新たに、リリースされたものです。
GoogleとOpenAIで首位争いになっています。
Gemini-Exp-1121は、ほとんど、 ChatGPT-4o-latestとかわらず、一位で
す。
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング2025/1/8
前月リリースされたGemini-Exp-1206がChatGPT-4o-latest (2024-11-
20)を抜いて、また一位になりました。
先月は、気が付きませんでしたが、DeepSeek V3が9位にランキングされていました。
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング2025/2/4
DeepSeek R1は、1/20(月)に発表され、OpenAIのo1を超え、3位につけ
ています。単にランクが高いだけでなく、オープンソースであることが、重要です。
1位から3位まで、OpenAIを抑えて、Google Geminiが独占しています。
IBM ミドルウェア・ユーザー研究会
生成AI 関連情報共有:生成AIモデルランキング2025/2/24
Grock3が、いきなり一位になりました。イーロンマスクのxAIのLLMです。
Xで利用可能です。
“Grok 3は、xAIが開発した最新の対話型AIモデルで、2025年2月18日
に発表され、推論機能を備えています。イーロン・マスク氏が「地球上で最も賢
いAI」と評するこのモデルは、人間の科学的発見を加速させることを目的として
おり、従来のモデルを大きく超える性能を持っています。” Grok 3より
IBM ミドルウェア・ユーザー研究会
OpenAIの「o1」モデルとDeepSeekの「R1」モデルは、どちらも高度な推論能力を持つ大規模言語モデル(LLM)ですが、コスト面で大きな違いが
あります。以下に、両モデルのコストを比較し、それぞれの特徴を詳しく解説します。
| **項目** | **OpenAI o1** | **DeepSeek R1** |
|-------------------------|---------------------------------------|---------------------------------------|
| **入力トークン単価** | $15.00 / 100万トークン[16][21][32]| $0.55 / 100万トークン(キャッシュミス時)[8][29][31] |
| **出力トークン単価** | $60.00 / 100万トークン[16][21][32] | $2.19 / 100万トークン(キャッシュミス時)[8][29][31] |
| **コスト削減率** | - | OpenAI o1の約95%削減[8][9][31] |
| **月額利用料** | $200(Proプラン)[19][24] | 無料または非常に低価格(条件付き)[34] |
#### **1. OpenAI o1のコスト**
- OpenAI o1は、1百万トークンあたり入力で$15.00、出力で$60.00と高額な料金設定です[16][21][32]。
- 高性能な推論能力を提供する一方で、コストが高いため、特に中小企業や個人開発者にとっては利用のハードルが高いとされています[6][16]。
#### **2. DeepSeek R1のコスト**
- DeepSeek R1は、入力トークンあたり$0.55、出力トークンあたり$2.19と、OpenAI o1に比べて非常に低コストです[8][29][31]。
- この価格設定により、OpenAI o1と同等の性能を持ちながら、最大で95%のコスト削減を実現しています[8][9][31]。
- また、オープンソースとして提供されており、自由に利用・改変が可能な点も大きな特徴です[8][9]。
DeepSeek R1について(コスト比較)
Felo.aiのAI Search検索結果
IBM ミドルウェア・ユーザー研究会
#### **3. コストパフォーマンスの違い**
- DeepSeek R1は、コストパフォーマンスにおいて圧倒的な優位性を持っています。特に、API利用料金がOpenAI o1のわずか2~5%程度である
ため、予算が限られているプロジェクトや企業にとって魅力的な選択肢となります[8][26][31]。
- 一方、OpenAI o1はその高い信頼性と広範なサポート体制が強みであり、大規模な商用プロジェクトや特定の高精度タスクに適しています
[16][18][22]。
### **結論**
DeepSeek R1は、OpenAI o1と同等の性能を持ちながら、コスト面で大幅に優れています。特に、低予算でAIを活用したい場合や、オープンソース
の柔軟性を重視する場合には、DeepSeek R1が最適な選択肢となるでしょう。一方で、OpenAI o1はその信頼性や商用サポートを重視するユー
ザーに適しています。
DeepSeek R1について(コスト比較)
Felo.aiのAI Search検索結果
IBM ミドルウェア・ユーザー研究会
DeepSeek R1について(情報セキュリティの懸念)
DeepSeek R1には、以下の情報セキュリティ上の懸念が指摘されています。
1. データプライバシーのリスク
入力データが中国のサーバーで処理され、中国のサイバーセキュリティ法に基づき政府がデータにアクセス
できる可能性があります。これにより、機密情報の漏洩リスクが高まります。
2. 脆弱性と悪用の可能性
ジェイルブレイク攻撃に対する耐性が低く、違法行為や有害な情報(例:ランサムウェア作成手順)の
生成が可能であることが確認されています。
3. データ漏洩の事例
過去に認証なしでアクセス可能なデータベースが発見され、チャット履歴やAPIキーなどの機密情報が漏
洩しました。
4. 規制と倫理的懸念
各国で利用が制限される動きがあり、特に米海軍や台湾政府はセキュリティと倫理上の理由から使用を
禁止しています。
これらのリスクを踏まえ、利用には慎重な判断が求められます。
Felo.aiのAI Search検索結果
IBM ミドルウェア・ユーザー研究会
中国以外のクラウド環境でDeepSeek R1を使用することは可能です。以下に、現在利用可能な主要な選択肢を
解説します。
中国以外のクラウドでDeepSeek R1を使用する方法
1. Azure AI Foundry
MicrosoftのAzure AI Foundryでは、DeepSeek R1がモデルカタログに登録されており、信頼性の高いエンター
プライズ向けプラットフォームで利用可能です。Azureでは、以下のような特徴があります:
• セキュリティとコンプライアンス:Azure AI Content Safetyを通じて、デフォルトでコンテンツフィルタリング
が有効化されており、安全な利用が可能です5。
• 迅速なデプロイ:サーバーレスエンドポイントを通じて、APIキーを取得し、すぐに利用を開始できます5。
2. Perplexity経由の利用
Perplexityは、DeepSeek R1を米国やヨーロッパのデータセンターでホストしており、中国のサーバーを経由せずに
利用できる選択肢を提供しています。特に、検索や推論タスクにおいて優れた性能を発揮します12。
DeepSeek R1の稼働環境
Felo.aiのAI Search検索結果
IBM ミドルウェア・ユーザー研究会
3. Fireworks AI
Fireworks AIは、DeepSeek R1を含むモデルを米国のサーバーで提供しています。このプラットフォームはOpenAI
API互換であり、VS CodeやCursorなどのツールと連携して利用可能です。データセキュリティが重視されており、デ
ータがモデルの学習に使用されることはありません4。
4. AWS Bedrock
Amazon BedrockでもDeepSeek R1が利用可能です。AWSのインフラを活用することで、信頼性の高い環境で
モデルを運用できます。特に、蒸留バージョンのDeepSeek R1をローカルで動作させることも可能です1116。
DeepSeek R1の稼働環境
Felo.aiのAI Search検索結果
IBM ミドルウェア・ユーザー研究会
• 首位争い
• いきなり3位に入り、安価で、高性能で世界を震撼させました。
• 情報セキュリティ
• 中国国内のサーバを利用しており、情報セキュリティ上の懸念があります。
• オープンソース
• オープンソースであり、既に米国でホスティングされたAzure、AWS Bedrock、
Perplexityなどで利用が可能です。
• DeepSeek R1をベースに、追加学習させたモデルも出始めており、ここから新た
な特徴を持ったモデルが、世界中で生まれる可能性があります。
DeepSeek R1 まとめ
IBM ミドルウェア・ユーザー研究会
RAG
Chat
RAGとは
• RAG(Retrieval-Augmented Generation)は、社内システムのデータベースや文書
を検索し、その情報を基に生成AIが回答を作成する技術
• UAP支援システムの中核となる技術
user
Q
A
RDB VectorDB GraphDB
Oracle
LLM
GPT-4-o mini
IBM ミドルウェア・ユーザー研究会
1. 概要
• GraphRAGは、LLMとナレッジグラフを組み合わせた技術で、情報を効率的に検索・生成します
2. 特徴
• ナレッジグラフの活用
データをエンティティとその関係で整理し、クエリに基づいて効率的に検索可能
• 柔軟な検索能力
グラフ構造を活用し、単純な検索では対応できない複雑・抽象的な質問にも回答
3. メリット
• 正確性の向上
複雑で抽象的な質問にも正確かつ関連性の高い回答を提供
• 多様な用途への対応
分散データやノイズが多い環境でも適切に情報を活用可能
• スケーラビリティ
大規模データセットにも効率的に対応可能
Graph RAGとは
IBM ミドルウェア・ユーザー研究会
RAGの3形態
・Vector DB 社内システムのデータベースや文書をベクトル化し、最も近い情報を抽出する。
※リアルタイムな情報は取れない。また、抽出であって、データ間の関係は見ていない。
・RDB 動的にLLMがSQLを生成し、リアルタイムに問い合わせたselect結果を文章にして返す。
※SQLに出来ない、あいまいな検索は不向き
・Graph DB Graph DBは、NodeとEdgeの関係で構成され、データ間の関係性を管理しています。
例えば、自動車の事故情報全体から、車名Node、発生部Nodeと事故内容Nodeを自
動的に関連付けて、情報を分析することが出来ます。
RDB VectorDB GraphDB
Oracle
IBM ミドルウェア・ユーザー研究会
Demo
今回のデモは、音声応答に対応しています。
問い合わせるデータは、分科会で利用している国土交通省事故情報で
す。
Azure OpenAI Services GPT-4o Realtime API Previewを使用しています。
質問の内容によって、Vector DB、SQL、Graph DBの問い合わせが自動的
に切り替わります。
IBM ミドルウェア・ユーザー研究会
まとめ
• RAGは、急速に進歩しており、次々と新しい技術が生まれています。
• 社内データは、データベースや文書など、特定の何かに限定するものは
無く、用途は広いです。
• 既存の業務フローに、部分的に組込み、拡大していくことが出来ます。
IBM ミドルウェア・ユーザー研究会
IBM ミドルウェア・ユーザー研究会
生成AI分科会
(Generative AI working Group)

2025/02/28 JIMUC 新春オープンセミナー生成AI分科会中間活動報告