AI
2024.06.05
織田拓磨
株式会社ディー・エヌ・エー + GO株式会社
DeepResearch
の理解と実践
AI 2
DeepResearchの理解と実践
◼ DeepResearchすごい
◼ DeepResearchのような複雑なLLMエージェントがどのように実現されているか概要レベル
で知りたい(きっと活用する上で少しは役にたつ)
◼ DeepResearchを仕事やプライベートで有効活用したい
本発表の背景・目的
NewsPicks
AI 3
項目
01|DeepResearchの概要
02|DeepResearchの思考戦略
03|DeepResearchの実践
AI 4
01 DeepResearchの概要
AI 5
◼ 金融、科学、政策、工学などの分野で集中的な知的作業を行い、かつ徹底的で正確な
信頼できるリサーチを必要とする人々向け
◼ 車、電化製品、家具などの入念なリサーチが通常必要になる個人向けの買い物にも有用
◼ すべての出力が、明確な引用元とともに文書化されるため、参照と情報の検証が可能
OpenAIがdeep research を構築した理由
DeepResearch 概要
AI 6
langchain-ai/open_deep_research
https://github.com/langchain-ai/open_deep_research?tab=readme-ov-file
AI 7
1. Planning
2. Searching
3. Reasoning
4. Reporting
DeepResearch ワークフロー
https://gemini.google/overview/deep-research/?hl=en
AI 8
ユーザから与えられた質問を解析し、「どのような観点・サブトピックを調べればよいか」のプランを
立てる
◼ モデルはユーザに質問の意図確認をする(ChatGPT)
◼ ユーザーの質問に対しリサーチプランを自動生成し、ユーザーはこのプランに修正を加えられ
る(Gemini)
Planning
AI 9
プランに基づき、検索エンジンやウェブブラウザを用いて情報収集を行う
◼ 逐次的な推論を行いながら、情報を判断・選別して次のアクションを決定
◼ 例えば「まず基本定義を検索 → その内容から派生する疑問についてさらに検索 → 矛盾
があれば別ソースで検証」といったプロセス
◼ これにより探索と推論のループが形成され、質問に対する網羅的かつ正確な情報集約が
進む
◼ このアプローチは、研究で知られるReAct (Reason+Act)やSelf-Ask with Searchの
考え方を実践するもの
Searching
AI 10
検索で得た断片的な情報を、内部で統合的に推論・分析
◼ 内容を比較・検証し、因果関係や背景を考察:例えばChatGPT o3モデルは、異なる
情報源の記述を照合して矛盾を検出したり、統計データの背景にある要因を説明できる
◼ 長大なコンテキストに対応:最大100万トークンのコンテキストウィンドウとRAG構成
(Gemini)
◼ 必要に応じて計算ツールやコード実行も活用:外部ツール(Pythonコードの実行)を駆
使することでモデルの弱点をツールで補完して推論する
Reasoning
AI 11
次のような多角的な観点に基づいて、一貫性があり、構造化され、包括的なレポートに統合
する
◼ 情報の信頼性
◼ 整合性と一貫性
◼ 出典の正確性
◼ 包括性と網羅性
◼ 応答の形式と可読性
Reporting
AI 12
02 DeepResearchの思考戦略
AI 13
疑似コード
Geminiのような高度なAIが
「DeepResearch」タスクを実行す
る際の概念的な仕組みを理解する
ための良い出発点として適切
(by Gemini)
AI 14
LLMがどのように問題を捉え、どのように考え、どのように行動(検索・ツール利用など)を進め
ていくかという「戦略・戦術」
(実際に商用DeepResearchに使われているかは不明)
◼ ToT: 多角的に考え、評価し、進むべき道を選ぶ
◼ ReAct: 考え(Reason)、行動し(Act)、観察する
DeepResearch 思考と行動の戦略・戦術
AI 15
調査プロセス全体を戦略的に管理・誘導する司令塔のような役割を果たす。単一の思考
(Chain-of-Thought)ではなく、複数の可能性(思考)をツリー状に展開し、評価・選
択することで、より網羅的で質の高い調査を実現。
ToT: Tree of Thoughts
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
AI 16
1. 問題の構造化:State(状態)と Action(行動)の定義、ルート状態の設定
2. 思考候補の生成:ある状態から次に可能な複数の「thought」をモデルに出力させ、子
ノードとして追加
3. 思考ノードの評価:各ノードにスコアを付与し、有望度を判定(低スコアのノードはプルー
ニング)
4. 探索戦略による再帰的展開:ビームサーチや幅優先/深さ優先などで有望ノードを選
択
5. 終端条件と最終解答の抽出:ゴール条件を満たすノードを発見
ToT: Tree of Thoughts
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
AI 17
ReAct は、ToTによって立てられた計画を実行し、情報を収集・処理するための「実行部隊」として極め
て重要な役割を果たす。ToTが「何をすべきか」という戦略を練るのに対し、ReActは「どのように実行し、
結果を得るか」という戦術的なサイクルを担う。
1. 思考 (Reason): 現在の目標と状況(これまでに得られた情報)に基づき、次に何をすべきかを考
え、計画する。
2. 行動 (Act): 思考に基づき、具体的なアクションを実行する。多くの場合、これは外部ツール(検索
エンジン、データベース、計算機、APIなど)の利用を意味する。
3. 観察 (Observation): 行動の結果(検索結果、計算結果、APIからの応答など)を受け取る。
ReAct(Reason + Act)
ReAct: Synergizing Reasoning and Acting in Language Models
AI 18
ToT/Self-Askからのタスク: 「洋上風力発電のコストは、火力発電より高いのか?」
ReActサイクル:
① 思考: 「両者の発電コスト(LCOE)を比較する必要がある。最新のLCOEデータを検索しよう。」
② 行動: Search("洋上風力発電 LCOE 日本") & Search("火力発電 LCOE 日本")
③ 観察: 「洋上風力はまだ火力より高いが、コストは急速に低下しているとの情報が多い。しかし、具体的な数値にば
らつきがある。」
④ 思考: 「なぜ数値にばらつきがあるのか?補助金や技術の種類による違いか?信頼できる政府機関の最新データを
参照し、条件を絞って再検索しよう。」
⑤ 行動: Search("経済産業省 発電コスト LCOE 最新 試算")
⑥ 観察: 「METIの試算データを発見。特定の条件下では、将来的に火力を下回る可能性が示唆されている。」
ReAct(Reason + Act)
ReAct: Synergizing Reasoning and Acting in Language Models
AI 19
03 DeepResearchの実践
AI 20
6 tips to get the most out of Gemini Deep Research
1. DeepResearchが必要なタスクかを判断する
2. 簡単な質問から始める
3. フォローアップの質問をする
4. 参照している興味深いリンクをチェックする
5. ローカルな質問を試す
6. 音声概要やGoogle docsにエクスポートする
DeepResearchを効果的に使うために
AI 21
Prompt Engineering Guide for Deep Research with ChatGPT’s O3-Model
1. ゴールを明確かつ具体的に設定する
「気候変動について教えてください」 =>「サハラ以南のアフリカにおける気候変動が農作物の収穫量に与える影響
を調査し、その結果をまとめてください」
2. コンテキストと制約を提供する
「コンピュータービジョン研究の文脈において、ゼロショット画像分類の最新の開発状況(2019~2024年)と、そ
の精度指標の報告を見つける」
3. クエリを分解する(非常に複雑な場合)
「ソーシャルメディアが10代の若者のメンタルヘルスに与える影響を調査してください。具体的には、1) 自尊心にどの
ような影響を与えるか? 2) 不安やうつ病の発生率との関連は? 3) 肯定的な結果(例:サポートコミュニテ
ィ)。」
プロンプト設計
AI 22
◼ 市場・業界の包括的な調査(財務分析、競合分析、デューデリなど)
◼ 顧客リサーチ・マーケティング
◼ 文献レビュー・関連研究調査
◼ 知識探索・自己学習
◼ 大きな買い物や旅行プランの調査
活用例
AI 23
活用例:顧客リサーチ・マーケティング
あなたは顧客リサーチ・マーケティングを専門とする DeepResearch エージェントです。
新規サービス「東京都市部向けマイクロトランジット」の顧客セグメントとペルソナを構築するため、以下をレポ
ート形式でまとめてください。
1. **ターゲット顧客候補の特定**
2. **既存類似サービス利用者の行動・意識調査**
3. **顧客ニーズの検証**
4. **ペルソナの定義**
5. **マーケティングチャネルとコミュニケーション戦略**
AI 24
◼ 大規模・構造化データの機械的収集/ETL
Web ページの“表”を読む程度は可能だが、API 認証やページネーション処理が書けず、欠損や型変換、参照整
合性チェックが弱い
◼ 複雑なマルチモーダル解析
画像や GIS データを「読み取る」は可能でも、それらを 統合的に解析して洞察を出す段で破綻
◼ 厳密な数値再現性や依存関係管理が必要
巨大データのETL・集計を実行できる計算環境を持たない
◼ リアルタイム/有料データソースが不可欠
検索ツールは一般 Web 検索に限定
DeepResearchの苦手タスク
spectrum of how useful deep research is fordifferent applications
Sayash Kapoor
AI 25
次のサイトを参考に2020年4月から2024年12月までの関東の月別の鉄道輸送人数およ
びバス輸送人数のデータを収集して、表とグラフにしてください。
DeepResearchの苦手タスク:データ収集
AI 26
DeepResearch結果(抜粋)
DeepResearchの苦手タスク:データ収集
年月 旅客数 旅客人キロ
2020-04 1,161,521 16,885,667
2020-05 1,208,081 17,399,959
2020-06 1,254,641 17,914,250
2020-07 1,301,201 18,428,542
2020-08 1,347,760 18,942,834
2020-09 1,394,320 19,457,125
2020-10 1,440,880 19,971,417
2020-11 1,487,440 20,485,709
2020-12 1,534,000 21,000,000
ChatGPT Gemini
AI 27
ご清聴ありがとうございました

AI技術共有会2025-06-05_DeepResearchの理解と実践.pdf