ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
公開URL:https://arxiv.org/abs/2210.03629
出典:Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao : ReAct: Synergizing Reasoning and Acting in Language Models, arXiv: 2210.03629 (2022)
概要:本論文では大規模言語モデルにおいて推論(Reasoning)と行動(Acting)を組合わせるprompt手法であるReActを提案した。知識集約型の推論タスク(QAタスク・事実検証タスク)と意思決定タスク(テキストゲーム、ウェブナビゲーション)でReActの性能を評価した。推論タスクにおいてReActはWikipedia APIとの対話によりChain of ThoughtのHallucinationを軽減し、意思決定タスクにおいては模倣学習や強化学習による手法を上回る性能を示した。
リーンアナリティクスの概要を30分で理解できるようスライドを作成しています。実際に社内プレゼンでは30分で終わりました。
リーンアナリティクスの前提となるリーンスタートアップについても簡単に説明しているため、前提知識がない人でも一通り理解できると思います。
なにかご不明の点があれば、以下までご連絡ください。
info@sikmi.com
You can get an overview of LEAN ANALYTICS in 30 minutes. Actually the in-house presentation was the end in 30 minutes.
Due to the brief description of THE LEAN STARTUP that is the premise of LEAN ANALYTICS , and I think that it can be understood one way in humans there is no prerequisite knowledge .
If there is any questions something , please contact the following .
Y Combinator 風の3分ピッチテンプレートです。初期のスタートアップには以下の構成をお勧めしています。
1. Problem
2. Solution
3. Market Size
4. Traction
5. Unique Insight
6. Business Model
7. Team
UTokyo 500k 用のテンプレートとして作成しました。
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
公開URL:https://arxiv.org/abs/2210.03629
出典:Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao : ReAct: Synergizing Reasoning and Acting in Language Models, arXiv: 2210.03629 (2022)
概要:本論文では大規模言語モデルにおいて推論(Reasoning)と行動(Acting)を組合わせるprompt手法であるReActを提案した。知識集約型の推論タスク(QAタスク・事実検証タスク)と意思決定タスク(テキストゲーム、ウェブナビゲーション)でReActの性能を評価した。推論タスクにおいてReActはWikipedia APIとの対話によりChain of ThoughtのHallucinationを軽減し、意思決定タスクにおいては模倣学習や強化学習による手法を上回る性能を示した。
リーンアナリティクスの概要を30分で理解できるようスライドを作成しています。実際に社内プレゼンでは30分で終わりました。
リーンアナリティクスの前提となるリーンスタートアップについても簡単に説明しているため、前提知識がない人でも一通り理解できると思います。
なにかご不明の点があれば、以下までご連絡ください。
info@sikmi.com
You can get an overview of LEAN ANALYTICS in 30 minutes. Actually the in-house presentation was the end in 30 minutes.
Due to the brief description of THE LEAN STARTUP that is the premise of LEAN ANALYTICS , and I think that it can be understood one way in humans there is no prerequisite knowledge .
If there is any questions something , please contact the following .
Y Combinator 風の3分ピッチテンプレートです。初期のスタートアップには以下の構成をお勧めしています。
1. Problem
2. Solution
3. Market Size
4. Traction
5. Unique Insight
6. Business Model
7. Team
UTokyo 500k 用のテンプレートとして作成しました。
HRカンファレンス2014春で使用した「考えても答えが出ない『体験型研修の効果測定』に考える補助線を引いてみよう」の講演資料です。ゲームを活用した研修に代表される体験型研修の効果測定を扱っています。HRカンファレンスは日本最大級のHRイベントです。登壇者はカレイドソリューションズ株式会社代表取締役開発者の高橋興史です。
Performed by Koji Takahashi (CEO of Kaleidosolutions.inc) / A file for one of the biggest HR event "HR conference 2014". This file is about evaluation of corporate training, esp. gaming simulation.
新人研修でAgileの考え方を取り入れてみました。その結果をまとめた資料になります。
This presentation is freshman's training report in this year.
We adopted 'Agile' and we got very good result.
オープンコミュニティ「要求開発アライアンス」(http://www.openthology.org)の2012年4月定例会発表資料です。
Open Community "Requirement Development Alliance" 2012/4 regular meeting of the presentation materials.
Introduction of KOTATSU-MODEL in Requirement DevelopmentKent Ishizawa
オープンコミュニティ「要求開発アライアンス」(http://www.openthology.org)の2010年5月定例会発表資料です。
Open Community "Requirement Development Alliance" 2010/05 regular meeting of the presentation materials.
18. Copyright (C) 2012 Corex Inc. All Rights Reserved.
根拠の作り方2: 演繹法
• 演繹法は、普遍ルール・観察事項(根拠)を用いて、言いたいこと(主張)を
サポートする論法。※蓋然性なし
17
演繹法とは
2つの情報を関連付けて、そこから結論を必然的に導き
出す思考法(三段論法)
主張(結論)
観察事象
ルール・一般論
例)
個人情報の保護に対する世間の目が厳しくなっている(一般論)
就職塾は、業務の特徴として様々な個人情報を取り扱う(観察事象)
就職塾は、個人情報の取り扱いに細心の注意を払わなくてはならない(主張・結論)
19. Copyright (C) 2012 Corex Inc. All Rights Reserved.
主張(結論)
ピラミッドストラクチャー
• ピラミッドストラクチャーとは、主張が、複雑な根拠に基づくときに、それ
らを整理して考えるためのツールである。
18
ピラミッドストラクチャー
A B C
A1 A2 A3 B1 B2 B3 C1 C2 C3
なぜそうなの?だからなに?
「主張と根拠(群)」の三角形1つ1つ(青三角)は、帰納法、演繹法などで論理を成立させる。
20. Copyright (C) 2012 Corex Inc. All Rights Reserved.
因果関係とは
• 因果関係は、結果が主張、原因が根拠、という形で、主張-根拠の構築に用いら
れることが多い。
19
主張
Claim
根拠
Reason
結果
Result
原因
Cause
原因を観察事象やルール
・一般論として、
まだ証明されていない
結果を主張する
21. Copyright (C) 2012 Corex Inc. All Rights Reserved.
因果関係を見つけるために確認すべきこと
• 因果関係の有無を見つけるためには、確認すべきことが3つある。
20
2. 相関関係が存在すること
相関関係とは、一方が変われば他方も変わるような関係のこと
1. 時間的順序が正しいこと
時間軸上において、まず原因があり、その後に結果があること
3. 第3因子が存在しないこと
第3因子とはある2つの事象の原因となっている因子のこと