Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
ARISE analytics
PDF, PPTX
988 views
【論文レベルで理解しよう!】 大規模言語モデル(LLM)編
「ARISE university Training(社内勉強会)」で使用した資料です。
Technology
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 20
2
/ 20
Most read
3
/ 20
4
/ 20
5
/ 20
6
/ 20
7
/ 20
8
/ 20
9
/ 20
10
/ 20
11
/ 20
12
/ 20
13
/ 20
Most read
14
/ 20
15
/ 20
16
/ 20
17
/ 20
18
/ 20
19
/ 20
20
/ 20
Most read
More Related Content
PDF
Attentionの基礎からTransformerの入門まで
by
AGIRobots
PPTX
[DL輪読会]MetaFormer is Actually What You Need for Vision
by
Deep Learning JP
PDF
coordinate descent 法について
by
京都大学大学院情報学研究科数理工学専攻
PDF
Transformerを多層にする際の勾配消失問題と解決法について
by
Sho Takase
PDF
機械学習モデルの判断根拠の説明(Ver.2)
by
Satoshi Hara
PDF
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
by
mlm_kansai
PPTX
backbone としての timm 入門
by
Takuji Tahara
PDF
ReAct: Synergizing Reasoning and Acting in Language Models
by
harmonylab
Attentionの基礎からTransformerの入門まで
by
AGIRobots
[DL輪読会]MetaFormer is Actually What You Need for Vision
by
Deep Learning JP
coordinate descent 法について
by
京都大学大学院情報学研究科数理工学専攻
Transformerを多層にする際の勾配消失問題と解決法について
by
Sho Takase
機械学習モデルの判断根拠の説明(Ver.2)
by
Satoshi Hara
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
by
mlm_kansai
backbone としての timm 入門
by
Takuji Tahara
ReAct: Synergizing Reasoning and Acting in Language Models
by
harmonylab
What's hot
PPTX
近年のHierarchical Vision Transformer
by
Yusuke Uchida
PPTX
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
by
Yusuke Uchida
PDF
最適化超入門
by
Takami Sato
PDF
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
by
Preferred Networks
PDF
グラフニューラルネットワークとグラフ組合せ問題
by
joisino
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
by
SSII
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
by
SSII
PDF
Transformer メタサーベイ
by
cvpaper. challenge
PDF
AHC-Lab M1勉強会 論文の読み方・書き方
by
Shinagawa Seitaro
PDF
強化学習と逆強化学習を組み合わせた模倣学習
by
Eiji Uchibe
PDF
グラフニューラルネットワーク入門
by
ryosuke-kojima
PDF
Generative Models(メタサーベイ )
by
cvpaper. challenge
PPTX
[DL輪読会]相互情報量最大化による表現学習
by
Deep Learning JP
PPTX
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
by
Deep Learning JP
PPTX
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
by
Deep Learning JP
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
by
Yamato OKAMOTO
PPTX
モデル高速化百選
by
Yusuke Uchida
PDF
機械学習におけるオンライン確率的最適化の理論
by
Taiji Suzuki
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
by
hoxo_m
PPTX
ORB-SLAMの手法解説
by
Masaya Kaneko
近年のHierarchical Vision Transformer
by
Yusuke Uchida
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
by
Yusuke Uchida
最適化超入門
by
Takami Sato
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
by
Preferred Networks
グラフニューラルネットワークとグラフ組合せ問題
by
joisino
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
by
SSII
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
by
SSII
Transformer メタサーベイ
by
cvpaper. challenge
AHC-Lab M1勉強会 論文の読み方・書き方
by
Shinagawa Seitaro
強化学習と逆強化学習を組み合わせた模倣学習
by
Eiji Uchibe
グラフニューラルネットワーク入門
by
ryosuke-kojima
Generative Models(メタサーベイ )
by
cvpaper. challenge
[DL輪読会]相互情報量最大化による表現学習
by
Deep Learning JP
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
by
Deep Learning JP
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
by
Deep Learning JP
Domain Adaptation 発展と動向まとめ(サーベイ資料)
by
Yamato OKAMOTO
モデル高速化百選
by
Yusuke Uchida
機械学習におけるオンライン確率的最適化の理論
by
Taiji Suzuki
トピックモデルの評価指標 Perplexity とは何なのか?
by
hoxo_m
ORB-SLAMの手法解説
by
Masaya Kaneko
Similar to 【論文レベルで理解しよう!】 大規模言語モデル(LLM)編
PDF
大規模言語モデルとChatGPT
by
nlab_utokyo
PPTX
【DL輪読会】Toolformer: Language Models Can Teach Themselves to Use Tools
by
Deep Learning JP
PDF
Wandb LLM Webinar May 30 2023 (配布用).pdf
by
Yuya Yamamoto
PDF
LLMで原稿生成
by
Takuo Tachibana
PPTX
生成AI・LLMシステムのセキュリティ:生成AI・LLMのAI倫理と機械学習システムセキュリティセッション
by
Nobukazu Yoshioka
PDF
個人または組織における仕事の成果につながる生成AI(主にChatGPT)入門講座
by
Koji Fukuoka
PDF
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
by
suzukiyu1
PPTX
【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
by
ARISE analytics
PDF
論文紹介:"Reflexion: language agents with verbal reinforcement learning", "MA-LMM...
by
Toru Tamaki
PDF
Crypto民のためのAI Agent入門 - Solana Developer Hub 13 #SolDevHub
by
K Kinzal
PDF
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
by
harmonylab
PDF
AIで始めるRustプログラミング #SolDevHub
by
K Kinzal
PDF
EMNLP2018 Overview
by
Takahiro Kubo
PDF
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
by
Webpla LLC.
PPTX
2023-03-23_SpiralAI
by
SasakiYuichi1
PDF
Chainer with natural language processing hands on
by
Ogushi Masaya
PDF
2023-03-22_Spiral.AI_FindyLT会
by
SasakiYuichi1
PDF
2023-03-23_Spiral.AI
by
SasakiYuichi1
PDF
広告文生成タスクの規定とベンチマーク構築
by
Masato Mita
大規模言語モデルとChatGPT
by
nlab_utokyo
【DL輪読会】Toolformer: Language Models Can Teach Themselves to Use Tools
by
Deep Learning JP
Wandb LLM Webinar May 30 2023 (配布用).pdf
by
Yuya Yamamoto
LLMで原稿生成
by
Takuo Tachibana
生成AI・LLMシステムのセキュリティ:生成AI・LLMのAI倫理と機械学習システムセキュリティセッション
by
Nobukazu Yoshioka
個人または組織における仕事の成果につながる生成AI(主にChatGPT)入門講座
by
Koji Fukuoka
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
by
suzukiyu1
【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx
by
ARISE analytics
論文紹介:"Reflexion: language agents with verbal reinforcement learning", "MA-LMM...
by
Toru Tamaki
Crypto民のためのAI Agent入門 - Solana Developer Hub 13 #SolDevHub
by
K Kinzal
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
by
harmonylab
AIで始めるRustプログラミング #SolDevHub
by
K Kinzal
EMNLP2018 Overview
by
Takahiro Kubo
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
by
Webpla LLC.
2023-03-23_SpiralAI
by
SasakiYuichi1
Chainer with natural language processing hands on
by
Ogushi Masaya
2023-03-22_Spiral.AI_FindyLT会
by
SasakiYuichi1
2023-03-23_Spiral.AI
by
SasakiYuichi1
広告文生成タスクの規定とベンチマーク構築
by
Masato Mita
More from ARISE analytics
PPTX
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
by
ARISE analytics
PPTX
【論文読み会】Autoregressive Diffusion Models.pptx
by
ARISE analytics
PPTX
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
by
ARISE analytics
PDF
教師なしGNNによるIoTデバイスの異常通信検知の検討
by
ARISE analytics
PPTX
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
by
ARISE analytics
PDF
【論文レベルで理解しよう!】 欠測値処理編
by
ARISE analytics
PPTX
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
by
ARISE analytics
PPTX
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
by
ARISE analytics
PDF
AgentOps:AIエージェント時代の幕開けとガバナンスについて ~AgentOpsの体系的な理解を目指して~
by
ARISE analytics
PDF
めんどうな環境構築とはおさらば!Dockerの概要と使い方
by
ARISE analytics
PPTX
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
by
ARISE analytics
PPTX
【論文読み会】On the Expressivity of Markov Reward
by
ARISE analytics
PDF
【JSAI2024】J-NER大規模言語モデルのための固有表現認識における拡張固有表現階層を考慮したベンチマークデータセット.pdf
by
ARISE analytics
PDF
ARISE analytics 会社紹介パンフレット ~2025年度版~ ご自由にダウンロードください。
by
ARISE analytics
PPTX
【第3回生成AIなんでもLT会資料】_動画生成AIと物理法則_v0.2.pptx
by
ARISE analytics
PDF
【JSAI2024】LLMエージェントの人間との対話における反芻的返答の親近感向上効果_v1.1.pdf
by
ARISE analytics
PDF
【JSAI2024】ブラックボックス大規模言語モデルにおけるHallucination検知手法の検討.pdf
by
ARISE analytics
PDF
【JSAI2024】学術論文の定量的評価と効果的な活用について Quantitative evaluation and effective utiliza...
by
ARISE analytics
PDF
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
by
ARISE analytics
PDF
Hierarchical Metadata-Aware Document Categorization under Weak Supervision (...
by
ARISE analytics
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
by
ARISE analytics
【論文読み会】Autoregressive Diffusion Models.pptx
by
ARISE analytics
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
by
ARISE analytics
教師なしGNNによるIoTデバイスの異常通信検知の検討
by
ARISE analytics
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
by
ARISE analytics
【論文レベルで理解しよう!】 欠測値処理編
by
ARISE analytics
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
by
ARISE analytics
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
by
ARISE analytics
AgentOps:AIエージェント時代の幕開けとガバナンスについて ~AgentOpsの体系的な理解を目指して~
by
ARISE analytics
めんどうな環境構築とはおさらば!Dockerの概要と使い方
by
ARISE analytics
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in D...
by
ARISE analytics
【論文読み会】On the Expressivity of Markov Reward
by
ARISE analytics
【JSAI2024】J-NER大規模言語モデルのための固有表現認識における拡張固有表現階層を考慮したベンチマークデータセット.pdf
by
ARISE analytics
ARISE analytics 会社紹介パンフレット ~2025年度版~ ご自由にダウンロードください。
by
ARISE analytics
【第3回生成AIなんでもLT会資料】_動画生成AIと物理法則_v0.2.pptx
by
ARISE analytics
【JSAI2024】LLMエージェントの人間との対話における反芻的返答の親近感向上効果_v1.1.pdf
by
ARISE analytics
【JSAI2024】ブラックボックス大規模言語モデルにおけるHallucination検知手法の検討.pdf
by
ARISE analytics
【JSAI2024】学術論文の定量的評価と効果的な活用について Quantitative evaluation and effective utiliza...
by
ARISE analytics
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
by
ARISE analytics
Hierarchical Metadata-Aware Document Categorization under Weak Supervision (...
by
ARISE analytics
Recently uploaded
PDF
TomokaEdakawa_職種と講義の関係推定に基づく履修支援システムの基礎検討_HCI2026
by
Matsushita Laboratory
PDF
maisugimoto_曖昧さを含む仕様書の改善を目的としたアノテーション支援ツールの検討_HCI2025.pdf
by
Matsushita Laboratory
PDF
20260119_VIoTLT_vol22_kitazaki_v1___.pdf
by
Ayachika Kitazaki
PDF
アジャイル導入が止まる3つの壁 ─ 文化・他部門・組織プロセスをどう乗り越えるか
by
Graat(グラーツ)
PDF
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
PDF
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
PDF
ST2024_PM1_2_Case_study_of_local_newspaper_company.pdf
by
akipii ogaoga
PDF
Team Topology Adaptive Organizational Design for Rapid Delivery of Valuable S...
by
akipii ogaoga
TomokaEdakawa_職種と講義の関係推定に基づく履修支援システムの基礎検討_HCI2026
by
Matsushita Laboratory
maisugimoto_曖昧さを含む仕様書の改善を目的としたアノテーション支援ツールの検討_HCI2025.pdf
by
Matsushita Laboratory
20260119_VIoTLT_vol22_kitazaki_v1___.pdf
by
Ayachika Kitazaki
アジャイル導入が止まる3つの壁 ─ 文化・他部門・組織プロセスをどう乗り越えるか
by
Graat(グラーツ)
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
ST2024_PM1_2_Case_study_of_local_newspaper_company.pdf
by
akipii ogaoga
Team Topology Adaptive Organizational Design for Rapid Delivery of Valuable S...
by
akipii ogaoga
【論文レベルで理解しよう!】 大規模言語モデル(LLM)編
1.
CONFIDENTIAL 【論文レベルで理解しよう!】 大規模言語モデル(LLM)編 Marketing Solution Division
Service Design Unit 渋谷 優介 2023/09/01 ©2023 ARISE analytics Reserved.
2.
論文 ©2023 ARISE analytics
Reserved. 1 論文 A Survey of Large Language Models* 概要 LLMの概要、構築方法、応用方法、性能、課題など 幅広く扱っている。 今回は時間の関係上、赤字の部分のみ紹介 *:[2303.18223] A Survey of Large Language Models (arxiv.org)
3.
論文読み会のゴール ©2023 ARISE analytics
Reserved. 2 論文読み会のゴール (すべての方向け) ➢ LLMの全体像が理解でき、LLMとは何か・特徴を簡単に説明できる ➢ LLMがどのように構築されているか、利用されているかを大まかに把握している (事前知識が豊富な方向け) ➢ LLMの知識を体系的に整理して説明でき、LLMについて知らなかったことを調べるきっかけとなる
4.
目次 ©2023 ARISE analytics
Reserved. 3 1. LLMの概要 2. LLMの構築から利用 2.1 構築フェーズ 2.2 適用フェーズ 2.3 利用フェーズ どう使うか (使えるレベルまで) どう改良するか どう作るか LLMとは何か LLMとは何がすごいのか
5.
目次 ©2023 ARISE analytics
Reserved. 4 1. LLMの概要 2. LLMの構築から利用 2.1 構築フェーズ 2.2 適用フェーズ 2.3 利用フェーズ どう使うか (使えるレベルまで) どう改良するか どう作るか LLMとは何か LLMとは何がすごいのか
6.
LLMとは ©2023 ARISE analytics
Reserved. 5 *:厳密にはトークン LLM(Large Language Model)とは、言語を単語を確率として扱う大規模言語モデルである。LLMはモデルを大規模化により 性能が大幅に向上したことで、既存のPLM(Pre-trained Language Model)と区別する形で命名された。 LLM PLM ex. GPT-2 ex. GPT-3 1.5 B (15 億) パラメータ数 175 B (1,750 億) LLMとは何か 大規模化 言語モデル 言語を単語*の出力確率としてモデル化 言語モデル 私の好きなスポーツは サッカー(50 %) 野球(25 %) バスケットボール(15 %) テニス(10 %)
7.
LLMの特長 ©2023 ARISE analytics
Reserved. 6 [1]:https://lifearchitect.ai/models/ LLMの特長として、最も特筆すべき能力は創発能力である。LLMは創発能力により、コーディングや数式の計算等の 未学習のタスクについても解くことができる。 LLMとは何がすごいのか パラメータ数 LLMの創発能力について[1] 小 大
8.
目次 ©2023 ARISE analytics
Reserved. 7 1. LLMの概要 2. LLMの構築から利用 2.1 構築フェーズ 2.2 適用フェーズ 2.3 利用フェーズ どう使うか (使えるレベルまで) どう改良するか どう作るか LLMとは何か LLMとは何がすごいのか 入力データについて
9.
LLMの構築:データの前処理(1/3):データ収集 ©2023 ARISE analytics
Reserved. 8 *:データサイズ以外にモデルサイズ、学習の計算量が大きいほどモデルの性能は大きくなる LLMの学習のためにはデータ(Raw Corpus)を集める必要がある。データはサイズ、クオリティが特に重視される。 - 書籍 - Wikipedia - Reddit - プログラム データサイズは多ければ多いほどモデルの性能が高くなること がスケーリング則*で示されている。 質の高いデータを学習したモデルの性能は高くなると示されて いる。 どう作るか データサイズ データクオリティ
10.
LLMの構築:データの前処理(2/3): クリーニング ©2023 ARISE
analytics Reserved. 9 収集したデータに対して(1)クオリティフィルタリング(2)重複除去(3)個人情報の除去を行うことで、学習に有効なデータを 作成する。 1. 不要な言語を取り除く言語による除去 2. 質の低いデータを取り除くための指標による削除 3. 偏ったデータ削除のための統計学的除去 4. 不適切な言葉を取り除くキーワード除去 どう作るか クオリティフィルタリング
11.
LLMの構築:データの前処理(3/3):トークン化 ©2023 ARISE analytics
Reserved. 10 クリーニングしたデータをモデルに入力できる形式に変更するためにトークン化を行う。 どう作るか トークン化 She loves reading. She loves reading . トークン 文章をモデルに入力できる形式に変更すること
12.
目次 ©2023 ARISE analytics
Reserved. 11 1. LLMの概要 2. LLMの構築から利用 2.1 構築フェーズ 2.2 適用フェーズ 2.3 利用フェーズ どう使うか (使えるレベルまで) どう改良するか どう作るか LLMとは何か LLMとは何がすごいのか
13.
LLMの適用:再学習と外部情報の利用 ©2023 ARISE analytics
Reserved. 12 LLMの適用では、(1)再学習(2)外部情報の利用が有効である。 問い 答え 追加の学習データ 外部情報 どう改良するか 再学習 外部情報の利用 LLMを変更する LLMを変更しない 学習 変化
14.
再学習:Instruction Tuning, RLHF ©2023
ARISE analytics Reserved. 13 LLMの再学習の中でもInstruction TuningとRLHF(Reinforcement Learning from Human Feedback)は特 に有効である。 どう改良するか RLHF ヒトからのフィードバックをもとに強化学習を行うことで ヒトの嗜好に合ったモデルへ Instruction Tuning 入力と出力の指示(インストラクション)に従うように学習さ せることで未知のタスクにも対応可能なモデルへ ### インストラクション 「与えられたメールがスパムか非スパムかを判定しなさ い。」 ### インプット "Congratulations!You have won $5,000,000. Click here to claim your prize.“ ### アウトプット "Spam"
15.
目次 ©2023 ARISE analytics
Reserved. 14 1. LLMの概要 2. LLMの構築から利用 2.1 構築フェーズ 2.2 適用フェーズ 2.3 利用フェーズ どう使うか (使えるレベルまで) どう改良するか どう作るか LLMとは何か LLMとは何がすごいのか
16.
In-Context Learning, Chain
of Thought ©2023 ARISE analytics Reserved. 15 *: Zero-shot(デモンストレーションを与えない)でCoTを作成する取り組みもある。 LLMの有効活用する方法として(1)In-Context Learning(ICL) (ii)Chain of Thought(CoT)が一般的である。 問いと答えの導き方、 答えのデモンスト レーションを与える* 問いと答えのデモン ストレーションを 与える ICL&CoTの共通点はモデルへの入力(プロンプト)で有用な情報を与えることである。 CoTはモデルの判断根拠の誘導・可視化できる。 モデルの判断根拠 が出力される。 どう使うか
17.
サマリー ©2023 ARISE analytics
Reserved. 16 1. LLMの概要 2. LLMの構築から利用 2.1 構築フェーズ 2.2 適用フェーズ 2.3 利用フェーズ ICL & CoT 再学習 & 外部情報の利用 データの前処理 問い 答え 私の好きなスポーツは サッカー(50 %) 野球(25 %) バスケットボール(15 %) テニス(10 %) 創発能力 大規模化 言語モデル
18.
論文読み会のゴール ©2023 ARISE analytics
Reserved. 17 論文読み会のゴール (すべての方向け) ➢ LLMの全体像が理解でき、LLMとは何か・特徴を簡単に説明できる ➢ LLMがどのように構築されているか、利用されているかを大まかに把握している (事前知識が豊富な方向け) ➢ LLMの知識を体系的に整理して説明でき、LLMについて知らなかったことを調べるきっかけとなる
19.
論文読み会のゴール ©2023 ARISE analytics
Reserved. 18 論文読み会のゴール (すべての方向け) ➢ LLMの全体像が理解でき、LLMとは何か・特徴を簡単に説明できる LLMとは大量の学習データ&パラメータで構築された機械学習モデルである。 応用性が高く、創発性を持つ。 ➢ LLMがどのように構築されているか、利用されているかを大まかに把握している LLMはまず大量の学習データで基礎を固め、解きたい問題に特化させることで構築される。 LLMの性能を引き出すためにモデルへの入力を工夫することが重要である。 (事前知識が豊富な方向け) ➢ LLMの知識を体系的に整理して説明でき、LLMについて知らなかったことを調べるきっかけとなる
20.
Best Partner for
innovation, Best Creator for the future.
Download