3. Phi-2:27億
基盤モデル
Microsoft Prometheus(GPT-4):1兆
for Bing AI ?
Copilot:数十億
特化型モデル
Bing Chat Copilot:17億
Microsoft & NVIDIA Megatron-Turing NLG:5,300億
Microsoft Turing NLG:170億
基盤モデル
Microsoft Research Data&AI
「如何に広範な選択肢の中から解を生成できるか」
≠「推論演算が速い」、「省電力で計算を行う」
計算に必要な電力が小さく、推論演算が速いものの
生成される解は限られた範囲の属性から生成する特化型AI。
AGI
Artificial
General
Intelligence
AIオーケストレーションにより人間の思考に近づくことが目的
AIの限界を超えることが目的(2023年時点でベビーAGIと言われている)
MAI
multimodal
Artifical
Intelligence
サイバーエージェント:130億
広告クリエイティブ制作領域のサービス
サイバーエージェント日本語LLM:68億
Llama 2:70億/130億/700億
基盤モデル
GPT-4:1兆7,600億
基盤モデル
GPT-5:17兆? (GPT3x100)
基盤モデル
Google PaLM2:3,400億
内部文書リークなので不明
テクニカルレポートでは
PaLM 2-L(Unicorn):3,400億
PaLM 2-M(Bison): 1470億
PaLM 2-S(Gecko):300億程度
Google FLAN-UL5:500億 FLAN-UL2:200億
Google Pathways:5,400億
Claude 2:520億
基盤モデル
BloombergGPT:500億
Finance
AWS Titan Foundation Model:1,000億
Amazon「Olympus」:2兆
for Alexa ?
Amazon Alexa model:200億
AWS Titan Foundation Model
IBM日本語LLM:80億
IBM Granite:130億
基盤モデル
IBM watsonx Code Assistant for Z:200億
115言語対応(段階的なCobol to Java可能)
Oracle Text Embeddings:3億5,500万
Oracle Text Generation:520億
Oracle Text Summarization: 520億
大規模化 特化
Gemini Ultra:5,400億 Gemini Pro:600億 Gemini Nano-1:18億
Gemini Nano-2:32.5億
5. AppleはAIビデオ圧縮のスタートアップ企業WaveOneの買収をはじめ、 元GoogleのHead of searchのJohn Giannandreaの採用などAIに投資しています。
同じくGoogleはGoogle PhotosでスタートしたMagic EraserをMagic Editorに引き上げたことを23年のGoogle IOで発表し、G3チップはすでにPixel 8に搭載されています。
AI
AI AI
会話のリアルタイム翻訳
メールの要約
カンファレンスのTranscript生成
写真の編集
撮影のアシスト
IDが必要
インターネット通信が必要
コンピューティング能力に依存
https://blog.google/products/photos/google-photos-magic-editor-pixel-io-2023/
Magic Editor in Google Photos
Apple unveils M3, M3 Pro, and M3 Max
https://www.apple.com/newsroom/2023/10/apple-unveils-m3-m3-pro-and-m3-
max-the-most-advanced-chips-for-a-personal-computer/
Google Tensor G3
https://blog.google/products/pixel/google-tensor-g3-pixel-8/
20. OpenAI Brand guidelines
https://openai.com/brand
Google Brand Resource Center: Logos list
https://about.google/brand-resource-center/logos-list/
PaLM 2 Technical Report
https://ai.google/static/documents/palm2techreport.pdf
Microsoft Bing Image Creator
https://gradientflow.com/gemini-cheat-sheet-googles-state-of-the-art-multimodal-assistant-explained/
Gemini Cheat Sheet: Google’s State-of-the-Art Multimodal Assistant Explained
https://www.bing.com/images/create
Microsoft Research Data&AI
https://www.microsoft.com/en-us/research/group/dataai/
Microsoft Copilot Studio
https://www.microsoft.com/ja-jp/microsoft-copilot/microsoft-copilot-studio
Azure AI Studio
https://azure.microsoft.com/ja-jp/products/ai-studio
クイック スタート: 独自のデータを使用して Azure OpenAI モデルとチャットする
https://learn.microsoft.com/ja-jp/azure/ai-services/openai/use-your-data-quickstart?tabs=command-line%2Cpython&pivots=programming-language-studio
THE BALANCING ACT OF TRAINING GENERATIVE AI
https://www.nextplatform.com/2023/07/17/the-balancing-act-of-training-generative-ai/
【Oracle Cloud ウェビナー】 LLM(大規模言語モデル)などの生成AIで圧倒的なコスト・パフォーマンスを提供するOracle AI インフラストラクチャ
https://speakerdeck.com/oracle4engineer/ocwc_20231004_generativeai?slide=7
Pretrained Foundational Models in Generative AI
https://docs.oracle.com/en-us/iaas/Content/generative-ai/pretrained-models.htm
Multimodal AIは、AIオーケストレーションのひとつの形態という理解が良いと思います。Multimodal AIという文脈では画像や音声と文字などのデータの種類でのオーケストレーションが例に挙げられることが多いのですが、テキストとテキスト、文書と文書などの組合せも複数のモダリティとして理解するとSmall Language ModelのAIオーケストレーションの設計の幅が広がります。