この資料では、高精度なオープンソースDeep Researchエージェント開発へのBAAI様の取り組みと、データセット・LLMの構築手法の例を紹介しています。3B規模のLLMであっても、この手法で構築されたデータセット上で学習することで十分に強力なDeep Researchエージェントを構成できることが示されています。ここでの結果は、オープンソースモデルが出揃っていないDeep Researchという分野において、小規模なモデルであってもフロンティアモデルとの差を埋めることができる可能性があることを示唆しています。
This document introduces BAAI's efforts toward developing high-precision open-source Deep Research agents and provides examples of dataset and LLM construction methods. It demonstrates that even a 3B-scale LLM can be trained on datasets built using this methodology to form sufficiently powerful Deep Research agents. These results suggest that in the field of Deep Research, where open-source models are not yet fully established, even small-scale models have the potential to bridge the gap with frontier models.