中国・Alibabaグループが開発する大規模言語モデル(LLM)「Qwen」の研究チームが、コード生成や補完、数学の推論タスクに特化したLLM「Qwen2.5-Coder」の新モデルを2024年11月12日にリリースしました。Qwen2.5-Coderのコーディング機能はGPT-4oに匹敵し、パラメータ数も ...
Qwen3-Coderは複数サイズで展開されるが、今回、最上位モデルのQwen3-Coder-480B-A35B-Instructを公開した。これは480Bのパラメータ、35BのアクティブパラメータをもつMoE (Mixture-of-Experts) モデルで、コンテキスト長は標準で256Kトークンまで対応し、YaRNなどの拡張手法 ...