大規模言語モデルの評価ベンチマーク「LiveBench」の最新ランキングで、アリババ集団(
09988)がオープンソースで公開した新世代の「通義千問(Qwen)」モデル「Qwen3」が、世界のオープンソースモデルで首位となった。『信報』が中国本土メディアを引用して6日伝えた。
「Qwen3」は、指示追従能力においても、OpenAIの「o3 High」「o4-Mini High」や、グーグル傘下の「Gemini 2.5 Pro」といったトップレベルのクローズドソースモデルを上回り、世界1位となった。
「LiveBench」ランキングは、数学、推論、プログラミング、言語理解など複数の複雑な側面から大規模言語モデルを総合的に評価する。動的に更新される問題セットを採用しているため、「世界初の不正行為が不可能なモデルベンチマーク」と評されている。
アリババ集団がオープンソース化した「Qwen3」には、2つのMixture of Experts(MoE)モデルと6つのDenseモデルが含まれ、パラメータ数は6億−2350億の範囲に及ぶ。「Qwen3」は119の言語と方言をサポートする。MoEアーキテクチャを採用しただけでなく、アリババ集団が初めて発表した「ハイブリッド推論モデル」であり、複雑な問題に対して時間をかけて「推論」したり、より簡単なリクエストには迅速に回答したりすることができる。