対話型AIモデルの性能比較ランキング「Chatbot Arena + OpenLM.ai」の2026年6月1日時点の集計で、中国企業が開発した大規模言語モデル(LLM)が世界の上位に相次いでランクインした。中国勢はIT大手に加え、AI開発を主力とする新興企業も存在感を高めており、生成AI分野で世界トップクラスの競争力を示している。
中国勢で首位となったのはアリババ集団(
09988)の「Qwen3.7-Max」で、Arena Eloスコアは1486だった。プログラミング能力を測るコーディング評価では1505、知識と推論能力を測定するMMLU-Proでは89.6を記録するなど、高い総合性能を示した。
中国勢で2位は百度(
09888)の「ERNIE-5.1」でスコアは1475だった。3位には北京智譜華章科技(
02513)の「GLM-5.1」とDeepSeekの「DeepSeek-V4-Pro」がともにスコアが1467で並んだ。GLM-5.1はMITライセンスによるオープンソースモデルとして提供されている。DeepSeekは推論能力を強化した「DeepSeek-V3.2-Thinking」なども展開している。
このほか、非上場の月之暗面(Moonshot)の「Kimi-K2.6-Thinking」が1466、動画投稿アプリ「TikTok」を運営するバイトダンス(ByteDance)の「Seed2.0 Pro」が1466、小米集団(
01810)の「MiMo-V2.5-Pro」も1466を記録し、上位グループに入った。
ランキングは、ユーザー同士のモデル比較投票を基にした「Arena」、複数の主要ベンチマークを統合した「Artificial Analysis Intelligence Index(AAII) v3」、汎用人工知能(AGI)の能力を評価する「ARC-AGI」の3指標を組み合わせて算出している。