アリババ集団(
09988)の大規模言語モデル「千問(Qwen)」を巡り、人材の動きが注目されている。中国本土メディアによると、Qwenの追加学習工程を統括していた郁博文氏が、字節跳動(バイトダンス)に移籍したようだ。Seedチームに所属し、視覚モデルとマルチモーダル対話分野の追加学習を担当する責任者を務めるという。『信報』が12日伝えた。
Qwenの技術責任者を務めていた林俊暘氏は先週、突然の辞任を発表しており、郁氏も同日にアリババ集団を離れていたとされる。
アリババ集団の呉泳銘・最高経営責任者(CEO)は先週のコメントで、今後もオープンソースモデル戦略を堅持するとともに、基盤モデルを支援する専門チームを設立する方針を示した。アリババクラウドの周靖人・最高技術責任者(CTO)は、引き続き通義ラボを率いて研究開発を進めるとしている。
報道によると、通義ラボでは組織体制の見直しが進められており、Qwenチームは従来、学習工程やモダリティーを一体で担ってきた「垂直統合型」体制から、事前学習、追加学習、テキスト、マルチモーダルなどの機能別に分かれた水平分業体制へ移行する計画という。こうした再編により、林氏や郁氏の管掌範囲は大幅に縮小し、技術方針を巡る意見の相違も生じていたとされる。
公開資料によると、郁氏は2022年に博士号を取得後、アリババの最上位新卒採用プログラム「アリババ・スター」を通じて阿里巴巴達摩院(DAMOアカデミー)に入社。アルゴリズム専門家としてQwenの初期学習と開発に深く関与し、短期間で中核人材となり、最終的に追加学習工程の責任者を務めていた。