K2 Think 性能媲美頂級推理模型,規(guī)模大幅縮減
阿聯(lián)酋阿布扎比2025年9月11日 /美通社/ -- Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) 旗下基礎(chǔ)模型研究所與 G42 今日聯(lián)合宣佈,正式推出領(lǐng)先的開源高階人工智能推理系統(tǒng) K2 Think。
K2 Think 開創(chuàng)了構(gòu)建更智能、更高效人工智能的嶄新模式。該模型僅有 320 億個參數(shù),其性能表現(xiàn)卻超越了規(guī)模大 20 倍的旗艦級推理模型。這項在參數(shù)效率上的重大突破,使 K2 Think 成為高階推理領(lǐng)域的另一強大選擇,並重新定義了精簡架構(gòu)的無限可能。
K2 Think 建基於六大創(chuàng)新支柱,奠定了新一代推理模型的典範。它採用「長思維鏈監(jiān)督式微調(diào)」以深化邏輯層次,繼而透過「可驗證獎勵的強化學(xué)習(xí)」提升處理複雜難題的準繩度。其「代理規(guī)劃」功能協(xié)助模型在推理前有效分解複雜挑戰(zhàn),而「測試時擴展技術(shù)」則進一步增強其適應(yīng)能力。此外,K2 Think 即將登陸 Cerebras 的晶圓級推理優(yōu)化計算平臺,讓全球研究人員與創(chuàng)新者能以閃電般的速度,將推理性能推向新高峰。透過為 Cerebras 硬體優(yōu)化的「推測解碼」技術(shù),K2 Think 的吞吐量將達到前所未有的每秒 2000 token,成為現(xiàn)時全球最快、最高效的推理系統(tǒng)之一。
K2 Think 的性能位列業(yè)界頂尖,在 AIME '24/'25、HMMT '25 及 OMNI-Math-HARD 等多項數(shù)學(xué)基準測試中,表現(xiàn)領(lǐng)先所有開源模型。
K2 Think 的面世不僅是一項技術(shù)成就,更是阿聯(lián)酋人工智能發(fā)展的重要里程碑。它充分體現(xiàn)了開放式創(chuàng)新與緊密的公私營合作,如何鞏固阿布扎比作為全球人工智能樞紐的領(lǐng)導(dǎo)地位,並證明未來 AI 推理的發(fā)展關(guān)鍵,不僅在於模型規(guī)模,更在於創(chuàng)意與協(xié)作。
MBZUAI 董事會主席兼人工智能及先進技術(shù)委員會 (AIATC) 成員 Khaldoon Khalifa Al Mubarak 閣下表示:「K2 Think 樹立了全新的全球基準,彰顯 MBZUAI 基礎(chǔ)模型研究所計劃的超卓創(chuàng)見,為全球合作及尖端研究提供了快行通道。這亦印證了阿聯(lián)酋的承諾——致力構(gòu)建由本地機構(gòu)研發(fā)、並與世界共享的先進系統(tǒng),最終推動具技術(shù)突破、實用且可擴展的創(chuàng)新,為全球帶來深遠的變革?!?/i>
MBZUAI 董事會成員、阿布扎比人工智能及先進技術(shù)委員會成員兼 G42 集團行政總裁 Peng Xiao 補充道:「K2 Think 已將 AI 推理的典範從『越大越好』成功轉(zhuǎn)向『越聰明越好』。在阿聯(lián)酋創(chuàng)新生態(tài)的支持下,MBZUAI 正以開放、高效及功能強大的技術(shù),開拓 AI 技術(shù)的前沿。這次的成果證明了更小、更具資源效益的模型,其實力足以媲美最大型的推理系統(tǒng),標誌著新一輪 AI 創(chuàng)新浪潮的來臨?!?/i>
有別於大多數(shù)僅發(fā)布權(quán)重的「開放式」AI 模型,K2 Think 實現(xiàn)全面開源,範圍涵蓋訓(xùn)練數(shù)據(jù)、參數(shù)權(quán)重,以至部署和測試時優(yōu)化的軟件代碼。這種前所未有的透明度,讓全球研究社群能夠深入研究、重現(xiàn)並拓展模型學(xué)習(xí)推理的整個過程。
MBZUAI 校長兼大學(xué)教授 Eric Xing 教授表示:「由 MBZUAI 基礎(chǔ)模型研究所開發(fā)的 K2 Think,是全球 AI 研發(fā)社群的一大重要進展。我們透過完全透明的框架提供這些先進成果,正引領(lǐng)一個更具成本效益、可重現(xiàn)且負責任的 AI 新時代。對於一所僅成立五年的年輕學(xué)府而言,我們的全球研究人員、工程師及團隊憑藉巧思與開創(chuàng)精神推動科技發(fā)展,對此我們深感自豪。」
K2 Think 建基於阿聯(lián)酋一個持續(xù)壯大的開源模型系列,當中包括全球最先進的阿拉伯語大型語言模型 (LLM) Jais、印地語模型 NANDA 及哈薩克語模型 SHERKALA。它同時延續(xù)了 K2-65B 的開創(chuàng)性傳統(tǒng)——K2-65B 是全球首個於 2024 年發(fā)布、可全面重現(xiàn)的開源基礎(chǔ)模型。
K2 Think 現(xiàn)已在 https://www.k2think.ai/ 及 Hugging Face 平臺上提供。
關(guān)於 Mohamed bin Zayed University of Artificial Intelligence (MBZUAI)
MBZUAI 是阿布扎比的研究型大學(xué),也是第一所完全致力於透過人工智能,推動科學(xué)進步的大學(xué)。大學(xué)透過世界一流的教育和跨學(xué)科研究,賦予下一代 AI 領(lǐng)袖能力,推動 AI 的創(chuàng)新和有影響力的科技應(yīng)用。2025 年,MBZUAI 首次推出其本科課程,即人工智能理學(xué)士 (Bachelor of Science in AI),此課程有兩個截然不同的範疇:商業(yè) (Business) 和工程 (Engineering)。更多資訊,請瀏覽 www.mbzuai.ac.ae。
進階搜尋
搜尋
|
|
|
|
|
|
繁體中文知識庫正在建設(shè)中,請您選擇簡體中文或英文版查看。
Copyright © 2025 美通社版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載.
Cision 旗下公司.