新一代混合推理模型引領AI技術革新

中國報告大廳網訊，在人工智慧領域，模型性能與成本效率的平衡一直是技術突破的關鍵。近日，一款名為千問3的新一代混合推理模型正式發布，以其創新的架構和卓越的性能，成為全球開源模型中的佼佼者。該模型不僅大幅降低了部署成本，還在多項國際評測中刷新了紀錄，為智能體應用和大模型部署提供了強有力的支持。

一、混合推理架構實現性能與成本雙突破

中國報告大廳發布的《2025-2030年全球及中國模型行業市場現狀調研及發展前景分析報告》指出，千問3採用了混合專家（MoE）架構，總參數量達到235B，但激活僅需22B，顯著降低了算力消耗。這種架構將「快思考」與「慢思考」集成於同一模型，能夠根據需求靈活調整計算資源。對於簡單問題，模型可以低算力快速響應；對於複雜問題，則通過多步驟深度思考提供精準答案。這種設計不僅提升了效率，還大幅節省了成本，僅需4張H20即可部署滿血版千問3，顯存占用僅為性能相近模型的三分之一。

二、多項評測刷新紀錄，性能全面領先

千問3在推理、指令遵循、工具調用和多語言能力等方面均表現出色。在奧數水平的AIME25測評中，千問3以81.5分刷新了開源模型紀錄；在代碼能力評測中，其得分突破70分，甚至超越了Grok3；在人類偏好對齊評測中，千問3以95.6分超越OpenAIo1及DeepSeekR1。這些成績充分證明了千問3在技術上的領先地位。

三、多樣化模型版本滿足不同場景需求

千問3提供了豐富的模型版本，包括2款30B和235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。每款模型均在同尺寸開源模型中表現最佳。例如，30B參數的MoE模型僅激活3B即可媲美上代32B模型的性能，而32B版本的千問3甚至跨級超越了72B模型的性能。這種多樣化的設計使得千問3能夠靈活適應手機、電腦、汽車等不同終端的部署需求。

四、智能體應用支持與工具調用能力大幅提升

千問3在智能體應用方面表現出色，其原生支持MCP協議，並具備強大的工具調用能力。結合QwenAgent框架，開發者可以輕鬆實現高效的手機及電腦Agent操作。在智能體能力評測中，千問3以70.8分超越Gemini2.5Pro和OpenAIo1等頂尖模型，進一步降低了智能體調用工具的門檻。

五、開源協議與多語言支持推動全球應用

千問3系列模型採用寬鬆的Apache2.0協議開源，並首次支持119多種語言。全球開發者、研究機構和企業均可免費下載並商用該模型，也可以通過雲平台調用其API服務。個人用戶可以通過相關應用直接體驗千問3，進一步推動了其普及與應用。

總結

千問3的發布標誌著混合推理模型在性能與成本效率上的重大突破。其創新的架構、卓越的性能表現以及多樣化的模型版本，為智能體應用和大模型部署提供了強有力的支持。同時，開源協議與多語言支持進一步推動了其全球應用，為人工智慧技術的普及與發展注入了新的活力。

所有欄目

一、混合推理架構實現性能與成本雙突破

二、多項評測刷新紀錄，性能全面領先

三、多樣化模型版本滿足不同場景需求

四、智能體應用支持與工具調用能力大幅提升

五、開源協議與多語言支持推動全球應用

熱門推薦

相關資訊

免費報告