中國報告大廳網訊,在人工智慧領域,模型性能與成本效率的平衡一直是技術突破的關鍵。近日,一款名為千問3的新一代混合推理模型正式發布,以其創新的架構和卓越的性能,成為全球開源模型中的佼佼者。該模型不僅大幅降低了部署成本,還在多項國際評測中刷新了紀錄,為智能體應用和大模型部署提供了強有力的支持。
中國報告大廳發布的《2025-2030年全球及中國模型行業市場現狀調研及發展前景分析報告》指出,千問3採用了混合專家(MoE)架構,總參數量達到235B,但激活僅需22B,顯著降低了算力消耗。這種架構將「快思考」與「慢思考」集成於同一模型,能夠根據需求靈活調整計算資源。對於簡單問題,模型可以低算力快速響應;對於複雜問題,則通過多步驟深度思考提供精準答案。這種設計不僅提升了效率,還大幅節省了成本,僅需4張H20即可部署滿血版千問3,顯存占用僅為性能相近模型的三分之一。
千問3在推理、指令遵循、工具調用和多語言能力等方面均表現出色。在奧數水平的AIME25測評中,千問3以81.5分刷新了開源模型紀錄;在代碼能力評測中,其得分突破70分,甚至超越了Grok3;在人類偏好對齊評測中,千問3以95.6分超越OpenAIo1及DeepSeekR1。這些成績充分證明了千問3在技術上的領先地位。
千問3提供了豐富的模型版本,包括2款30B和235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。每款模型均在同尺寸開源模型中表現最佳。例如,30B參數的MoE模型僅激活3B即可媲美上代32B模型的性能,而32B版本的千問3甚至跨級超越了72B模型的性能。這種多樣化的設計使得千問3能夠靈活適應手機、電腦、汽車等不同終端的部署需求。
千問3在智能體應用方面表現出色,其原生支持MCP協議,並具備強大的工具調用能力。結合QwenAgent框架,開發者可以輕鬆實現高效的手機及電腦Agent操作。在智能體能力評測中,千問3以70.8分超越Gemini2.5Pro和OpenAIo1等頂尖模型,進一步降低了智能體調用工具的門檻。
千問3系列模型採用寬鬆的Apache2.0協議開源,並首次支持119多種語言。全球開發者、研究機構和企業均可免費下載並商用該模型,也可以通過雲平台調用其API服務。個人用戶可以通過相關應用直接體驗千問3,進一步推動了其普及與應用。
總結
千問3的發布標誌著混合推理模型在性能與成本效率上的重大突破。其創新的架構、卓越的性能表現以及多樣化的模型版本,為智能體應用和大模型部署提供了強有力的支持。同時,開源協議與多語言支持進一步推動了其全球應用,為人工智慧技術的普及與發展注入了新的活力。