中國報告大廳網訊,近日,在上海市寶山區智慧灣科創園內,一場人機對弈吸引了眾多關注——由上海某頂尖實驗室研發的AI大模型「書生·思客」在圍棋領域展現了卓越能力。這場活動原定於下午5點結束,卻因大量兒童排隊體驗而延長至半小時後閉場,成為展廳中人氣最旺、收攤最晚的展區之一。
中國報告大廳發布的《2025-2030年全球及中國圍棋行業市場現狀調研及發展前景分析報告》指出,傳統圍棋AI多依賴棋盤狀態直接訓練模型,但書生·思客選擇了更具挑戰性的道路。其研發團隊通過將搜索過程轉化為自然語言建模進行學習,儘管這使計算量顯著增加,卻賦予了模型獨特的推理優勢。這種創新方法不僅讓AI能精準落子,還能用口語化解說對弈思路,例如解釋「飛、虎、粘」等圍棋術語的戰術意義。
圍棋的視覺語言與模型的學習方式存在天然矛盾。人類通過棋盤畫面理解落子邏輯,而書生·思客需僅憑坐標信息完成學習,相當於在「盲棋」狀態下進行複雜推理。為突破這一瓶頸,團隊構建了名為「加速訓練營」的混合訓練框架:通過持續交互反饋,使模型在數學、編程、謎題等多領域任務中同步進化,並由此觸發智能的「湧現現象」。例如,在無先驗圍棋知識的情況下,模型竟可自主推導出專業級策略。
書生·思客在兒童對弈中的全勝表現僅是其能力的一角。該模型通過跨任務強化學習,已具備奧賽數學解題、科學推理、算法編程等多元技能,並能以透明的思維鏈呈現邏輯推導過程。這種「通專融合」設計使得模型既能在特定領域達到專業水平(如圍棋),又能靈活應對複雜現實問題——例如用類似下棋的策略分析供應鏈優化路徑。
儘管書生·思客在圍棋上的表現已超越多數現有大模型,但其核心目標遠不止於此。研究團隊強調:「我們追求的是通過專業領域訓練反哺通用智能。」數據顯示,該模型在混合任務學習中展現出的遷移能力,使其比單一任務專精的AI更具泛化潛力。隨著技術疊代,未來或能在醫療診斷、金融風控等需要複雜推理的場景中發揮更大價值。
總結
從圍棋對弈到多領域智能躍遷,書生·思客展現了人工智慧發展的新範式——通過通專能力的深度融合突破單一任務局限。這場人機智斗不僅是一場科技展示,更標誌著AI在認知推理層面的重要進步。當大模型開始用人類可理解的方式解析複雜策略時,或許距離真正意義上的通用人工智慧又近了一步。