深圳南财多媒体有限公司介绍

AI成為數(shù)學(xué)家得力助手還要多久
2025-06-19 10:30:27 來(lái)源:科技日?qǐng)?bào) 編輯:
從計(jì)算機(jī)科學(xué)到醫(yī)學(xué)再到國(guó)家安全,數(shù)學(xué)是眾多關(guān)鍵應(yīng)用的基石,但數(shù)學(xué)領(lǐng)域的進(jìn)步可能需要數(shù)年時(shí)間才能實(shí)現(xiàn)。

幾百年來(lái),數(shù)學(xué)家使用的工具依然簡(jiǎn)樸:一張紙、一支筆。他們憑借邏輯與靈感,在符號(hào)的迷宮中尋找通往真理的路徑。

為了打破這一局面,美國(guó)國(guó)防高級(jí)研究計(jì)劃局今年4月啟動(dòng)了“指數(shù)性數(shù)學(xué)”計(jì)劃,旨在開(kāi)發(fā)一種能極大提升數(shù)學(xué)研究效率的人工智能(AI)“合著者”系統(tǒng)。

幾十年來(lái),數(shù)學(xué)家借助計(jì)算機(jī)進(jìn)行輔助計(jì)算或驗(yàn)證命題,如今的AI或許能更上層樓,挑戰(zhàn)那些人類長(zhǎng)年未解的難題。不過(guò),從能解高中題的AI,到能協(xié)助攻克前沿?cái)?shù)學(xué)難關(guān)的AI,中間仍隔著一道鴻溝。

圖片來(lái)源:物理學(xué)家組織網(wǎng)

解決重大難題仍力不從心

大型語(yǔ)言模型(LLM)并不擅長(zhǎng)數(shù)學(xué)。它們常常出現(xiàn)“幻覺(jué)”,甚至可能被誤導(dǎo)相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現(xiàn)出的進(jìn)步令數(shù)學(xué)家眼前一亮。

今年,這些模型在美國(guó)數(shù)學(xué)邀請(qǐng)賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過(guò)去“一錘定音”式的輸出,這些模型開(kāi)始嘗試模擬數(shù)學(xué)家逐步推理的思考過(guò)程。

同時(shí),一些將LLM與某種事實(shí)核查系統(tǒng)相結(jié)合的新型混合模型也取得了突破。例如,谷歌“深度思維”的AlphaProof系統(tǒng)將語(yǔ)言模型與棋類AI——AlphaZero結(jié)合,成為首個(gè)取得與國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽銀牌得主成績(jī)相當(dāng)?shù)南到y(tǒng)。今年5月,谷歌的AlphaEvolve模型更進(jìn)一步,在多個(gè)長(zhǎng)期未解的數(shù)學(xué)與計(jì)算難題上找到優(yōu)于人類現(xiàn)有方案的解法。

美國(guó)《麻省理工科技評(píng)論》指出,盡管這些AI成績(jī)亮眼,但專家們普遍認(rèn)為,它們?nèi)圆痪邆湔嬲膮f(xié)助科研的能力。競(jìng)賽題雖難,卻更像是智力游戲,有一定“套路”。真正的數(shù)學(xué)研究則更開(kāi)放、更復(fù)雜。面對(duì)“P vs NP”“黎曼猜想”等重大難題時(shí),AI仍力不從心。

為了更準(zhǔn)確地評(píng)估AI的能力,初創(chuàng)公司Epoch AI去年推出了FrontierMath測(cè)試,聯(lián)合60多位數(shù)學(xué)家設(shè)計(jì)出全新高難度題目,避開(kāi)模型已見(jiàn)過(guò)的訓(xùn)練數(shù)據(jù),結(jié)果LLM幾乎集體“交白卷”。

這些測(cè)試表明,AI在數(shù)學(xué)道路上雖已邁步,但離“合著者”角色仍有很長(zhǎng)一段路要走。

需攻克“超長(zhǎng)推理鏈”

仔細(xì)觀察數(shù)學(xué)問(wèn)題會(huì)發(fā)現(xiàn),它們?cè)谀承┓矫骖愃疲航鉀Q問(wèn)題需完成一系列連續(xù)步驟,關(guān)鍵在于找到這些步驟。

美國(guó)加州理工學(xué)院謝爾蓋·古科夫指出,困難的差異往往體現(xiàn)在路徑的長(zhǎng)度上。高中數(shù)學(xué)可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長(zhǎng)達(dá)百萬(wàn)步。

這類“超長(zhǎng)路徑”極難處理。就像下圍棋時(shí)尋找一條制勝序列,AI必須在指數(shù)級(jí)增長(zhǎng)的可能路徑中找到正確解法。而在數(shù)學(xué)中,這個(gè)復(fù)雜度要遠(yuǎn)超棋類游戲。

據(jù)物理學(xué)家組織網(wǎng)今年2月報(bào)道,為應(yīng)對(duì)這一挑戰(zhàn),古科夫團(tuán)隊(duì)開(kāi)發(fā)了一種方法,將多個(gè)步驟打包成“超級(jí)步驟”,相當(dāng)于穿上“巨人靴”跨越大段路程。他們?cè)O(shè)計(jì)了一個(gè)系統(tǒng),其中強(qiáng)化學(xué)習(xí)模型負(fù)責(zé)提出超級(jí)步驟,另一個(gè)模型負(fù)責(zé)驗(yàn)證其合理性。

該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學(xué)家推翻了一個(gè)40年來(lái)被廣泛引用的“反例”。這曾被視為證明該猜想錯(cuò)誤的關(guān)鍵依據(jù)。

牛津大學(xué)數(shù)學(xué)家馬丁·布里森對(duì)此表示肯定:“排除錯(cuò)誤路徑,是科研中非常有價(jià)值的一步。”

古科夫相信,這種“壓縮路徑”的思路適用于所有需要推理鏈條的領(lǐng)域。他希望,這種方法不僅能推動(dòng)AI跳出固有模式,也為數(shù)學(xué)研究帶來(lái)新突破。

真正的創(chuàng)新和突破仍屬人類

跳出思維定式,正是數(shù)學(xué)家攻克難題的關(guān)鍵。數(shù)學(xué)常被看作機(jī)械推理,而高等數(shù)學(xué)則更像是一場(chǎng)實(shí)驗(yàn),充滿一波三折的試錯(cuò)與靈光乍現(xiàn)的頓悟。

這正是AlphaEvolve等AI工具的優(yōu)勢(shì)所在。它通過(guò)LLM不斷生成并改進(jìn)解題代碼,配合第二個(gè)模型評(píng)估每一輪結(jié)果,最終提出比人類更優(yōu)的解法。這種方法不僅能獨(dú)立探索,也支持人類隨時(shí)介入,提供靈感和指令。

澳大利亞悉尼大學(xué)數(shù)學(xué)家喬迪·威廉姆森強(qiáng)調(diào),探索性思維是數(shù)學(xué)的核心。據(jù)英國(guó)《新科學(xué)家》網(wǎng)站報(bào)道,他與Meta合作開(kāi)發(fā)了PatternBoost AI系統(tǒng),可根據(jù)一個(gè)數(shù)學(xué)想法生成相似概念,幫助激發(fā)靈感。他說(shuō):“這就像是這里有一堆有趣的東西,我不知道是怎么回事,但你能再生成一些類似的東西嗎?”

這種頭腦風(fēng)暴在數(shù)學(xué)中至關(guān)重要,它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過(guò)純粹推理發(fā)現(xiàn)了它,其形狀并不存在于自然界中,卻深刻影響了數(shù)學(xué)的發(fā)展。威廉姆森希望,AI未來(lái)也能協(xié)助發(fā)現(xiàn)類似的“新數(shù)學(xué)對(duì)象”。

不過(guò),目前AI仍缺乏真正的創(chuàng)造力。讓AI贏棋是一回事,讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺(jué)的“偵察兵”,幫助人們發(fā)現(xiàn)路徑、避開(kāi)死路,但專家普遍認(rèn)為,真正的創(chuàng)新與突破,仍然屬于人類。

關(guān)鍵詞:

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

主站蜘蛛池模板: 行业分析:提及郑州火车站附近真有 特殊按摩 ?2025实地踩坑指南 新手如何避坑不踩雷 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 西门子伺服控制器维修-伺服驱动放大器-828D数控机床维修-上海涌迪 | 屏蔽泵厂家,化工屏蔽泵_维修-淄博泵业| 二手回收公司_销毁处理公司_设备回收公司-找回收信息网 | 大倾角皮带机-皮带输送机-螺旋输送机-矿用皮带输送机价格厂家-河南坤威机械 | GEDORE扭力螺丝刀-GORDON防静电刷-CHEMTRONICS吸锡线-上海卓君电子有限公司 | 上海阳光泵业制造有限公司 -【官方网站】 | 阀门智能定位器_电液动执行器_气动执行机构-赫尔法流体技术(北京)有限公司 | 扒渣机,铁水扒渣机,钢水扒渣机,铁水捞渣机,钢水捞渣机-烟台盛利达工程技术有限公司 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | 小型UV打印机-UV平板打印机-大型uv打印机-UV打印机源头厂家 |松普集团 | 深圳货架厂家_金丽声精品货架_广东金丽声展示设备有限公司官网 | 粉末冶金-粉末冶金齿轮-粉末冶金零件厂家-东莞市正朗精密金属零件有限公司 | 小型玉石雕刻机_家用玉雕机_小型万能雕刻机_凡刻雕刻机官网 | 设定时间记录电子秤-自动累计储存电子秤-昆山巨天仪器设备有限公司 | 客服外包专业服务商_客服外包中心_网萌科技 | 免联考国际MBA_在职MBA报考条件/科目/排名-MBA信息网 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 真空上料机(一种真空输送机)-百科| 红外光谱仪维修_二手红外光谱仪_红外压片机_红外附件-天津博精仪器 | 冷轧机|两肋冷轧机|扁钢冷轧机|倒立式拉丝机|钢筋拔丝机|收线机-巩义市华瑞重工机械制造有限公司 | 炭黑吸油计_测试仪,单颗粒子硬度仪_ASTM标准炭黑自销-上海贺纳斯仪器仪表有限公司(HITEC中国办事处) | 上海公司注册-代理记账-招投标审计-上海昆仑扇财税咨询有限公司 上海冠顶工业设备有限公司-隧道炉,烘箱,UV固化机,涂装设备,高温炉,工业机器人生产厂家 | 河南砖机首页-全自动液压免烧砖机,小型砌块水泥砖机厂家[十年老厂] | 短信营销平台_短信群发平台_106短信发送平台-河南路尚 | 科威信洗净科技,碳氢清洗机,超声波清洗机,真空碳氢清洗机 | 分子蒸馏设备(短程分子蒸馏装置)_上海达丰仪器 | 京马网,京马建站,网站定制,营销型网站建设,东莞建站,东莞网站建设-首页-京马网 | 鑫铭东办公家具一站式定制采购-深圳办公家具厂家直销 | 磁力去毛刺机_去毛刺磁力抛光机_磁力光饰机_磁力滚抛机_精密金属零件去毛刺机厂家-冠古科技 | 塑料熔指仪-塑料熔融指数仪-熔体流动速率试验机-广东宏拓仪器科技有限公司 | 河南包装袋厂家_河南真空袋批发价格_河南服装袋定制-恒源达包装制品 | 暴风影音| 三效蒸发器_多效蒸发器价格_四效三效蒸发器厂家-青岛康景辉 | 天津暖气片厂家_钢制散热器_天津铜铝复合暖气片_维尼罗散热器 | 学校用栓剂模,玻璃瓶轧盖钳,小型安瓿熔封机,实验室安瓿熔封机-长沙中亚制药设备有限公司 | 管理会计网-PCMA初级管理会计,中级管理会计考试网站 | 石家庄装修设计_室内家装设计_别墅装饰装修公司-石家庄金舍装饰官网 | 香港新时代国际美容美发化妆美甲培训学校-26年培训经验,值得信赖! | 汽车润滑油厂家-机油/润滑油代理-高性能机油-领驰慧润滑科技(河北)有限公司 |