绳结测试撕开AI伪装,康奈尔团队发现,空间推理能力差成致命伤

发布时间:2025-12-20 16:06  浏览量:1

文 |姑苏九歌

编辑 |姑苏九歌

最近刷到个挺有意思的研究,康奈尔大学搞了个叫KnotGym的测试平台,拿绳结给AI出了道题。

结果挺意外,咱们平时觉得无所不能的AI,在这儿栽了个跟头。

今天就聊聊这事儿,看看AI到底在哪些地方还差点意思,为啥连个绳结都搞不定。

现在的AI确实挺牛的,写论文、做PPT、甚至画画作曲,比不少人都麻利。

你让它分析段文字,或者认张图片里的猫和狗,闭着眼睛都能给你答上来。

但康奈尔大学陈佐伊团队偏要给AI出个"体力活",玩绳结。

这个KnotGym测试平台,说白了就是个虚拟的绳结训练场。

研究人员弄了各种绳结,让AI在里面练手。

任务分三种,解结、打结、还有把一种结转换成另一种结。

听起来不难吧?咱们小时候学系鞋带,练几次也就会了。

先看解结,AI表现还行,尤其是那种常见的三交叉鞋带结,成功率能到90%。

你把一团乱麻似的鞋带扔给它,它能顺着绳头一点点捋,跟咱们解缠在一起的耳机线似的,有条不紊。

这步确实让人觉得AI挺聪明,好像真能"看懂"绳子是怎么绕的。

可一到打结环节,AI就像突然忘了怎么动手。

简单的双交叉结,成功率还有83%,稍微复杂点的三交叉结,直接掉到16%。

就好比你让一个刚学会走路的孩子去跳芭蕾,腿都不知道往哪儿放。

研究人员观察发现,AI打结的时候总在重复无效动作,要么绳子绕错方向,要么绕完又解开,折腾半天还是一团乱。

更惨的是结转换任务,比如把八字结转换成方结,AI几乎全军覆没。

它好像完全搞不懂不同绳结之间的"拓扑关系",就像让一个只学过拼音的人去写毛笔字,每个笔画都认识,组合到一起就不知道是啥了。

本来以为AI解结那么厉害,打结应该顺手拈来,没想到换个方向就懵。

后来才发现,解结的时候绳子的"终点"是明确的,只要把所有缠绕都拆开就行,AI能靠着大数据里的绳结图片规律找到捷径。

但打结得从"起点"开始规划,每一步绕法都影响最终结果,这就超出AI的舒适区了。

AI的认知断层

为啥AI在文字上那么牛,到了绳结这种空间任务就不行?这得从AI的"学习方式"说起。

现在的AI,不管是GPT还是其他大模型,本质上都是"语言学霸"。

它们靠统计海量文字数据,学会了怎么组词造句、分析语义,就像一个背了十万本词典的学生,说起话来一套一套的。

但绳结是"空间问题",得靠眼睛看、手去摸,感受绳子的走向、缠绕的力度。

这种"动手能力",AI根本没学过。

咱们人类小时候玩积木、系鞋带,都是一边摸一边试,慢慢建立起空间感。

可AI没手没眼,它只能靠数字模拟绳子的形状,相当于闭着眼睛学系鞋带,能学会才怪。

陈佐伊团队有句话说得挺到位,"AI在三维世界的理性思考,其实是崩溃的。"

文字是离散的符号,每个字、每个词都有明确的定义,AI能靠统计规律掌握。

但绳子的缠绕是连续的,一毫米的偏差可能就导致结的形状完全不同,这种"连续性"恰恰是AI最不擅长的。

你想想,咱们解绳结的时候,不光看绳子的样子,还会记着刚才是怎么绕的,甚至能预判下一步怎么动。

这种"层次化思考",AI目前还做不到。

它解结时只会盯着局部绳子的位置,比如看到一个交叉就拆开,却想不到这个交叉拆了之后,后面的绳子会怎么变。

就像下棋只看一步的新手,赢不了全局。

最有意思的是魔方,AI能算出魔方的最优解法,那是因为魔方的每个块位置都是固定的,能转化成数字问题。

但绳结不一样,绳子是软的,形状会跟着动作变,AI没法像算魔方那样列公式。

这就是"符号智能"和"空间智能"的鸿沟,一个靠脑子记规律,一个靠动手悟感觉。

AI现在就像个偏科严重的学生,语文、英语考满分,物理实验却不及格。

咱们总说要发展通用AI,可连绳结这种生活小事都搞不定,怎么谈"通用"?KnotGym测试其实给行业提了个醒,智能不是只有语言一种形式,动手能力、空间感同样重要。

那AI有没有可能学会空间推理?研究人员提了几个方向。

比如把"语言逻辑"和"空间感知"结合起来,让AI既能分析文字描述的绳结步骤,又能模拟绳子的物理变化。

还有就是让AI多"练习",用更真实的物理引擎模拟绳子的软硬度、摩擦力,就像让它在虚拟世界里多摸几次绳子。

神经符号AI也是个思路,简单说,就是让AI既有统计数据的"感性",又有逻辑推理的"理性"。

比如解结时,先靠数据识别绳结类型,再用逻辑分析拆解步骤,最后用物理模拟验证动作对不对。

这种"混搭"说不定能补上空间推理的短板,不过这事儿急不来。

人类从会系鞋带到能打复杂的水手结,练了多少年?AI想补上这块短板,怕是也得走不少弯路。

毕竟智能这东西,从来不是单一技能的堆砌,而是各种能力的综合。

现在回头看KnotGym测试,它暴露的不只是AI解不开绳结,更是通用智能发展的真实困境。

咱们总期待AI快点变得像人一样聪明,却忘了人类的智能是在摸爬滚打中一点点积累的。

从解鞋带的小进步,到打结的大难题,AI的每一次"卡壳",其实都是在提醒我们,真正的智能,从来不止于语言。

未来的AI要想突破空间推理的天花板,可能得先学会"动手"。

就像小孩子学东西,光听不行,还得亲手试试。

或许有一天,当AI能熟练打出各种绳结时,我们才能真正说,通用智能,不远了。

但现在,它还只是个会背词典的"语言天才",离"动手能手"还差得远呢。