克日,,,,,,香港都会大学博士生方政上海申盛商业运营有限公司儒和所在团队让一群智能体在虚拟迷宫里配合探索,,,,,,只给它们一个极其简朴的目的——那就是学会展望同伴下一秒会看到什么以及会走到那里。。。。。。效果发明这些智能体不但学会了高效相助,,,,,,还在自己的“大脑”里自觉形成了类似动物大脑中的“地图细胞”,,,,,,甚至发明了一套只有它们才懂的秘私语言。。。。。。
他告诉 DeepTech:“PT视讯(中国区)官网实验批注,,,,,,智能体在仅有第一人称视角与严酷带脱期制下,,,,,,不但形成了类似网格细胞的空间表征与具备明确语义的离散符号系统,,,,,,还分解出类似社会位置细胞的功效神经元,,,,,,显著提升了使命乐成率与通讯效率。。。。。。”
这项研究为明确社会位置细胞的爆发提供了盘算模子,,,,,,也为多机械人系统在低带宽或通讯受限场景中的高效协作提供了新思绪。。。。。。这意味着基于该效果不但能让机械人变得越发智慧,,,,,,还能资助我们明确人类大脑是怎样学习和怎样社交的,,,,,,未来甚至能够用于机械人客栈搬运和灾难救援等许多地方。。。。。。
图 | 方政儒(泉源:方政儒)
在 Agent“大脑”里长出网络地图
大大都人都使用过手机上的地图软件。。。。。。人类在一定水平上依赖地图认路,,,,,,而科学家发明老鼠和蝙蝠等动物的大脑中也有一种脑内地图。。。。。。2014 年,,,,,,几位科学家由于发明了大脑中的 GPS 细胞,,,,,,也就是位置细胞和网格细胞,,,,,,获得了昔时的诺贝尔奖。。。。。。这些细胞即是是大脑里的导航仪:位置细胞可以告诉你现在在哪儿,,,,,,网格细胞则像坐标纸一样资助我们丈量走了多远。。。。。。
有趣的是,,,,,,科学家厥后还在蝙蝠大脑里发明了社会位置细胞,,,,,,这种细胞能够记着同伴的位置,,,,,,让动物们在觅食或者逃避天敌时能够默契地配合。。。。。。
(泉源:左图 Edwards (2018),,,,,,右图 Omer et al. (2018))
那么,,,,,,Agent 能不可也长出这样的脑细胞?????本次研究中,,,,,,方政儒等人并没有教给 Agent 任何关于地图的知识,,,,,,只是让它们在迷宫里一边走、一边试着展望自己和同伴接下来会看到什么。。。。。。效果发明,,,,,,Agent 的神经网络中真的自觉泛起了一种类似网格细胞的激活模式,,,,,,并泛起出整齐的六边形图案,,,,,,就像蜜蜂巢穴一样。。。。。。
这种图案和动物大脑中的网格细胞很是相似。。。。。。更主要的是,,,,,,若是人为地关掉这些细胞,,,,,,Agent 就会突然不认路了。。。。。。这说明,,,,,,这些自觉形成的结构关于 Agent 构建空间影象至关主要。。。。。。
(泉源:方政儒、郭彧)
Agent 之间也会相互说悄悄话
可是,,,,,,若是两个 Agent 一起在迷宫里寻找目的,,,,,,它们该怎样交流呢?????你可能会想:它们可以随时相互发送所看到的一切信息。。。。。。然而问题来了,,,,,,若是迷宫很大或者信号很差,,,,,,这时转达太多信息就会很是慢和很是耗电。。。。。。
研究中,,,,,,方政儒等人给 Agent 设置了这样一个挑战:让它们只能转达很少的信息,,,,,,以此视察它们是怎样相助的。。。。。。效果发明这些 Agent 居然自己发明了一套高效的相同模式:它们并不会一直地语言,,,,,,而是只在最需要的时间使用很短的旗号举行交流。。。。。。
好比,,,,,,当一个 Agent 走进死胡同的时间,,,,,,它会向其他 Agent 发出此路欠亨的信号;;;;;当 Agent 走到一个要害岔口的时间,,,,,,它会发出一个“这里有三个偏向可选”的信号。。。。。。
更智慧的是,,,,,,Agent 会判断同伴最有可能在那里猜错,,,,,,因此它可以只在对方最容易迷路或者漏看的地刚刚发出提醒。。。。。。这样一来,,,,,,它们纵然将某个要转达的信息压缩 32 倍,,,,,,也能完成统一使命,,,,,,并且乐成率还比多次重复说的旧有要领横跨了一大截。。。。。。
除了地图细胞和秘私语言,,,,,,本次研究发明 Agent 还长出了第三种有趣的结构:专门认真追踪同伴位置的社会神经元。。。。。。方政儒等人发明 Agent 的神经网络中会逐渐分解出三种差别的细胞:第一种细胞只体贴自己在那里,,,,,,就像人脑的位置细胞一样;;;;;第二种细胞只体贴同伴在那里,,,,,,就像人脑的社会位置细胞一样;;;;;第三种细胞则同时关注自己和同伴的位置。。。。。。
而若是人为地抑制那些专门关注同伴的细胞,,,,,,Agent 展望同伴位置的能力就会大大下降。。。。。。这说明,,,,,,这些细胞是在学会展望他人的历程中自然形成的,,,,,,而不是被事先设计好的。。。。。。
(泉源:方政儒、郭彧)
这项研究最引人注重的地方在于,,,,,,Agent 并没有被直接教会怎么认路或者怎么谈天,,,,,,它们只是被付与了展望同伴这样一个简朴的目的。。。。。。而在实现这个目的的历程中,,,,,,地图、语言、社交细胞所有自己冒了出来。。。。。。这就像我们念书时和同砚一起完成小组作业,,,,,,不知不觉学会了分工、记条记、甚至发明一些只有我们才懂的旗号一样。。。。。。
这种机制不但可以资助我们明确包括人类在内的动物大脑社交能力是怎样涌现出来的,,,,,,还能直接用在许多机械人相助的场景里。。。。。。
例如,,,,,,在仓储物流领域,,,,,,一群搬运机械人或允许以在大型客栈里自主协作、高效地分拣货物,,,,,,纵然信号欠好也能默契配合;;;;;而在多机械人搜救场景,,,,,,好比在地动现场或者火灾现场。。。。。,,,,,机械人步队可以快速地探索废墟,,,,,,使用最少的通讯量来共享要害信息,,,,,,更快地找到被困者;;;;;在明确社交障碍领域,,,,,,通过模拟 Agent 社交能力的形成,,,,,,科学家可以更好地研究自闭症等社交障碍的神经机制,,,,,,为治疗提供新的思绪。。。。。。
另据悉,,,,,,方政儒是香港都会大学赛马会“智慧都会”创科实验室的在读博士生(导师方玉光教授),,,,,,同时也是清华大学深圳国际研究生院智能感知与机械人实验室的会见学生(导师丁文伯教授)。。。。。。未来,,,,,,他将继续深耕机械人通讯感知与决议领域。。。。。。
参考资料:
相关论文 https://arxiv.org/abs/2511.04235
运营/排版:何晨龙
上海申盛商业运营有限公司