华娱2021：他不是搞科技的吗_ 第394章化繁为简，尽在掌控（4 / 8）笔趣阁

们换了个思路。我们用了一种叫做GRPO，嗯，大家可以理解为小组相对策略优化的方法。”

江倾故意放慢了语速，确保即使是非专业人士也能跟上他的思路。

“简单说，我们不太关心它中间是怎么想的，是用了九九乘法表还是列了一堆方程式，我们只在乎最后答案对不对。答案对了，就给糖吃，答案错了，就没糖。”

他摊摊手，语气诙谐。

“就这么简单粗暴。”

台下许多技术专家露出了深思的表情。

这种只以最终结果为导向的强化学习方式，听起来简单，但实际操作起来难度极高，需要对奖励信号的设计与优化有极其深刻的理解。

“我们发现，当你只告诉它目标，而不限制路径时，这个学生为了吃到糖，反而会自己琢磨出各种各样，有时甚至我们都没想到的奇妙解题思路。”

江倾笑着指了指自己的脑袋。

“它自我演化出了更高级的推理能力。这叫……嗯，不管黑猫白猫，抓到老鼠就是好猫。”

一句接地气的俗语，引得全场爆发出大笑声。

无论是听懂的技术宅，还是没完全听懂的普通观众，都被这个巧妙的比喻逗乐，同时也理解了核心思想。

姚启智院士边笑边对旁边的黄铁军低声感叹。

“化繁为简，大道至简啊！这个思路，妙！”

“没错，这个思路太惊艳了！”

黄铁军满脸赞同，说话时眼睛也未曾从台上移开过，令姚启智不禁摇头失笑。

江倾等笑声稍歇，继续分享。

“当然，光有思路还不够，还得有个好身板。我们给万象设计了一个新的大脑结构，名为MLA，即多维层级注意力机制。”

他点了点自己的太阳穴。

“这个新结构，效率更高，相当于用更小的脑容量，即参数，干更多的活儿，表现还更好。我们并没有一味地去堆砌参数，追求那个吓人的数字。”

李彦弘闻言，身体微微前倾，眼神认真。

&nbs