第394章 化繁为简,尽在掌控(4 / 8)

们换了个思路。我们用了一种叫做GRPO,嗯,大家可以理解为小组相对策略优化的方法。”

    江倾故意放慢了语速,确保即使是非专业人士也能跟上他的思路。

    “简单说,我们不太关心它中间是怎么想的,是用了九九乘法表还是列了一堆方程式,我们只在乎最后答案对不对。答案对了,就给糖吃,答案错了,就没糖。”

    他摊摊手,语气诙谐。

    “就这么简单粗暴。”

    台下许多技术专家露出了深思的表情。

    这种只以最终结果为导向的强化学习方式,听起来简单,但实际操作起来难度极高,需要对奖励信号的设计与优化有极其深刻的理解。

    “我们发现,当你只告诉它目标,而不限制路径时,这个学生为了吃到糖,反而会自己琢磨出各种各样,有时甚至我们都没想到的奇妙解题思路。”

    江倾笑着指了指自己的脑袋。

    “它自我演化出了更高级的推理能力。这叫……嗯,不管黑猫白猫,抓到老鼠就是好猫。”

    一句接地气的俗语,引得全场爆发出大笑声。

    无论是听懂的技术宅,还是没完全听懂的普通观众,都被这个巧妙的比喻逗乐,同时也理解了核心思想。

    姚启智院士边笑边对旁边的黄铁军低声感叹。

    “化繁为简,大道至简啊!这个思路,妙!”

    “没错,这个思路太惊艳了!”

    黄铁军满脸赞同,说话时眼睛也未曾从台上移开过,令姚启智不禁摇头失笑。

    江倾等笑声稍歇,继续分享。

    “当然,光有思路还不够,还得有个好身板。我们给万象设计了一个新的大脑结构,名为MLA,即多维层级注意力机制。”

    他点了点自己的太阳穴。

    “这个新结构,效率更高,相当于用更小的脑容量,即参数,干更多的活儿,表现还更好。我们并没有一味地去堆砌参数,追求那个吓人的数字。”

    李彦弘闻言,身体微微前倾,眼神认真。

   &nbs