p;参数规模一直是衡量大模型能力的关键指标之一,无问科技另辟蹊径,在算法与架构优化上取得突破,这意味着更低的训练推理成本,以及更广阔的应用前景。
他低声对身边的马化藤惊叹。
“如果这是真的,商业化的潜力太大了!”
马化藤面色凝重地点点头,手指无意识地在扶手上敲击,快速计算着这其中的影响。
“还有数据。”
江倾的分享并没有停下。
“大家都知道,训练AI需要海量的数据,但不是所有数据都是优质营养。我们的方法呢,更像是炼数据而不是堆数据。”
他做了一个提炼的动作。
“我们有一套技术,能自动从数据的海洋里,把那些最有价值、最精华的片段像淘金一样筛出来,专门喂给模型。这样训练效率自然就大大提升了。”
张一铭听到这里,忍不住深吸了一口气。
数据清洗与标注一直是AI训练中耗时耗力最大的环节之一,无问科技的方法如果真能高效自动化这个过程,价值不可估量。
“最后是工程实现。”
江倾的语气里透着自豪。
“我们的团队搞了个超级工厂流水线,用了诸如3D并行、INT4量化这些技术……”
他看到台下有不少人露出迷茫的表情,立刻笑着摆手。
“好吧,说人话就是,我们想办法让成千上万的显卡更高效地协同工作,减少浪费,让计算速度更快,同时还能省电省成本。这样最终出来的产品,大家用起来才会觉得又快又便宜嘛。”
他用最朴素的语言解释了极其复杂的工程优化,让非专业观众也能理解其带来的好处。
更低的延迟,更低的成本。
台下,来自全球顶尖科技公司与研究机构的工程师、专家学者,已经听得如痴如醉,不时发出低声的惊叹。
“只以最终答案正确性作为奖励……这太大胆了!”
“MLA架构?从来没听过,看来是他们自研的!”
&nbs