期货沙龙

7x24小时快讯

2026

03/16 22 : 53
长风破浪
月之暗面Kimi发布技术报告,对大模型沿用十年的核心结构残差连接进行全新设计,让模型每一层可自主选择关注此前各层输出,而非采用统一求和方式。该设计使48B模型训练效率提升1.25倍,被业内解读为提前披露下一代模型的关键模块。此项研究由月之暗面三位联合创始人杨植麟、吴育昕、周昕宇带领数十名研究员共同完成。。