快手“快意大模型”获信通院5级评估

2024年07月01日 | 小微 | 浏览量：49762

快手“快意大模型”获信通院5级评估
图片来源于网络，如有侵权，请联系删除

在近日举办的“可信AI·南京人工智能产业发展论坛”上，中国信息通信研究院（中国信通院）正式揭晓了“可信AI”大模型评测结果，快手“快意大模型”（KwaiYii-175B）在其组织的可信AI大模型评测中荣获最高等级——5级评估，彰显了其在人工智能领域的技术创新实力。

“快意”是快手大模型团队自主研发的大语言模型，能够实现高效的自然语言理解和文本生成，为复杂的知识问答、文案创作、实时翻译、逻辑推理，以及代码编写与分析等任务提供强大支持。

自去年 8 月份快手发布自研大语言模型“快意”（KwaiYii）-13B 版本以来，半年内快手又相继研发了 66B、175B 版本的大模型，用以适配不同的业务场景的需求。经过数万亿 Tokens 训练的快意大模型在 MMLU、C-Eval 等中英文权威榜单上均取得了优异的成绩。

据介绍，“快意”模型通过硬件优化与混合并行算法的结合，实现了GPU集群算力利用效率超50%的提升，同时将推理成本有效控制在开源方案的十分之一，极大地推动了AI应用的经济性和实用性。

在数据处理层面，“快意”模型成功将PB级别的原始数据精炼为TB级高质量训练集，不仅大幅度降低了数据处理的负担，还通过课程学习式的组织方式，确保了模型训练的高效与平稳。此外，该模型覆盖了广泛的领域知识，进一步强化了其在多元化应用场景中的适应能力。

据悉，快手与国内外顶尖学术机构携手，共同提出了Temporal Scaling Law理论，为超参数优化提供了新的理论支撑。同时，通过创新集成Scaffold-BPE、MiLe Loss等务实高效的前沿算法，快手在提升模型预训练效率和效果上取得了重大进展。

此外在技术上，快手采用Rejection Sampling等技术显著改善了数据质量，并通过多样本Packing、Iterative DPO/PPO、细粒度Loss等策略，有效提高了训练的稳定性和模型性能。在解码策略上，提出了创新性的并行解码预测策略，大幅提升了推理速度。

接下来，快手还将在即将召开的2024世界人工智能大会(WAIC)上，举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛。届时，快手将发布最新的大模型技术与应用战略，包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。

【责任编辑:谷雨】

阅读下一篇：