PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读


比特币巨鲸Garrett Jin从Binance提现5312万枚USDT,仍持有超3万枚BTC
PANews 2月14日消息, 链上数据显示,比特币巨鲸 Garrett Jin ( BitcoinOG 1011short )疑似已卖出其此前转入 Binance 的 5,000 枚 BTC ,约合...
PANews2026-02-14 14:50:00
对话矿业OG Jeremy:看好金银钨,做特许权模式的矿产投资
Jeremy Gray将探讨为什么黄金和钨在当前很重要、特许权模式提供了哪些传统矿业所没有的优势,以及他如何看待矿业周期下一阶段的展开。...
PANews2026-02-14 13:24:00
AI Agent经济的真正竞争是什么?
信用体系解决谁值得信任,算法信任解决无需信任任何人。...
PANews2026-02-14 12:24:00