PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
更多精彩内容请查阅
X(https://x.com/MyTokencap)或加入社区了解更多MyToken-官方华文电报群
(https://t.me/mytoken_cn)
X(https://x.com/MyTokencap)或加入社区了解更多MyToken-官方华文电报群
(https://t.me/mytoken_cn)
相关阅读


Spark 安全框架深度解析:六层防护如何守住你的链上资产?
Spark 发布风险管理功能全面概述,Spark Savings 金库受多层首损资本与流动性保障,SparkLend 货币市场采用多预言机与速率限制,保护用户资产安全。...
PANews2026-04-24 03:54:00
Deepseek官网公布deepseek-v4接口文档
PANews 4月24日消息,据金十报道,Deepseek官网上线deepseek-v4接口和模型介绍,包括deepseek-v4-flash和deepseek-v4-pro。...
PANews2026-04-24 02:58:00
硅谷教父Naval亲自坐镇,AngelList把未上市成长型公司装进USVC基金
AngelList 联合创始人 Naval Ravikant 掌舵新基金 USVC,500 美元门槛撬动 OpenAI、xAI 等未上市成长公司投资机会,解读 Pre-IPO 渠道如何向普通投资者开放...
PANews2026-04-24 02:43:00