PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读



ARK Invest发布《比特币与量子计算》白皮书:约35%比特币供应存在潜在量子攻击面
PANews 3月12日消息,ARK Invest 与 Unchained 联合发布《比特币与量子计算》白皮书称,当前量子计算尚不足以威胁比特币安全,量子风险将通过一系列可观测的技术里程碑逐步显现而非...
PANews2026-03-12 15:37:00
巴基斯坦立法:南亚 “十字路口” 如何用合规锚定数字资产未来?
巴基斯坦议会正式通过《虚拟资产法》,并设立国家级监管机构。...
PANews2026-03-12 15:32:00

币安将上线跟踪韩国股市ETF的EWYUSDT U本位永续合约
PANews 3月12日消息,Binance Futures将于2026年3月16日21:30(UTC+8)上线EWYUSDT指数永续合约,最高支持10倍杠杆。合约标的指数为iShares MSCI ...
PANews2026-03-12 14:32:00