,DeepSeek官方披露,其网页端和App正在测试新的长文本模型结构。主要更新亮点如下:
| 维度 | 更新内容 | 具体说明 |
|---|---|---|
| 上下文能力 | 从128K扩展到1M Token | 官方在相关社群中确认,新版本已支持1M上下文,处理能力相比前代V3系列提升了近7倍。这意味着它可以一次性处理如《三体》三部曲体量的超长文本,或解析中型规模的完整代码库。 |
| 知识时效性 | 更新至2025年5月 | 在不联网状态下,可以准确回答2025年4月之前的新闻事件,知识储备显著更新。 |
| 技术架构 | 融合V3与R1优势 | 新模型融合了V3的高效推理架构和R1的强化学习能力,推理能力、长文本写作和细节理解方面都有明显提升。 |
| 官方声明 | 不是V2/V3,也不是R1 | 对于底层模型,官方回应称:“我是DeepSeek最新版模型,站在V3这个巨人肩膀上,又往前走了几步的版本。” |
🔮 市场解读:V4的前奏与过渡
对于这次更新,市场和行业观察家们给出了更多维度的解读:
💡 总结
所以,你问DeepSeek春节有没有“扔王炸”?答案是肯定的。虽然它没有直接发布万众期待的V4,但这次上下文能力的巨大飞跃和底层模型的融合创新,无疑是一次扎实而 impactful 的更新。它不仅提升了实用能力,也为后续DeepSeek V4满血版的登场做好了铺垫和技术验证。
发表评论 取消回复