官方宣布 V3.1 版本正式发布,这一版本带来了多项重要升级,尤其值得关注的是,它采用了混合推理架构,支持思考与非思考模式的自由切换,大大提升了响应效率,Agent 能力也得到进一步增强。更引人瞩目的是,DeepSeek 官方介绍,该版本使用了 UE8M0 FP8 Scale 的参数精度,DeepSeek 官微在置顶留言中明确表示,UE8M0 FP8 是针对即将发布的下一代国产芯片设计。
在人工智能快速发展的当下,芯片作为算力的核心支撑,其重要性不言而喻。国产芯片近年来虽取得显著进展,但在与 AI 模型的适配性方面,仍存在一些挑战。以往,国产芯片在部署 DeepSeek 模型时,常常会出现性能减弱的情况,除非进行专门的软件适配,这无疑增加了应用成本与技术难度。而此次 DeepSeek-V3.1 的发布,通过采用 UE8M0 FP8 Scale 参数精度,为下一代国产芯片量身打造了技术规范与设计标准,天博体育赛事资讯填补了国产芯片与先进 AI 模型适配的关键技术空白。
FP8 是 Float8 的简称,即使用 8 位二进制数表示浮点数,主要应用于深度学习的训练和推理。相较于传统的 FP32(32 位浮点数)或 FP16(16 位浮点数),FP8 显著降低了显存占用和计算资源需求,同时通过动态范围调整等优化设计,维持了较高的精度。对于国产芯片而言,FP8 技术的应用将极大提升其使用效率,进一步缩小与国际领先的 NV 芯片在效率 / 成本方面的差距,大幅增加国产芯片在 AI 领域的可用性。
除了对国产芯片的适配,DeepSeek-V3.1 自身在技术层面也实现了重大突破。其采用的混合推理架构,允许一个模型同时支持思考模式与非思考模式。这意味着在面对不同需求时,天博体育赛事资讯模型能够灵活选择是快速给出答案,还是进行更长链路的推理,在保持性能稳定的同时,显著提升了响应速度。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,有效避免了 “越改越乱” 的问题。
在复杂搜索任务上,V3.1 也展现出更为成熟的检索与整合能力。它能够规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能远超前代模型。此外,配合 128K 的上下文扩展和 FP8 精度推理,V3.1 在工程层面强化了吞吐效率与能耗表现,为大规模应用奠定了坚实基础。这些技术升级,不仅提升了 DeepSeek-V3.1 模型自身的性能,也为国产芯片在实际应用中发挥更大作用提供了有力支持。
在商业与生态布局上,DeepSeek 采取了 “双轨” 策略。一方面,继续提供 API 服务,但从 9 月 6 日起,对 API 接口调用价格进行了调整,取消了夜间时段优惠。输入价格方面,缓存命中时为 0.5 元 / 百万 tokens,缓存未命中时价格从之前 V3 的 2 元 / 百万 tokens 涨至 4 元 / 百万 tokens;输出价格则从 V3 的 8 元 / 百万 tokens 调整为 12 元 / 百万 tokens。官方解释称,V3.1 的基础模型在 V3 的基础上重新进行了外扩训练,共增加训练了 840B tokens,成本的增加一定程度上导致了价格的调整。
另一方面,V3.1 的 Base 模型与后训练版本已在 Hugging Face 和魔搭同步开源。开源策略对于国产芯片产业生态的构建具有重要意义。通过开源,开发者能够基于 DeepSeek-V3.1 模型进行二次开发与优化,使其更好地适配国产芯片的硬件特性,促进国产芯片与 AI 模型的深度融合,加速国产 AI 生态全方面闭环的形成。
目前,国产 AI 芯片正处于技术突破与生态落地的关键窗口期,DeepSeek-V3.1 的发布,无疑为国产芯片产业的发展注入了一剂强心针。
它不仅在技术层面为国产芯片提供了适配方案,提升了国产芯片在 AI 领域的竞争力,还通过开源等生态策略,吸引更多开发者参与,推动国产芯片产业生态的繁荣发展。随着下一代国产芯片的即将发布,我们有理由期待,在 DeepSeek-V3.1 等先进技术的助力下,国产芯片将在 AI 时代迎来新的发展机遇,实现更大的突破。