Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DeepSeek-V4 百万上下文大模型发布:Agent代码能力首超闭源,Pro/Flash双版开源引领普惠AI
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > DeepSeek-V4 百万上下文大模型发布:Agent代码能力首超闭源,Pro/Flash双版开源引领普惠AI
AI 工具AIGC 资讯最新趋势

DeepSeek-V4 百万上下文大模型发布:Agent代码能力首超闭源,Pro/Flash双版开源引领普惠AI

站外新闻
最近更新: 2026年5月24日 上午2:29
Agent能力 AI推理优化 DeepSeek-V4 开源大模型 百万上下文大模型
SHARE

💡 站外导读:当上下文窗口从千级跃升至百万级,大模型的落地边界正被彻底重构。然而,超长上下文带来的二次方计算瓶颈与高昂显存成本,始终是行业规模化应用的‘拦路虎’。与此同时,AI Agent的爆发对模型的代码能力、工具调用与长程规划提出了全新挑战。DeepSeek-V4的发布,正是对这些核心痛点的精准回应:它不仅以创新的注意力架构破解了长上下文效率难题,更在Agent和代码竞赛中首次让开源模型追平顶尖闭源对手,为行业提供了性能与成本兼备的普惠化新基座。

DeepSeek-V4是什么

DeepSeek-V4是DeepSeek推出的新一代大语言模型系列预览版,拥有百万字超长上下文窗口,在Agent能力、世界知识与推理性能方面达到开源领域领先水平。模型包含deepseek-v4-pro 和 deepseek-v4-flash 两个版本,分别定位高性能与经济高效,均已开源并提供API服务,支持非思考与思考双模式,为长文本处理与智能体应用提供普惠化基础设施。

阅读目录
  • DeepSeek-V4是什么
  • DeepSeek-V4的主要功能
  • DeepSeek-V4的技术原理
  • DeepSeek-V4的性能体现
  • 如何使用DeepSeek-V4
  • DeepSeek-V4的关键信息和使用要求
  • DeepSeek-V4的核心优势
  • DeepSeek-V4的项目地址
  • DeepSeek-V4的同类竞品对比
  • DeepSeek-V4的应用场景
      • 📝 站长洞察 (Editor’s Insight)

DeepSeek-V4

DeepSeek-V4的主要功能

  • 百万上下文处理:原生支持1M Token超长文本理解与记忆,为官方服务标配。
  • 混合注意力机制:CSA与HCA架构大幅降低长上下文计算与显存开销。
  • Agent编码增强:针对Claude Code、OpenClaw等主流Agent框架深度优化。
  • 双模式推理:支持非思考与思考模式,后者可通过reasoning_effort参数调节强度。
  • 多领域专家融合:通过OPD蒸馏整合数学、代码、Agent等领域专家能力。
  • 经济高效选择:Flash版本用更低参数实现接近Pro的推理性能,API成本显著降低。

DeepSeek-V4的技术原理

  • CSA压缩稀疏注意力:将每m个token的KV压缩为1个条目,通过Lightning Indexer计算索引分数并执行Top-k稀疏选择,结合滑动窗口与Attention Sink机制保留局部依赖。
  • HCA重度压缩注意力:以更大压缩比m’将KV条目合并为单个条目,保持密集注意力而不采用稀疏选择,进一步降低计算量。
  • mHC流形约束超连接:将残差映射矩阵通过Sinkhorn-Knopp算法投影到双随机矩阵流形,约束谱范数不超过1,增强深层信号传播稳定性。
  • Muon优化器:模型采用混合Newton-Schulz迭代对梯度矩阵进行正交化,分快速收敛与精确稳定两个阶段,支持大规模MoE高效训练。
  • FP4量化感知训练:对MoE专家权重和CSA索引器QK路径进行FP4量化,用FP8扩展动态范围实现无损反量化,降低内存与计算开销。

DeepSeek-V4的性能体现

  • 知识能力
    • 世界知识领先开源:SimpleQA-Verified达57.9%,超越所有已评测开源模型20个百分点,仅稍逊于Gemini-3.1-Pro(75.6%)。
    • 中文知识突出:Chinese-SimpleQA达84.4%,大幅领先K2.6(75.9%)与GLM-5.1(75.0%)。
    • 教育知识接近前沿:MMLU-Pro 87.5%、GPQA Diamond 90.1%,与GPT-5.4持平,略低于Gemini-3.1-Pro。
  • 推理与代码能力
    • 数学竞赛比肩闭源:HMMT 2026 Feb达95.2%,IMOAnswerBench达89.8%,超越K2.6与GLM-5.1,接近GPT-5.4与Opus-4.6。
    • 代码竞赛首次开源追平闭源:Codeforces Rating达3206,与GPT-5.4(3168)相当,当前排名人类选手第23位。
    • 高难度推理突破:Apex Shortlist达90.2%,超越GPT-5.4(78.1%)与Opus-4.6(85.9%);LiveCodeBench达93.5%,领先所有对比模型。
  • Agent能力
    • 软件工程接近顶级闭源:SWE Verified达80.6%,与Opus-4.6(80.8%)基本持平;SWE Pro 55.4%、SWE Multilingual 76.2%。
    • 终端操作领先开源:Terminal Bench 2.0达67.9%,超越K2.6(66.7%)、GLM-5.1(63.5%)与Opus-4.6(65.4%)。
    • 工具调用泛化优秀:MCPAtlas Public 73.6%、Toolathlon 51.8%,在包含广泛工具和MCP服务的评测中表现突出。
  • 长上下文能力
    • 百万上下文检索强劲:MRCR 1M达83.5%,超越Gemini-3.1-Pro(76.3%);128K内检索性能高度稳定,1M时仍保持较强能力。
    • 真实场景长文档理解:CorpusQA 1M达62.0%,优于Gemini-3.1-Pro(53.8%)。
  • 效率表现
    • 计算量断崖式下降:1M上下文下,V4-Pro单Token推理FLOPs仅为V3.2的27%,V4-Flash仅为10%。
    • KV缓存大幅压缩:1M上下文下,V4-Pro累计KV缓存为V3.2的10%,V4-Flash仅为7%。
    • 路由专家FP4量化:专家权重采用FP4存储,未来硬件上理论可再提升1/3效率。

DeepSeek-V4

如何使用DeepSeek-V4

  • 网页端/App:访问DeepSeek官网或官方App,选择专家模式(Pro)或快速模式(Flash)。
  • API调用:修改model参数为deepseek-v4-pro或deepseek-v4-flash,base_url保持不变。
  • 思考模式:复杂Agent场景建议启用思考模式并设置reasoning_effort: max。
  • 本地部署:通过Hugging Face或ModelScope下载开源权重自行部署。

DeepSeek-V4的关键信息和使用要求

  • 版本规格:Pro版1.6T参数/49B激活,Flash版284B参数/13B激活,预训练数据分别为33T与32T。
  • 上下文长度:两个版本均支持1M Token,旧接口deepseek-chat与deepseek-reasoner将于2026-07-24停用。
  • API定价(每百万Token):Pro输入缓存命中1元/未命中12元,输出24元;Flash输入缓存命中0.2元/未命中1元,输出2元。
  • 算力限制:Pro版当前服务吞吐有限,预计下半年昇腾950超节点批量上市后价格将大幅下调。

DeepSeek-V4的核心优势

  • 百万上下文普惠化:1M Token超长上下文成为官方服务标配,突破传统注意力机制的二次计算瓶颈,使长文本任务与测试时缩放真正可行。
  • 极致长上下文效率:通过CSA压缩稀疏注意力与HCA重度压缩注意力的混合架构,1M上下文下V4-Pro的单Token推理FLOPs仅为V3.2的27%,KV缓存仅10%,Flash版更是低至10%与7%。
  • 开源模型性能新标杆:V4-Pro-Max在知识、推理、代码竞赛等评测中全面领先前代开源模型,Agent编码能力内部评测优于Claude Sonnet 4.5,交付质量接近Opus 4.6非思考模式。
  • 双版本灵活覆盖:Pro版(1.6T/49B)定位顶级性能,Flash版(284B/13B)以极小激活参数实现接近的推理能力,API价格低至Pro的1/12,普惠不同预算场景。
  • Agent能力原生增强:针对Claude Code、OpenClaw等主流Agent框架专项优化,支持跨用户消息边界的连贯推理保留,在SWE、Terminal Bench等Agent评测中表现优异。

DeepSeek-V4的项目地址

  • HuggingFace模型库:https://huggingface.co/collections/deepseek-ai/deepseek-v4
  • 技术论文:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

DeepSeek-V4的同类竞品对比

对比维度 DeepSeek-V4-Pro Claude Opus 4.6 Kimi K2.6
模型定位 开源高性能MoE 闭源顶级通用 开源Agent智能
开源状态 完全开源 闭源API 开源/开放API
总参数量 1.6T 未公开 未公开
激活参数 49B 未公开 未公开
上下文长度 1M Token 200K 1M Token
核心架构 CSA+HCA混合注意力 传统Transformer MoE+长上下文
MMLU-Pro 87.5 89.1 87.1
SimpleQA 57.9 46.2 36.9
Codeforces 3206 – –
SWE Verified 80.6 80.8 80.2
Terminal Bench 67.9 65.4 66.7
MRCR 1M 83.5 92.9 –
API输入价格 12元/百万Token 约150元/百万Token 约60元/百万Token
长上下文效率 KV缓存仅为V3.2的10% 标准KV缓存 高效但细节未公开

DeepSeek-V4的应用场景

  • 长文档分析:支持百万字级论文、报告、法律合同的全文理解与跨章节推理。
  • 智能体编码:在Claude Code、OpenClaw等框架中执行复杂代码生成、重构与调试任务。
  • 多轮工具调用:在Agent工作流中保留完整推理历史,支持跨用户消息边界的连贯思考。
  • 知识密集型问答:在世界知识评测中大幅领先开源模型,适用于教育、科研与专业咨询。
  • 白领办公任务:模型在中文写作、信息分析、文档生成与编辑等场景表现优异。

📝 站长洞察 (Editor’s Insight)

DeepSeek-V4的发布标志着大模型竞争进入‘长上下文原生化’与‘Agent实战化’并行的新阶段。其核心创新CSA/HCA混合架构,本质上是用‘压缩记忆’的工程思想,在超长上下文场景下实现了计算复杂度的近线性增长,这比简单堆砌参数更具产业价值。更关键的是,V4在Agent和代码基准上首次让开源模型追平顶级闭源模型,意味着智能体应用的底层技术壁垒正在被开源力量瓦解。结合其Pro与Flash的双版本策略,DeepSeek实际上在定义下一代模型的‘价值公式’:不再是单纯的性能竞赛,而是单位算力下的任务完成效率与全场景成本覆盖能力。随着昇腾等国产算力节点的成熟,这种‘高效架构+开源生态+普惠定价’的组合,可能将深刻改变企业级AI应用的选型逻辑。

奔腾4惊现AI复活赛!2006年古董CPU硬扛Meta Llama 3大模型,每秒仅0.21 Token背后藏何玄机?
腾讯电脑管家Mac版重磅发布!首创AI安全沙箱,一文看懂如何守护AI智能体
MiniMax Music 2.5+:专业级AI音乐生成模型,支持跨风格融合与全场景配乐
vLLM深度解析:开源大模型推理框架,PagedAttention技术如何提升吞吐量10倍并大幅降低硬件成本
Re.Art AI 图像生成器
TAGGED:Agent能力AI推理优化DeepSeek-V4开源大模型百万上下文大模型
分享
Email 复制链接 打印
Share
上一篇 量子芯片科技感占位特色图 xAI重磅发布Grok V9-Medium:1.5万亿参数专攻编程,Blackwell架构深度优化,剑指AI代码助手新霸主
下一篇 量子芯片科技感占位特色图 谷歌CEO皮查伊罕见坦承:编程领域暂落后于竞品,AI搜索将稳健转型而非激进颠覆
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

英伟达重磅开源Nemotron Speech ASR:实时语音识别延迟低至24ms,游戏翻译会议全搞定
AI 工具 AIGC 资讯
高德地图x北邮发布FantasyWorld:统一视频与3D建模框架,赋能AR/VR与机器人导航新纪元
AI 工具 AIGC 资讯
Obsidian-skills:Obsidian官方开源AI工具包深度解析|Claude Code无缝集成指南
AI 工具
全球首个产品级开源智能体操作系统!女娲智能体OS发布,企业AI自动化新标杆
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

Flipbook:前OpenAI团队打造AI原生视觉浏览器,颠覆HTML的无限像素交互革命

站外新闻
AIGC AI浏览器 openai 视觉生成 零代码开发
AI 工具

Outerbase

remaker
AI 工具

Wallpapers AI

remaker
AIGC 资讯

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 Midjourney MiniMax Mistral AI MoE MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 知识管理 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.