Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 美团万亿参数大模型LongCat-2.0-Preview:国产芯片训推闭环破局,1M上下文免费开放内测
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 美团万亿参数大模型LongCat-2.0-Preview:国产芯片训推闭环破局,1M上下文免费开放内测
AI 工具AIGC 资讯

美团万亿参数大模型LongCat-2.0-Preview:国产芯片训推闭环破局,1M上下文免费开放内测

站外新闻
最近更新: 2026年5月24日 上午2:29
MoE架构 万亿参数 国产算力 大模型 美团
SHARE

💡 站外导读:当全球大模型竞赛陷入算力瓶颈,国内厂商对英伟达GPU的依赖成为“卡脖子”难题。美团LongCat-2.0-Preview横空出世,以1.6T总参数、纯国产5-6万张加速卡的硬核配置,首次实现万亿级模型训练与推理全闭环,英伟达占比为0。这不仅是一次技术突破,更是国产AI基础设施自主可控的里程碑。

LongCat-2.0-Preview是什么

LongCat-2.0-Preview 是美团推出的万亿参数级大模型预览版,采用 MoE 架构,总参数达 1.6T、激活参数约 48B,支持 1M 超长上下文。模型基于 5–6 万张国产加速卡完成全流程训练与推理,英伟达算力占比为 0,系业内首次在国产芯片上跑通万亿级大模型训推闭环,目前模型已开放内测,每日提供 1000 万免费 Token 额度。

阅读目录
  • LongCat-2.0-Preview是什么
  • LongCat-2.0-Preview的主要功能
  • LongCat-2.0-Preview的技术原理
  • 如何使用LongCat-2.0-Preview
  • LongCat-2.0-Preview的关键信息和使用要求
  • LongCat-2.0-Preview的核心优势
  • LongCat-2.0-Preview的同类竞品对比
  • LongCat-2.0-Preview的应用场景
      • 📝 站长洞察 (Editor’s Insight)

LongCat-2.0-Preview

LongCat-2.0-Preview的主要功能

  • 超长上下文理解:支持 1M token 长文本输入,可处理整本书籍、大型代码库、长篇报告等海量内容。
  • 代码生成与推理:基于 MoE 架构精准调度专家网络,在编程、数学推理与复杂指令跟随任务中表现稳定。
  • 多轮对话与语义检索:通过稀疏注意力机制,在长对话历史中快速定位关键信息,减少重复计算。
  • 多模态内容理解:结合美团在本地生活场景的积累,支持对复杂业务文档、图文混合内容的深度解析。

LongCat-2.0-Preview的技术原理

  • MoE(混合专家)架构:总参数 1.6T 中仅激活 48B 参与单次前向计算,通过门控路由动态选择最相关的专家模块,降低推理成本。
  • N-gram Embedding:将部分原本位于专家层的参数前移至 Embedding 层,引入词组级建模能力,使高频语言模式可直接匹配命中,减少逐层计算开销。
  • 稀疏注意力与跨层流感知索引:引入轻量稀疏注意力机制,叠加跨层语义路径索引,避免全量 O(n²) Attention 计算,保障 1M 上下文下的推理延迟可控。
  • 确定性算子自研:针对国产芯片生态,自研 FlashAttention 反向梯度(FAG)、Scatter 类算子及 GEMM 模块,将性能损失控制在 5% 左右,确保万卡集群长期训练的可复现性。
  • 显存与通信优化:通过 V-ZB 算法将训练峰值显存压缩至 60GB 以下,重构专家并行(EP)、张量并行(TP)与流水线并行(PP)策略,适配国产芯片带宽与显存约束。

如何使用LongCat-2.0-Preview

  • 申请内测资格:访问LongCat开放平台,官网点击内测申请入口,填写基本信息并提交审核。
  • 等待审核通过:团队将在申请提交后进行资格审核,通过后以邮件或短信形式通知用户开通权限。
  • 登录平台获取额度:用审核通过的账号登录 LongCat 平台,系统自动发放每日 1000 万 Token 的免费调用额度。
  • 选择接入方式:用户可通过 Web 聊天界面直接体验,或根据文档指引获取 API Key,将模型接入自有应用与工作流程。
  • 开始长文本任务:在对话框或 API 请求中输入长文档、代码库或复杂指令,模型将基于 1M 上下文窗口与 MoE 专家网络完成推理并返回结果。

LongCat-2.0-Preview的关键信息和使用要求

  • 模型名称:LongCat-2.0-Preview
  • 发布方:美团 / LongCat 团队
  • 模型架构:MoE,总参数 1.6T,激活参数 48B
  • 上下文窗口:1M(百万级)token
  • 算力底座:5–6 万张国产加速卡,训推全流程国产化
  • 使用阶段:受邀内测,需申请资格
  • 免费额度:每日 1000 万 Token
  • 硬件要求:用户端无需配置硬件,通过云端 API 或 Web 界面调用

LongCat-2.0-Preview的核心优势

  • 全流程国产自主可控:从训练到推理完全基于国产芯片,摆脱对英伟达 CUDA 生态的依赖,验证国产算力可支撑顶级大模型任务。
  • 超长文本能力领先:1M 上下文窗口配合稀疏注意力,在长文档分析、视频脚本理解等场景具备显著优势。
  • 推理成本可控:MoE 架构仅激活少量专家,N-gram Embedding 进一步降低计算量,单位任务成本远低于稠密模型。
  • 工程稳定性强:通过确定性计算与多层容错恢复体系,在万卡级国产集群上实现长周期稳定训练,故障定位与复现能力追平国际水平。
  • 开源基因深厚:LongCat 团队已开源 Flash、Video、Image、AudioDiT 等多个项目,2.0 版本大概率延续开放路线。

LongCat-2.0-Preview的同类竞品对比

对比维度 LongCat-2.0-Preview DeepSeek-V4
发布方 美团 DeepSeek
总参数量 约 1.6T 万亿级
激活参数 约 48B 未公开具体数值
上下文窗口 1M 1M
训练算力 5–6 万张国产卡,全流程 英伟达 GPU 训练,国产平台推理首发
架构特色 N-gram Embedding + 稀疏注意力 MLA + MoE
国产自主程度 训推全流程国产化,英伟达含量为 0 训练依赖英伟达,推理可跑国产芯片
开源策略 大概率延续开源 已开源
使用成本 内测阶段每日 1000 万免费 Token V4 Flash 0.02 元/百万 Tokens,V4 Pro 0.025 元/百万 Tokens
生态定位 验证国产算力上限,深耕本地生活场景 极致性价比,服务广泛开发者

LongCat-2.0-Preview的应用场景

  • 长文档分析与研报生成:一次性输入百万字级资料,进行摘要提取、观点对比与深度研报撰写。
  • 大型代码库理解与开发:处理整个项目仓库的代码,完成跨文件依赖分析、Bug 定位与功能模块生成。
  • 智能客服与工单处理:在电商、外卖、酒旅等场景中,基于超长上下文理解用户历史订单与复杂投诉链路。
  • 多语言翻译与本地化:利用长上下文保持术语一致性,处理整本技术手册或影视字幕的批量翻译。
  • 教育科研与知识管理:辅助学者快速梳理海量文献,构建知识图谱,回答跨论文的综合性问题。

📝 站长洞察 (Editor’s Insight)

LongCat-2.0-Preview的发布,标志着国产算力从“可用”迈向“好用”的关键转折。其技术路径极具前瞻性:MoE架构降低推理成本,N-gram Embedding提升语义匹配效率,稀疏注意力突破长文本瓶颈——这些创新直指大模型落地的核心痛点。更值得关注的是,美团将本地生活场景的深厚积累融入多模态理解,使模型具备独特的产业价值。在中美科技博弈背景下,这款模型验证了国产生态支撑顶级AI任务的可能性。未来,谁能率先在国产芯片上跑通大规模训推闭环,谁就能在AI基础设施竞争中占据主动。LongCat不仅是一个模型,更是中国AI算力自主化的一份宣言。

阿里Qwen3.6-27B开源!270亿参数碾压万亿级MoE,编程+多模态全能型大模型深度解析
ScriptMe
OpenAI官方命令行工具震撼发布:一键调用GPT-5.5,开发者效率革命已至
360鸿图
ChartAI
TAGGED:MoE架构万亿参数国产算力大模型美团
分享
Email 复制链接 打印
Share
上一篇 Career-Ops: 基于Claude Code的开源AI求职系统,精准筛选职位并自动生成ATS简历,告别海投低效
下一篇 gnhf:开源AI Agent自主编排器,睡前一设定,醒来满仓代码——夜间自动迭代的开发神器
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

开源buffett-skills:用Claude Code复现巴菲特决策框架,AI一键生成10章节投资分析报告
AI 工具
港中文开源OpenGame框架:端到端生成可玩网页游戏,揭秘AI游戏开发新范式
AI 工具 AIGC 资讯
OpenAI重磅开源隐私过滤模型:本地运行、支持128K长文本的PII脱敏新方案
AI 工具 AIGC 资讯
流光脑波AI大脑占位特色图
《AI伦理安全指引1.0》重磅发布:阿里华为等联合起草,为大模型落地装上“安全闸”,开启合规新纪元
AIGC 资讯 最新趋势

相关推荐

AI 工具

Where To

remaker
AI 工具

Beducated

remaker
AI 工具

Noise Eraser

remaker
AI 工具

Cohesive

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

3D AI AI Agent AIGC AI工具 AI智能体 AI生成内容 AI绘画 AI编程 AI编程工具 AI视频 AI设计 Anthropic chatgpt Claude Claude Code DALL-E3 DeepSeek Gemini GPT-5.5 meta Midjourney NVIDIA openai Pika prompt runway Stability AI stable diffusion 世界模型 丛林 乐高 人像 人工智能 人物 具身智能 办公自动化 动物 咒语 图像生成模型 多模态 多模态大模型 大模型 大模型API 大语言模型 女性 字节跳动 室内设计 家居 局部重绘 展台 帅哥 建筑 建筑设计 开发者工具 开源 开源工具 开源平台 开源框架 开源模型 强化学习 微摄影 微软 怪物 提示词 摄影 教程 新加坡 新闻 日本排放核污水 早报 智能体 水果 海报设计 清华大学 游戏 游戏美术 玻璃 破碎 科幻 窗 美食 背景 腾讯混元 芭比 花 英伟达 苹果 表情包 视频编辑 赛博朋克 超现实主义 运动 阶跃星辰 阿里通义 阿里通义千问 风景 食物 香水 马斯克
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.