Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 豆包大模型1.5 – 字节跳动推出的最新版大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > 豆包大模型1.5 – 字节跳动推出的最新版大模型
AIGC 资讯

豆包大模型1.5 – 字节跳动推出的最新版大模型

站外新闻
最近更新: 2026年6月8日 下午4:48
SHARE

豆包大模型1.5是什么

豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得分在知识、代码、推理、中文等多个测评基准上优于GPT-4o和Claude 3.5 Sonnet等模型。豆包大模型1.5 还推出了豆包·实时语音模型(Doubao-1.5-realtime-voice-pro)和豆包·视觉理解模型(Doubao-1.5-vision-pro),具备低时延、可打断的语音对话能力以及更强的视觉推理和文档识别能力。模型训练过程中未使用任何其他模型生成的数据。

阅读目录
  • 豆包大模型1.5是什么
  • 豆包大模型1.5的主要功能
  • 豆包大模型1.5的技术原理
  • 如何使用豆包大模型1.5
  • 豆包大模型1.5的项目地址
  • 豆包大模型1.5的应用场景

豆包大模型1.5

豆包大模型1.5的主要功能

  • 综合能力显著增强:在知识(如MMLU_PRO、GPQA)、代码(如McEval、FullStackBench)、推理(如DROP)、中文(如CMMLU、C-Eval)等多个权威测评基准上表现全球领先,综合得分优于GPT-4o、Claude 3.5 Sonnet等业界一流模型。
  • 高效模型结构与低成本:采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,远超业内常规效率。自研服务器集群方案支持低成本芯片,硬件成本大幅降低。
  • 多模态能力全面提升
    • 豆包·视觉理解模型(Doubao-1.5-vision-pro):在多模态数据合成、动态分辨率、多模态对齐、混合训练上全面升级,视觉推理、文字文档识别、细粒度信息理解能力显著增强。
    • 豆包·实时语音模型(Doubao-1.5-realtime-voice-pro):采用Speech2Speech端到端框架,支持端到端语音对话,具备低时延、可随时打断等特性,已全量上线豆包App。
  • 深度思考能力:基于豆包1.5基座模型,通过RL算法突破和工程优化,研发出深度思考模型Doubao-1.5-Pro-AS1-Preview,在AIME等评测中表现领先。
  • 数据独立性:模型训练过程中未使用任何其他模型生成的数据,构建了完全自主的数据生产体系,确保数据来源的独立性和可靠性。

豆包大模型1.5的技术原理

  • 大规模稀疏MoE架构:豆包大模型1.5 采用了大规模稀疏MoE(Mixture of Experts)架构,通过较小的激活参数进行预训练,等效于7倍激活参数的Dense模型性能,远超业内常规的3倍杠杆效率。
  • 多模态融合技术:模型在多模态能力上进行了显著升级,支持文本、图像、语音等多种模态的输入和输出。
  • 高效的数据处理与训练:豆包大模型1.5 在训练过程中未使用任何其他模型生成的数据,是通过自主构建的数据生产体系,结合标注团队和模型self-play技术,确保数据来源的独立性和可靠性。模型通过自研服务器集群方案和优化技术,显著降低了硬件成本。
  • 强化学习与优化框架:豆包大模型团队提出了HybridFlow框架,是灵活且高效的强化学习(RL)训练框架,结合了单控制器和多控制器的优势,显著提升了训练吞吐量。
  • 模型优化与推理加速:豆包大模型1.5 通过精细量化、PD分离等技术,优化了模型的推理效率。

如何使用豆包大模型1.5

  • 豆包APP:豆包大模型1.5已灰度上线,用户可在豆包APP中体验。
  • 火山引擎API:开发者可通过火山引擎直接调用API,支持多场景应用。
  • 价格优势:保持原有模型价格不变,加量不加价。

豆包大模型1.5的项目地址

  • 项目官网:https://team.doubao.com/zh/special/doubao_1_5_pro

豆包大模型1.5的应用场景

  • 情感分析与反馈:通过语音和文本的情感分析,更好地理解用户情绪,提供更有针对性的服务。
  • 智能作业辅导:帮助学生解答数学、科学等学科问题,提供解题思路和步骤。
  • 文本生成:支持长文本生成,适用于新闻报道、文案创作、故事创作等。
  • 视频生成:豆包视频生成模型可基于文本或图片生成高质量视频,支持动态海报和短视频创作。
  • 视觉理解:豆包视觉理解模型可识别图像中的物体、场景,并进行逻辑推理,适用于教育领域的题目解析、图表分析等。
  • 多语言学习:支持多语种语音识别和生成,可用于语言学习和教学。
阿里Qwen3.6-Plus发布:百万上下文+超低参数量,编码智能体性能直逼Claude 4.5 Opus
Mellum2 – JetBrains 开源的混合专家模型
NBA中国携手阿里巴巴上线首个官方大模型“NBA Chat”
VACE – 阿里通义推出的视频生成与编辑框架
万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型
分享
Email 复制链接 打印
Share
上一篇 GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架
下一篇 X-Prompt – 用于多模态视频目标分割的通用框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

X-Prompt – 用于多模态视频目标分割的通用框架
AIGC 资讯
GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架
AIGC 资讯
Cube 3D – Roblox 推出的 AI 3D 生成模型
AIGC 资讯
OpenMath-Nemotron – 英伟达开源的数学推理系列模型
AIGC 资讯

相关推荐

全息流体渐变通用占位特色图
AIGC 资讯

SentinelOne裁员8%聚焦AI安全:年营收增长21%仍亏损,科技巨头集体押注生成式AI

站外新闻
AI网络安全 SentinelOne 企业转型 生成式AI 科技裁员
AIGC 资讯

A2A – 谷歌开源的首个标准智能体交互协议

站外新闻
AIGC 资讯

Qwen2.5-Omni-3B – 阿里 Qwen 团队推出的轻量级多模态 AI 模型

站外新闻
AI 工具AIGC 资讯

AnyClaw 开源发布:专为AI Agent打造的「万能转接头」,一键将传统API、脚本转为MCP/Skills/CLI工具

站外新闻
AI Agent MCP协议 OpenCLI 开源工具 智能转接头
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.