Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 豆包大模型1.5 – 字节跳动推出的最新版大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > 豆包大模型1.5 – 字节跳动推出的最新版大模型
AIGC 资讯

豆包大模型1.5 – 字节跳动推出的最新版大模型

站外新闻
最近更新: 2026年6月8日 下午4:48
SHARE

豆包大模型1.5是什么

豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得分在知识、代码、推理、中文等多个测评基准上优于GPT-4o和Claude 3.5 Sonnet等模型。豆包大模型1.5 还推出了豆包·实时语音模型(Doubao-1.5-realtime-voice-pro)和豆包·视觉理解模型(Doubao-1.5-vision-pro),具备低时延、可打断的语音对话能力以及更强的视觉推理和文档识别能力。模型训练过程中未使用任何其他模型生成的数据。

阅读目录
  • 豆包大模型1.5是什么
  • 豆包大模型1.5的主要功能
  • 豆包大模型1.5的技术原理
  • 如何使用豆包大模型1.5
  • 豆包大模型1.5的项目地址
  • 豆包大模型1.5的应用场景

豆包大模型1.5

豆包大模型1.5的主要功能

  • 综合能力显著增强:在知识(如MMLU_PRO、GPQA)、代码(如McEval、FullStackBench)、推理(如DROP)、中文(如CMMLU、C-Eval)等多个权威测评基准上表现全球领先,综合得分优于GPT-4o、Claude 3.5 Sonnet等业界一流模型。
  • 高效模型结构与低成本:采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,远超业内常规效率。自研服务器集群方案支持低成本芯片,硬件成本大幅降低。
  • 多模态能力全面提升
    • 豆包·视觉理解模型(Doubao-1.5-vision-pro):在多模态数据合成、动态分辨率、多模态对齐、混合训练上全面升级,视觉推理、文字文档识别、细粒度信息理解能力显著增强。
    • 豆包·实时语音模型(Doubao-1.5-realtime-voice-pro):采用Speech2Speech端到端框架,支持端到端语音对话,具备低时延、可随时打断等特性,已全量上线豆包App。
  • 深度思考能力:基于豆包1.5基座模型,通过RL算法突破和工程优化,研发出深度思考模型Doubao-1.5-Pro-AS1-Preview,在AIME等评测中表现领先。
  • 数据独立性:模型训练过程中未使用任何其他模型生成的数据,构建了完全自主的数据生产体系,确保数据来源的独立性和可靠性。

豆包大模型1.5的技术原理

  • 大规模稀疏MoE架构:豆包大模型1.5 采用了大规模稀疏MoE(Mixture of Experts)架构,通过较小的激活参数进行预训练,等效于7倍激活参数的Dense模型性能,远超业内常规的3倍杠杆效率。
  • 多模态融合技术:模型在多模态能力上进行了显著升级,支持文本、图像、语音等多种模态的输入和输出。
  • 高效的数据处理与训练:豆包大模型1.5 在训练过程中未使用任何其他模型生成的数据,是通过自主构建的数据生产体系,结合标注团队和模型self-play技术,确保数据来源的独立性和可靠性。模型通过自研服务器集群方案和优化技术,显著降低了硬件成本。
  • 强化学习与优化框架:豆包大模型团队提出了HybridFlow框架,是灵活且高效的强化学习(RL)训练框架,结合了单控制器和多控制器的优势,显著提升了训练吞吐量。
  • 模型优化与推理加速:豆包大模型1.5 通过精细量化、PD分离等技术,优化了模型的推理效率。

如何使用豆包大模型1.5

  • 豆包APP:豆包大模型1.5已灰度上线,用户可在豆包APP中体验。
  • 火山引擎API:开发者可通过火山引擎直接调用API,支持多场景应用。
  • 价格优势:保持原有模型价格不变,加量不加价。

豆包大模型1.5的项目地址

  • 项目官网:https://team.doubao.com/zh/special/doubao_1_5_pro

豆包大模型1.5的应用场景

  • 情感分析与反馈:通过语音和文本的情感分析,更好地理解用户情绪,提供更有针对性的服务。
  • 智能作业辅导:帮助学生解答数学、科学等学科问题,提供解题思路和步骤。
  • 文本生成:支持长文本生成,适用于新闻报道、文案创作、故事创作等。
  • 视频生成:豆包视频生成模型可基于文本或图片生成高质量视频,支持动态海报和短视频创作。
  • 视觉理解:豆包视觉理解模型可识别图像中的物体、场景,并进行逻辑推理,适用于教育领域的题目解析、图表分析等。
  • 多语言学习:支持多语种语音识别和生成,可用于语言学习和教学。
Step3-VL-10B:阶跃星辰开源10B参数多模态模型,性能对标200B级巨模,端侧部署新标杆
员工反弹与技术翻车:Meta 缩减“监控员工训练 AI”计划
TinyClaw:树莓派也能跑的轻量多智能体协作框架,开源释放边缘AI潜能
讯飞星火X1 – 科大讯飞推出的首个全国产深度推理大模型
Step-R1-V-Mini – 阶跃星辰最新推出的多模态推理模型
分享
Email 复制链接 打印
Share
上一篇 GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架
下一篇 X-Prompt – 用于多模态视频目标分割的通用框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

字节跳动发布SeedVR2:单步视频修复模型,以极低成本实现1080p高清画质革新
AI 工具 AIGC 资讯
北大微软联手突破:Next-Frame Diffusion实现30+FPS实时自回归视频生成,扩散模型与因果注意力新范式
AI 工具 AIGC 资讯
美团LLIA框架深度解析:实时音频驱动肖像视频生成,如何实现低延迟高保真交互?
AI 工具 AIGC 资讯
腾讯开源Hunyuan3D-2.1:工业级3D生成模型,支持PBR材质与多模态输入,1秒极速出图
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

ArenaRL:通义&高德开源对比式强化学习,破解开放域AI智能体判别崩溃难题

站外新闻
AI Agent 对比式强化学习 开放域智能体 通义 高德
AI 工具AIGC 资讯

2026年5月27日

站外新闻
AI生成UI Cheng Lou 前端性能优化 文本布局 虚拟滚动
AI 工具AIGC 资讯

蚂蚁集团EchoMimicV3震撼发布:130亿参数多模态数字人视频生成框架,重新定义AI动画创作

站外新闻
AIGC Transformer架构 多模态AI 数字人视频生成 蚂蚁集团
AIGC 资讯

WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.