Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Instella – AMD开源的30亿参数系列语言模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Instella – AMD开源的30亿参数系列语言模型
AIGC 资讯

Instella – AMD开源的30亿参数系列语言模型

站外新闻
最近更新: 2026年6月8日 下午12:47
SHARE

Instella是什么

Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构,包含36个解码器层和32个注意力头,支持最长4096个标记的序列。Instella经过多阶段训练,包括大规模预训练、监督微调和偏好优化,提升自然语言理解、指令跟随和对话能力。Instella在多个基准测试中超越现有的开源模型,与最先进的开源权重模型具有竞争力。AMD完全开源Instella的模型权重、训练配置、数据集和代码,促进AI社区的合作与创新。

阅读目录
  • Instella是什么
  • Instella的主要功能
  • Instella的技术原理
  • Instella的项目地址
  • Instella的应用场景

Instella

Instella的主要功能

  • 自然语言理解:理解复杂的自然语言文本,处理各种语言任务,如问答、文本生成和语义分析。
  • 指令跟随:基于监督微调(SFT)和直接偏好优化(DPO),准确理解和执行用户指令,生成符合人类偏好的回答。
  • 多轮对话能力:支持多轮交互,根据上下文进行连贯的对话。
  • 问题解决能力:在数学问题、逻辑推理和知识问答等任务上表现出色。
  • 多领域适应性:基于多样化的训练数据,适应多种领域,如学术、编程、数学和日常对话等。

Instella的技术原理

  • Transformer架构:基于自回归Transformer架构,包含36个解码器层,每层有32个注意力头,支持最长4096个标记的序列长度。
  • 高效训练技术:FlashAttention-2、Torch Compile和bfloat16混合精度训练,优化内存使用和计算效率。
  • 多阶段训练:用4.065万亿标记进行大规模预训练,建立基础语言理解能力。在第一阶段基础上进一步训练,使用额外的575.75亿标记,增强特定任务能力。
  • 监督微调(SFT):用高质量的指令-响应对数据进行微调,提升指令跟随能力。
  • 直接偏好优化(DPO):基于人类偏好数据对模型进行优化,让输出更符合人类价值观。
  • 分布式训练:基于完全分片数据并行(FSDP)技术,将模型参数、梯度和优化器状态在节点内分片,在节点间复制,实现大规模集群训练。
  • 数据集:基于多样化的高质量数据集进行训练,包括学术、编程、数学和对话数据,及合成数据集,确保模型具备广泛的知识和能力。

Instella的项目地址

  • 项目官网:https://rocm.blogs.amd.com/artificial-intelligence/introducing-instella
  • GitHub仓库:https://github.com/AMD-AIG-AIMA/Instella
  • HuggingFace模型库:https://huggingface.co/collections/amd/instella

Instella的应用场景

  • 智能客服:自动回答问题,提供个性化服务,提升客户体验。
  • 内容创作:生成文案、故事等,辅助内容创作者提高效率。
  • 教育辅导:解答学术问题,提供学习建议,辅助学生学习。
  • 编程辅助:生成代码片段,提供编程建议,帮助开发者解决问题。
  • 企业知识管理:整合公司知识,提供内部咨询,提升协作效率。
阿里开源Qwen3.6-35B-A3B:3B激活参数超越27B,MoE架构编程与多模态新标杆
杭州全息智能技术研究院揭牌六大AI联合实验室,打造产学研融合新引擎
高考公平再升级!豆包、文心一言等主流AI大模型集体宣布:高考期间禁用拍题搜题功能
谷歌Veo 3.1 Lite发布:成本直降50%的AI视频生成模型,1080p高性价比解决方案
Dubbing v2 – ElevenLabs 推出的 AI 配音模型
分享
Email 复制链接 打印
Share
上一篇 Concept Lancet – 宾夕法尼亚大学推出的图像编辑框架
下一篇 Reka Flash 3 – Reka AI 推出的开源推理模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Reka Flash 3 – Reka AI 推出的开源推理模型
AIGC 资讯
Concept Lancet – 宾夕法尼亚大学推出的图像编辑框架
AIGC 资讯
NLWeb – 微软推出支持自然语言与任何网站交互的开源项目
AIGC 资讯
Cua – 专为 MacOS 推出的开源 AI Agent项目
AIGC 资讯

相关推荐

AIGC 资讯

Miras – 谷歌推出的深度学习架构设计通用框架

站外新闻
AIGC 资讯

oli – 开源的终端AI编程助手,支持代码辅助与解释

站外新闻
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

欧盟急谈Anthropic引进”地表最强”网安大模型Mythos:AI安全攻防进入地缘政治博弈新阶段

站外新闻
Anthropic 地缘政治 欧盟AI监管 网安大模型 网络安全漏洞
AI 工具AIGC 资讯

Claude Opus 4.8 核弹级发布:编程能力碾压GPT-5.5,成本直降67%,AI开发者生产力革命来了

站外新闻
AI编程 Anthropic Claude Opus 4.8 GPT-5.5 大模型成本
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.