Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Instella – AMD开源的30亿参数系列语言模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Instella – AMD开源的30亿参数系列语言模型
AIGC 资讯

Instella – AMD开源的30亿参数系列语言模型

站外新闻
最近更新: 2026年6月8日 下午12:47
SHARE

Instella是什么

Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构,包含36个解码器层和32个注意力头,支持最长4096个标记的序列。Instella经过多阶段训练,包括大规模预训练、监督微调和偏好优化,提升自然语言理解、指令跟随和对话能力。Instella在多个基准测试中超越现有的开源模型,与最先进的开源权重模型具有竞争力。AMD完全开源Instella的模型权重、训练配置、数据集和代码,促进AI社区的合作与创新。

阅读目录
  • Instella是什么
  • Instella的主要功能
  • Instella的技术原理
  • Instella的项目地址
  • Instella的应用场景

Instella

Instella的主要功能

  • 自然语言理解:理解复杂的自然语言文本,处理各种语言任务,如问答、文本生成和语义分析。
  • 指令跟随:基于监督微调(SFT)和直接偏好优化(DPO),准确理解和执行用户指令,生成符合人类偏好的回答。
  • 多轮对话能力:支持多轮交互,根据上下文进行连贯的对话。
  • 问题解决能力:在数学问题、逻辑推理和知识问答等任务上表现出色。
  • 多领域适应性:基于多样化的训练数据,适应多种领域,如学术、编程、数学和日常对话等。

Instella的技术原理

  • Transformer架构:基于自回归Transformer架构,包含36个解码器层,每层有32个注意力头,支持最长4096个标记的序列长度。
  • 高效训练技术:FlashAttention-2、Torch Compile和bfloat16混合精度训练,优化内存使用和计算效率。
  • 多阶段训练:用4.065万亿标记进行大规模预训练,建立基础语言理解能力。在第一阶段基础上进一步训练,使用额外的575.75亿标记,增强特定任务能力。
  • 监督微调(SFT):用高质量的指令-响应对数据进行微调,提升指令跟随能力。
  • 直接偏好优化(DPO):基于人类偏好数据对模型进行优化,让输出更符合人类价值观。
  • 分布式训练:基于完全分片数据并行(FSDP)技术,将模型参数、梯度和优化器状态在节点内分片,在节点间复制,实现大规模集群训练。
  • 数据集:基于多样化的高质量数据集进行训练,包括学术、编程、数学和对话数据,及合成数据集,确保模型具备广泛的知识和能力。

Instella的项目地址

  • 项目官网:https://rocm.blogs.amd.com/artificial-intelligence/introducing-instella
  • GitHub仓库:https://github.com/AMD-AIG-AIMA/Instella
  • HuggingFace模型库:https://huggingface.co/collections/amd/instella

Instella的应用场景

  • 智能客服:自动回答问题,提供个性化服务,提升客户体验。
  • 内容创作:生成文案、故事等,辅助内容创作者提高效率。
  • 教育辅导:解答学术问题,提供学习建议,辅助学生学习。
  • 编程辅助:生成代码片段,提供编程建议,帮助开发者解决问题。
  • 企业知识管理:整合公司知识,提供内部咨询,提升协作效率。
谷歌 Nano Banana Pro 实测:Gemini 3 Pro 图像模型如何重新定义 2K/4K 高分辨率 AI 创作与编辑
PrimitiveAnything – 腾讯联合清华大学推出的新型3D形状生成框架
2026年6月15日
Multi-Speaker – AudioShake 推出的多说话人声分离模型
FoloUp – 开源AI语音面试平台,自动生成定制化面试问题
分享
Email 复制链接 打印
Share
上一篇 Concept Lancet – 宾夕法尼亚大学推出的图像编辑框架
下一篇 Reka Flash 3 – Reka AI 推出的开源推理模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

云原生应用管理再进化:Rainbond v6.9.0 正式发布,开启大模型私有化部署新纪元

站外新闻
全息流体渐变通用占位特色图
AIGC 资讯

西班牙AI立法重磅落地:违规最高罚3500万欧元,欧洲监管铁幕再升级

站外新闻
AI监管 人工智能专员 人工智能法案 欧盟AI法案 西班牙
AIGC 资讯

OpenBioMed – 清华AIR联合水木分子推出的开源Agent平台

站外新闻
AIGC 资讯

Aligner – 北大推出的残差修正模型对齐技术

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.