Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: TeleChat3发布:中国电信千亿参数MoE大模型,全链路国产化训练,开源36B版本
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > TeleChat3发布:中国电信千亿参数MoE大模型,全链路国产化训练,开源36B版本
AI 工具AIGC 资讯

TeleChat3发布:中国电信千亿参数MoE大模型,全链路国产化训练,开源36B版本

站外新闻
最近更新: 2026年6月7日 下午8:08
MoE架构 国产算力 开源模型 智能客服
SHARE

💡 站外导读:随着AI大模型进入深水区,企业级应用对模型的效率、可控性和成本提出了更高要求。传统的稠密模型面临算力瓶颈,而细粒度MoE架构正成为突破性能天花板的关键。中国电信TeleAI团队此次推出的TeleChat3,不仅是一次技术的展示,更是国产大模型在核心算力、框架全链路自主化道路上的一次重要实践。

TeleChat3是什么

TeleChat3是中国电信人工智能研究院(TeleAI)自主研发的千亿参数细粒度MoE语义大模型,采用国产算力训练,支持多轮对话、文本创作、代码生成等任务。模型包含105B参数(实际激活4.7B),通过192个路由专家实现精准知识调用,擅长处理复杂任务如游戏设计、网页开发等。特色在于全链路国产化技术,训练效率达93%,已应用于智能客服、政务问答等场景,开源了36B稠密模型版本。

阅读目录
  • TeleChat3是什么
  • TeleChat3的主要功能
  • TeleChat3的技术原理
  • TeleChat3的项目地址
  • TeleChat3的应用场景
      • 📝 站长洞察 (Editor’s Insight)

TeleChat3

TeleChat3的主要功能

  • 代码生成与优化:能高效拆解任务需求,整合多项代码能力,一次性交付完整可运行的代码,实现代码补全、代码修改、网站和网页游戏生成等多类任务,省去大量人工调试时间投入,运行流畅,结果准确。
  • 知识问答与逻辑推理:在知识问答、逻辑推理等维度实现了能力提升,能更好地理解和回答用户的问题,提供准确的知识信息和逻辑推理结果。
  • 文本创作与语义理解:具备文本创作能力,能生成高质量的文本内容,在语义理解方面进行了针对性优化,能更好地理解用户输入的文本信息。
  • 角色扮演与多轮对话:支持角色扮演功能,可以根据用户设定的角色和场景进行对话,在多轮对话中能自动处理历史信息,保持对话的连贯性和一致性。
  • 引入“Thinking模式”:通过在对话模板中加入特定引导符号,模型可自动生成中间推理步骤,显著提升在复杂任务中的逻辑性与准确性,使AI推理过程可追溯。

TeleChat3的技术原理

  • 模型架构:TeleChat3采用细粒度Mixture-of-Experts(MoE)架构,例如TeleChat3-105B-A4.7-Thinking模型包含1个共享专家和192个路由专家,每次激活4个专家。
  • 推理机制:TeleChat3支持长文推理优化,通过NTK-aware外推和attention scaling方法,能将在较短长度上微调的模型在推理时外推到更长的长度。
  • 训练与优化:系列模型完全基于国产算力(如上海临港国产万卡算力池)训练,基础数据量达15T tokens。同时,模型实现了对昇腾Atlas 800T A2训练服务器及昇思MindSpore框架的深度适配。
  • 思考模式:TeleChat3全系支持Thinking思考模式,通过在chat template中加入特定引导符号生成推理过程,提升在复杂任务中的逻辑性与准确性。
  • 位置编码与注意力机制:采用旋转位置编码(Rotary Embedding)为token注入位置信息,通过对查询(Q)和键(K)的旋转操作,使模型捕捉序列的顺序依赖关系。同时,支持因果自注意力机制,确保每个位置的预测仅依赖于前面的token。
  • 非线性增强:模型包含多层感知机(MLP)模块,用于对注意力层的输出进行非线性变换,增强模型的表达能力。

TeleChat3的项目地址

  • Github仓库:https://github.com/Tele-AI/TeleChat3
  • ModelScope:
    • https://www.modelscope.cn/models/TeleAI/TeleChat3-105B-A4.7B-Thinking
    • https://www.modelscope.cn/models/TeleAI/TeleChat3-36B-Thinking

TeleChat3的应用场景

  • 代码生成与开发辅助:可用于代码补全、代码修改以及生成网站和网页游戏等,帮助开发者快速实现编程任务,提高开发效率。
  • 知识问答与教育:在知识问答、逻辑推理等任务中表现良好,能为用户提供准确的知识信息,适用于教育领域,辅助学习和答疑。
  • 文本创作与内容生成:能生成高质量的文本内容,可用于写作、文案创作、新闻报道等场景,满足不同文本创作需求。
  • 多轮对话与客服:支持多轮对话,能自动处理历史信息,保持对话连贯性,适用于智能客服、虚拟助手等场景。
  • 角色扮演与互动娱乐:支持角色扮演功能,可根据用户设定的角色和场景进行对话,应用于游戏、互动娱乐等领域。

📝 站长洞察 (Editor’s Insight)

TeleChat3的发布,标志着国产大模型正从“参数竞赛”迈入“效能与生态”并重的第二阶段。其采用的细粒度MoE架构(105B总参/4.7B激活)是当前最前沿的技术路线之一,能在保持甚至提升性能的同时,大幅降低推理成本,这对于大规模商业化落地至关重要。更值得关注的是其“全链路国产化”——从昇腾算力到MindSpore框架的深度适配,这不仅是技术突破,更是构建自主可控AI基础设施的战略一步。模型开源36B版本,则显示了其“以开源促生态”的务实思路。在应用层面,其强调的“Thinking模式”和代码生成能力,正切中当前企业对于可解释性AI和生产力工具的核心需求。总体来看,TeleChat3不仅是一个模型,更是一个信号:国产大模型正加速从技术验证走向产业深水区。

Multi-Agent Orchestrator – 亚马逊开源的多智能体框架
Casevo – 中国传媒大学推出的开源社会传播模拟系统
EmotiVoice – 网易有道开源的AI语音合成系统
Insert Anything – 浙大联合哈佛大学和南洋理工推出的图像插入框架
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
TAGGED:MoE架构国产算力开源模型智能客服
分享
Email 复制链接 打印
Share
上一篇 Open Interpreter:本地运行代码的开源AI助手,让终端变身智能生产力引擎
下一篇 MiroMind开源MiroThinker v1.5:30B参数级搜索Agent,以交互式扩展技术挑战大模型性能极限
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具

TweetStorm AI

remaker
AI 工具AIGC 资讯

阿里云Qoder Cloud Agents全托管平台发布:企业AI Agent上线周期从1个月缩短至1天

站外新闻
AI Agent 企业级应用 全托管平台 工程化落地 阿里云
AIGC 资讯

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

站外新闻
AI 工具AIGC 资讯

Sub2API 开源 AI API 中转网关:多账户管理+精准计费,高效实现 AI 订阅拼车共享

站外新闻
AI API 中转 Claude Sub2API 拼车共享 精准计费
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.