Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: TeleChat3发布:中国电信千亿参数MoE大模型,全链路国产化训练,开源36B版本
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > TeleChat3发布:中国电信千亿参数MoE大模型,全链路国产化训练,开源36B版本
AI 工具AIGC 资讯

TeleChat3发布:中国电信千亿参数MoE大模型,全链路国产化训练,开源36B版本

站外新闻
最近更新: 2026年6月7日 下午8:08
MoE架构 国产算力 开源模型 智能客服
SHARE

💡 站外导读:随着AI大模型进入深水区,企业级应用对模型的效率、可控性和成本提出了更高要求。传统的稠密模型面临算力瓶颈,而细粒度MoE架构正成为突破性能天花板的关键。中国电信TeleAI团队此次推出的TeleChat3,不仅是一次技术的展示,更是国产大模型在核心算力、框架全链路自主化道路上的一次重要实践。

TeleChat3是什么

TeleChat3是中国电信人工智能研究院(TeleAI)自主研发的千亿参数细粒度MoE语义大模型,采用国产算力训练,支持多轮对话、文本创作、代码生成等任务。模型包含105B参数(实际激活4.7B),通过192个路由专家实现精准知识调用,擅长处理复杂任务如游戏设计、网页开发等。特色在于全链路国产化技术,训练效率达93%,已应用于智能客服、政务问答等场景,开源了36B稠密模型版本。

阅读目录
  • TeleChat3是什么
  • TeleChat3的主要功能
  • TeleChat3的技术原理
  • TeleChat3的项目地址
  • TeleChat3的应用场景
      • 📝 站长洞察 (Editor’s Insight)

TeleChat3

TeleChat3的主要功能

  • 代码生成与优化:能高效拆解任务需求,整合多项代码能力,一次性交付完整可运行的代码,实现代码补全、代码修改、网站和网页游戏生成等多类任务,省去大量人工调试时间投入,运行流畅,结果准确。
  • 知识问答与逻辑推理:在知识问答、逻辑推理等维度实现了能力提升,能更好地理解和回答用户的问题,提供准确的知识信息和逻辑推理结果。
  • 文本创作与语义理解:具备文本创作能力,能生成高质量的文本内容,在语义理解方面进行了针对性优化,能更好地理解用户输入的文本信息。
  • 角色扮演与多轮对话:支持角色扮演功能,可以根据用户设定的角色和场景进行对话,在多轮对话中能自动处理历史信息,保持对话的连贯性和一致性。
  • 引入“Thinking模式”:通过在对话模板中加入特定引导符号,模型可自动生成中间推理步骤,显著提升在复杂任务中的逻辑性与准确性,使AI推理过程可追溯。

TeleChat3的技术原理

  • 模型架构:TeleChat3采用细粒度Mixture-of-Experts(MoE)架构,例如TeleChat3-105B-A4.7-Thinking模型包含1个共享专家和192个路由专家,每次激活4个专家。
  • 推理机制:TeleChat3支持长文推理优化,通过NTK-aware外推和attention scaling方法,能将在较短长度上微调的模型在推理时外推到更长的长度。
  • 训练与优化:系列模型完全基于国产算力(如上海临港国产万卡算力池)训练,基础数据量达15T tokens。同时,模型实现了对昇腾Atlas 800T A2训练服务器及昇思MindSpore框架的深度适配。
  • 思考模式:TeleChat3全系支持Thinking思考模式,通过在chat template中加入特定引导符号生成推理过程,提升在复杂任务中的逻辑性与准确性。
  • 位置编码与注意力机制:采用旋转位置编码(Rotary Embedding)为token注入位置信息,通过对查询(Q)和键(K)的旋转操作,使模型捕捉序列的顺序依赖关系。同时,支持因果自注意力机制,确保每个位置的预测仅依赖于前面的token。
  • 非线性增强:模型包含多层感知机(MLP)模块,用于对注意力层的输出进行非线性变换,增强模型的表达能力。

TeleChat3的项目地址

  • Github仓库:https://github.com/Tele-AI/TeleChat3
  • ModelScope:
    • https://www.modelscope.cn/models/TeleAI/TeleChat3-105B-A4.7B-Thinking
    • https://www.modelscope.cn/models/TeleAI/TeleChat3-36B-Thinking

TeleChat3的应用场景

  • 代码生成与开发辅助:可用于代码补全、代码修改以及生成网站和网页游戏等,帮助开发者快速实现编程任务,提高开发效率。
  • 知识问答与教育:在知识问答、逻辑推理等任务中表现良好,能为用户提供准确的知识信息,适用于教育领域,辅助学习和答疑。
  • 文本创作与内容生成:能生成高质量的文本内容,可用于写作、文案创作、新闻报道等场景,满足不同文本创作需求。
  • 多轮对话与客服:支持多轮对话,能自动处理历史信息,保持对话连贯性,适用于智能客服、虚拟助手等场景。
  • 角色扮演与互动娱乐:支持角色扮演功能,可根据用户设定的角色和场景进行对话,应用于游戏、互动娱乐等领域。

📝 站长洞察 (Editor’s Insight)

TeleChat3的发布,标志着国产大模型正从“参数竞赛”迈入“效能与生态”并重的第二阶段。其采用的细粒度MoE架构(105B总参/4.7B激活)是当前最前沿的技术路线之一,能在保持甚至提升性能的同时,大幅降低推理成本,这对于大规模商业化落地至关重要。更值得关注的是其“全链路国产化”——从昇腾算力到MindSpore框架的深度适配,这不仅是技术突破,更是构建自主可控AI基础设施的战略一步。模型开源36B版本,则显示了其“以开源促生态”的务实思路。在应用层面,其强调的“Thinking模式”和代码生成能力,正切中当前企业对于可解释性AI和生产力工具的核心需求。总体来看,TeleChat3不仅是一个模型,更是一个信号:国产大模型正加速从技术验证走向产业深水区。

NBA官宣引入AI鹰眼2.0系统:彻底终结出界判罚争议,裁判将聚焦主观判罚
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
Google DeepMind发布Lyria 3:AI音乐生成模型重大突破,一句话生成带人声的30秒完整歌曲
ClawLess:南方科技大学 & 港科大AI Agent安全框架,形式化验证+系统调用拦截,构筑数学级安全壁垒
Midjourney V8震撼发布:速度飙升5倍、原生2K直出,AI图像生成进入新时代
TAGGED:MoE架构国产算力开源模型智能客服
分享
Email 复制链接 打印
Share
上一篇 Open Interpreter:本地运行代码的开源AI助手,让终端变身智能生产力引擎
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Open Interpreter:本地运行代码的开源AI助手,让终端变身智能生产力引擎
AI 工具 AIGC 资讯
10Kh RealOmni-Open: Gen Robot.AI开源全球最大具身智能数据集(1万小时/95TB)
AI 工具 AIGC 资讯
字节UI-TARS Desktop开源:自然语言操控电脑的AI GUI智能体,彻底解放你的双手!
AI 工具
上海AI Lab重磅开源OS-Copilot:你的终极通用操作系统AI Agent,革新人机交互与自动化工作流
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

站外新闻
AIGC 资讯

AbletonMCP – AI音乐制作工具,基于MCP支持音轨创建与修改

站外新闻
AI 工具AIGC 资讯

阿里通义开源 Qwen3-ASR 语音识别模型:支持52语种方言,1.7B版达SOTA,0.6B版吞吐提升2000倍

站外新闻
ASR Qwen3-ASR 开源大模型 语音识别模型 通义千问
AIGC 资讯

SmolDocling – 轻量级的多模态文档处理模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw OpenRouter prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小米 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 蚂蚁集团 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.