Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: k1.5 – Kimi推出的多模态思考模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > k1.5 – Kimi推出的多模态思考模型
AIGC 资讯

k1.5 – Kimi推出的多模态思考模型

站外新闻
最近更新: 2026年6月8日 下午11:18
SHARE

k1.5是什么

k1.5 是月之暗面Kimi推出的最新多模态思考模型,具备强大的推理和多模态处理能力。模型在 short-CoT(短链思维)模式下,数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet,领先幅度高达 550%。在 long-CoT(长链思维)模式下,k1.5 的性能达到了 OpenAI o1 正式版的水平,成为全球范围内首个达到这一水平的多模态模型。

阅读目录
  • k1.5是什么
  • k1.5的主要功能
  • k1.5的技术原理
  • k1.5的项目地址
  • 如何使用k1.5
  • k1.5的应用场景

k1.5 的设计和训练包含四大关键要素:长上下文扩展、改进的策略优化、简洁的框架和多模态能力。通过扩展上下文窗口至 128k 和部分展开技术,模型在推理深度和效率上显著提升。k1.5 通过 long2short 技术,将长链思维的优势迁移到短链思维模型中,进一步优化性能。

k1.5

k1.5的主要功能

  • 多模态推理能力:k1.5 能同时处理文本和视觉数据,具备联合推理能力,适用于数学、代码和视觉推理等领域。
  • 短链和长链思维:在短链思维模式下,k1.5 的数学、代码、视觉多模态和通用能力大幅超越全球领先的模型(如 GPT-4 和 Claude 3.5),领先幅度高达 550%。在长链思维模式下,其性能达到了 OpenAI o1 正式版的水平。
  • 出色的数学与代码能力:k1.5 在数学推理和编程任务中表现出色,尤其在 LaTeX 格式的数学公式输入上表现优异。
  • 高效的训练和优化:通过长上下文扩展(上下文窗口扩展至 128k)和改进的策略优化,k1.5 实现了更高效的训练,展现出规划、反思和修正的推理特性。
  • 深度推理能力:k1.5 擅长解决复杂的推理任务,如难解的数学问题、编程调试和工作难题,能帮助用户解锁更复杂的任务。

k1.5的技术原理

  • 长上下文扩展(Long Context Scaling):Kimi k1.5 将强化学习的上下文窗口扩展到 128k,通过增加上下文长度显著提升了模型的推理能力。核心是基于部分回滚(Partial Rollout)策略,通过重用先前的轨迹片段来生成新的轨迹,避免从头生成完整轨迹的高计算成本。
  • 改进的策略优化(Improved Policy Optimization):模型采用了基于长链思维(Long-CoT)的强化学习公式,并结合在线镜像下降法(Online Mirror Descent)的变体进行策略优化。通过有效的采样策略、长度惩罚和数据配方优化,进一步提升了算法的性能。
  • 简洁的框架(Simplistic Framework):Kimi k1.5 的设计摒弃了复杂的蒙特卡洛树搜索、价值函数和过程奖励模型等技术,是通过扩展上下文长度和优化策略,实现了强大的推理能力。使模型在长上下文推理中表现出色,同时具备规划、反思和修正的能力。
  • 多模态联合训练(Multimodalities):模型在文本和视觉数据上进行了联合训练,能同时处理文本和视觉信息,具备跨模态推理的能力。
  • Long2Short 技术:Kimi k1.5 提出了一种将长链思维模型的推理能力迁移到短链思维模型的方法,包括模型融合、最短拒绝采样、DPO(成对偏好优化)和 Long2Short RL(强化学习)。

k1.5

k1.5的项目地址

  • GitHub仓库:https://github.com/MoonshotAI/kimi-k1.5
  • 技术论文:https://github.com/MoonshotAI/Kimi-k1.5/blob/main/Kimi_k1.5.pdf

如何使用k1.5

  • 网页端:访问 Kimi 官网,即可直接使用。
  • 手机端:在应用商店搜索“Kimi 智能助手”并下载,或通过微信小程序搜索“Kimi 智能助手”。
  • API 调用:开发者可以使用 Kimi API 进行调用。

k1.5的应用场景

  • 复杂推理任务:Kimi k1.5 在深度推理任务中表现出色,能处理复杂的数学问题、编程调试以及推理难题。
  • 跨模态推理:模型支持文本和视觉数据的联合推理,能处理涉及数学题目与图形分析、代码与图像综合理解等任务。
  • AI 智能助手:Kimi k1.5 可作为智能助手,为用户提供高效的推理能力,帮助解决多种复杂问题。能通过多轮对话理解用户需求,提供详细的解答。
  • 教育领域:在教育场景中,Kimi k1.5 可用于辅助教学,帮助学生解决数学难题、编程练习以及逻辑推理问题。
  • 科研与开发:对于科研人员和开发者,Kimi k1.5 可以作为工具辅助进行复杂的理论推导、代码生成和算法优化。支持 LaTeX 格式的数学公式输入,进一步提升了在科研领域的适用性。
  • 多模态数据分析:Kimi k1.5 能处理多模态数据,适用于需要结合文本和图像信息的分析任务,例如图像标注、视觉问答等。
ZenCtrl – Fotographer AI 推出的商品图生成AI工具
RecGPT:淘天百亿参数大模型重塑电商推荐,点击量两位数增长背后的AI引擎
DeepMesh – 清华和南洋理工推出的 3D 网格生成框架
百川智能Baichuan-M4医疗大模型登顶全球榜单:幻觉率仅3.3%,AI家庭医生”百小医”开启健康管理新范式
快手Q1财报深度:AI成’利润黑洞’,可灵视频陷转型阵痛,34亿净利暴跌26%
分享
Email 复制链接 打印
Share
上一篇 MM-Eureka – 上海AI Lab联合上交大等推出的多模态推理模型
下一篇 CityDreamer4D – 南洋理工推出的无边界 4D 城市建模框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

字节跳动Seaweed APT2革新:单GPU 24帧/秒,AAPT技术攻克长视频生成难题,AI视频生成迈入实时交互新纪元
AI 工具 最新趋势
MiniMax-M1开源发布:4560亿参数MoE架构,百万上下文推理模型性价比之王
AI 工具 AIGC 资讯
FlowDirector:无需训练,一文看懂西湖&中南大学如何用ODE革新AI视频编辑,精准指令直达
AI 工具 AIGC 资讯
字节跳动DreamActor-H1:DiT框架革新电商视频生成,3D动作引导+身份保留引领AIGC商业化
AI 工具

相关推荐

AIGC 资讯

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

站外新闻
AIGC 资讯

OmAgent – Om AI联合浙大开源的多模态语言代理框架

站外新闻
AIGC 资讯

gpt-4o-mini-transcribe – OpenAI 推出的语音转文本模型

站外新闻
AI 工具AIGC 资讯

腾讯AI Lab发布SongBloom:全长度AI歌曲生成模型,10秒样本生成2分半高质量音乐

站外新闻
AIGC AI音乐生成 开源模型 扩散模型 腾讯AI Lab
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.