Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Miras – 谷歌推出的深度学习架构设计通用框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Miras – 谷歌推出的深度学习架构设计通用框架
AIGC 资讯

Miras – 谷歌推出的深度学习架构设计通用框架

站外新闻
最近更新: 2026年6月8日 上午3:02
SHARE

Miras是什么

Miras是谷歌推出的用在深度学习架构设计的通用框架,特别是序列建模任务。Miras基于关联记忆和注意力偏差的概念,将Transformer、现代线性RNN等模型重新定义为具有内部优化目标的关联记忆模块。Miras基于四种关键选择构建模型,关联记忆架构、注意力偏差目标、保持门及记忆学习算法。Miras能生成具有不同优势的新型序列模型,例如Moneta、Yaad和Memora,模型在语言建模、常识推理等任务中表现出色,超越现有的Transformer和线性RNN模型。

阅读目录
  • Miras是什么
  • Miras的主要功能
  • Miras的技术原理
  • Miras的项目地址
  • Miras的应用场景

Miras

Miras的主要功能

  • 统一现有架构:将现有的多种序列模型(如Transformer、RetNet、Mamba等)纳入统一的框架下。
  • 优化记忆管理:基于引入注意力偏差(Attentional Bias)和保留门(Retention Gate)的概念,Miras能够更好地平衡学习新信息和保留旧信息,从而优化模型的记忆管理能力。
  • 设计新型模型:支持设计出具有不同注意力偏差和保留机制的新型序列模型,如Moneta、Yaad和Memora。
  • 提升模型性能:提升模型在长序列任务中的性能,保持快速的并行化训练能力。

Miras的技术原理

  • 关联记忆:将输入(键,Keys)映射到输出(值,Values)的机制。在Miras中,序列模型被看作是关联记忆模块,基于学习输入和输出之间的映射关系存储和检索信息。关联记忆是Miras的核心,决定模型如何存储和利用序列数据中的信息。
  • 注意力偏差:注意力偏差是关联记忆的内部优化目标,用在衡量模型如何优先关注某些事件或刺激。决定模型如何学习输入(键和值)之间的映射关系。基于选择不同的注意力偏差目标(如ℓ2回归、ℓ1回归、Huber损失等),调整模型对数据的敏感度和鲁棒性。
  • 保持门:一种正则化机制,控制模型在学习新信息时如何保留旧信息。引入保留正则化项(如ℓ2正则化、KL散度等)平衡学习和保留。防止模型过度遗忘旧信息,在长序列任务中保持更好的性能。
  • 记忆学习算法:记忆学习算法用在优化关联记忆的目标函数。常见的算法包括梯度下降、动量梯度下降等。基于选择合适的优化算法,提高模型的训练效率和收敛速度。

Miras的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2504.13173

Miras的应用场景

  • 语言建模:NLP研究人员、文本生成开发者用于高效处理长文本,捕捉长距离依赖。
  • 常识推理:AI研究者、智能助手开发者提升对隐含信息的理解和推理能力。
  • 长文本处理:文本分析工程师、信息检索专家优化长文本处理效率,减少资源消耗。
  • 多模态任务:多模态研究者、多媒体内容分析工程师融合多种模态信息,提升跨模态推理能力。
谷歌强推AI搜索遭反噬,DuckDuckGo下载量飙升30%:隐私搜索如何逆势崛起?
马斯克千亿资本腾挪:SpaceX低息贷款置换高息债,年省10亿美元利息
99%高管确认AI将引发裁员潮:两年内大规模岗位流失,科技行业已裁超10万人
快手Q1财报深度:AI成’利润黑洞’,可灵视频陷转型阵痛,34亿净利暴跌26%
claw-code: Claude Code 泄露源码净室重写,开源 Agent 框架移植 Rust 追求高性能
分享
Email 复制链接 打印
Share
上一篇 Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
AIGC 资讯
PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景
AIGC 资讯
GPT-4.1 – OpenAI 推出新一代语言模型,支持百万 token 上下文
AIGC 资讯
TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变
AIGC 资讯

相关推荐

流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

820万美元估值背后:Human Archive如何用印度零工‘金矿’为AI机器人铺设数据高速公路

站外新闻
Human Archive 多模态传感器 机器人训练数据 第一人称视角数据 零工经济
AIGC 资讯最新趋势

AI生成内容反超人类:互联网‘信息污染’时代,你的思维能力正在被悄悄吞噬?

站外新闻
AIGC AI生成内容 信息污染 模型退化
AI 工具AIGC 资讯

李飞飞团队推出Marble 1.1:AI生成式世界模型革命,一图变3D沉浸式场景

站外新闻
AI 3D生成 Marble 1.1 World Labs 李飞飞 生成式世界模型
量子芯片科技感占位特色图
AI 工具AIGC 资讯最新趋势

软银微软强强联手:Azure AI打造全自动呼叫中心,破解日本劳动力困局

站外新闻
AI智能体 Azure AI 企业服务自动化 全自动呼叫中心 软银
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.