Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型
Gemini 2.5 Pro (I/O 版)是什么 Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI…
Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型
Fin-R1是什么 Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构,通过在金融推理场景…
DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型
DeepClaude是什么 DeepClaude 是高性能的开源 AI 工具,基于深度集成 DeepSeek R1 和 Claude 两大模型,结合推理、创造力和代码生成…
Multi-SWE-bench – 字节豆包开源的多语言代码修复基准
Multi-SWE-bench是什么 Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Pytho…
谛韵DiffRhythm – 西北工业联合港中文推出的端到端音乐生成工具
DiffRhythm是什么 DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Dif…
MM-StoryAgent – 上海交大联合阿里开源的多智能体故事绘本视频生成框架
MM-StoryAgent是什么 MM-StoryAgent 是上海交通大学X-LANCE实验室和阿里巴巴集团联合推出的开源多模态、多智能体框架,用在生成沉浸式的有声故事…
UniAct – 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架
UniAct是什么 UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征,消除因物理形态和控制接…
Paper2Code – AI论文自动转为代码的多智能体框架
Paper2Code是什么 Paper2Code 是韩国科学技术院和DeepAuto.ai联合推出的多 Agent 大语言模型(LLM)框架,支持将机器学习领域的科学论文…
Skywork-VL Reward – Skywork AI开源的多模态奖励模型
Skywork-VL Reward是什么 Skywork-VL Reward是Skywork AI开源的多模态奖励模型,能为多模态理解和推理任务提供可靠的奖励信号。模型基…
高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已开放内测
阿里巴巴集团旗下高德于6月8日正式发布全球首个3D原生城市世界模型ABot-Earth0.5,标志着空间智能技术在城市级三维重建领域取得重大突破。该模型目前已建成全球覆盖…
Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型
Amodal3R是什么 Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 T…
谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划
近日,有关谷歌 Chrome 浏览器在最新金丝雀版本中测试一项新功能的消息引发广泛关注。该功能允许用户在地址栏中输入搜索词时,直接进入 AI 模式,而不是跳转到传统的 G…
反超美国!中国AI大模型周调用量创新高,包揽全球前四
根据最新监测数据,全球AI大模型在上周迎来了爆发式增长,总调用量高达36. 1 万亿Token,实现了连续七周的上涨。在这波人工智能热潮中,中国AI大模型的表现尤为亮眼。…
3FS – DeepSeek开源的高性能分布式文件系统
3FS是什么 3FS(Fire-Flyer File System)是DeepSeek推出的高性能分布式文件系统,专为AI训练和推理任务设计。3FS用现代SSD和RDMA…
顾全全确认离职字节Seed团队,曾主导SeedFold与Seed2.0训练体系建设
字节跳动Seed团队核心研究员顾全全已确认离职。顾全全日前在社交平台发文表示,当天是其在字节跳动Seed团队的最后一天,并回顾了过去三年在AI药物发现和大语言模型预训练领…
SkyReels-A1 – 昆仑万维开源的表情动作可控算法
SkyReels-A1是什么 SkyReels-A1是昆仑万维开源的中国首个SOTA(State-of-the-Art)级别的基于视频基座模型的表情动作可控算法。SkyR…
