站外新闻 – 第 90 页 – Prompt 语宙

站外新闻

5183 .

SynthID Text – 谷歌DeepMind推出的AI生成文本水印技术

SynthID Text 是什么 SynthID Text 是谷歌DeepMind 推出的文本水印技术，用在识别和验证由大型语言模型（LLM）生成的文本。基于细微调整生成…

全息流体渐变通用占位特色图

银河通用机器人创始人王鹤： 2028 年，具身智能的 “ChatGPT 时刻” 即将来临！

在 2026 世界人工智能大会上，银河通用机器人的创始人兼首席技术官王鹤分享了他的未来预测。他认为，具身智能技术将在 2028 年前迎来重大突破，届时，这种智能系统的表现…

超低延迟 AI 对话神器！Wan-Streamer v0.2 让你与 AI 零距离沟通

在现代科技的快速发展中，AI 与人类的互动日益频繁，但传统的视频通话往往伴随着卡顿、延迟和声画不同步的问题。然而，通义实验室最新推出的 Wan-Streamer v0.2…

VILA-U – 融合多模态理解和生成的统一基础模型

VILA-U是什么 VILA-U是集成视频、图像、语言理解和生成的统一基础模型。基于单一的自回归下一个标记预测框架处理理解和生成任务，简化模型结构，在视觉语言理解和生成方…

Video-XL – 智源联合多所高校推出的开源超长视觉理解模型

Video-XL是什么 Video-XL是北京智源人工智能研究院联合上海交大、中国人民大学、中科院、北邮和北大的研究人员共同推出的专为小时级视频理解设计的超长视觉理解模型…

影视飓风49元AI课程上线首日售出10万份，单日营收超490万元

千万粉科技内容创作者“影视飓风”近日推出49元AI实战课程，上线首日销量突破10万份，单日销售额超过490万元，再次展现头部内容IP在AI教育市场的商业转化能力。据了解，…

Embed3 – Cohere推出的多模态AI搜索模型，支持动态更新机制

Embed3是什么 Embed3是Cohere公司推出的行业领先的多模态AI搜索模型，能从文本和图像生成嵌入向量，帮助企业快速准确地搜索复杂报告、产品目录和设计文件等多模…

全息流体渐变通用占位特色图

文远知行推出物理 AI 大模型 WITT

在自动驾驶领域，技术的不断进步让人眼花缭乱。7 月 17 日，自动驾驶科技公司文远知行（WeRide）正式发布了他们自研的物理 AI 认知基础大模型 ——WeRide W…

DriveDreamer4D – 基于世界模型增强4D驾驶场景重建效果的框架

DriveDreamer4D是什么 DriveDreamer4D是用在提升自动驾驶场景4D重建质量的框架，基于世界模型先验增强4D驾驶场景的表示。框架能基于真实世界的驾驶…

全息流体渐变通用占位特色图

阶跃星辰发布STEPX Neo样机，全球首款大模型原生智能体手机亮相

7月17日，阶跃星辰在上海“2026世界人工智能大会（WAIC2026）”展台首次展示全球首款大模型原生智能体手机 STEPX Neo 样机，探索AI Agent与移动终…

全息流体渐变通用占位特色图

文远知行发布物理AI认知基础大模型WIIT，构建真实世界理解框架

在2026世界人工智能大会（WAIC）现场，文远知行发布物理AI认知基础大模型 WIIT，探索人工智能从数据理解向真实世界认知演进的新方向。据介绍，WIIT基于真实世界场…

Animate-X – 阿里巴巴开源的通用动画生成框架

Animate-X是什么 Animate-X是基于LDM的通用动画框架，能将静态图像转化为动态视频，擅长处理拟人化角色。通过引入姿势指示器，增强了对运动模式的捕捉能力，…

全息流体渐变通用占位特色图

百度沈抖：每位员工每月发 1000 元额度自由体验主流大模型，强制推行AI办公难见效

7 月 17 日，据虎嗅报道，百度集团执行副总裁、百度智能云事业群总裁沈抖在接受采访时，系统谈到了他对AI落地的判断与百度的内部实践。沈抖预测，通用智能体、行业垂类智能体…

MarDini – Meta联合KAUST推出的视频生成扩散模型

MarDini是什么 MarDini是新型的视频扩散模型，融合掩码自回归（MAR）和扩散模型（DM）的优势，用在大规模视频生成。模型能处理任意数量和位置的掩码帧，支持视频…

SDXL-EcomID – 阿里推出的单个参考图像生成定制的个性图像框架

SDXL-EcomID是什么 SDXL-EcomID是阿里妈妈推出的开源项目，从单个参考图像生成定制的个性图像。融合PuLID和InstantID的优点，优化背景一致性、…

DreamClear – 中科院联合字节推出的高性能图像修复技术

DreamClear是什么 DreamClear是中国科学院自动化研究所和字节跳动团队联合推出的高性能图像修复技术，专注于隐私安全的数据集管理，能将低质量（LQ）图像恢复…