站外新闻 – 第 165 页 – Prompt 语宙

站外新闻

4994 .

AI 工具 AIGC 资讯

突破分钟级长视频生成瓶颈：Meta&普林斯顿推出LinGen，线性复杂度实现单GPU高效生成

💡 站外导读：当前AI视频生成领域面临核心痛点：高分辨率、长时长的视频创作需要巨大的算力支撑，传统基于Diffusion Transformer的模型因二次复杂度的自注意…

AIGC meta 普林斯顿大学

AI 工具 AIGC 资讯

Midjourney V1正式发布：首个AI视频生成模型，10美元/月实现静态图像转动态视频

💡 站外导读：在AIGC内容爆发时代，静态图像已无法满足数字营销与创意表达的动态需求。Midjourney作为AI图像生成领域的领军者，正式推出其首款AI视频生成模型V1…

AIGC AI视频生成 Midjourney 动态内容创作图像转视频

AI 工具 AIGC 资讯

Office-PowerPoint-MCP-Server：基于MCP协议的开源PPT自动化工具，用AI指令高效生成与编辑演示文稿

💡 站外导读：在快节奏的数字化工作中，演示文稿（PPT）的制作常成为效率瓶颈，企业报告、市场营销和教育课件等场景耗费大量人力进行重复性排版和数据填充。Office-Pow…

AI助手 MCP Model Context Protocol PPT自动化 python-pptx

AI 工具 AIGC 资讯

香港科大团队突破：MeWM医学世界模型精准预测肿瘤演化，F1值飙升13%

💡 站外导读：在精准医疗时代，医生面临治疗方案选择的核心痛点：如何预见不同干预下的疾病演变？香港科技大学（广州）等机构提出MeWM医学世界模型，通过构建策略、动态与逆向动…

3D扩散模型 AI临床决策医学世界模型肝癌TACE治疗肿瘤演化模拟

AI 工具 AIGC 资讯

昆仑万维开源Skywork-SWE-32B：32B参数量刷新SWE-bench记录，代码智能体基座模型迎来新突破

💡 站外导读：在AI编程助手日益普及的今天，如何让模型真正解决复杂、真实的软件工程问题，而非仅限于代码片段补全，成为行业核心挑战。仓库级代码修复涉及长上下文理解、多轮交互…

Skywork-SWE-32B 代码智能体大模型开源昆仑万维软件工程

AI 工具 AIGC 资讯

中科院Stream-Omni重磅发布：GPT-4o级多模态大模型，实现语音、视觉、文本无缝交互

💡 站外导读：随着GPT-4o的发布，多模态交互成为AI领域的下一个核心战场。然而，真正的多模态模型面临数据需求巨大、模态对齐困难、实时交互延迟等痛点。Stream-Om…

AIGC GPT-4o 多模态大模型视觉理解语音交互

AI 工具 AIGC 资讯

香港大学开源RAG-Anything：革命性多模态RAG系统，一键处理图文表格复杂文档

💡 站外导读：在信息爆炸时代，企业、研究机构每天面对海量包含文本、图表、公式的复杂文档，传统检索增强生成（RAG）系统处理效率低下，成为数据价值挖掘的核心痛点。香港大学数…

RAG 多模态大模型应用知识图谱香港大学

AI 工具 AIGC 资讯

微软重磅发布Deep Video Discovery：AI智能体如何革新长视频分析？

💡 站外导读：面对长达数小时的视频内容，传统AI分析方法往往效率低下、准确率不足，成为教育、安防、影视等行业的痛点。随着视频数据爆发式增长，高效、精准的长视频理解技术成为…

AI智能体 Deep Video Discovery 大型语言模型微软视频理解

AI 工具 AIGC 资讯最新趋势

Time-R1: 3B参数小模型登顶时间推理，三阶段强化学习如何击败671B巨无霸？

💡 站外导读：在AI快速发展的今天，大模型参数量动辄千亿，但“更大是否等于更强”的争议持续存在。与此同时，AI在时间维度上的推理能力——理解历史、预测未来——一直是公认的…

AIGC Time-R1 强化学习时间推理模型

MiniMax-Remover：两阶段AI视频移除黑科技，6步搞定高效去物体

💡 站外导读：在AI视频编辑领域，现有目标移除技术常面临幻觉物体、视觉伪影和推理缓慢等痛点，阻碍了影视后期和内容创作的效率。随着AIGC浪潮席卷全球，行业急需更高效、高质…

AIGC AI视频 MiniMax-Remover 目标移除视频编辑

AI 工具 AIGC 资讯

Salesforce开源MAS-Zero：无需人类监督，自动生成与优化多智能体系统的全新框架

💡 站外导读：随着大模型应用深入，多智能体系统（MAS）成为解决复杂任务的关键范式。然而，传统MAS设计严重依赖人工经验，难以应对动态变化的复杂问题，且优化成本高昂。企业…

MAS-Zero Salesforce 多智能体系统智能体框架自动设计

AI 工具 AIGC 资讯

MultiTalk：美团等联合推出AI视频生成框架，音频驱动多人对话，口型精准同步

💡 站外导读：在AIGC浪潮下，AI视频生成技术日新月异，但如何让虚拟角色的口型与音频精准同步，并处理多人互动场景，一直是行业面临的巨大挑战。传统的单人驱动或静态口型方案…

AIGC 扩散模型美团音频驱动

AI 工具 AIGC 资讯

Hugging Face开源SmolVLA：4.5亿参数机器人模型，CPU可运行、消费级GPU可训练

💡 站外导读：机器人技术正从实验室走向日常，但高昂的硬件成本、复杂的模型部署和数据的封闭性一直是普及的三大门槛。开发者渴望能用消费级硬件训练和部署的机器人AI，而非依赖昂…

Hugging Face SmolVLA 开源机器人机器人模型视觉语言模型

AI 工具 AIGC 资讯

字节跳动ContentV开源！80亿参数文生视频模型，轻松生成5秒高清视频

💡 站外导读：随着Sora等文生视频模型引爆市场，AI视频生成成为AIGC领域最炙手可热的赛道。然而，高质量长视频生成仍面临算力消耗巨大、时长与画质难以兼顾、训练数据标注…

AIGC 字节跳动文生视频

AI 工具 AIGC 资讯

PartCrafter：单图生成多部件3D模型，AI精准重建复杂场景 | 前沿3D生成技术解析

💡 站外导读：从一张图片到一个完整且可分解的3D场景，曾是3D建模领域的巨大痛点。传统方法依赖人工精细雕刻，耗时且成本高昂。随着生成式AI的浪潮席卷，自动化、高质量的3D…

3D网格扩散变换器 AI 3D生成多部件联合生成端到端建模部件感知生成

AI 工具 AIGC 资讯

阿里通义实验室MaskSearch：揭秘如何让AI大模型成为顶级信息检索专家，性能暴涨！

💡 站外导读：在AI大模型竞争白热化的今天，其“幻觉”与知识滞后问题严重制约了在真实场景中的应用。如何让大模型不仅“能说会道”，更能主动、精准地获取和利用外部最新知识，成…

AIGC 检索增强生成阿里巴巴通义