Ad image
Ad image

最近更新

字节跳动Seaweed APT2革新:单GPU 24帧/秒,AAPT技术攻克长视频生成难题,AI视频生成迈入实时交互新纪元

💡 站外导读:当视频内容需求呈指数级增长,传统视频生成模型却深陷效率与质量的泥潭:生成过程缓慢、计算资源消耗巨大,且在处理长视频时频繁出现动作漂移和物体变形,严重制约了其在影视、游戏等领域的实际应用。行业迫切需要一种能够实现高帧率、长时序、…

腾讯LeVo:3秒克隆音色的AI唱歌模型,Suno4.5级别的音乐生成革命

💡 站外导读:在AIGC浪潮席卷内容产业的当下,音乐创作领域正经历着从工具辅助到智能生成的范式转移。对于广大音乐爱好者与…

MiniMax Hailuo 02 AI视频模型:架构革新、成本碾压,复杂场景生成能力超可灵Veo 3

💡 站外导读:在AIGC视频生成赛道白热化竞争的背景下,模型能力与商业化成本成为行业痛点。MiniMax推出的Hailu…

松下联手UCLA发布OmniFlow:革命性多模态AI实现文本、图像、音频任意生成

💡 站外导读:当前AIGC(生成式AI)发展迅猛,但多数模型仍局限于单一模态生成,难以满足跨模态内容创作的复杂需求。松下…

上海AI Lab发布SurveyForge:10分钟、0.5美元自动生成6.4万字学术综述,附带评估基准

💡 站外导读:面对海量文献,传统学术综述撰写耗时费力,严重阻碍研究效率与知识传播。SurveyForge框架应运而生,由…

南洋理工等机构发布Sparc3D:突破3D生成瓶颈,实现高保真1024³分辨率建模

💡 站外导读:在3D内容需求激增的当下,传统3D模型生成方法长期受困于细节丢失和计算成本高昂的瓶颈,严重制约了其在VR、游戏、数字孪生等领域的规模化应用。南洋理工大学、Sensory Universe与帝国理工学院的研究团队联合推出了Sparc3D框架,旨在从根本上解决这一行业痛点。该框架通过创新的稀疏数据结构,在保持极高几何精度的同时,大幅提升了生成效率,为构建高保真、可交互的虚拟世界提供了关键…

ClipSketch AI:开源AI视频工具,自动提取B站小红书关键帧生成手绘故事板,免费使用

💡 站外导读:短视频和社交媒体内容创作需求爆发,但手动提取关键帧、设计分镜、撰写文案耗时费力,成为创作者和运营人员的共同…

突破传统Token架构!字节跳动DLCM动态大概念模型:推理效率提升34%、准确率+2.69%的下一代LLM新范式

💡 站外导读:大模型推理成本居高不下,已成为制约AI规模化落地的核心瓶颈。传统Transformer架构以token为基…

谷歌D4RT:4D重建模型速度提升300倍,动态场景AI追踪与预测的革命

💡 站外导读:传统计算机视觉模型在处理动态场景时,常面临重建精度低、计算耗时长、无法有效预测运动轨迹等核心痛点,限制了其…

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中…

清华×斯坦福重磅开源:Ctrl-World具身世界模型登顶全球第一,0.986一致性重构机器人开发范式

💡 站外导读:机器人研发长期面临“仿真到现实”的鸿沟——虚拟环境中训练的策略部署到真实物理世界后,常因物理规律模拟不精确…

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日…