Ad image
Ad image

最近更新

SkyReels-V3开源发布:昆仑万维多模态模型实现专业级AI视频生成,统一架构引领高保真新阶段

💡 站外导读:在AIGC浪潮席卷下,AI视频生成正从炫技走向实用,但创作者常面临技术门槛高、一致性差、叙事连贯性不足等痛点。昆仑万维推出的SkyReels-V3,以单一统一架构直击这些难题,标志着行业正迈向高保真、全模态的成熟阶段,为从短视…

Project Genie:谷歌DeepMind AI世界模型来袭,文字秒生可交互虚拟宇宙

💡 站外导读:当AI不仅能生成文字和图片,还能实时构建可交互的3D虚拟世界时,内容创作的范式正在被彻底改写。谷歌Deep…

宇树科技重磅开源UnifoLM-VLA-0:基于Qwen2.5-VL-7B,单一模型实现12类机器人操作,准确率98.7%

💡 站外导读:当大语言模型在数字世界中大放异彩时,如何将AI的智慧“注入”机器人的身体,让它们像人一样理解物理世界并灵活…

生数科技Vidu Q3重磅发布:全球首款16秒音画同步AI视频生成模型,技术原理与应用场景全解析

💡 站外导读:在Sora引爆市场想象、AI视频成为AIGC最炙手可热的赛道之际,创作者面临的核心痛点也日益凸显:生成的视…

阶跃星辰开源Step 3.5 Flash:1960亿参数MoE模型,350TPS极速推理与Agent性能比肩顶尖闭源模型

💡 站外导读:随着大模型从“大力出奇迹”向“高效实用”演进,如何在海量参数与推理效率间取得平衡,成为行业核心痛点。阶跃星…

斯坦福&英伟达发布TTT-Discover:测试时强化学习实现低成本AI科学发现

💡 站外导读:当前AI模型在科学发现等复杂任务中往往依赖海量数据与天价算力训练,且模型在部署后性能固定,无法从具体问题中实时进化。这限制了AI在解决开放性、前沿科学问题上的潜力。斯坦福与英伟达等机构最新提出的TTT-Discover方法,旨在打破这一僵局,通过创新的测试时强化学习框架,让AI模型在推理过程中动态学习,实现低成本、高性能的定向科学突破。 TTT-Discover是什么 TTT-Dis…

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用1…

R2R – AI 检索增强生成应用开发平台,支持多模态内容处理、混合搜索、知识图谱构建

R2R是什么 R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索…

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的…

Eliza – 开源多功能AI Agent框架,快速搭建智能、高效的AI系统

Eliza是什么 Eliza 是ai16z开源的多代理模拟框架,旨在创建、部署和管理自主 AI 代理。 以 TypeSc…

smoltalk-chinese – OpenCSG 开源专为中文大型语言模型设计的合成数据集

smoltalk-chinese是什么 smoltalk-chinese 是OpenCSG开源的专为中文大型语言模型(L…

MagicMirror – 开源的一键 AI 换脸、换发型和穿搭应用

MagicMirror是什么 MagicMirror是开源的AI换脸、换发型和穿搭应用,通过深度学习技术让用户能够一键变…