ScholarCopilot – 滑铁卢与卡内基梅隆大学联合推出的AI学术写作助手
ScholarCopilot是什么 ScholarCopilot 是加拿大滑铁卢大学与卡内基梅隆大学的研究团队开发的专为学术写作设计的人工智能工具,基于 Qwen-2.5…
Chat2SVG – 文本描述实现高质量矢量图形的生成框架
Chat2SVG是什么 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。…
Step-Video-TI2V – 阶跃星辰开源的图生视频模型
Step-Video-TI2V是什么 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有 300…
Ev-DeblurVSR – 中科大等机构推出的视频画面增强模型
Ev-DeblurVSR是什么 Ev-DeblurVSR是中国科学技术大学、合肥综合性国家科学中心人工智能研究所和新加坡国立大学联合推出的视频画面增强模型,能从低分辨率且…
LBM – AI图像转换框架,实现可控阴影生成
LBM是什么 LBM(Latent Bridge Matching)是Jasper Research团队推出的新型图像到图像转换框架,基于在潜在空间中构建桥匹配实现快速高…
Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架
Mini DALL·E 3是什么 Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然…
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统
WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言…
Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型
Infinite Mobility是什么 Infinite Mobility 是上海AI Lab推出的可交互物体生成模型,基于程序化生成技术,高效生成高质量的可交互物体数…
MT-MegatronLM – 摩尔线程开源的混合并行训练框架
MT-MegatronLM是什么 MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense…
ZeroSearch – 阿里通义开源的大模型搜索引擎框架
ZeroSearch是什么 ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架,基于强化学习激励大模型的搜索能力,无需与真实搜索引擎交互。框架爱基于大…
TripoSG – VAST AI 开源的高保真 3D 形状合成技术
TripoSG是什么 TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型的高保真 3D 形状合成…
AgentPrune – 同济联合港中文等机构推出的多智能体通信优化框架
AgentPrune是什么 AgentPrune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型(LLM)驱动的多智能体系统通信优化框架,通过“剪枝”技术,剔除…
QwQ-32B – 阿里通义千问开源的最新推理模型
QwQ-32B是什么 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 67…
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目
Dify-Plus是什么 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dif…
Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型
Embodied Reasoner是什么 Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型,基于视觉搜索…
Imagen 4 – 谷歌推出的最新图像生成AI模型
Imagen 4是什么 Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在…
