Cube 3D – Roblox 推出的 AI 3D 生成模型
Cube 3D是什么 Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的…
OpenMath-Nemotron – 英伟达开源的数学推理系列模型
OpenMath-Nemotron是什么 OpenMath-Nemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于…
WeClone – 开源AI数字分身一站式解决方案
WeClone是什么 WeClone是从聊天记录创造数字分身的一站式解决方案。基于聊天记录微调大语言模型(LLM),让模型具有特定的风格,绑定到微信、QQ、Telegra…
FinGPT – 开源金融领域大模型,可预测股票价格走势
FinGPT是什么 FinGPT 是开源的金融领域大型预训练语言模型,基于自然语言处理技术推动金融创新。通过强化学习和人类反馈(RLHF)技术,能学习个人偏好,提供个性化…
IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音
IndexTTS是什么 IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技…
Light-A-Video – 上海AI Lab联合交大等高校推出的视频重照明方法
Light-A-Video是什么 Light-A-Video 是上海交通大学、中国科学技术大学、香港中文大学、香港科技大学、斯坦福大学及上海AI实验室的共同推出的无需训练…
InternVL3 – 上海 AI Lab 开源的多模态大语言模型
InternVL3是什么 InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺…
ComfyUI-Copilot – 阿里推出基于 ComfyUI 的 AI 智能助手
ComfyUI-Copilot是什么 ComfyUI-Copilot 是阿里巴巴国际数字商业集团(AIDC-AI)推出基于 ComfyUI 框架深度开发的 AI 智能助手…
LanDiff – 浙大联合月之暗面推出的文本到视频生成混合框架
LanDiff是什么 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势…
UniTok – 字节联合港大、华中科技推出的统一视觉分词器
UniTok是什么 UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器,能同时支持视觉生成和理解任务。基于多码本量化技术,将视觉特征分割成多个小块,每…
TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术
TaoAvatar是什么 TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,…
AxBench – 斯坦福大学推出评估语言模控制方法的基准测试框架
AxBench是什么 AxBench 是斯坦福大学推出的评估语言模型(LM)可解释性方法的基准测试框架。基于合成数据生成训练和评估数据,比较不同模型控制技术在概念检测和模…
OmniSVG – 复旦大学联合 StepFun 推出端到端多模态矢量图形生成模型
OmniSVG是什么 OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通…
Asyncflow v1.0 – Podcastle 推出的 AI 文本转语音模型
Asyncflow v1.0是什么 Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项,能为文本内容…
AstrBot – 开源多平台聊天机器人及开发框架
AstrBot是什么 AstrBot是多平台聊天机器人及开发框架,支持多种大语言模型(如 OpenAI GPT、Google Gemini、Llama 等)和多种消息平台…
OmniManip – 智元机器人联合北大推出的通用机器人操作框架
OmniManip是什么 OmniManip 是北京大学与智元机器人联合实验室开发的通用机器人操作框架,通过结合视觉语言模型(VLM)的高层次推理能力和精确的三维操作能力…
