站外新闻 – 第 122 页 – Prompt 语宙

站外新闻

5065 .

VectorVein – 开源的无代码AI工作流工具，简单拖拽定制AI应用

VectorVein是什么 VectorVein 是一款开源的无代码AI工作流工具，通过简化的拖拽操作，让用户无需编程知识即可构建智能工作流，实现日常任务的自动化。Vec…

ChatTTS – 开源的用于对话的生成式语音合成模型

#安装ModelScope pip install modelscope #SDK模型下载 from modelscope import snapshot_downloa…

Vary-toy：开源的小型视觉多模态模型

Vary-toy是什么 Vary-toy是一个小型的视觉语言模型（LVLM），由来自旷视、国科大、华中大的研究人员共同提出，旨在解决大型视觉语言模型（LVLMs）在训练和…

ColorFlow – 清华和腾讯共同推出的图像序列着色模型

ColorFlow是什么 ColorFlow是清华大学和腾讯ARC实验室共同推出的图像序列着色模型，能精细化地保持图像序列中个体身份的同时进行着色。基于检索增强、上下文学…

HumanVid – 专为人类图像动画生成而设计的高质量数据集

HumanVid是什么 HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集，专为人类图像动画训练设计。结合了现实世界视频和合成数据，通过精心设计的规…

AutoDev – 微软推出的AI编程和程序开发智能体框架

AutoDev是什么 AutoDev是由微软的研究人员推出的一个AI编程工具，专门设计用于自主规划和执行复杂的软件工程任务，如代码编写、调试、测试和版本控制等。AutoD…

MARS5-TTS – 开源的AI声音克隆工具，支持140+语言

MARS5-TTS是什么 MARS5-TTS是CAMB.AI推出开源的AI声音克隆工具，有突破性逼真的韵律，支持140多种语言支持。还能处理复杂韵律场景，如体育解说和动漫…

OpenCity – AI交通预测模型，卓越的零样本预测和情境适应能力

OpenCity是什么 OpenCity是由香港大学联合华南理工大学和百度共同研发的交通预测模型。OpenCity采用Transformer架构和图神经网络，通过大规模预…

Seed-TTS – 字节跳动推出的高质量文本到语音生成模型

Seed-TTS是什么 Seed-TTS是由字节跳动开发的高级文本到语音（Text to Speech，TTS）模型，能够生成与人类语音极为相似的高质量语音，具备出色的上…

Lepton Search – 开源的对话式AI搜索引擎项目

Lepton Search是什么 Lepton Search是由原阿里巴巴技术副总裁和AI科学家贾扬清创办的Lepton AI应用构建平台开源的一个对话式AI搜素引擎，该…

LingBot-Video – 蚂蚁灵波开源面向具身智能的视频模型

LingBot-Video是什么 LingBot-Video 是蚂蚁灵波科技开源的全球首个面向具身智能的 MoE 视频生成基础模型。模型基于 DiT + MoE 架构，总…

Robostral Navigate – Mistral AI 推出的具身智能导航模型

Robostral Navigate是什么 Robostral Navigate 是 Mistral AI 推出的首个具身智能导航模型，用一个普通 RGB 摄像头可让机器…

NodeTool – AI工作流可视化构建器，拖放节点设计复杂工作流

NodeTool是什么 NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型，基于简单、可视化的界面，让用户无需编码即可快速原型设计和…

ORMBG – 开源的AI图像分割工具

ORMBG是什么 ORMBG是开源的AI图像分割工具，由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景，用先进的图像处理技术，实…

Grok-1 – 马斯克旗下xAI开源的大模型，参数量3140亿

Grok-1是什么 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型，是一个混合专家（MoE）模型，拥有 3140 亿参数，使其成为目前参数…

HeadGAP – 字节跳动推出的3D头像生成模型

HeadGAP是什么 HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型，仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架，基于大规模…