站外新闻 – 第 72 页 – Prompt 语宙

站外新闻

4977 .

WiseFlow – 开源的AI信息挖掘工具

WiseFlow是什么 WiseFlow是开源的AI信息挖掘工具，能从网站、微信公众号、社交平台等多源信息中智能提取并分类数据。结合了统计学习和大型语言模型（LLM），支…

Agents – AIWaves公司推出的AI Agent开发工具

Agents是什么 Agents是AIWaves公司推出的AI Agent开发工具，支持用户对AI模型进行详细调整和优化，构建更加智能和个性化的AI Agent。通过Ag…

MiniCPM-V – 面壁智能推出的开源多模态大模型

MiniCPM-V是什么 MiniCPM-V是面壁智能推出的开源多模态大模型，拥有80亿参数，擅长图像和视频理解。MiniCPM-V在单图像理解上超越了GPT-4V等模型…

VideoDoodles – Adobe推出的AI视频编辑框架

VideoDoodles是什么 VideoDoodles是Adobe公司联合多所大学推出的AI视频编辑框架。支持用户在视频中轻松插入手绘动画，实现与视频内容的无缝融合。通…

CharacterFactory – 大连理工推出的AI角色创作工具

CharacterFactory是什么 CharacterFactory是大连理工大学IIAU团队推出的AI角色创作工具，通过扩散模型在无需参考图片的情况下，仅需2.5G…

UniBench – Meta推出的视觉语言模型(VLM)评估框架

UniBench是什么 UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架，对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基…

Retinex-Diffusion – AI图像照明控制框架，让图像明暗更自然、细腻

Retinex-Diffusion是什么 Retinex-Diffusion是基于Retinex理论的AI图像照明控制技术，让图像明暗更加自然、细腻、富有层次感。Reti…

EXAONE 3.0 – LG 推出的开源 AI 模型，专为英语和韩语设计

EXAONE 3.0是什么 EXAONE 3.0是LG AI Research推出的开源AI模型，具有7.8亿参数，专为英语和韩语设计。EXAONE 3.0在英语和韩语的…

DressCode – 上海科技大学推出的3D服装生成框架

DressCode是什么 DressCode是上海科技大学、宾夕法尼亚大学和Deemos科技联合推出的3D服装生成框架。支持用户通过文本描述来自动生成各种风格和材质的3D…

ReSyncer – 清华联合百度推出的AI视频编辑工具

ReSyncer是什么 ReSyncer是清华大学和百度联合推出的AI视频编辑工具，通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-Sync…

MotionClone – 文本驱动的AI视频动作克隆框架

MotionClone是什么 MotionClone是文本驱动的AI视频动作克隆框架，通过时间注意力机制从参考视频中克隆动作，结合文本提示词生成新视频。能处理复杂的全局相…

Mini-Monkey – 华科联合华南理工推出的多模态AI模型

Mini-Monkey是什么 Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM…

MDT-A2G – 复旦&腾讯优图推出的AI模型，可根据语音同步生成手势

MDT-A2G是什么 MDT-A2G是复旦大学和腾讯优图联合推出的AI模型，专门用于根据语音内容同步生成相应的手势动作。MDT-A2G模仿人类在交流时自然产生的手势，计算…

ASAM – vivo公司推出的AI图像分割模型

ASAM是什么 ASAM（Adversarial Adjustment of Segment Anything Model）是vivo公司推出的AI图像分割模型，通过对抗…

Falcon Mamba 7B – 首个通用Mamba开源AI大模型

Falcon Mamba 7B是什么 Falcon Mamba 7B是阿联酋技术创新研究所（TII）推出的开源AI大模型，性能超越了Meta的Llama 3.1-8B等模…

NotesGPT – 开源的AI语音笔记工具，实时转录文本自动生成行动项

NotesGPT是什么 NotesGPT是一款开源的AI驱动语音笔记工具，能将用户的语音笔记快速转录成文本，自动生成行动项。工具基于包括Convex数据库、Next.js…