站外新闻 – 第 86 页 – Prompt 语宙

站外新闻

5187 .

ASAM – vivo公司推出的AI图像分割模型

ASAM是什么 ASAM（Adversarial Adjustment of Segment Anything Model）是vivo公司推出的AI图像分割模型，通过对抗…

Falcon Mamba 7B – 首个通用Mamba开源AI大模型

Falcon Mamba 7B是什么 Falcon Mamba 7B是阿联酋技术创新研究所（TII）推出的开源AI大模型，性能超越了Meta的Llama 3.1-8B等模…

NotesGPT – 开源的AI语音笔记工具，实时转录文本自动生成行动项

NotesGPT是什么 NotesGPT是一款开源的AI驱动语音笔记工具，能将用户的语音笔记快速转录成文本，自动生成行动项。工具基于包括Convex数据库、Next.js…

MEXMA – Meta推出的预训练跨语言句子编码器

MEXMA是什么 MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中，MEXMA用一种语言的…

Lingua – Meta推出的轻量级独立代码库

Lingua是什么 Lingua 是 Meta AI推出的一个轻量级且独立的代码库，旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件，便于研究人员尝试新的…

VideoAgent – 斯坦福联合多所研究机构推出自改进的视频生成系统

VideoAgent是什么 VideoAgent是一种自改进的视频生成系统，由斯坦福大学、滑铁卢大学、DeepMind等机构的研究人员共同推出。根据图像观察和语言指令生成…

Llama Tutor – 开源的AI学习平台，提供学习主题生成定制学习计划

Llama Tutor是什么 Llama Tutor 是一个基于AI的个性化学习平台，由 Llama 3.1 和 Together AI 技术驱动，是一个完全开源的项目。…

ComfyGen – 英伟达联合特拉维夫推出的文本到图像生成系统

ComfyGen是什么 ComfyGen是由NVIDIA和特拉维夫大学研究人员推出的一种文本到图像生成系统，基于大型语言模型（LLM）自动创建与用户文本提示相匹配的工作流…

restorePhotos.io – 开源的AI照片修复项目，高质量修复老旧照片

restorePhotos.io 是什么 restorePhotos.io 是一个开源的AI项目，专注于修复老旧和模糊的人脸照片。用GFPGAN机器学习模型，基于Next…

PDFtoChat – AI驱动的与PDF互动提取关键信息的开源项目

PDFtoChat是什么 PDFtoChat 是一个开源的创新AI项目，支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技术，包括 Togeth…

Self-Taught Evaluators – Meta推出的新型模型评估方法

Self-Taught Evaluators是什么 Self-Taught Evaluators是一种新型的模型评估方法，基于自我训练的方式提高大型语言模型（LLM）的评…

TurboSeek – AI驱动的开源的智能搜索引擎

TurboSeek是什么 TurboSeek是一个开源的AI搜索引擎，由Together.ai提供技术支持。基于现代化的技术栈，包括Next.js、Tailwind、Bi…

Napkins.dev – AI驱动的支持截图或线框图快速生成网页应用的开源项目

Napkins.dev是什么 Napkins.dev是一个创新的开源项目，基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。项目背后依托于Meta的Llam…

MDM – 苹果推出开源的新型扩散模型框架

MDM是什么 Matryoshka Diffusion Models（MDM）是由苹果公司研究人员推出的一种新型扩散模型框架，旨在解决生成高分辨率图像和视频时面临的计算和…

Fluid – 谷歌联合MIT推出文本到图像的自回归生成模型

Fluid是什么 Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型，基于连续标记和随机生成顺序的方法，在视觉质量和评估性能上取得突…

SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法

SaRA是什么 SaRA是一种新型的预训练扩散模型微调方法，由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数，让模型能适应新任务。SaRA基…