09-18 AIGC 早报

最近更新: 2023年9月18日下午2:54

AIGC 早报

AirCode 一个在线编程工具，可即时在线编写 Node.js 函数，并配备内置的数据库和文件存储功能。
IncarnaMind ：可通过大语言模型（LLMs）与多个文档同时聊天。
OmnimatteRF：一个全新的先进的视频抠图方法。它可以将视频分离为多个层，同时允许用户替换或单独处理某些层，然后再将它们合成回去。与其他方法不同的是，OmnimatteRF 结合了 2D 前景层和 3D 背景模型。这意味着，它不仅仅是将前景对象与背景分离，而是为背景创建了一个 3D 模型。这种结合使得 OmnimatteRF 能够更准确地重建真实世界中的场景，特别是那些背景复杂的场景。2D 前景层保留了主题的所有细节，而 3D 背景模型则为真实世界的视频稳健地重建了场景。类似结合使 OmnimatteRF 在各种真实世界的视频中都能产生高质量的抠图效果。
项目及演示：https://omnimatte-rf.github.io
M3DDM：一种专门用于“视频外部绘制”模型。类似Photoshop的Generative Fill图像扩展功能，不同的是它主要针对视频，可以对视频缺失的边缘部分进行扩充补全！这比单纯的图像外部绘制更具挑战性，因为除了空间上的连续性，还需要保持时间上的连续性，确保视频流畅。该项目由阿里巴巴和中国科学院计算技术研究所共同研究。
项目及演示：https://fanfanda.github.io/M3DDM/
昆仑万维：天工通用大模型推理能力超过 GPT-3.5 和 LLaMA2。昆仑万维发布消息称，在权威推理榜单 Benchmark GSM8K 测试中，昆仑万维自研的通用基座大模型天工大模型以 80% 的正确率脱颖而出，大幅领先 GPT-3.5（57.1%）和 LLaMA2-70 B（56.8%），“标志着天工大模型的推理能力达到全球领先，接近 GPT-4”。
智源发布全球最大中英文向量模型训练数据集，规模高达3亿文本对。北京人工智能产业峰会暨中关村科学城科创大赛颁奖典礼现场，智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP（massive text pairs）。这是全球最大的中、英文文本对训练数据集，数据规模达3亿对，具有规模巨大、主题丰富、数据质量高三大特征，进而可以推动解决中文模型训练数据集缺乏问题。

TAGGED:AIGC 早报

瞬间看懂 Midjourney 通过相机角度 Prompts 控制 AI 生成构图

下一篇 Midjourney 生成风格独特风景壁纸的 Prompt 咒语提示词分享

发表评价

09-18 AIGC 早报

发表评价取消回复

最近更新

大语言模型的“破解”研究：仅需二十次尝试 [译]

Deep Research 与知识价值：从信息搜索到价值重新定义

什么是多模态大语言模型（MLLM）？[译]

比尔·盖茨：特朗普、马斯克，以及我的神经多样性如何塑造了我 [译]

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复