- Open Interpreter:可在本地运行 OpenAI 的代码解释器 – 具有完全的互联网访问权限 - 所有操作都在本地执行,安全隐私 – 用户可以使用任何软件包或库 - 没有时间或文件大小的限制。 - 开源,MIT 许可,可自由地使用、修改和分发 - 持多种编程语言,包括 Python、JavaScript、Shell 等 用户可以通过一个类似于 ChatGPT 的界面与 Open Interpreter 进行交互,执行各种任务,如创建和编辑照片、视频、PDF 文件,控制 Chrome 浏览器进行研究,处理大型数据集等。 与 OpenAI 官方的代码解释器相比,Open Interpreter 具有更多的灵活性,由于在本地环境中,没有时间或文件大小的限制。
项目地址: https://github.com/KillianLucas/open-interpreter - 华纳音乐与虚拟形象Noonoouri 签约并发行首张单曲 Dominoes,该单曲由德国 DJ 和音乐制作人,Alle Farben 参与。 这首歌使用了人工智能技术来创建,基于一名真实歌手的声音但进行了修改,以便她有自己独特的声音。 视频中 Noonoouri 穿着 Kim Kardashian(金·卡戴珊)的塑身内衣品牌 Skims。这意味着 Noonoouri 成为第一个签订重大唱片合约的人工智能角色。 虚拟角色背景: Noonoouri 是一个19岁的数字人物,拥有超过40万的 Instagram 粉丝,已经与多家时尚界的大品牌合作,居住在巴黎。 她是由43岁的慕尼黑平面设计师 Joerg Zuber 和他的创意机构 Opium Effect 创造的。Noonoouri 于2017年底由Zuber 推向市场,从那时起,她与像 Marc Jacobs、Dior 和 Versace 这样的品牌合作,为 Kim Kardashian(金·卡戴珊)的化妆品线做广告,并与像 Naomi Campbell 这样的超模成为“朋友”。
- Laughing Matters::能够根据人的静态照片生成包含笑声的笑脸视频。 该模型能够将静态人脸图像和笑声音频合成为一个动态的笑脸视频。为了实现这一目标,研究者采用了 U-Net 架构,这是一种在图像处理领域广泛应用的深度学习模型。他们对这个架构进行了一系列的优化,以适应笑声生成的特殊需求。结果显示模型的性能不仅在传统的图像和视频质量指标上表现优异,同时在专为笑声生成设计的新评估指标上同样表现出色。 这应该是目前第一个:从单个参考帧和原始音频剪辑生成自然笑声视频模型!
项目地址: https://sites.google.com/view/laughing-matters - DeepMind 联合创始人:OpenAI 正秘密训练 GPT-5。DeepMind 联合创始人和 Inflection AI CEO Mustafa Suleyman 在采访时透露,OpenAI 正秘密训练 GPT-5,在未来 18 个月内,Inflection AI 训练的模型比当前的前沿模型大 100 倍。未来 3 年内,Inflection 的模型比现在大 1000 倍。
- 百度输入法上线“超会写”AI 助手,基于文心一言大模型打造。在百度宣布“文心一言”首批获批向全社会开放之后,百度输入法于近日迎来 11.7.19.9 安卓版本更新。据介绍,升级后的百度输入法新增全场景 AI 创作助手“超会写”,该功能基于文心大模型打造,可帮助用户“高情商沟通”、“神评论”、改写文案等。此外,该功能还支持为用户提供短视频配文、小红书爆款标题、创意微博等。
- Gartner:2023年AI半导体市场将达到534亿美元。根据Gartner的最新预测,用于执行人工智能(AI)工作负载的半导体将在2023年为半导体行业带来534亿美元的收入,比2022年增长20.9%。首批8家大模型正式获批上线,开启中国大模型行业产品化新篇章。阿里、腾讯、科大讯飞等巨头或将跟进,推动AI产品更快落地。此举将提升大模型服务规范化和迭代速度,推动算力板块需求增加,有利于相关公司和行业的快速发展。Gartner:2023年AI半导体市场将达到534亿美元。根据Gartner的最新预测,用于执行人工智能(AI)工作负载的半导体将在2023年为半导体行业带来534亿美元的收入,比2022年增长20.9%。
09-04 AIGC 早报
发表评价