Toonflow – 开源的一站式 AI 短剧创作工具
Toonflow是什么 Toonflow 是开源的一站式 AI 短剧创作工具,将小说、剧本通过多 Agent 协作自动转化为结构化剧本、智能分镜、角色视觉和动画视频,实现…
BrowserAct Skills – 开源的 AI Agent 浏览器自动化 CLI 工具
BrowserAct Skills是什么 BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI 工具,能解决 Agent 操控浏览器时的核…
PawBench – 阿里通义推出的通用智能体评测基准
PawBench是什么 PawBench 是通义实验室推出的通用智能体评测基准,面向个人助理与 Agent 场景,将底座模型与运行框架(Harness)纳入同一评测体系。…
MAI-Voice-2 – 微软推出的新一代文本转语音模型
MAI-Voice-2是什么 MAI-Voice-2 是微软推出的新一代文本转语音(TTS)模型,是微软迄今最具表现力和自然感的语音合成模型。相比前代在保真度、语言覆盖、…
JoyAI-Echo – 京东开源的长音视频生成框架
JoyAI-Echo是什么 JoyAI-Echo 是京东推出的开源长音视频生成框架,专为分钟级多镜头故事生成设计。框架通过跨模态记忆库、记忆驱动后训练、Director …
Microsoft Scout – 微软推出的 AI 个人助手
Microsoft Scout是什么 Microsoft Scout 是微软推出的 AI 个人助手,基于 OpenClaw 开源技术构建。工具拥有独立 Entra 身份,…
GitNexus – 开源代码知识图谱引擎,构建完整依赖关系图
GitNexus是什么 GitNexus 是开源的代码知识图谱引擎,通过 Tree-sitter 解析将代码仓库构建为完整的依赖关系图,用 MCP 协议向 Cursor、…
html-video – Open Design 团队开源的 HTML 版剪映
html-video是什么 html-video 是 Open Design 团队(nexu.io)开源的HTML版剪映,基于 hyperframes 框架构建。工具让 …
Open Code Review – 阿里开源的 AI 代码审查 CLI 工具
Open Code Review是什么 Open Code Review 是阿里巴巴开源的 AI 代码审查 CLI 工具,源自集团内部服务数万名开发者、执行超百万次审查任…
Magenta RealTime 2 – 谷歌Magenta开源的实时音乐生成模型
Magenta RealTime 2是什么 Magenta RealTime 2(MRT2)是谷歌 Magenta 团队推出的第二代开源本地实时音乐生成模型。MRT2 基…
PlanningBench – 腾讯混元等开源的大模型规划能力评测框架
PlanningBench是什么 PlanningBench 是腾讯混元团队联合中国人民大学高瓴人工智能学院等机构推出的开源框架,专注于大语言模型的规划能力评测与训练。框…
中国将首发公有云大模型 Token 性能榜,日均调用量已突破 140 万亿次
随着人工智能技术的爆发式增长,作为大模型计量与结算核心单位的 Token 正在迎来爆发式增长。最新官方统计数据显示,截至 2026 年 3 月,我国日均词元调用量已强劲攀…
腾讯会议多项AI功能升级,元宝纪要月使用时长增长近5倍
6月5日,2026腾讯云AI产业应用大会现场,腾讯会议多项AI功能升级,打造Agent友好的通讯产品。通过声链、AI同传、AI美颜等创新功能,将人与人之间的通讯打磨到极致…
Cloudflare CEO:机器人流量超越人类,网络未来或全面走向“付费抓取”
网络安全与服务巨头 Cloudflare 的首席执行官马修·普林斯近日指出,互联网已经迎来了一个极其关键的历史性拐点。根据最新统计数据,目前互联网上的机器人自动流量已经正…
拍照识别野生蘑菇遭“误判”?豆包紧急回应:AI识别仅供参考,切勿盲目食用
针对近期网络热议的“豆包AI误判蘑菇导致用户中毒”事件,火山引擎多模态大模型“豆包”团队已正式联系上当事用户,并对事件全过程进行了核实与技术梳理。反馈结果显示,该用户此前…
华尔街规则为马斯克破例,SpaceX 史诗级 IPO 助力其冲刺首位万亿富豪
科技媒体 The Verge 近日在一档播客节目中,与《纽约时报》科技记者深度剖析了即将到来的 SpaceX 首次公开募股(IPO)。这场估值逼近 2 万亿美元的资本盛宴…
