工作流迈向工程化!国内开源 AI 智能体 Runtime 框架 MateClaw 发布 v1.5.0 重磅更新
近日,开源 AI 智能体(Agent)Runtime 框架MateClaw 正式发布了 v1.5.0版本。本次迭代并未盲目追求模型接入的数量,而是将重心放在了补齐 Age…
日日新SenseNova V6 – 商汤推出的多模态融合模型系列
日日新SenseNova V6是什么 日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列,基于6000亿参数的多模态MoE架构,实现文本、图像和视…
能力与安全的博弈!OpenAI 上线 ChatGPT“封锁模式”,宁可断网也要防数据泄露
在生成式人工智能向智能体(Agent)时代全速演进的过程中,越发强大的工具调用和联网能力,也让安全防御的系统防线面临着前所未有的考验。为了应对日益猖獗的提示注入攻击,Op…
Kiss3DGen – 基于图像扩散模型的3D资产生成框架
Kiss3DGen是什么 Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle…
OpenCV 5 重磅发布:全新 DNN 引擎原生支持大模型,迈入大模型时代
作为全球计算机视觉与人工智能领域的基石,开源视觉库 OpenCV 正式迎来了里程碑式的重大升级。本周,OpenCV 团队正式对外发布了全新的OpenCV5,在延续其二十多…
o1-pro – OpenAI 推出的升级版推理模型
o1-pro是什么 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势在于显著提升的计算能力,…
ChatDLM – Qafind Labs推出的全球最快扩散语言模型
ChatDLM是什么 ChatDLM是 Qafind Labs推出的全球最快扩散语言模型,核心定位是突破传统Transformer架构在长上下文处理与推理效率上的瓶颈。模…
II-Agent – Intelligent Internet开源的通用AI Agent框架
II-Agent是什么 II-Agent 是开源的Agent框架,通过与大型语言模型(LLM)的交互,简化和提升跨多个领域的工作流程。具备多种核心功能,包括研究与事实核查…
WorldScore – 斯坦福大学推出的世界生成模型统一评估基准
WorldScore是什么 WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布…
LDGen – 理想汽车推出的多语言文本到图像生成技术
LDGen是什么 LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技…
听听乱码就被“洗劫”?谷歌 Gemini 语音助理爆潜伏漏洞,黑客用特殊通知给 AI “下毒”
智能家居与语音助手正成为黑客眼中的“新猎物”。网络安全公司 SafeBreach 日前公开披露,谷歌旗下的智能语音助理Gemini存在一个极其隐蔽的新型安全漏洞。黑客可以…
告别低效教学!知达 AI 用全闭环智能工具重构教育生产力
备课耗时、批改量大、学情分析不精准、个性化教学难落地…… 这些长期困扰教育工作者的痛点,正在被 AI 技术逐一破解。知达 AI 作为国内教育大模型领域的先行者,以全流程智…
压轴题全押错?AI军团折戟 2026 高考作文,教育部发声反炒作
6月7日,2026年全国高考正式拉开帷幕,1290万考生奔赴考场。每年最受瞩目的高考语文作文题如期揭晓,其中北京卷的微写作涉及“人工智能与幸福晚年”的主题,上海卷则抛出了…
C盘空间瞬间释放4GB!谷歌浏览器终于服软,新版 Chrome 允许彻底禁用并删除本地 AI 大模型
在这个“无软件不 AI”的时代,各大应用都在不遗余力地往客户端塞进各种人工智能组件,但强行捆绑的策略也常常引发用户的反感。近日,全球市场份额第一的谷歌浏览器终于在用户长期…
苹果WWDC2026前瞻:库克卸任前谢幕秀,Siri将引入Google Gemini全面重构
苹果公司即将在WWDC2026上迎来重大AI战略转向,全面升级AI Siri并推出可与ChatGPT竞争的独立AI助手应用。作为首席执行官蒂姆·库克(Tim Cook)正…
打破僵化API!Perplexity 推出“搜索即代码”,让 AI 智能体自主编写搜索管道
传统搜索引擎为人类浏览而设计的“蓝色链接列表”正在成为 AI 智能体(Agents)高效工作的瓶颈。在处理复杂研究任务时,AI 只能通过硬性调整搜索词进行多轮、手工作坊式…
