清华智谱发布Vision2Web:首个三层递进式AI建站能力评估基准,重新定义Agent开发边界
💡 站外导读:在AI从生成内容迈向构建应用的关键拐点,如何客观衡量AI Agent的真实工程能力成为行业难题。清华与智谱AI联合推出的Vision2Web基准,直击当前评…
Lightpanda:颠覆Chrome!开源AI浏览器,内存仅1/16,速度飙升9倍
💡 站外导读:在AI Agent与大规模自动化需求井喷的时代,传统浏览器引擎的高内存、高延迟已成核心瓶颈。开发者与企业在部署爬虫、测试与数据收集时,常面临成本高昂、并发受…
谷歌Veo 3.1 Lite发布:成本直降50%的AI视频生成模型,1080p高性价比解决方案
💡 站外导读:在AIGC视频生成领域,高昂的成本与有限的灵活性始终是制约大规模应用的核心痛点。谷歌最新发布的Veo 3.1 Lite模型,正是瞄准这一行业瓶颈,以超过50…
claw-code: Claude Code 泄露源码净室重写,开源 Agent 框架移植 Rust 追求高性能
💡 站外导读:2025年,Anthropic 的 Claude Code 源码泄露事件引发行业震动,开发者社区面临法律合规与技术自主的双重挑战。在 AIGC 工具爆发的当…
智谱AI发布GLM-5V-Turbo:原生多模态Coding基座模型,看图写代码能力领先
💡 站外导读:随着AI编程助手和Agent技术爆发,开发者对模型的“视觉理解”与“任务执行”能力提出更高要求。传统文本编码模型难以处理UI截图、设计稿等视觉输入,导致前端…
Meta推出Muse Spark:原生多模态大模型,多智能体协同,性能全面超越GPT-5.4
💡 站外导读:当AI竞争进入深水区,单纯的文本对话能力已无法满足产业需求。如何让模型像人一样理解复杂图表、协同处理多步骤任务,并在医疗、设计等专业领域落地,成为行业共同痛…
3.3%幻觉率登顶三大榜单!Baichuan-M4医疗大模型与‘百小医’家庭医生微信生态全解析
💡 站外导读:医疗AI长期受困于‘事实性幻觉’,即模型在关键医学问题上输出错误信息,严重阻碍其临床落地。百川智能在最新学术论坛上展示了新一代医疗大模型Baichuan-M…
百川智能Baichuan-M4医疗大模型登顶全球榜单:幻觉率仅3.3%,AI家庭医生”百小医”开启健康管理新范式
💡 站外导读:当前AI医疗面临核心矛盾:通用大模型咨询规模虽大,却因幻觉严重、循证推理差而无法满足真实诊疗需求,优质医疗资源供给不足更是行业长期痛点。百川智能创始人王小川…
