Ad image
Ad image

最近更新

腾讯联合中科院、故宫博物院推出 Chronicles-OCR:首个覆盖汉字’七体之变’的视觉大模型跨时间评测基准

💡 站外导读:随着AI大模型深入应用,一个关键瓶颈浮现:当前的视觉大语言模型在面对跨越三千年的中国汉字形态剧变时,感知能力究竟如何?从殷商甲骨到近现代行草,古文字识别、古籍数字化长期受限于缺乏系统性评测工具。业界亟需一个能全面评估模型跨时间…

乐鑫 ESP-Claw 开源:用自然语言对话定义物联网设备行为的 AI Agent 框架

💡 站外导读:在物联网时代,硬件设备的编程与定制长期依赖专业开发人员,门槛高、周期长。乐鑫最新推出的 ESP-Claw …

Qwen3.7 Preview 发布:阿里通义千问双旗舰模型Max/Plus登顶LMSYS榜单,百万Token长上下文与Agentic Coding能力全面解读

💡 站外导读:当大模型竞赛进入“能力分层”与“场景细分”的深水区,单纯的参数堆叠已无法满足从极限推理到企业级高效部署的复…

Gemini 3.5 Flash深度解析:Google发布速度提升4倍、成本减半的AI Agent新王者

💡 站外导读:在AI模型军备竞赛白热化的当下,企业正陷入两难:前沿模型能力强大但昂贵缓慢,轻量模型快速便宜却性能不足。G…

谷歌Gemini Omni Flash深度解析:多模态世界模型如何统一视频生成、编辑与交互

💡 站外导读:视频生成赛道正经历从单一模态到多模态统一的范式跃迁。当行业还在纠结“文生视频”的质量时,谷歌I/O大会抛出…

Stable Audio 3开源:本地秒级生成6分钟音频,重塑AI音乐创作格局

💡 站外导读:当AI音频创作还在为生成时长受限、依赖云端算力、无法精细编辑而烦恼时,Stability AI带来了开源领域的重磅突破——Stable Audio 3。这款模型系列不仅将高质量音频生成时长从47秒一举推至6分钟以上,更首次实现了在MacBook Pro等消费级设备上的完全离线运行,解决了创作者对数据隐私和即时可用的核心痛点。它的出现,标志着AI音频工具从“玩具级”演示正式迈入“专业级…

如何像一个人一样做代码审查(第一部分)

最近,我阅读了一些关于代码审查最佳实践的文章。我发现这些文章把重点几乎全部放在了“找漏洞”上,而几乎忽视了审查工作的其他…

在 AI 时代,博客写作仍然值得 【译】

去年,当我重新开始半定期写博客时,也问过自己同样的问题,这篇文章正是我试图总结为何博客写作依然值得的原因。简单来说就是:…

作者 Mark Manson 对自己的畅销书《The Subtle Art of Not Giving a F*ck》的总结

大家好,我是**马克·曼森(Mark Manson)**,\ 我写过一本纽约时报畅销书,叫做《**The Subtle …

介绍 GitHub Copilot agent 模式(预览版)

Copilot agent 模式是 AI 辅助编程的下一步演化。它可以作为一位自治的“编程同伴”,执行多步骤的编码任务—…

Claude 的推理思考(Extended Thinking)【译】

有些事情,我们几乎瞬间就会想到答案,比如“今天是星期几?”。但也有一些事情需要更大的脑力投入,例如解一道有难度的填字谜题…

Deep Research 的问题 【译】

OpenAI 的 Deep Research 看起来像是专门为我打造的工具,但我却无法真正使用它。它再次展现了惊艳的演示…