Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 腾讯联合中科院、故宫博物院推出 Chronicles-OCR:首个覆盖汉字’七体之变’的视觉大模型跨时间评测基准
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > 腾讯联合中科院、故宫博物院推出 Chronicles-OCR:首个覆盖汉字’七体之变’的视觉大模型跨时间评测基准
AIGC 资讯

腾讯联合中科院、故宫博物院推出 Chronicles-OCR:首个覆盖汉字’七体之变’的视觉大模型跨时间评测基准

站外新闻
最近更新: 2026年5月22日 下午5:30
古文字识别 数字化 腾讯混元 视觉大语言模型 评测基准
SHARE

💡 站外导读:随着AI大模型深入应用,一个关键瓶颈浮现:当前的视觉大语言模型在面对跨越三千年的中国汉字形态剧变时,感知能力究竟如何?从殷商甲骨到近现代行草,古文字识别、古籍数字化长期受限于缺乏系统性评测工具。业界亟需一个能全面评估模型跨时间鲁棒性的标准,以揭示其在文化遗产数字化中的真实能力边界。Chronicles-OCR正是在此背景下应运而生的破局之作。

Chronicles-OCR是什么

Chronicles-OCR 是腾讯混元联合中国科学院信息工程研究所、安阳师范学院、南开大学及故宫博物院共同推出的业界首个覆盖中国汉字”七体之变”完整演化轨迹的跨时间视觉感知评测基准,基准包含 2,800 张高质量图像,系统涵盖甲骨文、金文、篆书、隶书、楷书、行书、草书七大字体,通过阶段自适应标注范式与四大评测任务,评估视觉大语言模型在面对数千年汉字形态持续演变时的感知鲁棒性。

阅读目录
  • Chronicles-OCR是什么
  • Chronicles-OCR的主要功能
  • 如何使用Chronicles-OCR
  • Chronicles-OCR的核心优势
  • Chronicles-OCR的同类竞品对比
  • Chronicles-OCR的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Chronicles-OCR

Chronicles-OCR的主要功能

  • 七体全覆盖评测:完整覆盖甲骨文、金文、篆书、隶书、楷书、行书、草书七大中国字体,构建从殷商到近现代的跨时间评测体系。
  • 阶段自适应标注:针对古文字(甲骨/金文/篆书)提供单字级边界框+现代汉字映射标注;针对成熟字体(隶/楷/行/草)提供序列级布局理解标注,适配不同历史阶段的形态差异。
  • 四大核心评测任务:支持跨时期字符定位、细粒度古文字识别、古文本解析、字体分类,全方位评估模型能力。
  • 视觉指代机制:通过彩色框标出图像中的目标字符,让模型进行识别,实现字符破译能力与空间定位能力的解耦评估。
  • 高质量专家标注:由古文字学博士、研究生及领域专家进行多层级交叉标注,确保字体分类、边界框定位和字符转录的高保真度。
  • 权威数据源整合:甲骨文来自安阳师范学院甲骨文信息处理重点实验室,金文/篆书由古文字学团队整理,隶/楷/行/草来自故宫博物院文物手写体识别测试数据集。
  • 模型鲁棒性诊断:系统评估视觉大语言模型在数千年汉字形态演化过程中的感知能力边界,揭示现代文档解析向历史书写系统泛化的关键瓶颈。

如何使用Chronicles-OCR

  • 访问开源仓库:前往 GitHub 仓库 https://github.com/VirtualLUOUCAS/Chronicles-OCR 获取数据集、论文及评测代码。
  • 下载数据集:获取包含 2,800 张图像的完整数据集,其中甲骨文、金文、篆书、隶书、楷书、行书、草书各 400 张,附带 JSON 或 XML 格式的标注文件。
  • 理解数据格式:阅读阶段自适应标注规范——古文字阶段(甲骨/金文/篆书)为单字级边界框坐标 + 现代汉字映射;成熟字体阶段(隶/楷/行/草)为序列级文本布局与阅读顺序标注。
  • 选择评测任务:根据研究目标从四大任务中选取:跨时期字符定位、细粒度古文字识别、古文本解析、字体分类
  • 准备被测模型:部署待评测的视觉大语言模型(VLLM),确保模型支持图像输入与文本输出能力。
  • 执行模型推理:将数据集图像输入模型,按任务要求输出对应结果(如边界框坐标、现代汉字转录、字体类别等)。
  • 运行评测脚本:使用仓库提供的官方评估代码,将模型输出与标准标注进行比对,自动计算各任务指标(如定位精度、NED 编辑距离、分类准确率等)。
  • 分析评测结果:对照基准报告中的模型表现数据,诊断被测模型在古文字感知、历史布局理解及字体演化认知上的能力边界与缺陷。
  • 引用与反馈:在相关研究论文中引用 arXiv:2605.11960v1,并可通过 GitHub Issues 向作者团队反馈使用问题或改进建议。

Chronicles-OCR的核心优势

  • 业界首创跨时间评测体系:首个系统覆盖汉字”七体之变”(甲骨文、金文、篆书、隶书、楷书、行书、草书)完整演化轨迹的视觉感知评测基准,填补了从殷商到近现代的时间跨度评测空白
  • 顶级学术机构联合背书:由腾讯混元联合中国科学院信息工程研究所、安阳师范学院甲骨文信息处理重点实验室、南开大学及故宫博物院共同推出,数据源与标注质量经过严格学术把关
  • 首创阶段自适应标注范式:针对不同历史阶段字体的剧烈形态变化,差异化地实现古文字阶段的单字级定位+映射与成熟字体阶段的序列级布局理解,评估维度更精准
  • 深度揭示模型能力边界:不仅提供评测数据,更系统性地揭示了当前主流 VLLMs 在古文字细粒度空间定位和语义破译上的灾难性失败,为模型优化提供明确方向
  • 权威数据源与专家级标注:甲骨文来自安阳师范学院专业实验室,金文/篆书由古文字学博士团队整理,隶/楷/行/草取自故宫博物院文物数据集,经多层级交叉标注确保高保真度
  • 视觉指代解耦评估机制:通过彩色框视觉指代,将字符级破译能力与空间定位能力解耦评估,精准诊断模型具体短板
  • 完全开源可复现:论文与数据集均已开源,便于学术界复现验证、对比评测及进一步拓展研究

Chronicles-OCR的同类竞品对比

对比维度 Chronicles-OCR AncientDoc ACCID
发布机构 腾讯混元、中科院信工所、安阳师范学院、南开大学、故宫博物院 字节跳动、北京交通大学等 学术研究机构(论文未明确单一机构)
数据集规模 2,800 张严格平衡图像,七体各 400 张 约 3,000 页古籍图像,来自 100+ 部古籍 2,892 字符类别图像,含部首级标注
覆盖内容 七大字体:甲骨文、金文、篆书、隶书、楷书、行书、草书 14 类古籍文档(经史子集、医学、天文历算、楚辞等) 古代汉字图像(侧重部首结构)
时间跨度 约三千年(殷商至近现代) 战国秦汉至明清 古代汉字(未明确分期)
评测任务 跨时期字符定位、细粒度古文字识别、古文本解析、字体分类 页面级 OCR、白话翻译、推理 QA、知识 QA、语言变体 QA 零样本字符识别、部首识别
标注粒度 阶段自适应:古文字单字级边界框+现代汉字映射;成熟字体序列级布局 页面级文本、问答对、翻译对 字符级 + 部首级(含坐标、结构)
目标模型 视觉大语言模型(VLLMs) 视觉语言模型(VLMs) 零样本 OCR / 深度学习模型
核心创新 首创跨时间汉字演化评测、阶段自适应标注范式、视觉指代解耦评估 首个古籍多任务评测基准,从 OCR 延伸至知识推理 首创部首级精细标注,支持零样本学习

Chronicles-OCR的应用场景

  • 古文字智能识别:辅助甲骨文、金文等未完全破译古文字的自动化识别与专家校验,降低古文字学研究门槛。
  • 古籍数字化工程:对历代书法、碑帖、文献进行高精度 OCR 与结构化解析,推动文化遗产数字化存档。
  • 字体演化研究:用 AI 模型分析汉字从甲骨文到楷书的形态演变规律,支撑文字学、历史学跨学科研究。
  • VLLM 能力评测:作为标准化基准,评测和对比不同视觉大语言模型的跨时间感知能力与鲁棒性。
  • 文物信息提取:从青铜器铭文、竹简、帛书等文物图像中提取文字信息,辅助考古研究与文物鉴定。
  • 教育科普应用:用于汉字文化教学中的古文字识别演示与字体演变可视化,增强公众对汉字历史的认知。

📝 站长洞察 (Editor’s Insight)

Chronicles-OCR的发布标志着AI评测从现代文档向历史纵深的关键跃迁。它精准切中了视觉大模型研究的两大前沿趋势:一是领域基准的专业化与垂直化,通用能力评测已无法满足古文字、文物等细分场景的需求;二是多模态智能向文化遗产保护的深度渗透,这是AI体现其社会价值的重要方向。该基准不仅通过’阶段自适应标注’这一创新范式,解决了古今字体形态差异悬殊的标注难题,更通过视觉指代机制,创造性地将空间定位与语义破译解耦评估,为模型优化提供了前所未有的精准诊断。它揭示了一个深刻启示:未来的AI竞争,不仅是算力与数据的比拼,更是对细分领域知识深度建模能力的较量。谁能率先在垂直领域构建起不可替代的认知壁垒,谁就能在下一轮大模型竞争中占据先机。

Taking your Marriage License and Wedding Done Proper
DALL-E 3 与 Mdijourney 的各项功能对比
Karpathy 开源 autoresearch:单 GPU 实现 AI 自主科研,自动跑实验、调参、迭代,打造你的专属 AI 科学家
腾讯混元 Hy-MT2 开源翻译大模型:7B 参数性能碾压 Gemini,440MB 量化版让手机变身离线翻译机
超线性回报 [译]
TAGGED:古文字识别数字化腾讯混元视觉大语言模型评测基准
分享
Email 复制链接 打印
Share
上一篇 开源神器ReadFrog(陪读蛙):AI沉浸式翻译+划词学习,免费支持20+模型,效率提升70%
下一篇 Cursor发布Composer 2.5:自研Agentic编程模型,性能比肩Opus 4.7、成本仅1/10
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

开源AI Agent反检测浏览器:Camofox Browser如何用C++级指纹伪造突破Cloudflare封锁
AI 工具
Step Image Edit 2:3.5B参数轻量模型如何秒杀20B级开源大模型?阶跃星辰发布新一代图像编辑模型
AI 工具 AIGC 资讯
Cursor发布Composer 2.5:自研Agentic编程模型,性能比肩Opus 4.7、成本仅1/10
AI 工具 AIGC 资讯
开源神器ReadFrog(陪读蛙):AI沉浸式翻译+划词学习,免费支持20+模型,效率提升70%
AI 工具

相关推荐

AIGC 资讯

Ethnic Influences in Asian Human relationships

lilizhu
AIGC 资讯

CloudDM:一站式开源数据库管控平台,30种数据源、54条SQL审核规则,企业级权限与脱敏能力全免费

站外新闻
CloudDM SQL审核 开源平台 数据库管控 数据脱敏
AIGC 资讯

Midjourney 不同画面艺术流派风格 Prompts 对人像生成效果的影响

OZ
AI人像 AI生成 AI绘画 Midjourney prompt 人像
AI 工具AIGC 资讯

阿里通义Qwen3.7-Max旗舰大模型发布:全能智能体基座,编程推理全面领先,定义AI Agent新标杆

站外新闻
AI编程 Qwen3.7-Max 大模型 智能体 阿里通义千问
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

3D AI AI Agent AIGC AI人像 AI工具 AI换脸 AI海报设计 AI生成视频 AI绘画 AI视频 AI设计 app图标 chatgpt DALL-E3 excel GPT meta Midjourney openai Pika prompt runway SDXL Stability AI stable diffusion UI设计 专业 丛林 乐高 人像 人物 动物 吉卜力 咒语 图像生成 图标设计 圣诞 壁纸 多模态大模型 大模型 女性 奶牛 实验室 宠物 客厅 室内设计 家居 局部重绘 展台 帅哥 建筑 建筑设计 开源模型 微摄影 怪物 提示词 摄影 教程 新闻 日本排放核污水 早报 智能体 智谱AI 枯木 植物 模特 水果 泳池 海报 海报设计 温馨的家 游戏 游戏美术 玻璃 矢量插画 破碎 科幻 穿搭 窗 美食 背景 腾讯混元 节日 芭比 花 花卉 茶园一角 草原 荷兰奶源 表情包 视频编辑 赛博朋克 超现实主义 软件 运动 金毛 风景 食物 香水
Prompt 语宙Prompt 语宙
Follow US
© 2009-2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Welcome Back!

Sign in to your account

Username or Email Address
Password

忘记密码