Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集
AIGC 资讯

ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集

站外新闻
最近更新: 2026年6月8日 上午12:41
SHARE

ChildMandarin是什么

ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)共同推出的,针对3-5岁儿童的普通话语音数据集。数据集包含41.25小时的语音数据,来自397名儿童,覆盖中国22个省级行政区,性别分布均衡。数据用智能手机录制,确保高质量音频。ChildMandarin核心特点是自然真实交互,用家长引导式对话采集方式,模拟自然交流场景。数据集填补了低幼儿童语音研究的空白,推动儿童语音识别、语言发展研究及智能语音交互系统的发展。

阅读目录
  • ChildMandarin是什么
  • ChildMandarin的主要功能
  • ChildMandarin的技术原理
  • ChildMandarin的项目地址
  • ChildMandarin的应用场景

ChildMandarin

ChildMandarin的主要功能

  • 语音识别:为自动语音识别(ASR)模型提供大量3-5岁儿童的自然语音数据,提升儿童语音识别的准确性和鲁棒性。
  • 说话人验证:支持说话人验证(SV)任务,帮助识别和区分不同儿童的声音,用在儿童身份认证等场景。
  • 语言研究:为儿童语言发展研究提供数据支持,助力开发儿童语言学习工具和互动教育系统。

ChildMandarin的技术原理

  • 数据采集:用家长引导式对话的方式,模拟自然交流场景,确保语音数据的真实性和自然性。数据采集覆盖中国22个省级行政区,确保不同地域口音的多样性。用智能手机(Android和iPhone)进行录音,确保音频质量高,采样率为16kHz,精度为16位。
  • 数据标注:由专业转录人员进行手动标注,包括儿童的发音、停顿、重复等自然语言现象。标注说话人的年龄、性别、出生地、录音设备、口音等级等信息。
  • 模型训练和评估:用多种ASR模型(如Transformer、Conformer、Paraformer)进行训练和评估,基于CTC、AED、RNN-T等技术。对预训练模型(如HuBERT、Whisper)进行微调,用在大规模数据上学习到的特征,提升儿童语音识别的性能。用说话人嵌入提取模型(如x-vector、ECAPA-TDNN、ResNet-TDNN)进行说话人验证任务,评估模型在儿童语音上的表现。
  • 数据集设计:数据集分为训练集、验证集和测试集,确保模型训练和评估的科学性和有效性。基于多样化的数据采集和标注,确保数据集能够覆盖不同年龄段、性别、地域和口音的儿童语音。

ChildMandarin的项目地址

  • GitHub仓库:https://github.com/flageval-baai/ChildMandarin
  • HuggingFace模型库:https://huggingface.co/datasets/BAAI/ChildMandarin
  • arXiv技术论文:https://arxiv.org/pdf/2409.18584

ChildMandarin的应用场景

  • 儿童语言学习工具:开发智能语音辅助工具,帮助儿童学习语言发音、词汇和语法,提升语言能力。
  • 互动教育系统:为儿童教育软件和互动学习平台提供语音交互功能,让学习过程更加生动有趣。
  • 智能玩具开发:增强智能玩具的语音识别能力,更好地理解儿童的语音指令,提升互动体验。
  • 语音助手优化:改进语音助手(如智能音箱、手机助手)对儿童语音的识别和响应,更适合儿童使用。
  • 儿童健康管理:监测儿童的语言发展和健康状况,为早期干预提供支持。
GPTs 系列介绍 [译]
智谱AI发布GLM-5V-Turbo:原生多模态Coding基座模型,看图写代码能力领先
Meta全面押注订阅经济:Meta One品牌整合三大应用Plus,AI升级方案引爆付费用户增长
美团开源LongCat-AudioDiT:波形潜空间扩散TTS模型,零样本语音克隆性能超越Seed-TTS SOTA
小米OneVL开源:0.24秒延迟!具身智能团队发布SOTA级自动驾驶VLA世界模型
分享
Email 复制链接 打印
Share
上一篇 Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型
AIGC 资讯
Scenethesis – 英伟达推出的交互式3D场景生成框架
AIGC 资讯
MedReason – 美国加州联合南洋理工等机构推出的医学推理框架
AIGC 资讯
Phi-4-reasoning – 微软推出的Phi-4推理模型系列
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

HiDream-O1-Image:智象未来开源8B像素级统一图像生成模型,性能全面超越FLUX与GPT Image

站外新闻
HiDream-O1-Image UiT架构 图像生成模型 开源AIGC 智象未来
AI 工具AIGC 资讯

MindDR 1.5:30B小模型如何以低训练成本超越巨头?深度研究智能体架构全解析

站外新闻
AI Agent 大模型 强化学习 深度研究 理想汽车
量子芯片科技感占位特色图
AI 工具AIGC 资讯

名创优品Q1营收猛增28.5%,8.75亿AI投资收益撑起利润,主业承压背后藏着什么秘密?

站外新闻
AI投资收益 MiniMax TOP TOY 名创优品 直营扩张
AIGC 资讯

Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.