Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集
AIGC 资讯

ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集

站外新闻
最近更新: 2026年6月8日 上午12:41
SHARE

ChildMandarin是什么

ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)共同推出的,针对3-5岁儿童的普通话语音数据集。数据集包含41.25小时的语音数据,来自397名儿童,覆盖中国22个省级行政区,性别分布均衡。数据用智能手机录制,确保高质量音频。ChildMandarin核心特点是自然真实交互,用家长引导式对话采集方式,模拟自然交流场景。数据集填补了低幼儿童语音研究的空白,推动儿童语音识别、语言发展研究及智能语音交互系统的发展。

阅读目录
  • ChildMandarin是什么
  • ChildMandarin的主要功能
  • ChildMandarin的技术原理
  • ChildMandarin的项目地址
  • ChildMandarin的应用场景

ChildMandarin

ChildMandarin的主要功能

  • 语音识别:为自动语音识别(ASR)模型提供大量3-5岁儿童的自然语音数据,提升儿童语音识别的准确性和鲁棒性。
  • 说话人验证:支持说话人验证(SV)任务,帮助识别和区分不同儿童的声音,用在儿童身份认证等场景。
  • 语言研究:为儿童语言发展研究提供数据支持,助力开发儿童语言学习工具和互动教育系统。

ChildMandarin的技术原理

  • 数据采集:用家长引导式对话的方式,模拟自然交流场景,确保语音数据的真实性和自然性。数据采集覆盖中国22个省级行政区,确保不同地域口音的多样性。用智能手机(Android和iPhone)进行录音,确保音频质量高,采样率为16kHz,精度为16位。
  • 数据标注:由专业转录人员进行手动标注,包括儿童的发音、停顿、重复等自然语言现象。标注说话人的年龄、性别、出生地、录音设备、口音等级等信息。
  • 模型训练和评估:用多种ASR模型(如Transformer、Conformer、Paraformer)进行训练和评估,基于CTC、AED、RNN-T等技术。对预训练模型(如HuBERT、Whisper)进行微调,用在大规模数据上学习到的特征,提升儿童语音识别的性能。用说话人嵌入提取模型(如x-vector、ECAPA-TDNN、ResNet-TDNN)进行说话人验证任务,评估模型在儿童语音上的表现。
  • 数据集设计:数据集分为训练集、验证集和测试集,确保模型训练和评估的科学性和有效性。基于多样化的数据采集和标注,确保数据集能够覆盖不同年龄段、性别、地域和口音的儿童语音。

ChildMandarin的项目地址

  • GitHub仓库:https://github.com/flageval-baai/ChildMandarin
  • HuggingFace模型库:https://huggingface.co/datasets/BAAI/ChildMandarin
  • arXiv技术论文:https://arxiv.org/pdf/2409.18584

ChildMandarin的应用场景

  • 儿童语言学习工具:开发智能语音辅助工具,帮助儿童学习语言发音、词汇和语法,提升语言能力。
  • 互动教育系统:为儿童教育软件和互动学习平台提供语音交互功能,让学习过程更加生动有趣。
  • 智能玩具开发:增强智能玩具的语音识别能力,更好地理解儿童的语音指令,提升互动体验。
  • 语音助手优化:改进语音助手(如智能音箱、手机助手)对儿童语音的识别和响应,更适合儿童使用。
  • 儿童健康管理:监测儿童的语言发展和健康状况,为早期干预提供支持。
司农:南京农业大学开源农业大模型,40亿token数据驱动,赋能智慧农业全场景
从基本变量预测到复杂现象死磕!全球海洋现象智能预报大模型“琅琊”2. 0 正式发布
GLM-TTS重磅开源:智谱AI发布声音克隆与情感语音合成模型,重塑多行业应用
Xiaomi MiMo – 小米开源的首个推理大模型
Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型
分享
Email 复制链接 打印
Share
上一篇 Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型
下一篇 Context7 – 为大模型和AI编辑器提供最新文档和代码示例的平台
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯
PreenCut开源AI视频剪辑工具:基于WhisperX与大模型,实现自然语言秒搜定位,高效视频剪辑新革命
AI 工具 AIGC 资讯
阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

BlockDance – 复旦联合字节推出的扩散模型加速方法

站外新闻
AIGC 资讯

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型

站外新闻
AI 工具AIGC 资讯

英伟达Polar框架开源:零门槛强化学习,AI编码智能体进化提速500%+

站外新闻
GRPO Polar框架 代码智能体 强化学习 英伟达
AI 工具AIGC 资讯

AI2发布Olmo 3全系列开源大模型:32B参数性能强大,支持编程推理与高度定制

站外新闻
AI2 Olmo 3 人工智能 开源大模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.