慧听儿童中文普通话语音识别数据库-1000小时

發布日期:2018-06-13

兒童中文普通話語音數據識別數據庫在國內多地開展錄音采集,完成總人數1500人以上。

該數據庫總有效時長1000小時。發音人覆蓋中國華北、華南、華東、華中、西北、東北、西南7大地區,年齡覆蓋5-12歲,男女比例均衡。

考慮到兒童語音識別的市場應用需求,錄音的文本語料主要從口語、兒童命令語句、兒童故事等領域選取。

錄音環境是相對安靜的室內。采用的錄音設備是高端智能手機,數據的規格為16kHz、16bit、MONO,非壓縮PCM格式存儲。

該數據庫錄音人數多、覆蓋兒童各年齡段、發音內容符合兒童語音識別應用需求,可用于中文語音識別系統訓練、測試、語音分析、兒童發音研究等多種用途。

相關數據
排列三组选045前后关系