慧听轻口音普通话语音识别数据库-6000小时

發布日期:2019-01-23

輕口音普通話語音識別數據庫在國內多地完成語音采集工作, 完成人數10000人以上。

該數據庫總有效時長6000小時。數據采樣率為16 kHz,采樣精度是16bit,為單通道錄音,并以PCM非壓縮文件格式存儲。所有發音人沒有明顯口音,用普通話錄音,發音自然流利。

語音采集設備是智能手機,采用基于Android系統的多種品牌型號手機進行錄制;

錄音環境以室內錄制為主。

全部錄音數據與錄音文本均由標注團隊成員細心校對,保證句錯誤率低于5%。

該輕口音普通話數據庫標注質量高,可用于語音識別系統訓練、測試、語音分析、普通話發音研究等多種用途。

相關數據
排列三组选045前后关系