好未来旗下真实教育场景数据

助力教育AI发展

成人中文授课音频

语音识别数据集为好未来线上课程的老师授课音频，涵盖语文、数学两门学科。共包含80+说话人，每条音频只有一位说话人。标注数据包含了科目及说话人编号。训练集、验证集、测试集比例为7：1：2（3个文件共9.03G）

数据规模	100小时
采样率	16KHz
采样位声	16bit
录制设备	普通麦克风
说话人	80+
录制时间	2018年4月 ~ 5月
数据格式	语音：.wav单声道；标注结果：.txt
音频长度	1 ~ 60s

样例：

这两个数他们也叫好朋友数为什么呢它们的个位能够凑成整十只要是个位能凑整十都叫好朋友数

成人中文语音情感分类

语音情感数据集为好未来老师上课音频，共包含4541条音频，总时长12.5小时。录音在安静的室内环境中录制，每条音频只有一个说话人。标注包括愉悦度（Pleasure）和激情度（Arousal）两个维度，每个音频片段对应一个P值和A值，范围都在[-3,3]之间，值越大表示愉悦度或激情度越高。（文件1.16GB）

数据规模	12.5小时
采样率	16KHz
采样位声	16bit
录制设备	普通麦克风
说话人	42人，男性：18人，女性：24人
数据格式	语音：.wav单声道；标注结果：.txt
音频长度	10s
准确率	96%

样例：

ID: 900 P: -0.046 A: 0.93 speaker: SER005 gender: man

成人中英文混合授课音频

该数据集为好未来英语课授课音频，包含中英文混合讲话的情况，每条音频只有一位说话人。（文件63.36G）

数据规模	587小时音频
采样率	16KHz
采样位声	16bit
录制设备	普通麦克风
说话人	200+
录制时间	2019年
数据格式	音频：.wav；标注结果：.txt
音频长度	1～60s
数据类型	英语课教师授课音频