小学算数式子(手写+印刷)
算数数据集为小学数学1到3年级的学生手写数学式子,共3万图片。每个数学式子经过手工裁剪。每个图像提供了对应标注。特殊数学符号标注方式请查看字符对应表。(文件87.04MB)
数据规模 | 3万张图片 |
数据类型 | 小学1~3年级学生习题册 |
公式类型 | 横式 |
运算 | 加、减、乘、除 |
数据格式 | 图片:.jpg;标注结果:.txt |
样例:
340b14=Z4Z7Z6Z0(b:代表×,Z:手写标志)
手写中文(手写)
手写中文数据集为30名大学生手写的中文古诗词,总计11739张图片,每张图片提供了对应的文本内容标注。(文件183.92MB)
数据规模 | 11739张图片 |
数据类型 | 手写中文古诗词 |
数据格式 | 图片:.jpeg;标注结果:.txt |
样例:
加。柳下桃蹊,乱分春色到人家。
手写英文(手写)
手写英文数据集为学生手写英文作文,总计1万行英文,对应1万张图片,每张图片提供了对应的文本内容标注。(文件222.16MB)
数据规模 | 1万张图片 |
数据类型 | 手写英文 |
数据格式 | 图片:.jpeg;标注结果:.txt |
样例:
Because eating fast food is a simple way to eat.
K-12 教辅书题目(印刷体)
截取的教辅中试题图片,共计47845张。学科涉及数学、语文等多个学科。每张图片都有对应标注,标注内容包括每一行文本的坐标及对应文字内容。(文件2.25GB)
数据规模 | 47485 |
数据类型 | 教辅试题图片 |
数据格式 | 图片:.jpeg;标注结果:.txt |
样例:
数据集label:
label包含文本框坐标及对应文本行的内容,格式如下, x0 y0 x1 y1 文本内容,其中x0,y0代表文本框左上角坐标,x1,y1代表坐标框右下角坐标。 示例图详细label如下, 2 37 408 8 五、写出下列各组数的最小公倍数。 43 48 881 89 1.9和18 16和48 7和35 12和36 82 95 872 135 ( ) ( ) ( ) ( ) 45 144 976 197 如果两个数是倍数关系,它们的最小公倍数是___。 33 205 885 241 2.6和7 3和11 5和9 8和11 76 252 861 292 ( ) ( ) ( ) ( ) 34 290 976 338 如果两个数是互质关系,它们的最小公倍数是___。
点阵笔输入小学数学手写
轨迹数据集为通过手写轨迹生成的图片,共计41910张图片。图片内容包括文字、公式等,每张图片提供对应标注。(文件561.7MB)
数据规模 | 41912 |
数据类型 | 手写轨迹生成图片 |
数据格式 | 图片:.jpeg;标注结果:.txt |
样例:
x + y < 1 0