目标按层次实现
- 实现单个简单100汉字手写体的识别
- 完成预处理模块
- 实现单个常用3000汉字手写体的识别
- 实现联想输入
- 实现单行文本的识别
- 扩展
- 语音识别
- 联机手写汉字识别系统
-
gnt转png模块 周义青finish
- In brief, each file has a header with the header size given as the first 4-byte integer number in the file. The last two integer numbers in the header give the number of samples in the file and the feature dimensionality. Following the header are the records of all samples, each sample including a 2-byte label (GB code) and the feature vector, each dimension in a unsigned char byte.
- gnt文件格式详细说明
-
输入模块(input)籍家荣 finish
-
输出模块(output)籍家荣 finish
关于预处理的一点想法:
现阶段所作的预处理工作都是基于图像的预处理,是否有办法进行基于文本图像的预处理工作。
- 图片放缩(周义青)finish
- 滤波降噪(smoothing)籍家荣 finish
- 彩色图像转灰度图像(邬洲)finish
- 灰度图像二值化 使用 OTSU(binaryzation)邬洲finish
- 倾斜校正(tilt_coorrection)籍家荣 finish
- 细化(refining)张炳辰finish
- 毛刺消除(remove_burr)
组内三人每人实现一个经典的CNN模型,并使用100字训练,记录最高首选正确率及训练时间。模型的分配:
完成后综合正确率和训练时间选择一个最优的模型用于最终的训练。剩余两个作为备选模型。
- 完成预处理模块
- 模型的学习
- 预处理模块的测试
- 预处理模块的BUG修复
- 模型的学习
- 模型的选择
- 模型的训练(cpu版本)(100字)
- 模型的改进、修补
- cpu版本的模型改为gpu版本的模型
- 模型的大规模训练
- 调参
- 联想输入(11.12——11.24)
- 扩展计划
- 模板
- 字迹鉴定
- 生成
- 预处理模块的优化
- 数据集的优化
《联机手写汉字识别系统技术要求与测试规程(GB/T 18790-2010)》