Skip to content

JIJIARONGjijiarong/HCCR

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

56 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

手写体汉字识别(HCCR)

目标:脱机手写汉字识别系统

目标按层次实现

  1. 实现单个简单100汉字手写体的识别
    1. 完成预处理模块
  2. 实现单个常用3000汉字手写体的识别
  3. 实现联想输入
  4. 实现单行文本的识别
  5. 扩展
    1. 语音识别
    2. 联机手写汉字识别系统

基本结构

I/O模块(opencv)

  • gnt转png模块 周义青finish

    关于gnt文件格式的说明

    • In brief, each file has a header with the header size given as the first 4-byte integer number in the file. The last two integer numbers in the header give the number of samples in the file and the feature dimensionality. Following the header are the records of all samples, each sample including a 2-byte label (GB code) and the feature vector, each dimension in a unsigned char byte.
    • gnt文件格式详细说明
  • 输入模块(input)籍家荣 finish

  • 输出模块(output)籍家荣 finish

预处理模块(opencv)

关于预处理的一点想法:

现阶段所作的预处理工作都是基于图像的预处理,是否有办法进行基于文本图像的预处理工作。

  • 图片放缩(周义青)finish
  • 滤波降噪(smoothing)籍家荣 finish
  • 彩色图像转灰度图像(邬洲)finish
  • 灰度图像二值化 使用 OTSU(binaryzation)邬洲finish
  • 倾斜校正(tilt_coorrection)籍家荣 finish
  • 细化(refining)张炳辰finish
  • 毛刺消除(remove_burr)

字符分割模块 暂未确定人选情况

分类模型

组内三人每人实现一个经典的CNN模型,并使用100字训练,记录最高首选正确率及训练时间。模型的分配:

  • Alexnet(周义青)

  • Googlenet(籍家荣)

    img

  • VGG(邬洲)

完成后综合正确率和训练时间选择一个最优的模型用于最终的训练。剩余两个作为备选模型。

联想输入模块(张炳辰)

计划

第一阶段(第一周:10.28——11.3)

  • 完成预处理模块
  • 模型的学习
  • 预处理模块的测试

第二阶段(第二、三周)(11.4——11.17)

  • 预处理模块的BUG修复
  • 模型的学习
  • 模型的选择
  • 模型的训练(cpu版本)(100字)

第三阶段(第四周)(11.18——11.24)

  • 模型的改进、修补
  • cpu版本的模型改为gpu版本的模型
  • 模型的大规模训练
  • 调参

第四阶段

  • 联想输入(11.12——11.24)
  • 扩展计划
    • 模板
    • 字迹鉴定
    • 生成
    • 预处理模块的优化
    • 数据集的优化

参考

《联机手写汉字识别系统技术要求与测试规程(GB/T 18790-2010)》

CASIA Online and Offline Chinese Handwriting Databases

gnt文件格式详细说明

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

No packages published

Contributors 3

  •  
  •  
  •