字符串匹配算法:字符串识别算法



最近,个项目,做个工具,代替原来人工识别文档工作,

有辛,本人被安排研究串识别算法,

历经7天, 已经实现改算法, 识别率相当高!

被分析串来自excel行. 按照业务逻辑来看,行excel里面 只有两中域 种叫可变域,另种叫非可变域,

研究发现, 可变域(下面称为FIELD)有着比较明显特点,都是以特殊打头,以某几种方式存在,

以特殊打头~~~~所以,算法来了!

1.关键头字触发

触发什么呢? 暗示下面可能会有个FIELD, 那么下面就开始看,是不是个FIELD,我实现办法主要是:正则表达式匹配出满足特征,

个正则表达式子就解决问题了吗?没有~~~~~~有关FIELD设计思路在这里体现出来了!

//'X','X','*','Y','M','D','H','Z','9' //'X' list_x.add("X+\\-X+"); list_x.add("X+"); //'X' list_X2.add("(X )+X"); list_X2.add("(X )+"); //'Y' list_Y.add("[Y]{4}[/][M]{2}[/][D]{2}"); list_Y.add("[Y]{4}"); //'*' list_xx.add("(* ){3}.+(* ){3}"); //'H' list_H.add("HH:MI:SS"); list_H.add("HH:MI"); //'M' list_M.add("[M]{2}/[D]{2}"); list_M.add("[M]{2}"); //'D' list_D.add("[D]{2}"); //'Z' list_Z.add("[Z]{1,3},(ZZZ,)*[Z]{1,2}9"); list_Z.add("[Z]{1,3}9"); list_Z.add("[Z]{1,3}"); //'9' list_9.add("9999");



实现
Tags:  图像识别算法 字符串查找算法 字符串加密算法 字符串匹配算法

延伸阅读

最新评论

发表评论